Author | Topic |
|
Posted: 28.07.07 19:59. Post subject: Источники-оригиналы
Появилась такая идея. Почему бы не создать сайт, на котором будут храниться средневековые источники на оригинальных языках? Речь идет даже не об OCR. Было бы хорошо (даже предпочтительно, по-моему) иметь копии книг в форматах djvu, pdf. В последнее время в интернете появилось немало таких книг-первоисточников. Но это лишь крупица. Да и хранится это все на разных сайтах. Приходится бегать по интернету в поисках того или иного текста. Конечно, бумажный вариант всегда лучше, но для этого надо иметь доступ в хорошую библиотеку, но не у всех есть такая возможность. Я довольно часто заказываю книги по межбиблиотечному обмену, но каждый такой заказ обходится мне в $30, что на самом деле не так уж и много, учитывая, что книги порой приходят из-за океана. Как вам такая идея, господа историки? Есть предложения, идеи?
|
|
|
Replys - 63
, page:
1
2
3
4
5
All
[new only]
|
|
|
Posted: 28.07.07 22:28. Post subject: Re:
Целиком "за". Вижу два пути реализации такого проекта: 1) Делаем на форуме ветку и выкладываем в ней все линки на оригинальные источники. Кто-то один берет на себя координацию деятельности и в случае, если линк "умер", выкладывает источник повторно на свой премиум-аккаунт на рапиде. Стоимость реализации = стоимости премиума + время. К тому же рапида иногда почему-то удаляет файлы со сканами тех книг, которые перешли в общественное достояние. Жаловаться бесполезно. Иногда по ошибке может заодно и прикрыть аккаунт. Такое случается крайне редко, но все же бывает. 2) Свой физический сервер. Я бы такой вариант не рассматривал, поскольку это будет стоить долларов 300 в месяц (размещение+техобслуживание+аммортизация+настройка).
|
|
|
|
Posted: 28.07.07 22:51. Post subject: Re:
|
|
|
|
Posted: 29.07.07 00:08. Post subject: Re:
2Bewerr А третий вариант? Создается сайт, на котором ничего храниться не будет, а будут ссылки на файлообменники. Но сайт должен поддерживать поиск. Примером может послужить хорошо известный Вам натахаус.ру.
|
|
|
|
Posted: 29.07.07 00:09. Post subject: Re:
2Thietmar Такой вариант хорош в качестве промежуточного. Кстати, если мы уж заговорили о сайтах, то, если не секрет, во сколько обходится Вам содержание Востлита?
|
|
|
|
Posted: 29.07.07 02:23. Post subject: Re:
Carlos de Almansa пишет: quote: | во сколько обходится Вам содержание Востлита? |
| То есть ? Сколько стоит хостинг или суммарные траты ?
|
|
|
|
Posted: 29.07.07 08:39. Post subject: Re:
Ага. Хостинг.
|
|
|
|
Posted: 29.07.07 10:33. Post subject: Re:
Thietmar пишет: Знаю. Но рук одного человека не хватает на всё, поэтому требуется доброволец, который занимался бы только линками.
|
|
|
|
Posted: 29.07.07 11:31. Post subject: Re:
Carlos de Almansa пишет: Хостинг стоит 88 долларов в год. Но хостинг - одна из самых незначительных трат...
|
|
|
|
Posted: 29.07.07 12:20. Post subject: Re:
А какие есть еще траты? И как это отражается на кошельке?
|
|
|
|
Posted: 29.07.07 13:41. Post subject: Re:
Carlos de Almansa пишет: quote: | А какие есть еще траты? И как это отражается на кошельке? |
| Интернет - 44 евра/месяц, читательский 25/год, Сканер 90/единоразово, ксерокс книг которые не дают на дом - по разному, минимум 6 центов/копия. На кошельке это сказывается по-разному, но всегда отрицательно.
|
|
|
|
Posted: 29.07.07 14:31. Post subject: Re:
Ссылки на другие сайты - это не всегда хорошо. Например, на Books Google очень много таких книг в PDF, но у них обычно нет оглавлений в Bookmarks, что не очень удобно. Да и нумерация страниц в Pdf и в бумажном варианте не соответствуют: в оригинале часто предисловие нумеруется римскими цифрами, а текст источника - арабскими. Так что лучше их скачать, привести в приличный вид и перезалить в другое место. Неплохо бы иметь и в текстовом виде (HTML или XML), так как при цитировании проще копировать, чем возиться с отсканированным и нераспознанным PDF. А начать можно с создания рубрик и их заполнения названиями и (если есть) ссылками на тексты. Можно русской версией Википедии воспользоваться - заодно и ссылки сделать на статью о сайте ВЛ :)
|
|
|
|
|
Posted: 29.07.07 14:40. Post subject: Re:
И не только средневековые, но и античные. Античные латинские тексты в формате RTF у меня уже готовы - примерно мегабайт 110 получилось, сейчас делаю греческие (античные и византийские). А средневековые латинские оставил на потом, их очень много и требуется OCR. Пожалуй, сканировать почти не придётся - большая часть текстов у меня есть, я проверял по списку.
|
|
|
|
Posted: 29.07.07 14:52. Post subject: Re:
У меня тоже есть немало отсканированных источников на иностранных языках. И исследований на них же - стирать жалко а пользоваться исследоваиями некому. Я бы эти исследования с удовольствием кому-нибудь слил.
|
|
|
|
Posted: 29.07.07 16:03. Post subject: Re:
С гугльбукса одних исследований и источников на русском по периоду до 19 века набралось уже около 20 гигов. Сколько будет, если добавить туда иностранные - подумать страшно... измерять придется в терабайтах. Правда, если оставить только источники и исследования, содержащие источники в виде приложений, то получится меньше. По крайней мере сопоставимо с размером харда в 75-150 гигов. Сосканировать тоже можно довольно много, был бы спрос и возможность разместить где-либо. Установка и содержание мало-мальски приличного сервера будет стоить: Единоразовая плата за сервер - примерно 1000-1500 долларов, если считать сервером какой-нибудь простенький десктоп на Conroe + миррор из двух WD-шек Raptor + памяти 4-8 GB. Ежемесячный хостинг - 100-200 долларов в зависимости от страны расположения. Первоначальная настройка ОС и установка готового движка - зависит от расценок программера. Сам движок сайта - ??? зависит от того, есть ли что-то готовое, сколько надо вложить труда в переделку под конкретные нужды проекта - от "0" до 2000-5000 тыс.долларов. Самая расплывчатая строка сметы. Ежемесячная техподдержка - энтузиаст, разместивший сервер, периодически ездит к нему и меняет вышедшие из строя харды и другое железо. Т.е. это все дорого и хлопотно, пока нет нефтяной вышки. Проще складировать линки на рапиду. Тот же гугльбукс, кстати, не имеет ничего против использования книг в некорыстных целях, что нас полностью устраивает.
|
|
|
|
Posted: 29.07.07 17:20. Post subject: Re:
Bewerr пишет: quote: | Проще складировать линки на рапиду. |
| Вот тебе и сольем исследования..
|
|
|
Replys - 63
, page:
1
2
3
4
5
All
[new only]
|
|