On-line: guests 0. In total there are: 0 [information..]
AuthorTopic



link post  Posted: 28.07.07 19:59. Post subject: Источники-оригиналы


Появилась такая идея. Почему бы не создать сайт, на котором будут храниться средневековые источники на оригинальных языках? Речь идет даже не об OCR. Было бы хорошо (даже предпочтительно, по-моему) иметь копии книг в форматах djvu, pdf. В последнее время в интернете появилось немало таких книг-первоисточников. Но это лишь крупица. Да и хранится это все на разных сайтах. Приходится бегать по интернету в поисках того или иного текста. Конечно, бумажный вариант всегда лучше, но для этого надо иметь доступ в хорошую библиотеку, но не у всех есть такая возможность. Я довольно часто заказываю книги по межбиблиотечному обмену, но каждый такой заказ обходится мне в $30, что на самом деле не так уж и много, учитывая, что книги порой приходят из-за океана. Как вам такая идея, господа историки? Есть предложения, идеи?

Спасибо: 0 
ProfileQuote Reply
Replys - 63 , page: 1 2 3 4 5 All [new only]







link post  Posted: 28.07.07 22:28. Post subject: Re:


Целиком "за".
Вижу два пути реализации такого проекта:
1) Делаем на форуме ветку и выкладываем в ней все линки на оригинальные источники. Кто-то один берет на себя координацию деятельности и в случае, если линк "умер", выкладывает источник повторно на свой премиум-аккаунт на рапиде. Стоимость реализации = стоимости премиума + время. К тому же рапида иногда почему-то удаляет файлы со сканами тех книг, которые перешли в общественное достояние. Жаловаться бесполезно. Иногда по ошибке может заодно и прикрыть аккаунт. Такое случается крайне редко, но все же бывает.
2) Свой физический сервер. Я бы такой вариант не рассматривал, поскольку это будет стоить долларов 300 в месяц (размещение+техобслуживание+аммортизация+настройка).

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 28.07.07 22:51. Post subject: Re:


Bewerr пишет:

 quote:
Делаем на форуме ветку и выкладываем в ней все линки на оригинальные источники



Я когда-то пытался сделать что-то подобное:
http://vostlit.borda.ru/?1-2-0-00000028-000-0-0-1176297062

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 29.07.07 00:08. Post subject: Re:


2Bewerr

А третий вариант? Создается сайт, на котором ничего храниться не будет, а будут ссылки на файлообменники. Но сайт должен поддерживать поиск. Примером может послужить хорошо известный Вам натахаус.ру.

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 29.07.07 00:09. Post subject: Re:


2Thietmar

Такой вариант хорош в качестве промежуточного. Кстати, если мы уж заговорили о сайтах, то, если не секрет, во сколько обходится Вам содержание Востлита?

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 29.07.07 02:23. Post subject: Re:


Carlos de Almansa пишет:

 quote:
во сколько обходится Вам содержание Востлита?



То есть ? Сколько стоит хостинг или суммарные траты ?

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 29.07.07 08:39. Post subject: Re:


Ага. Хостинг.

Спасибо: 0 
ProfileQuote Reply





link post  Posted: 29.07.07 10:33. Post subject: Re:


Thietmar пишет:

 quote:
Я когда-то пытался сделать что-то подобное:
http://vostlit.borda.ru/?1-2-0-00000028-000-0-0-1176297062



Знаю. Но рук одного человека не хватает на всё, поэтому требуется доброволец, который занимался бы только линками.

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 29.07.07 11:31. Post subject: Re:


Carlos de Almansa пишет:

 quote:
Ага. Хостинг.



Хостинг стоит 88 долларов в год. Но хостинг - одна из самых незначительных трат...

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 29.07.07 12:20. Post subject: Re:


А какие есть еще траты? И как это отражается на кошельке?

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 29.07.07 13:41. Post subject: Re:


Carlos de Almansa пишет:

 quote:
А какие есть еще траты? И как это отражается на кошельке?



Интернет - 44 евра/месяц, читательский 25/год, Сканер 90/единоразово, ксерокс книг которые не дают на дом - по разному, минимум 6 центов/копия. На кошельке это сказывается по-разному, но всегда отрицательно.

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 29.07.07 14:31. Post subject: Re:


Ссылки на другие сайты - это не всегда хорошо. Например, на Books Google очень много таких книг в PDF, но у них обычно нет оглавлений в Bookmarks, что не очень удобно. Да и нумерация страниц в Pdf и в бумажном варианте не соответствуют: в оригинале часто предисловие нумеруется римскими цифрами, а текст источника - арабскими. Так что лучше их скачать, привести в приличный вид и перезалить в другое место.
Неплохо бы иметь и в текстовом виде (HTML или XML), так как при цитировании проще копировать, чем возиться с отсканированным и нераспознанным PDF.
А начать можно с создания рубрик и их заполнения названиями и (если есть) ссылками на тексты. Можно русской версией Википедии воспользоваться - заодно и ссылки сделать на статью о сайте ВЛ :)


Спасибо: 0 
ProfileQuote Reply



link post  Posted: 29.07.07 14:40. Post subject: Re:


И не только средневековые, но и античные. Античные латинские тексты в формате RTF у меня уже готовы - примерно мегабайт 110 получилось, сейчас делаю греческие (античные и византийские). А средневековые латинские оставил на потом, их очень много и требуется OCR. Пожалуй, сканировать почти не придётся - большая часть текстов у меня есть, я проверял по списку.


Спасибо: 0 
ProfileQuote Reply



link post  Posted: 29.07.07 14:52. Post subject: Re:


У меня тоже есть немало отсканированных источников на иностранных языках. И исследований на них же - стирать жалко а пользоваться исследоваиями некому. Я бы эти исследования с удовольствием кому-нибудь слил.

Спасибо: 0 
ProfileQuote Reply





link post  Posted: 29.07.07 16:03. Post subject: Re:


С гугльбукса одних исследований и источников на русском по периоду до 19 века набралось уже около 20 гигов.
Сколько будет, если добавить туда иностранные - подумать страшно... измерять придется в терабайтах.
Правда, если оставить только источники и исследования, содержащие источники в виде приложений, то получится меньше. По крайней мере сопоставимо с размером харда в 75-150 гигов.
Сосканировать тоже можно довольно много, был бы спрос и возможность разместить где-либо.

Установка и содержание мало-мальски приличного сервера будет стоить:
Единоразовая плата за сервер - примерно 1000-1500 долларов, если считать сервером какой-нибудь простенький десктоп на Conroe + миррор из двух WD-шек Raptor + памяти 4-8 GB.
Ежемесячный хостинг - 100-200 долларов в зависимости от страны расположения.
Первоначальная настройка ОС и установка готового движка - зависит от расценок программера.
Сам движок сайта - ??? зависит от того, есть ли что-то готовое, сколько надо вложить труда в переделку под конкретные нужды проекта - от "0" до 2000-5000 тыс.долларов. Самая расплывчатая строка сметы.
Ежемесячная техподдержка - энтузиаст, разместивший сервер, периодически ездит к нему и меняет вышедшие из строя харды и другое железо.

Т.е. это все дорого и хлопотно, пока нет нефтяной вышки.
Проще складировать линки на рапиду. Тот же гугльбукс, кстати, не имеет ничего против использования книг в некорыстных целях, что нас полностью устраивает.


Спасибо: 0 
ProfileQuote Reply



link post  Posted: 29.07.07 17:20. Post subject: Re:


Bewerr пишет:

 quote:
Проще складировать линки на рапиду.



Вот тебе и сольем исследования..

Спасибо: 0 
ProfileQuote Reply
Replys - 63 , page: 1 2 3 4 5 All [new only]
Reply:
1 2 3 4 5 6 7 8 9
большой шрифт малый шрифт надстрочный подстрочный заголовок большой заголовок видео с youtube.com картинка из интернета картинка с компьютера ссылка файл с компьютера русская клавиатура транслитератор  цитата  кавычки моноширинный шрифт моноширинный шрифт горизонтальная линия отступ точка LI бегущая строка оффтопик свернутый текст

показывать это сообщение только модераторам
не делать ссылки активными
Username, Password:      register    
Тему читают:
- user online
- user offline
All times are GMT  3 Hours. Hits today: 0
You can: smiles yes, images yes, types yes, poll no
avatars yes, links on, premoderation off, edit new post no