On-line: guests 0. In total there are: 0 [information..]
AuthorTopic





link post  Posted: 17.04.06 20:20. Post subject: Копии/сканы книг


Есть возможность копировать и сканировать для дальнейшего распознавания книги, изданные хоть в начале 19-го века.
Естественно, при условии их наличия в библиотеке. В основном - русские, но можно пробовать найти что-то и среди книг на немецком.

Один лист А4 по библиотечным расценкам стоит 0.06USD.
Поход в библиотеку, заказ книг, забрать копии и сосканировать - я все это делаю бесплатно.

Интересующихся прошу отвечать либо в этой ветке, либо на мэйл dddv@pochta.ru

С уважением,
Bewerr


Спасибо: 0 
ProfileQuote Reply
Replys - 71 , page: 1 2 3 4 5 All [new only]





link post  Posted: 04.07.07 04:10. Post subject: статья Orme N


Спасибочки огромное!!
только у меня почему то архив не открывается, посмотрите пожалуйста еще раз может что не так
а то я сейчас пытаюсь найти ее выходные данные и никак не получается, вроде потерялись :(

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 04.07.07 04:49. Post subject: Re:


у меня скачался файл размером 1122 kb но открыть не могу??

"! orme.rar: Unexpected end of archive"

я не говорю что я сильно умная, но может просто что не так сделала?

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 04.07.07 08:55. Post subject: Re:


Euxeynos, файл в порядке. Только что скачал, распаковал. Если хотите, вышлю Вам на мыло. Выходные данные статьи:
Nicholas Orme, "The Culture of Children in Medieval England", in Past and Present, vol. 148 (Aug., 1995), pp. 48-88.


Спасибо: 0 
ProfileQuote Reply





link post  Posted: 04.07.07 09:28. Post subject: Re:


Strori пишет:

 quote:
А никто не знает программы, которая убирает фон с листа? Допустим те же желтые страницы - они плохо воспринимаются файнридером. Так оставить бы только черный цвет на странице, т.е. буквы.



Требуется конвертация в B/W. Это можно сделать пакетно в фоторедакторе или продвинутом вьювере (XnView, Irfan), поэкспериментировав с установками контраста, гаммы, Input-Output Levels, резкости. Но в очень сложных случаях, когда RGB скан в одной части страницы имеет фон более темный, чем текст в другой ее части, требуется применение "интеллектуальных" фильтров. Эти фильтры работают по принципу разницы в контрасте между соседними пикселами или группами пикселов. Такое может СканКромсатор. О всех тонкостях и нюансах по использованию этой мощной, но сложной в освоении программы, смотрите разрозненные ЧАВО и постинги на разных форумах.

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 05.07.07 04:15. Post subject: Re:


очень хочу
euxeynos@yandex.ru
спасибо

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 05.07.07 11:16. Post subject: Re:


Euxeynos, отправил.

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 05.07.07 16:04. Post subject: Re:


Заболел человек, который у нас занимается сканированием. Так что статья Лесникова немного откладывается.
Список книг, который дал Thietmar завтра проверю по каталогу.

Bewerr
Требуется конвертация в B/W.
Вот как раз перевод в B/W здесь нежелателен. Все граф. редакторы, которые мне попадались (в том числе Photoshop и XnView), вместо прямого преобразования по заданному порогу "черное-белое" занимаются каким-то непонятным хитромудрием. В результате чего получается "картинка" приятная для посмотреть и полюбоваться, но малосъедобная для FineReader.

Здесь уж скорее надо вычитать цветной фон. Это можно сделать или в Фотошопе (но деталей уже не помню), или преобразованием в DjVu. Там в процессе сжатия цветная картинка делится на слои, один из которых как раз B&W. Потом можно разжать обратно в TIFF, причем послойно.

Спасибо: 0 
ProfileQuote Reply





link post  Posted: 05.07.07 16:46. Post subject: Re:


Shangry пишет:

 quote:
вместо прямого преобразования по заданному порогу "черное-белое" занимаются каким-то непонятным хитромудрием.



Я использую Able Tif Fax View

Shangry пишет:

 quote:
преобразованием в DjVu. Там в процессе сжатия цветная картинка делится на слои, один из которых как раз B&W.



Для получения хорошего разделения на эти слои как раз и требуется "усилить" черную составляющую. В идеале - сделать скан черно-белым.

Очень хорошо для таких целей подходит коррекция гаммы (в Фотошопе отсутствует, но есть, если не ошибаюсь, в Иллюстраторе). И в Able Tif Fax View есть


Спасибо: 0 
ProfileQuote Reply



link post  Posted: 06.07.07 15:25. Post subject: Re:


Bewerr пишет:

 quote:
Able Tif Fax View


А кто и где ее делает? Сейчас попробовал запустить поиск по этому названию, но в ответ почему-то ничего не выдалось. Даже на Гугле.

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 06.07.07 15:31. Post subject: Re:


Отсканировал статью Лесникова. Качество не очень понятное: для просмотра еще годится, а вот для FineReader - трудно сказать. Объем 6 Мб с хвостиком.
Куда ее теперь?

Спасибо: 0 
ProfileQuote Reply





link post  Posted: 10.07.07 18:49. Post subject: Re:


Shangry пишет:

 quote:
А кто и где ее делает?



http://www.graphicregion.com/


Спасибо: 0 
ProfileQuote Reply





link post  Posted: 10.07.07 18:52. Post subject: Re:


Shangry пишет:

 quote:
Качество не очень понятное: для просмотра еще годится, а вот для FineReader - трудно сказать. Объем 6 Мб с хвостиком.



6 мегов на 32 страницы - хм... высказывать оценки качества пока преждевременно, дождусь сканов.
6 мегов = 9-10 при пересылке - делите на две части.


Спасибо: 0 
ProfileQuote Reply





link post  Posted: 12.07.07 08:43. Post subject: Re:


Теперь понятно, почему 200 килобайт на страницу - сканы-то 600 dpi.

Качество хорошее. Видно, что оригинал был далеко не идеальным, поэтому для данного оригинал качество даже отличное

Спасибо: 0 
ProfileQuote Reply



link post  Posted: 12.07.07 18:22. Post subject: Re:


1. А.А. Васильев. Византия и арабы. Том 2. Политические отношения Византии и арабов за время македонской династии. СПб. 1902. Нужны стр. 113-128 приложений (т.е. источников).

У нас он числится как "Записки Историко-филологического факкультета Императорского Санкт-Петербургского университета, часть LXVI". И номер тома на карточке не прописан, просто название и все.
Это то, что нужно или как?

2. Письма русского из Персии. СПб. 1844 [автор: Н. Т. Муравьев]. Нужны стр. 229, 294.
Это есть, заказал. Но автором указан некто Масальский.

3. Воспоминания о Персии 1834-1835. Барона Феодора Корфа. СПб. 1838. Нужны стр. 288-289.
Пока не нашел, надо будет более тщательно пошарить.

4. Мирза Мухаммад Хайдар. Тарих-и Рашиди. Ташкент. Фан. 1996. Нужны стр. 403-404.
Эту тоже пока не нашел. И в основном потому, что не очень понятно на какую букву книгу поставили. С именами тюркского происхождения вечная проблема - что там имя, а что фамилия :-).

... сканы-то 600 dpi.
А это наш стандарт сканирования. Все издания по умолчанию делаются на 600 точек (если не требуется большего разрешения).
Очень рад, что по качеству подошло.

Спасибо: 0 
ProfileQuote Reply





link post  Posted: 12.07.07 20:49. Post subject: Re:


Shangry пишет:

 quote:
... сканы-то 600 dpi.
А это наш стандарт сканирования. Все издания по умолчанию делаются на 600 точек (если не требуется большего разрешения).



Я знаю. Принятый у распознавателей рунета 400 dpi - это выстраданный компромисс между качеством и размером пересылаемых и складируемых файлов. Несколько лет назад это было крайне актуально. Это в последние год-два некоторые стали сканировать для распознавания даже в RGB

Спасибо: 0 
ProfileQuote Reply
Replys - 71 , page: 1 2 3 4 5 All [new only]
Reply:
1 2 3 4 5 6 7 8 9
большой шрифт малый шрифт надстрочный подстрочный заголовок большой заголовок видео с youtube.com картинка из интернета картинка с компьютера ссылка файл с компьютера русская клавиатура транслитератор  цитата  кавычки моноширинный шрифт моноширинный шрифт горизонтальная линия отступ точка LI бегущая строка оффтопик свернутый текст

показывать это сообщение только модераторам
не делать ссылки активными
Username, Password:      register    
Тему читают:
- user online
- user offline
All times are GMT  3 Hours. Hits today: 15
You can: smiles yes, images yes, types yes, poll no
avatars yes, links on, premoderation off, edit new post no