Author | Topic |
|
Posted: 17.04.06 20:20. Post subject: Копии/сканы книг
Есть возможность копировать и сканировать для дальнейшего распознавания книги, изданные хоть в начале 19-го века. Естественно, при условии их наличия в библиотеке. В основном - русские, но можно пробовать найти что-то и среди книг на немецком. Один лист А4 по библиотечным расценкам стоит 0.06USD. Поход в библиотеку, заказ книг, забрать копии и сосканировать - я все это делаю бесплатно. Интересующихся прошу отвечать либо в этой ветке, либо на мэйл dddv@pochta.ru С уважением, Bewerr
|
|
|
Replys - 71
, page:
1
2
3
4
5
All
[new only]
|
|
|
Posted: 04.07.07 04:10. Post subject: статья Orme N
Спасибочки огромное!! только у меня почему то архив не открывается, посмотрите пожалуйста еще раз может что не так а то я сейчас пытаюсь найти ее выходные данные и никак не получается, вроде потерялись :(
|
|
|
|
Posted: 04.07.07 04:49. Post subject: Re:
у меня скачался файл размером 1122 kb но открыть не могу?? "! orme.rar: Unexpected end of archive" я не говорю что я сильно умная, но может просто что не так сделала?
|
|
|
|
Posted: 04.07.07 08:55. Post subject: Re:
Euxeynos, файл в порядке. Только что скачал, распаковал. Если хотите, вышлю Вам на мыло. Выходные данные статьи: Nicholas Orme, "The Culture of Children in Medieval England", in Past and Present, vol. 148 (Aug., 1995), pp. 48-88.
|
|
|
|
Posted: 04.07.07 09:28. Post subject: Re:
Strori пишет: quote: | А никто не знает программы, которая убирает фон с листа? Допустим те же желтые страницы - они плохо воспринимаются файнридером. Так оставить бы только черный цвет на странице, т.е. буквы. |
| Требуется конвертация в B/W. Это можно сделать пакетно в фоторедакторе или продвинутом вьювере (XnView, Irfan), поэкспериментировав с установками контраста, гаммы, Input-Output Levels, резкости. Но в очень сложных случаях, когда RGB скан в одной части страницы имеет фон более темный, чем текст в другой ее части, требуется применение "интеллектуальных" фильтров. Эти фильтры работают по принципу разницы в контрасте между соседними пикселами или группами пикселов. Такое может СканКромсатор. О всех тонкостях и нюансах по использованию этой мощной, но сложной в освоении программы, смотрите разрозненные ЧАВО и постинги на разных форумах.
|
|
|
|
Posted: 05.07.07 04:15. Post subject: Re:
очень хочу euxeynos@yandex.ru спасибо
|
|
|
|
Posted: 05.07.07 11:16. Post subject: Re:
Euxeynos, отправил.
|
|
|
|
Posted: 05.07.07 16:04. Post subject: Re:
Заболел человек, который у нас занимается сканированием. Так что статья Лесникова немного откладывается. Список книг, который дал Thietmar завтра проверю по каталогу. Bewerr Требуется конвертация в B/W. Вот как раз перевод в B/W здесь нежелателен. Все граф. редакторы, которые мне попадались (в том числе Photoshop и XnView), вместо прямого преобразования по заданному порогу "черное-белое" занимаются каким-то непонятным хитромудрием. В результате чего получается "картинка" приятная для посмотреть и полюбоваться, но малосъедобная для FineReader. Здесь уж скорее надо вычитать цветной фон. Это можно сделать или в Фотошопе (но деталей уже не помню), или преобразованием в DjVu. Там в процессе сжатия цветная картинка делится на слои, один из которых как раз B&W. Потом можно разжать обратно в TIFF, причем послойно.
|
|
|
|
Posted: 05.07.07 16:46. Post subject: Re:
Shangry пишет: quote: | вместо прямого преобразования по заданному порогу "черное-белое" занимаются каким-то непонятным хитромудрием. |
| Я использую Able Tif Fax View Shangry пишет: quote: | преобразованием в DjVu. Там в процессе сжатия цветная картинка делится на слои, один из которых как раз B&W. |
| Для получения хорошего разделения на эти слои как раз и требуется "усилить" черную составляющую. В идеале - сделать скан черно-белым. Очень хорошо для таких целей подходит коррекция гаммы (в Фотошопе отсутствует, но есть, если не ошибаюсь, в Иллюстраторе). И в Able Tif Fax View есть
|
|
|
|
Posted: 06.07.07 15:25. Post subject: Re:
Bewerr пишет: А кто и где ее делает? Сейчас попробовал запустить поиск по этому названию, но в ответ почему-то ничего не выдалось. Даже на Гугле.
|
|
|
|
Posted: 06.07.07 15:31. Post subject: Re:
Отсканировал статью Лесникова. Качество не очень понятное: для просмотра еще годится, а вот для FineReader - трудно сказать. Объем 6 Мб с хвостиком. Куда ее теперь?
|
|
|
|
Posted: 10.07.07 18:49. Post subject: Re:
|
|
|
|
|
Posted: 10.07.07 18:52. Post subject: Re:
Shangry пишет: quote: | Качество не очень понятное: для просмотра еще годится, а вот для FineReader - трудно сказать. Объем 6 Мб с хвостиком. |
| 6 мегов на 32 страницы - хм... высказывать оценки качества пока преждевременно, дождусь сканов. 6 мегов = 9-10 при пересылке - делите на две части.
|
|
|
|
Posted: 12.07.07 08:43. Post subject: Re:
Теперь понятно, почему 200 килобайт на страницу - сканы-то 600 dpi. Качество хорошее. Видно, что оригинал был далеко не идеальным, поэтому для данного оригинал качество даже отличное
|
|
|
|
Posted: 12.07.07 18:22. Post subject: Re:
1. А.А. Васильев. Византия и арабы. Том 2. Политические отношения Византии и арабов за время македонской династии. СПб. 1902. Нужны стр. 113-128 приложений (т.е. источников). У нас он числится как "Записки Историко-филологического факкультета Императорского Санкт-Петербургского университета, часть LXVI". И номер тома на карточке не прописан, просто название и все. Это то, что нужно или как? 2. Письма русского из Персии. СПб. 1844 [автор: Н. Т. Муравьев]. Нужны стр. 229, 294. Это есть, заказал. Но автором указан некто Масальский. 3. Воспоминания о Персии 1834-1835. Барона Феодора Корфа. СПб. 1838. Нужны стр. 288-289. Пока не нашел, надо будет более тщательно пошарить. 4. Мирза Мухаммад Хайдар. Тарих-и Рашиди. Ташкент. Фан. 1996. Нужны стр. 403-404. Эту тоже пока не нашел. И в основном потому, что не очень понятно на какую букву книгу поставили. С именами тюркского происхождения вечная проблема - что там имя, а что фамилия :-). ... сканы-то 600 dpi. А это наш стандарт сканирования. Все издания по умолчанию делаются на 600 точек (если не требуется большего разрешения). Очень рад, что по качеству подошло.
|
|
|
|
Posted: 12.07.07 20:49. Post subject: Re:
Shangry пишет: quote: | ... сканы-то 600 dpi. А это наш стандарт сканирования. Все издания по умолчанию делаются на 600 точек (если не требуется большего разрешения). |
| Я знаю. Принятый у распознавателей рунета 400 dpi - это выстраданный компромисс между качеством и размером пересылаемых и складируемых файлов. Несколько лет назад это было крайне актуально. Это в последние год-два некоторые стали сканировать для распознавания даже в RGB
|
|
|
Replys - 71
, page:
1
2
3
4
5
All
[new only]
|
|