On-line: guests 0. In total there are: 0 [information..]
AuthorTopic





link post  Posted: 11.12.06 18:32. Post subject: Краткое руководство по сканированию


Просто решил обобщить накопившуюся информацию. Что-то почерпнул в инете, но бОльшая часть описанного все же из личного опыта. Замечания и дополнения приветствуются :).

Краткое руководство по сканированию.

1. Выбор сканера.

Производители.
Cамый удачный выбор среди настольных сканеров по соотношению цена/качество/скорость/надежность– Epson и Canon. Это механически надежные сканеры, с продвинутым софтом и хорошей оптикой. Речь идет только о CCD моделях (см. ниже).
Не рекомендуется – Hewlett-Packard, главным образом из-за более высокой цены и не очень удачного софта.
Остальное можно оценить по принципу "Лучшее - враг хорошего".

Интерфейс.
У любого из современнных сканеров интерфейс USB 2.0.
При режиме черно-белого сканирования в разрешении до 400 dpi интерфейс подключения на скорость практически не влияет, и пропускной способности шины USB 1.1 вполне достаточно. Для больших разрешений и любых цветных режимов интерфейс USB 1.1 является сильным тормозом.

Тип матрицы.
Как правило, надо отдавать предпочтение сканерам с CCD матрицей, и не брать сканер с CIS. Матрицы типа CIS для качественного скана требуют очень плотного прилегания листа к стеклу сканера, и допускаемый зазор между сканируемым листом и стеклом минимален, порядка 2-5 мм. В их конструкции основной упор сделан на минимальную толщину сканера, а также более дешевую цену готового изделия, что трудно совмещается с надежной и выносливой механической частью. Вообще, хороший сканер – это еще плюс ко всему и толстый в буквальном смысле слова сканер.
Хороший ССD сканер обладает глубиной резкости, достаточной для четкого сканирования с оригинала, отстоящего от стекла на расстоянии до 15-20 мм. Этого расстояния, наверное, в 99% случаев вполне достаточно, чтобы сосканировать текст на разворотах, не ложащихся на стекло из-за крепкого или склеенного корешка.

Для макимальной производительности важен такой параметр, как скорость сканирования листа А4. Для сканеров от серьезных производителей эта скорость указана в технических характеристиках сканера, выражается некоторым числом и единицами измерения msec/line. Line – это «ряд(или строка) точек». Чтобы узнать время, за которое сканер сосканирует лист А4, требуется подставить этот параметр в следующую формулу:
Время(секунды) = Параметр(msec/line) x 12(дюймов) x Разрешение(одна цифра) : 1000
Например, для модели Epson Perfection 1670 скорость сканирования в черно-белом режиме составляет 3.68 msec/line. Время сканирования приблизительно будет равно:
при разрешении 300 dpi 3.68 х 12 х 300 : 1000 = 14 секунд
при разрешении 400 dpi 3.68 x 12 x 400 : 1000 = 18 секунд (реальная скорость была даже немного выше, порядка 16 секунд).

Сегодня сканеры ценового диапазона (80-100 долларов) без проблем сканируют лист А4 в разрешении 400 dpi за время.
Иногда приводится характеристика «Время сканирования черно-белого документа в 300-400 dpi». Интересно, что приходилось сталкиваться и со случаями, когда реальная скорость сканирования оказывалась выше заявленной производителем. Т.е. если указано 15-20 сек./А4, то этого вполне достаточно для продуктивной работы.

Техническое отступление: скорость сканирования зависит в том числе и от внутреннего процессора сканера – чем быстрее он может обработать поступившую от матрицы информацию, тем быстрее матрица может перейти к сканированию следующего ряда точек. В более дорогих сканерах используются более мощные процессоры. Это вызвано тем, что на максимальных разрешениях им необходимо обрабатывать гораздо больший объем информации, чем у дешевых сканеров. Побочный эффект – немного возросшая скорость сканирования также и в черно-белом режиме.
Передвижение каретки с большей скоростью, чем у дешевых моделей, требует и более надежной, точной и качественной механики. Поэтому сканер ценового диапазона от 150-200 долларов и выше может оказаться более надежным при больших объемах сканирования. Минимальная наработка на отказ CCD планшетного настольного сканера начального уровня - 10000 сканов (точнее, циклов движение-возврат каретки). У более дорогих моделей производители (например, Epson) обещают до 30000 и даже до 100000 сканов. Возможно, что в действительности сканер проработает больше обещанного. Например, для Epson Perfection 1670 заявленная наработка на отказ составляет 10000, в то же время сканер после небольшой профилактики, с легкими поскрипываниями при начале работы, продолжает работать, уже сделав 12000 сканов А4.

2. Программное обеспечения для сканирования.

Предпочтительнее использовать программное обеспечение, идущее в комплекте сканера. Например, софт от Epson'a достаточно удобен, содержит все необходимые настройки. В то же время интерфейс программы прост, не перегружен лишними кнопками и маловажными и редко используемыми настройками. Сканирование производится "батчем", "серией", в выбранную директорию.

3. Разрешение сканирования и оптимальное качество.

Оговримся, что речь идет о сканировании для возможной дальнейшей пересылки сканов, для чего требуется найти оптимальный компромисс между размером файла и качеством изображения.

Выбираемое разрешение:
Текст (даже с примечаниями мелким шрифтом) - 400 dpi.
Рисунки, в случае, когда сканируются отдельно от текста - минимум 300 dpi.
Географические карты - 300-600 dpi.

Книга сканируется в три захода:
1) текст + черно-белые рисунки (графика, которую при увеличении можно увидеть как линии, штрихи и точки). Формат файла - однобитный (черно-белый) (Black/White, B/W, Line-Art), TIFF(*.tif), компрессия Group 4 (может обозначаться как TIFF G4).
2) серые рисунки и фотографии (содержат полутона). Под увеличением фрагменты таких изображений остаются сплошными участками серого и не превращаются в штрихи и линии. Формат - JPG Greyscale 256 градаций серого (8 бит) с установкой компрессии 75-80% от 100% возможного качества.
Примечание: если затруднительно определить, каким же именно является изображение - черно-белым или серым - то делаются сканы в двух режимах.
3) Цветные рисунки и карты. Формат - JPG RGB (24 бита) с установкой компрессии 75-80% от 100% возможного качества.

Естественно, что стекло сканера должно быть чистым. Для протирания стекла от грязи используйте слегка влажную не оставляющую волокон салфетку или кусок ткани с минимальным количеством ворса.
В процессе сканирования стекло пачкается редко. Чаще проблему доставляет пыль, остающаяся на стекле от бумаги. Если сканирование происходит в черно-белом режиме, то такую пыль можно просто смахнуть чистой сухой ладонью или же используйте кусок ткани с минимальным количеством ворса (шелк и т.п.). При сканировании в "сером" и "цветном" режиме рукой пыль смахивать не надо, используйте только ткань.

Сосканированное изображение должно быть четким, чистым, без лишнего "мусора" (точек). В случае сканирования текста это достигается правильной установкой порога Threshold (уровень, начиная с которого сканированное изображение воспринимается как черное). Проверяется на нескольких пробных сканах. Критерий правильной установки порога - на скане бумага уже выглядит белым листом без вкраплений, а линии букв еще не стали утоньшаться и прерываться.

4. Сканирование.

Сканируемая книга должна быть хорошо прижата к стеклу сканера. Особенное внимание следует уделить прилеганию части страницы около корешка(сгиба) книги. Часто корешок книги требуется сильно выгнуть в обратную сторону. В качестве прижимающего груза можно использовать книги, или, предпочтительнее, какой-либо бесформенный тяжелый предмет. Например, мешочек с песком или другим сыпучим наполнителем (крупа и т.п.). Вес порядка 1-3 кг, в ряде случаев может быть и больше(!), в зависимости от усилия, необходимого для плотного прилегания сгиба конкретной книги. Если сканер быстрый, то можно обойтись нажатием на корешок рукой. Заодно, при сканировании сотен страниц, это будет хорошей гимнастикой ;).
Не рекомендуется использовать в качестве груза тяжелые твердые предметы – при случайном неосторожном обращении возможно повреждение стекла и самого сканера.


Спасибо: 0 
ProfileQuote Reply
Replys - 1 [new only]





link post  Posted: 15.12.06 11:33. Post subject: Дополнения ;)



 quote:
Оговримся, что речь идет о сканировании для возможной дальнейшей пересылки сканов, для чего требуется найти оптимальный компромисс между размером файла и качеством изображения.

Выбираемое разрешение:
Текст (даже с примечаниями мелким шрифтом) - 400 dpi.
Рисунки, в случае, когда сканируются отдельно от текста - минимум 300 dpi.
Географические карты - 300-600 dpi.



Нередко бывает, что сканер не покупается специально для книг, а он "уже есть". Во многих моделях, с какими сталкивался, скорость сканирования листа А4 с разрешением 300 dpi и 400 dpi сильно отличалась - 400 точек делались медленнее раза в полтора. Если Ваш сканер ведет себя так, то советую сканировать текст на 300 dpi - качество (для распознавания) будет немногим хуже, чем при 400 точках, а времени съэкономите порядочно даже с учетом дополнительных исправлений при OCR.
Вообще же при любом удобном случае используйте МФУ :)


 quote:
Книга сканируется в три захода:
2) серые рисунки и фотографии (содержат полутона). Под увеличением фрагменты таких изображений остаются сплошными участками серого и не превращаются в штрихи и линии. Формат - JPG Greyscale 256 градаций серого (8 бит) с установкой компрессии 75-80% от 100% возможного качества.
Примечание: если затруднительно определить, каким же именно является изображение - черно-белым или серым - то делаются сканы в двух режимах.
3) Цветные рисунки и карты. Формат - JPG RGB (24 бита) с установкой компрессии 75-80% от 100% возможного качества.



В старых советских книгах "серая" картинка (например, фотография) при увеличении чудесно распадется на точки, причем расстояние между точками будет больше, чем их диаметр. Это не должно смущать - она все равно "серая" - причина в использовавшейся технологии печати.
Я бы не рекомендовал использовать "вшитое в сканер" jpeg-сжатие при сканировании картинок - см. пп.2-3 выше. Лучше отсканировать в тиф greyscale или rgb без компрессии. Ее всегда можно (и нужно) будет включить при создании конечного варианта книги, но у Вас будет выбор! К тому же, если Вы будете масштабировать картинки, то без компрессии источника результат получится существенно лучше.


 quote:
Сосканированное изображение должно быть четким, чистым, без лишнего "мусора" (точек). В случае сканирования текста это достигается правильной установкой порога Threshold (уровень, начиная с которого сканированное изображение воспринимается как черное). Проверяется на нескольких пробных сканах. Критерий правильной установки порога - на скане бумага уже выглядит белым листом без вкраплений, а линии букв еще не стали утоньшаться и прерываться.



Тут про это не упоминается, но момент важный. При сканировании картинок настоятельно не рекомендуется делать это с превью и автоподстройкой сканера. Это гораздо дольше, а аналогичного результата легко достичь, установив экспериментальным путем подходящие значения коррекции яркости и контраста в драйвере сканера. Имейте в виду, что используемые по умолчанию значения в 90% случаев - не подходят.


 quote:
В качестве прижимающего груза можно использовать книги, или, предпочтительнее, какой-либо бесформенный тяжелый предмет. Например, мешочек с песком или другим сыпучим наполнителем (крупа и т.п.). Вес порядка 1-3 кг, в ряде случаев может быть и больше(!)



Если у Вас сканер Epson - то кладите песок и не сомневайтесь ;) Если нет - я бы рекомендовал быть очень аккуратными с нагрузкой на стекло. Во многих недорогих моделях нажатие на стекло - даже небольшое - мешает правильному позиционированию лампы - как результат смазанные сканы. Что еще хуже, визуально это может быть не очень заметно сразу. Худший вариант - стекло просто провалится и все - оно часто бывает "приклеено снизу".

Спасибо: 0 
ProfileQuote Reply
Reply:
1 2 3 4 5 6 7 8 9
большой шрифт малый шрифт надстрочный подстрочный заголовок большой заголовок видео с youtube.com картинка из интернета картинка с компьютера ссылка файл с компьютера русская клавиатура транслитератор  цитата  кавычки моноширинный шрифт моноширинный шрифт горизонтальная линия отступ точка LI бегущая строка оффтопик свернутый текст

показывать это сообщение только модераторам
не делать ссылки активными
Username, Password:      register    
Тему читают:
- user online
- user offline
All times are GMT  3 Hours. Hits today: 49
You can: smiles yes, images yes, types yes, poll no
avatars yes, links on, premoderation off, edit new post no