Author | Topic |
|
Posted: 29.06.09 19:01. Post subject: Как сделать для себя удобнее процесс вычитки?
Написал пару скриптов, может кому пригодится. 1. удаление двойных пробелов; удаление производится в цикле, поэтому достаточно один раз нажать на эту кнопку и двойных пробелов в документе не останется; в редких случаях, может потребоваться нажать второй раз, т.к. алгоритм очень несложен и не использует обратной связи, а просто повторяет операцию десять раз; иконка «двойные тапочки», стандартная из комплекта Word’а. 2. Check_old_russe; замена идиом по всему тексту; список идиом хранится в файле e:\scan\idioms_for_oldrusse.txt (при желании путь к файлу и имя можно изменить); удаляются лишние твердые знаки, меняются i на и, исправляются некоторые характерные ошибки OCR-ной программы; иконка «ять», нарисованная. 3. Init_Doc; подготовка документа после OCR, — шрифт меняется на Courier New, размер 12, удаляются символы мягкого переноса, выставляется абзацный отступ в 1 см.; иконка «улыбающаяся рожица» из комплекта Word’а. 4. Set_footnote; установить стиль сноски; в выделенном участке текста выставляется шрифт синего цвета, надстрочный, жирный; иконка «единичка надстрочная, синяя, жирная», нарисована. 5. Set_stylepagenumber; установить стиль номера страницы; в выделенном участке текста выставляется шрифт коричневого цвета, жирный; иконка «единичка в квадратных скобках, шрифт коричневый, жирный», нарисована. Подробности и файлы здесь здесь
|
|
|
Replys - 4
[new only]
|
|
|
Posted: 30.06.09 21:07. Post subject: Я правильно понимаю,..
Я правильно понимаю, вы меняете окончание -аго на -ого? Это, конечно, не по нынешним правилам, но я бы оставил. Скажите, а если имеется вордовский файл с разрывами страниц, можно ли при помощи макроса вставлять на место разрыва или рядом с ним набор знаков - те же квадратные скобки в красном цвете?
|
|
|
|
Posted: 01.07.09 01:56. Post subject: по п. 3 - не совсем ..
по п. 3 - не совсем понятно зачем это все. За исключением удаления переноса. по п. 4 - указанное форматирование на сайте прописано в теге <sup> в CSS. Так что в ворде этого можно не делать. Главное показать, что символ надстрочный. По окончаниям согласен с Игорем Ф.
|
|
|
|
Posted: 02.07.09 06:55. Post subject: Игорь Ф. пишет: Ска..
Игорь Ф. пишет: quote: | Скажите, а если имеется вордовский файл с разрывами страниц, можно ли при помощи макроса вставлять на место разрыва или рядом с ним набор знаков - те же квадратные скобки в красном цвете? |
| Т.е. word'овская разбивка страниц; наверняка можно, подумаю. Strori пишет: quote: | по п. 3 - не совсем понятно зачем это все. За исключением удаления переноса. |
| Я же говорю: для удобства. Кое-что из этого можно и в FineReadere выставить. но не все. Нажал одну кнопку и документ готов, не надо возиться: выбирать из списков, передвигать ползунки. Можно добавить какие-то другие действия или изменить текущие. Strori пишет: quote: | по п. 4 - указанное форматирование на сайте прописано в теге <sup> в CSS. Так что в ворде этого можно не делать. Главное показать, что символ надстрочный. |
| Именно это и делает скрипт. Выделение цветом и жирный шрифт для лучшего вида. При размещение на своем сайте я все равно меняю все word'овские теги.
|
|
|
|
Posted: 01.02.11 16:16. Post subject: Как я понял использо..
Как я понял использовать этот скрипт можно с текстом в котором нет настоящего символа Ять? То есть при распознавании в FR не используется язык "Русский (старая орфография)"
|
|
|
|