Лайфхак: как распознать нераспознаваемое
28-01-2011 18:35
к комментариям - к полной версии
- понравилось!
Прежде чем ответить заказчику, беру я перевод или не беру, я всегда проверяю количество знаков. Чтобы не взять на себя больше, чем я могу сделать до указанного времени. Обычно заказчик хочет быстрого ответа, да и мне не очень хочется тратить много времени на этот процесс. С Word все ясно, с Excel и PowerPoint поможет верный FineCount. Pdf бывает читабельным - копируешь в Word и все. Если нечитабельный - распознаю FineReaderом. Но бывает еще интереснее - pdf, защищенный от копирования. Распознать его не получится, он не дается. В таких случаях я пользуюсь замечательной программкой FastStone, которая сама по себе очень полезна для работы с рисунками и их вставкой в текст. Кроме всего прочего, у нее есть функция Capture Scrolling Window - т.е. сделать скриншот прокручивающегося окна. Чтобы распознать защищенный pdf, я просто открываю файл, запускаю эту функцию и получаю один огромный "рисунок", в котором содержится весь (!) текст, хоть сто страниц. А потом распознаю его FineReaderом.
вверх^
к полной версии
понравилось!
в evernote