Это цитата сообщения
KonVeda Оригинальное сообщениеСервисы для распознавания текста.
[показать]Готовя посты для дневника, я сталкиваюсь с тем, что многие описания моделей сосканированы очень небрежно и в плохом качестве. И хочется самой написать чистеньоке и иногда более подробное описание. Но затраты времени на ручное переписывание описания очень уж не производительны. Я стала разыскивать сервисы для распознавания текста. И вот что обнаружила.
"Как только человек изобрел компьютер, он стал переносить в него свои знания. Поскольку главным носителем знаний до появления компьютерной техники были книги, возникла задача - каким образом накопленную информацию можно быстро перевести в "цифру"? Глупо было бы использовать для этого самый простой и очевидный способ перевода книг в цифровой формат - набор вручную. Человечество тысячелетиями накапливало различные тексты, поэтому процесс их повторного "написания" занял бы невероятно много времени. Для решения этой задачи необходимо было найти какой-то простой и эффективный способ автоматизации процесса повторного набора текста. Так возникли различные технологии оптического распознавания текста или сокращенно OCR (optical character recognition).
В наши дни с процедурой перевода машинописного листа в текстовый документ знаком каждый студент и школьник. Печатный текст сканируется (или фотографируется), затем с помощью специального программного обеспечения компьютер анализирует снимок текста, выделяет на изображении отдельные элементы и создает новый документ, в который заносит все распознанные буквы и символы. Такой документ, как правило, является редактируемым, благодаря чему можно исправлять ошибки машинного распознавания и работать с ним как с набранным текстом.
В зависимости от сложности исходного текста и качества отсканированного изображения, процесс обработки документа OCR-приложением занимает больше или меньше времени. К счастью, сегодня процедура перевода набранного текста в формат электронного документа занимает намного меньше времени, чем несколько лет назад - аппаратные возможности компьютеров за последние десять лет заметно увеличились, а благодаря постоянным усовершенствованиям алгоритмов анализа изображения процент ошибок стал намного меньше. Более того, теперь распознавание текста можно доверить даже онлайновым сервисам, преимущества которых перед обычными настольными приложениями очевидны - не нужно раскошеливаться на дорогостоящее ПО и тратить время на установку приложения. Наконец, используя для распознавания онлайновые средства, можно получить редактируемый текст из снимка даже на таких компьютерах, где просто нет возможности устанавливать программы, например, на публичном ПК в библиотеке.
FineReader Online
Начнем с онлайнового сервиса компании ABBYY. Нет ничего удивительного в том, что она использует в качестве системы для распознавания текста популярную программу FineReader. В рекламе этот продукт не нуждается - сегодня это приложение можно считать одним из лучших вариантов OCR.
далее читать на сайте http://www.3dnews.ru/software/online_ocr_services/