CuneiformКак бы мы ни любили свободное ПО, приходится признать: для автоматического ввода текста с бумаги в компьютер оно пока не лучший вариант.
В 2008 году компания Congnitive Technologies выложила в открытый доступ исходные коды своего пакета распознавания текста Cuneiform.
Эта программа не была в лидерах рынка, иначе мы вряд ли увидели бы её исходные коды. Используемые в ней технологии давно не обновлялись. Но сейчас это приложение уже не соответствуют тем стандартам функциональности и удобства, к которым привыкли пользователи конторских ПК.
Linux по-прежнему нельзя назвать наиболее подходящей средой для распознавания текстов.
Из открытых программ только Cuneiform поддерживает распознавание документов на русском языке: попытки русификации других аналогов пока что не увенчались приемлемыми результатами.
В своей нынешней реализации Cuneifrom представляет собой приложение командной строки, что определенным образом ограничивает её функциональность. Её графический интерфейс находится лишь в начале разработки.
Важную роль в пакетах распознавания текста всегда играла интерактивность – например, возможность наглядно сопоставить распознанный фрагмент текста и соответствующий ему фрагмент исходного изображения (графический вариант Cuneiform для Windows, а с недавних пор и для линукс предоставляет такую возможность).
Как бы мы ни любили свободное ПО, приходится признать: для автоматического ввода текста с бумаги в компьютер оно пока не лучший вариант.
В 2008 году компания Congnitive Technologies выложила в открытый доступ исходные коды своего пакета распознавания текста Cuneiform.
Эта программа не была в лидерах рынка, иначе мы вряд ли увидели бы её исходные коды. Используемые в ней технологии давно не обновлялись. Но сейчас это приложение уже не соответствуют тем стандартам функциональности и удобства, к которым привыкли пользователи конторских ПК.
Linux по-прежнему нельзя назвать наиболее подходящей средой для распознавания текстов.
Из открытых программ только Cuneiform поддерживает распознавание документов на русском языке: попытки русификации других аналогов пока что не увенчались приемлемыми результатами.
В своей нынешней реализации Cuneifrom представляет собой приложение командной строки, что определенным образом ограничивает её функциональность. Её графический интерфейс находится лишь в начале разработки.
Важную роль в пакетах распознавания текста всегда играла интерактивность – например, возможность наглядно сопоставить распознанный фрагмент текста и соответствующий ему фрагмент исходного изображения (графический вариант Cuneiform для Windows, а с недавних пор и для линукс предоставляет такую возможность).
Оболочка Cuneiform-QtВ апреле 2009 выпущена первая версия Cuneiform-Qt — графического интерфейса к Cuneiform на основе библиотеки Qt4.
Код Cuneiform-Qt доступен здесь:
http://sourceforge.net/project/showfiles.php?group_id=260391
Интерфейс Cuneiform-Qt пока что более чем минималистический
и не богат по части функциональности
Скачать готовые deb-пакеты самой программы и графического интерфейса к ней можно здесь:
http://www.mediafire.com/alexpА исходные тексты последнего релиза Cuneiform доступны по адресу
https://launchpad.net/cuneiform-linux/+download
Работает программа с готовыми ‘сканами’, а не напрямую со сканером. Это сильно напоминает, как если бы использовать окошечную версию под WINE.
Cuneiform не справляется с распознаванием таблиц, зато понимает текст, разбитый на несколько колонок (их расположение в результирующем тексте не сохраняется, вместо этого они размещаются как абзацы - одна под другой).
Впрочем, и тут не обошлось без затруднений. Нередко бывает так, что программа воспринимает пробелы, расположенные друг под другом в нескольких строках подряд, как разделитель между двумя столбцами. В результате Cuneiform находит колонки там, где их нет, что приводит к непредсказуемому изменению компоновки распознанного текста.
Как самому собрать Cuneiform
Исходные тексты последнего релиза Cuneiform доступны по адресу
https://launchpad.net/cuneiform-linux/+downloadДля сборки Cuneiform необходима установленная система СМаке (если вы пользуетесь КDЕ 4, она наверняка у вас уже имеется).
Кроме того, перед компиляцией Cuneiform следует установить пакет преобразования графических форматов ImageMagick. Если этого не сделать, программа сможет читать исходные данные только из простых растровых файлов (BMP).
И обязательно посетите сайт :
http://symmetrica.net/cuneiform-linux/Важно:
Готовые deb-пакеты распознавалки cuneiform_for_linux имеются здесь:
http://www.mediafire.com/alexpВ том числе для:
ubuntu 9.04 jaunty
debian 5 lenny
Графическая оболочка YAGFОболочка YAGF предоставляет графический интерфейс для консольной программы распознавания тектов
cuneiform на платформе
Linux.Оболочку разрабатывает
Андрей БоровскийСтраничка программы :
http://symmetrica.net/cuneiform-linux/yagf-ru.htmlYAGF позволяет в отличие от других gui:
* сканировать текст прямо из оболочки
* пакетное распознавание последовательности сканов
* масштабтровать отображение скана
* выбирать отдельный блок для распознавания (на картинке - выделение синим) и благодаря этому обеспечивает более высокое качество распознавания
* прямое редактирование распознанного текста
YAGF позволяет управлять сканированием изображений, их предварительной обработкой и собственно распознаванием из единого центра. Программа YAGF также упрощает последовательное распознавание большого числа отсканированных страниц.
Если желается управлять сканированием изображений напрямую из
YAGF, то установите программу
XSane. Для распознвания текста потребуется, естественно, программа cuneiform.
Краткое описание работы в YAGFРабота в YAGF состоит из некольких этапов: получение изображения (серии изображений) страниц; подготовка к распознаванию (если необходимо); распознавание; сохранение результатов.
Получение изображений
Можно использовать файлы изображений, сохраненные на жестком диске, или отсканировать новое изображение.
YAGF поддерживает все основные растровые гафические форматы
(JPEG, PNG, BMP, TIFF, GIF, PNM, PPM, PBM и другие).Если имя открытого файла имеет вид nameXXX.ext, где XXX - последовательность цифр, вы можете переходить к предыдущему/следующему файлам с помощью кнопок перехода, расположенных на панели быстрого доступа.
Например, если вы открыли файл MyPage06.jpg, то при щелчке кнопки перехода к следующему изображению программа попытается открыть файл MyPage07.jpg.
Вы можете получать изображения напрямую со сканера с помощью программы
XSane.Находясь в
YAGF, скомандуйте Файл/Сканировать. Будет запущена программа
XSane.Мои испытания показали, что после загрузки
XSane лучше будет окно
YAGF свернуть.
Настройте параметры сканирования в
XSane и нажмите кнопку
"Сканировать".Если вам нужно отсканировать несколько изображений, выполняйте эти операции несколько раз.
Затем закройте
XSane. Разверните окно
YAGF – будет открыто первое из отсканированных изображений. Для перехода к другим изображениям пользуйтесь кнопками с панели быстрого доступа, как описано выше.
Подготовка изображений
В
YAGF вы можете выполнть простые операции подготовки отсканированного изображения: выделение блока ткста для распознавания и поворот.
Если изображение ориентировано неправильно, его можно повернуть на 90 градусов по и против часовой стрелки или на 180 градусов. Делается это с помощью кнопок панели быстрого доступа в окне просмотра изображений.
Если вы хотите передать на распознавание не все отсканированное изображение, а его часть, вы можете выделить мышью соответствующий блок в окне просмотра изображений (выделенный блоек заполняется синей штриховкой).
Для удобства выделения блока вы можете уменьшить или увеличить размеры изображения в окне просмотра (эта операция не влияет на размеры изображения, передаваемого программе cuneiform).
РаспознаваниеПриступая к распознаванию, вы должны выбрать подходящий язык распознавания (или пару языков, если распознаваемый документ написан на нескольких языках). Основная версия cuneiform позволяет вам распознавать тексты почти на всех европейских языках (см. докуентацию по cuneiform), а также тексты, содержащие пару языков русский-английский.
Каждый новый распознанный фрагмент текста (выделеный блок или новая страница) добавляется в редактор распознанного текста в виде нового абзаца.
Сохранение результатовРаспознанный текст может быть сохранен на диске в текстовом формате (кодировка UTF-8) или скопирован в буфер обмена. Кнопка "Копировать текст в буфер обмена" копирует в буфер выделеный фрагмент распознанного текста или весь текст, если в редакторе отсутствует выделение.
Актуальная версия YAGFАктуальную версию
YAGF ищите на сайте программы
http://symmetrica.net/cuneiform-linux/yagf-ru.htmlТекущая версия YAGF-0.8.1, выпущена 14 августа 2009 года.
Новое в этой версии:
* Улучшено распознавание отдельных блоков
* Внедрена пакетная обработка
* Сейчас доступны методы распознавания:
1. Распознавание отдельных блоков
2. Распознавание отдельной страницы целиком
3. Распознавание всех страниц из набора
4. Если вам нужно распознать текст сразу с нескольких изображений, теперь вы можете воспользоваться пакетным распознаванием.
Для этого все изображения, которые требуется распознать, должны быть открыты на панели изображений (в левой части окна программы). Щелкните кнопку "Распознать все страницы". Все открытые изображения будут загружаться и распознаваться автоматически.
При этом будет выведено диалоговое окно, отображающее прогресс распознавания. Вы можете остановить процесс пакетного распознавания, щелкнув кнопку "Прервать".
Каждый новый распознанный фрагмент текста (выделеный блок или новая страница) добавляется в редактор распознанного текста в виде нового абзаца.
Скачать готовый deb-пакет YAGF - 0.8.1 с исходной версии этого сайта = 184 КБ.
P.S.
Пользователи Mandriva 2009.1 Spring могут установить эту версию YAGF из репозитария EduMandriva, в том числе с помощью он-лайн установщика программ.
Как самому собрать установочный пакет YAGF из исходного текста (может потребоваться при появлении новейшей версии оболочки) описано в моём блоге