На главную страницу На главную страницу Помоги больным детям! Их можно спасти!
 
Справочные материалы ←

Как распознать текст отсканированного документа?

В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:

pkg install -r latest tesseract

Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:

unzip -d /usr/local VietOCR-5.6.1.zip

VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:

pkg install -r latest openjdk8-jre

После этого можно запускать VietOCR из командной строки в Терминале:

env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar

Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.

Примечание 1:

Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».

Примечание 2:

Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.

 

Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме. Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная переписка не допускаются. Соблюдайте правила русского языка. Комментарии публикуются после проверки модератором и могут быть удалены без объяснения причин. Ответы на заданные в комментариях вопросы могут исходить от любого пользователя и являются неофициальными.
Импортозамещение
Для организации онлайн-взаимодействия с IT-компаниями создаётся облачное решение «для проработки предлагаемых мер поддержки индустрии», сообщил вице-премьер Дмитрий Чернышенко на встрече с представителями отрасли, говорится на сайте правительства. Встреча была посвящена итогам июльской встречи председателя правительства Михаила Мишустина и технологических компаний в Иннополисе и «более глубокой проработке вопросов развития отдельных сегментов индустрии». Чернышенко подчеркнул, что правительство […] Сообщени... 
В воскресенье 9 августа исполнилось 100 лет со дня рождения Анатолия Ивановича Китова, выдающегося русского учёного, математика и кибернетика, создателя IT-проекта «Красная книга» (1959), намного опередившего нынешний национальный проект «Цифровая экономика», но отвергнутого коммунистическим руководством СССР. «Красная книга» хранилась под грифом «секретно» вплоть до смерти Китова в 2005 году. Российский учёный, доктор технических наук, профессор, […] Сообщение Сто лет со дня рождения пионера отечественной ... 
Деловые организации и отраслевые объединения IT-компаний на днях получили письмо, в котором Минкомсвязь разъясняет механизм льготного кредитования компаний для приобретения российских технологических решений, включая программное обеспечение и программно-аппаратные комплексы, сообщает АРПП «Отечественный софт». Письмо адресовано: организациям «Опора России», «Деловая Россия», торгово-промышленной палате РФ, Российскому союзу промышленников и предпринимателей, Ассоциации разработчиков программных продуктов «О... 
Беспилотные автомобили «Яндекса» проходят тестирование в России, Израиле и США, рассказала компания в четверг. Основная точка – Москва. Здесь находится центр разработки, здесь проходили первые испытания на полигоне и первые уличные заезды. Сейчас автономные автомобили «Яндекса» выезжают на улицы города каждый день. Ещё одна тестовая зона находится в Иннополисе. Два года назад компания запустила там […] Сообщение «Яндекс» сообщил, где тестирует свои беспилотные автомобили появились сначала на Digital Russia. 
Пользователи Рунета выбрали 10 проектов, которые войдут в число заданий для решения на региональном этапе всероссийского конкурса «Цифровой прорыв»; проекты направлены на решения актуальных для малого и среднего бизнеса задач, сообщают организаторы конкурса. Напомним, приём заданий в интересах малого и среднего бизнеса начался в апреле 2020 года; в июле-начале августа проходило народное голосование по проектам. […] Сообщение Для регионального этапа «Цифрового прорыва» выбрано 10 задач, актуальных для малого... 
Проект постановления правительства РФ «О внесении изменений в правила государственной регистрации медицинских изделий», которым предусмотрен ускоренный порядок вывода на рынок новых программных продуктов, в том числе программного обеспечения ?с применением технологий искусственного интеллекта, путём введения одноэтапной процедуры их государственной регистрации, опубликован для общественного обсуждения. Как пишет издание vademec.ru, по состоянию на август 2020 года единственным […] Сообщение Минздрав предлож... 
Российский производитель компьютерной техники «Аквариус» увеличил производственные мощности своего завода в городе Шуя Ивановской области в два раза — с 400 тысяч до 800 тысяч устройств в год — за счет введения в эксплуатацию новых цехов с современным ленточным конвейером и высокоскоростными линиями поверхностного и штыревого монтажа, сообщила компания в среду. Инвестиции в проект составили […] Сообщение «Аквариус» в 2020 г. увеличил мощности по производству российских ПК, серверов и ноутбуков в два раза – ... 
Опубликована статистическая информация по национальному проекту «Цифровая экономика» за 2019 год. Внутренние затраты на развитие цифровой экономики за счёт всех источников (по доле в валовом внутреннем продукте страны) оценены Росстатом в 2019 году в 2,2%. Ранее этот показатель не рассчитывался. Доля социально значимых объектов инфраструктуры, имеющих возможность подключения к широкополосному доступу к Интернету (ШПД), в […] Сообщение Обеспечение социально значимых объектов ШПД и импортозамещение ПО в 2019 ... 
Проект Координационного центра доменов .RU/.РФ по поддержке кириллических доменов Поддерживаю.РФ запустил тестирование продуктов на правильность поддержки ими доменных имен в зоне .рф; каждый разработчик программного обеспечения или сервиса может проверить свой продукт и получить соответствующий сертификат, сообщает КЦ. Для этого необходимо пройти на сайте бесплатный учебный курс по введению в универсальное принятие, включая работу с […] Сообщение Стартовал проект проверки правильности поддержки доменных им... 
Объем госзакупок в сфере информационных технологий (компьютеры и периферийное оборудование, программное обеспечение и лицензии) по 44-ФЗ вырос в первом полугодии текущего года почти на 70% по сравнению с аналогичным периодом 2019 года и составил 153,2 миллиарда рублей, сообщило D-Russia.ru АО «ТЭК-Торг» – федеральная электронная торговая площадка для проведения закупок. На закупку софта и лицензий пришлось […] Сообщение Названы топ-10 регионов по госзакупкам в IT за I полугодие 2020 года появились сначала н... 
    Наверх       На главную страницу       Адрес электропочты   Рейтинг@Mail.ru
Данный интернет-сайт носит исключительно информационный характер, и ни при каких условиях информационные
материалы и цены, размещенные на сайте, не являются публичной офертой, определяемой положениями Статьи 437 ГК РФ.

Сергей Волков – эксперт в области информационных технологий © 2011−2020
Работает система управления сайтом «Публикатор 1.7» © 2004−2020