Програми розпізнавання тексту

Програми розпізнавання тексту

Як правило, якщо мова йде про програми для розпізнавання сканованого тексту (OCR, оптичне розпізнавання символів), більшість користувачів згадують єдиний продукт - Abbyy Finereader, який, безсумнівно, є лідером серед таких програмного забезпечення в Росії та одного з лідерів у світ.

Тим не менш, Finereader - це не єдине таке рішення: існують безкоштовні програми для розпізнавання тексту, онлайн -сервісів для тих же цілей, і, крім того, такі функції також присутні в деяких програмах, які ви знаєте, які, можливо, вже були встановлені на вашому комп’ютері. Я спробую написати про все це у цій статті. Усі програми, що розглядаються, працюють у Windows 7, 8 та XP.

Лідер розпізнавання тексту - програма Abbyy Finereader

Про Finereader (вимовляється як читач пожежі), напевно, більшість із вас чули. Ця програма є найкращою або однією з найкращих для розпізнавання тексту високої якості у російської мови. Програма виплачується, а ціна ліцензії на домашнє використання - трохи менше 2000 рублів. Також можна завантажити пробну версію штрафу або використовувати розпізнавання в Інтернеті в Abbyy Fine Reader Online (ви можете розпізнати кілька сторінок безкоштовно, тоді - за певну плату). Все це доступно на офіційному веб -сайті розробника http: // www.Пожвавлений.Ру.

Встановлення пробної версії Finereader не спричинило жодних проблем. PO може бути інтегрований з Microsoft Office та Windows провідником, щоб зробити його зручнішим для запуску розпізнавання. З обмежень у безкоштовній пробній версії - 15 днів використання та можливість розпізнавати не більше 50 сторінок.

Schold для тестування програм розпізнавання

Оскільки у мене немає сканера, я використовував малюнок з низької якості телефонної камери для перевірки, в якій я трохи відредагований контраст. Якість не є хорошою, давайте подивимось, хто може впоратися.

Меню програми Finereader

Finereader може отримувати графічне зображення тексту безпосередньо зі сканера, з графічних файлів або камери. У моєму випадку цього було достатньо, щоб відкрити файл зображення. Результат задоволений - лише пара помилок. Я мушу відразу сказати, що це найкращий результат з усіх перевірених програм під час роботи з цим зразком - подібна якість визнання була лише на безкоштовному онлайн -сервісному онлайн -OCR (але в цьому огляді ми говоримо лише про програмне забезпечення, а не Розпізнавання в Інтернеті).

Результат розпізнавання тексту у Finereader

Чесно кажучи, для кириличних текстів Finereader, мабуть, не має конкурентів. Переваги програми - це не лише якість розпізнавання тексту, але й широку функціональність, підтримка форматування, компетентний експорт у багато форматів, включаючи Word Docx, PDF та інші можливості. Таким чином, якщо завдання OCR - це те, з чим ви стикаєтесь, то не шкодуйте про відносно невелику суму грошей, і це повністю окупиться: ви заощадите величезну кількість часу, швидко отримаючи якісний результат до Finereader. До речі, я нічого не рекламую - я дійсно думаю, що ті, кому потрібно визнати більше десятка сторінок, повинні подумати про придбання такого.

CUNEEFORM - Програма розпізнавання тексту

У моїй оцінці, друга за популярною програмою OCR в Росії - безкоштовно Cunear, яку можна завантажити з офіційного веб -сайту http: // congnivitiveforms.ru/продукти/cuneeform/.

Встановлення програми також дуже проста, вона не намагається встановити будь -яке третє програмне забезпечення (як багато вільного програмного забезпечення). Інтерфейс є стислим і зрозумілим. У деяких випадках найпростіший спосіб використання господаря, для якого призначений перший з піктограм у меню.

За допомогою зразка, який я використовував у Finereader, програма не могла впоратися, або, точніше, видала щось погано читання та обрізки слів. Друга спроба була зроблена за допомогою скріншота тексту з місця цієї програми, яку, однак, довелося збільшити (вона потребує сканування з роздільною здатністю 200 ддійських і вище, вона не читає скріншоти з товщиною 1 -2 лінії шрифту пікселів). Тут вона добре впоралася (частина тексту не була визнана, оскільки була обрана лише російська мова).

Розпізнавання тексту в Cuneeform

Таким чином, можна припустити, що Cuneeform - це те, що слід спробувати, особливо якщо у вас є якісно скановані сторінки, і ви хочете їх розпізнати безкоштовно.

Microsoft OneNote - програма, яку ви вже можете мати

Склад Microsoft Office, починаючи з версії 2007 року та закінчуючи поточним 2013 року, має програму для зберігання нотаток - OneNote. Він також містить функції розпізнавання тексту. Для того, щоб використовувати його, просто вставте відскановане або будь -яке інше зображення тексту в примітку, натисніть на праву клавішу миші на ньому та використовуйте контекстне меню. Зауважте, що за замовчуванням англійська мова встановлюється для визнання.

Розпізнавання в Microsoft Onenote

Я не можу сказати, що текст визнається ідеально, але, наскільки я можу судити, він дещо краще, ніж у клинопис. Плюс програми, як уже згадувалося, полягає в тому, що зі значною ймовірністю вона вже встановлена ​​на вашому комп’ютері. Хоча, звичайно, його використання, якщо необхідно працювати з великою кількістю відсканованих документів, навряд чи буде зручним, скоріше він підходить для швидкого визнання візитних карток.

Omnipage Ultimate, Omnipage 18 - має бути щось дуже круте

Я не знаю, наскільки хороша програма для розпізнавання текстів Omnipage: немає пробних версій, я не хочу десь завантажувати. Але, якщо його ціна буде виправданою, і це коштуватиме близько 5000 рублів у версії для індивідуального використання, а не остаточно, то це має бути щось вражаюче. Сторінка програми: http: // www.Нюанс.Com/for-individuals/belarduct/ommnipage/index.HTM

Всюди

Якщо ви ознайомилися з характеристиками та відгуками, в тому числі у російських публікаціях, він зазначає, що Omnipage дійсно забезпечує високу якість та точне визнання, в тому числі російською. З недоліків, не найзручніших, особливо для початківця користувача. Так чи інакше, на західному ринку Omnipage є прямим конкурентом для Finereader та в англійських, що вигадує рейтинги, вони борються між собою, і, отже, я думаю, програма повинна бути гідною.

Це далеко не всі програми такого типу, також існують різні варіанти невеликих безкоштовних програм, але, експериментуючи з ними, я знайшов у них два основні недоліки: відсутність підтримки алфавіту Кирилика або різні, не надто корисні в термінах встановлення, і тому вирішив не згадувати про них тут.