Cuneiform: оптичне розпізнавання тексту

Відео: розпізнавання тексту CuneiForm

Cuneiform: оптичне розпізнавання тексту
У виконанні завдання оптичного розпізнавання тексту є два походу. Перший, найбільш простий (на словах) - матричний розпізнавання, або розпізнавання за зразком. У нас є картинка з текстом і десь в пам`яті ми зберігаємо алфавіт, еталонний набір картинок-символів. Ми розбиваємо зображення з текстом на елементи (припускаючи в кожному з них букву) і порівнюємо ці елементи з елементами алфавіту. При кожному порівнянні визначається ступінь схожості елемента тексту з кожним з елементів шаблонного алфавіту. Хто має найвищу ступінь подібності, той і є шукана буква. Інший підхід складніше. Програма-распознаватель теж містить зразковий алфавіт, однак він представлений не графікою, а правилами накреслення символу. Тобто, букву А можна описати як «паличка 1, нахилена вправо, і паличка 2, нахилена вліво, і між ні-ми горизонтальна паличка 3».

На Заході матричний або «паттерновий» метод розпізнавання застосовувався ще в 60-х роках. Був навіть розроблений стандартний моноширинний шрифт OCR-A, що застосовується, наприклад, в банківських чеках. Мінуси методу - накреслення літер, переданих розпізнає з програмою, має бути їй заздалегідь відомо або принаймні бути подібним в наявних у неї зразках шрифтів (щоб було, з чим порівнювати).

Cuneiform: оптичне розпізнавання тексту




Другий підхід - по ідеї, найбільш ефективний, оскільки не вимагає прив`язки до шрифту. Однак і найбільш складний - адже алгоритму необхідно «розкласти» передбачувані літери на складові накреслення. І не тільки в розкладанні труднощі. Рядки тексту адже не завжди йдуть строго прямо, особливо в сканованих джерелах. Ще шрифти бувають різних розмірів., А деякі літери схожі на інші літери і на цифри. Як відрізнити англійську «а» від російської? Потрібен вже словник - програма буде намагатися скласти рас-пізнані символи в слова і звіряти кожне слово зі зразками зі словника.




Яке сучасний стан ПО для розпізнавання тексту? Кого про це не запитаєш, все називають одну і ту ж програму - FineReader. У минулому ж називали CuneiForm. Але взагалі-то CuneiForm нікуди не зникла. Більш того, її вихідні коди стали відкриті під BSD-подібною ліцензією ...



Закінчуєте робити ремонт у своїй новій квартирі і Вам зовсім не до вивчення Cuneiform? Що ж, тоді я рекомендую Вам прямо зараз придбати відмінні люстри (https://brille.ua/lyustry/), які ідеально впишуться в ваш оновлений інтер`єр! А найширший асортимент люстр Ви знайдете на brille.ua.

ІНШЕ

Stuffmerge message composer фото

Stuffmerge message composer

StuffMerge Message Composer - ще одне свіже додаток, що полегшує прості повсякденні завдання. Строго кажучи, воно…

Cuneiform в наші дні С„РѕС‚Рѕ

Cuneiform в наші дні

Відео: # Нефилимов НАШІ ДНІ 2 # ЯКИЙ ПЛАН У занепалих? # З початку 90-х років компанія Cognitive Technologies випускала…

Формули в word фото

Формули в word

Відео: Введення формули в word Сьогодні ми детально вивчимо, яким чином можна вставити формулу в документ, а також які…

Прикладне по від google фото

Прикладне по від google

Відео: Google РосіяGoogle Chrome і Chromium Веб-браузер Chromium (https://chromium.org) - це Open Source-проект, який…

Gimp 2.8: інші зміни фото

Gimp 2.8: інші зміни

Відео: GIMP 2.8 Як в редакторі Змінити Фото та Зберегти в Потрібному Форматі. Конвертація фотографій #PI Інтерфейс для…

Linux-порт cuneiform фото

Linux-порт cuneiform

Відео: CuneiForm. Заміна ABBYY FineReader? «Віз і нині там» - можна відповісти словами байки, тільки аж…

Як зробити таблицю в екселя? фото

Як зробити таблицю в екселя?

Якщо Вам потрібно створити електронну таблицю або погасити, то Вам допоможе програма Excel. Створивши новий файл в цій…

» » Cuneiform: оптичне розпізнавання тексту