Курсовая теория на тему Технологии распознавания текста
-
Оформление работы
-
Список литературы по ГОСТу
-
Соответствие методическим рекомендациям
-
И еще 16 требований ГОСТа,которые мы проверили
Скачать эту работу всего за 490 рублей
Ссылку для скачивания пришлем
на указанный адрес электронной почты
на обработку персональных данных
Содержание:
Введение 2
1. История и основные достижения по теме «Технологии распознавания текста» 5
2. Теоретические основы темы «Технологии распознавания текста» 21
Литература 38
Введение:
Актуальность темы исследования.
Распознавание текста — это механический или электронный перевод различных текста в последовательность кодов, которые используются для представления в текстовом редакторе. Это широко используется для конвертации книг и документов в электронный вид, для автоматизации систем учета в бизнесе или для публикации текста на веб-странице.
Оптическое распознавание текста позволяет редактировать текст, осуществлять поиск слова или фразы, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тесту электронный перевод, форматирование или преобразование в речь.
Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения. Так же – это способность компьютера получать и интерпретировать интеллектуальный рукописный ввод. Распознавание текста может производиться «оффлайновым» методом из уже написанного на бумаге текста или «онлайновым» методом считыванием движений кончика ручки, к примеру по поверхности специального компьютерного экрана.
Оффлайновый вид распознавания успешно применяется в сферах деятельности, где необходимо обрабатывать большое количество рукописных документов, к примеру, в страховых компаниях. Качество распознавания можно повысить, используя структурированные документы (формы). Кроме того, можно улучшить качество, уменьшив диапазон возможных вводимых символов. Оффлайновое распознавание считается более сложным по сравнению с онлайновым.
Точное распознавание латинских символов в печатном тексте в настоящее время возможно только если доступны чёткие изображения, такие как сканированные печатные документы. Точность при такой постановке задачи превышает 99%, абсолютная точность может быть достигнута только путем последующего редактирования человеком. Проблемы распознавания рукописного «печатного» и стандартного рукописного текста, а также печатных текстов других форматов (особенно с очень большим числом символов) в настоящее время являются предметом активных исследований.
Широко исследуемой проблемой является распознавание рукописного текста. На данный момент достигнутая точность даже ниже, чем для рукописного «печатного» текста. Более высокие показатели могут быть достигнуты только с использованием контекстной и грамматической информации. Например, в процессе распознания искать целые слова в словаре легче, чем пытаться проанализировать отдельные символы из текста. Знание грамматики языка может также помочь определить, является ли слово глаголом или существительным. Формы отдельных рукописных символов иногда могут не содержать достаточно информации, чтобы точно (более 98 %) распознать весь рукописный текст.
Методы автоматического распознавания образов и их реализация в системах оптического чтения текстов (OCR-системах – Optical Character Recognition) – одна из самых плодотворных технологий ИИ.
В приведенной трактовке OCR понимается как автоматическое распознавание с помощью специальных программ изображений символов печатного или рукописного текста (например, введенного в компьютер с помощью сканера) и преобразование его в формат, пригодный для обработки текстовыми процессорами, редакторами текстов и т. д.
Однако в настоящее время в школьной программе не рассматриваются
Фрагмент текста работы:
1. История и основные достижения по теме «Технологии распознавания текста»
Оптическое распознавание символов или оптическое считывание символов (OCR) — это электронное или механическое преобразование изображений печатного, рукописного или печатного текста в машинно-кодированный текст, будь то из отсканированного документа, фотографии документа, фотографии сцены (например, текст на вывесках и рекламных щитах на пейзажной фотографии) или из текста субтитров, наложенного на изображение (например: из телепередачи) [5].
Ученые всегда мечтали использовать машины для воспроизведения человеческих возможностей. Это включает в себя чтение и классификацию прочитанного. Истоки оптического распознавания символов (OCR) восходят к 1870 году, когда Чарльз Р. Кэри, американский изобретатель, изобрел сканер сетчатки глаза — систему передачи изображения, использующую мозаику фотоэлементов. Два десятилетия спустя разработка очередного сканера изображения немецким изобретателем Паулем Нипковым дала решающий импульс для современных телевизоров или читающих машин и, таким образом, для распознавания символов [16].
Однако первые OCR-устройства в первую очередь предназначались для слепых и слабовидящих людей, например, оптофон, разработанный в 1912 году ирландским изобретателем доктором Эдмундом Фурнье д’Альбе (рис. 1) [13]. Оптофон представлял собой сканер, который при перемещении по печатной странице производил звуки, соответствующие определенным буквам или символам, чтобы слепой человек мог их интерпретировать [23].
Мари Джеймсон начала пользоваться оптофоном в 1918. К 1972 году она могла читать 60 слов в минуту (рис.2) [21].