Дипломная работа (ВКР) — бакалавр, специалист на тему Программой комплекс сравнительной оценки эффективности распознавания зашумлённых строк символов нейросетями Хопфилда и Хемминга
-
Оформление работы
-
Список литературы по ГОСТу
-
Соответствие методическим рекомендациям
-
И еще 16 требований ГОСТа,которые мы проверили
Введи почту и скачай архив со всеми файлами
Ссылку для скачивания пришлем
на указанный адрес электронной почты
Содержание:
Список условных обозначений и сокращений. 4
Введение. 5
1 Теоретический анализ задачи восстановления
текстовой информации. 7
1.1
Постановка задачи. 7
1.2
Схема функциональной структуры.. 9
1.3
Концептуальная модель объекта исследования. 11
1.4 Описание автоматизируемых функций. 15
2 Анализ программного средства для сравнения
методов распознавания зашумлённых строк символов нейросетями Хопфилда и
Хемминга. 17
2.1
Математическая модель функционирования объекта исследования. 17
2.2
Алгоритмы функционирования и их описание. 25
2.3 Информационное обеспечение. 27
2.3.1
Входная информация. 27
2.3.2
Выходная информация. 29
2.3.3
Организация БД (внутри и вне машинной) 32
2.4 Техническое обеспечение. 34
2.4.1
Обоснование, выбор, состав, схема и описание работы КТС.. 34
2.5
Программное обеспечение. 35
2.5.1
Описание структуры программного комплекса. 35
3 Экспериментальное исследование программного
комплекса для распознавания зашумлённых символов нейросетями Хопфилда и Хеминга. 48
3.1
Тестовый пример. 48
3.2
Руководство пользователя. 57
Заключение. 59
Библиографический
список. 61
Приложение
А. Исходный код интерфейса пользователя разработанного программного обеспечения. 63
Приложение
Б. Исходный код основного модуля разработанного программного обеспечения. 69
Введение:
Передача
цифровых данных по современным надежным каналам связи уже достаточно давно
подразумевает достаточно низкую долю искаженной двоичной информации (на порядки
меньше одного процента). Тем не менее, отдельные ошибки еще случаются и,
вероятнее всего, будут встречаться всегда. Также существуют отдельные отрасли,
где интенсивность ошибок при передаче может быть значительно выше за счет некой
специфики каналом связи или приемо-передающего оборудования (например, из-за
высокого уровня электромагнитных помех). С одной стороны во многих компьютерных
сетях используется наиболее популярный стек протоколов TCP-IP, в котором на
транспортном уровне подразумевается контроль за ошибками в сообщениях с помощью
механизма квитирования (если используется протокол TCP). Однако, если
используется другой популярный протокол UDP (или его модификации наподобие QUIC
и др.), то контроль ошибок не выполняется. Отсюда следует, что целесообразной
является проработка других (кроме контроля на транспортном уровне модели ISO
OSI) методов и средств обеспечения целостности сообщений.
В
частности, наиболее простым типом информации, которая вообще может передаваться
в телекоммуникационных сетях является текстовая информация. При этом, однако,
следует отметить, что она может представляться в разных формах: с помощью кодов
(как, например, в таблице ASCII) или, как вариант, с помощью визуального
представления ее букв (то есть каждый символ передается как изображение).
Последний вариант, будучи более расточительным по объему, занимаемому текстовой
информацией, предоставляет взамен интересные возможности по эффективному
восстановлению поврежденного текста, представленного изображениями его
символов. В частности такое восстановление может проводиться на основе нейронных
сетей Хопфилда и Хемминга. Таким образом, разработка и исследование подхода к
восстановлению текстовой информации на основе анализа графических изображений
ее символов является актуальной
задачей для специалиста в области информационных технологий и искусственного
интеллекта.
Целью данного исследования
является оценка эффективности восстановления зашумлённых строк символов
нейросетями Хопфилда и Хемминга на основе собственного программного продукта.
Для
достижения цели требуется решить следующие задачи
работы:
—
проанализировать особенности зашумления текстовой информации и возможные
способы ее восстановления;
—
обосновать применение нейросетей Хопфилда и Хемминга и рассмотреть особенности
этого процесса, создать алгоритмическую основу для дальнейшей программной
реализации;
—
выбрать средства разработки и провести программную реализацию, на основе
которой провести исследования эффективности восстановления.
Объект исследования – процесс
восстановления текстовой информации.
Предмет исследования – методы восстановления
изображений символов, образующих текстовую информацию, с помощью нейронных
сетей Хопфилда и Хемминга.
Методы, примененные в работе:
методы отрасли искусственного интеллекта и технологий программирования;
простейшие методы математической статистики.
Практическое значение работы состоит в разработке
программного продукта, выполняющего восстановление изображений символов, из
которых может состоять передаваемая текстовая информация, подверженная
зашумлению. Помимо чисто практического использования, продукт предоставляет
также дополнительную информацию о числовых характеристиках процесса, которая
может быть полезна при решении исследовательских задач в данной отрасли.
Заключение:
Таким образом, в работе рассмотрены нейронные сети,
являющиеся удобным и эффективным инструментом для решения задач некоторых
специфических классов, на которые, в том числе нацелен и мозг человека.
Проведен анализ таких задач на предмет решения с помощью нейронных сетей и в
частности задачи восстановления текстовой информации (при разных вариантах ее
представления). Установлено, что при представлении символов в графической форме
степень искажения битовой последовательности может достигать десятка процентов
при 100%-ом восстановлении переданного символа. При передаче в закодированной
форме наоборот искажение даже на 1 бит может вызвать существенные изменения
текста, которые сложно будет исправить даже с использованием сложных методов
обработки естественных текстов (NLP). В связи с этим именно графическое
представление символьной информации принято за основу в практической части
работы.
Поскольку в качестве основного математического аппарата были
выбраны нейронные сети, то проанализированы их свойства в целом, а также
свойства основной их структурной единицы – искусственного нейрона. Также
выполнен анализ способов объединения отдельных нейронов в целые сети с
указанием особенностей сетей разных типов. В качестве конкретных вариантов
нейронных сетей согласно заданию на работу взяты нейросети Хопфилда и Хемминга,
которые, как это общеизвестно, предоставляют хорошие результаты по
восстановлению двоичной информации. На основе указанного математического
аппарата разработано программное обеспечение, осуществляющее восстановление
цифр, представленных в виде изображений размером 10 х 5 точек. В
результате работы с программой установлено, что в исследованных случаях
восстановления оба рассматриваемые варианта сетей работают с одинаковой
степенью точности, что может быть пояснено их аналогичной структурой (за
исключением дополнительного выходного слоя, применяемого в сети Хемминга).
Разница в работе двух систем может наблюдаться только в части их
производительности. Наиболее важным выводом является то, что при небольших
степенях искажения входной информации порядка нескольких процентов (которые
реально могут наблюдаться в современных каналах связи) степень ее
восстановления составляет 100%. Таким образом, рассмотренные методы
восстановления символьных данных, передаваемых в графической форме, являются
достаточно эффективными и могут использоваться в реальных практических случаях.
Фрагмент текста работы:
1 Теоретический анализ задачи восстановления
текстовой информации 1.1 Постановка задачи Существуют подходы по использованию помехоустойчивого
кодирования с помощью детерминированных преобразований входной информации.
Однако, на сегодняшний день, ввиду чрезвычайно активного развития отрасли
искусственного интеллекта развиваются соответствующие методы обработки
информации (в частности с помощью нейронных сетей), которые можно попытаться
применить и для задач восстановления текстовой информации. Соответственно в данной работе следует на основе
практического исследования созданного своими силами программного продукта,
оценить эффективность применения нейронных сетей для задач восстановления
информации. В частности, программный продукт должен реализовывать использование
сетей Хопфилда и Хемминга для восстановления текстовой информации.
Таким образом, можно сформировать следующую задачу на
разработку, подлежащую решению в данной работе.
Название продукта: HHRestore (Hopfield и Hemming).
Тип продукта: программный продукт для обработки текстовой
информации, представленной в графическом символьном виде.
Архитектура продукта: настольное приложение.
Назначение продукта: восстановление текстовой информации,
представленной в графической форме, поврежденной при передаче по каналам связи.
Целевая программно-аппаратная платформа: персональный компьютер
с ОС Windows. Версия ОС – поддерживаемая на момент релиза продукта HHRestore,
т.е. Windows 8.1 на весну 2022
г.