Часть дипломной работы на тему Применение алгоритмов машинного обучения к задачам кластеризации в обнаружении разрывов ДНК клеток
-
Оформление работы
-
Список литературы по ГОСТу
-
Соответствие методическим рекомендациям
-
И еще 16 требований ГОСТа,которые мы проверили
Введи почту и скачай архив со всеми файлами
Ссылку для скачивания пришлем
на указанный адрес электронной почты
Содержание:
ГЛАВА I
ТЕОРЕТИЧЕСКАЯ ЧАСТЬ. 3
1.1 Применение
искусственного интеллекта в автоматизации обработки и анализа биометрических
данных. 3
1.2 Основные
алгоритмы, применяемые в машинном обучении. 6
1.3 Алгоритмы
кластеризации. 9
1.4 Задачи
кластеризации в обнаружении разрывов ДНК-клеток. 11
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ.. 14
Введение:
Заключение:
Фрагмент текста работы:
16.0pt;mso-bidi-font-size:14.0pt;font-family:»Times New Roman»,serif;
color:windowtext’>ГЛАВА lang=EN-US style=’font-size:16.0pt;mso-bidi-font-size:14.0pt;font-family:»Times New Roman»,serif;
color:windowtext;mso-ansi-language:EN-US’>Istyle=’mso-bookmark:_Toc99645200’>mso-bidi-font-size:14.0pt;font-family:»Times New Roman»,serif;color:windowtext’>
16.0pt;mso-bidi-font-size:14.0pt;font-family:»Times New Roman»,serif;
color:windowtext’>ТЕОРЕТИЧЕСКАЯ ЧАСТЬmso-bidi-font-size:14.0pt;font-family:»Times New Roman»,serif;color:windowtext’>0cm;mso-add-space:auto;text-align:justify;text-indent:0cm;mso-list:l2 level2 lfo1’>name=»_Toc99645201″>mso-bidi-font-size:13.0pt;font-family:»Times New Roman»,serif;mso-fareast-font-family:
«Times New Roman»;color:windowtext’>1.1style=’font:7.0pt »Times New Roman»‘> 13.0pt;font-family:»Times New Roman»,serif;color:windowtext’>Применение
искусственного интеллекта в автоматизации обработки и анализа биометрических
данныхfont-family:»Times New Roman»,serif;color:windowtext’>150%’>font-family:»Times New Roman»,serif’>Современный анализ данных – это быстро
развивающаяся дисциплина, которая включает в себя множество знаний, полученных
исторически в разных предметных областях. Задачей анализа данных как дисциплины
является получение новых знаний для принятия управленческих решений в рассматриваемой
предметной области. По сути, анализ данных является ключевым определением
понятия науки о данных – это дисциплина, которая занимается добычей,
обработкой, анализом информации, поступаемой в неимоверно больших количествах
каждый день по всему миру. Задачей науки о данных в данном случае будет
являться разбить информацию на определенные порции таким образом, чтобы ее
можно было воспринимать удобным для человека способом – сжато и по существу, не
теряя главной идеи, которую эта информация несет.150%’>font-family:»Times New Roman»,serif’>На рисунке 1.1 представлена общая модель,
по которой была сформирована наука о данных:150%’>font-family:»Times New Roman»,serif;mso-fareast-language:RU;mso-no-proof:yes’>src=»file:///C:/Users/mwu309/AppData/Local/Temp/msohtmlclip1/01/clip_image002.png»
v:shapes=»Рисунок_x0020_2″>mso-bidi-font-size:11.0pt;line-height:150%;font-family:»Times New Roman»,serif’>line-height:150%’>line-height:150%;font-family:»Times New Roman»,serif’>Рис. 1.1 – Наука о данных
исторически сложилась из разных дисциплин150%’>font-family:»Times New Roman»,serif’>Говоря об автоматизации данных, очень
важную роль в процессе играет структуризация данных. Изначально
подразумевается, что данные «живут» в подходящей для этого структуре или
иерархии, с помощью которой можно заниматься их активной обработкой. На
качество структуры влияет вид данных и уровень доступа к ним.150%’>font-family:»Times New Roman»,serif’>Способ структуризации данных влияет на
время выполнения алгоритмов. В свою очередь, понятие алгоритма тесно связано с
искусственным интеллектом, который и является конечным продуктом для решения
вопроса автоматизации. Но прежде дадим понятие алгоритма.150%’>font-family:»Times New Roman»,serif’>Предположим, нам нужно научить робота
делать бутерброд с семгой. Наши команды можно написать так:text-indent:35.45pt;line-height:150%;mso-list:l0 level1 lfo2’>style=’font-size:14.0pt;mso-bidi-font-size:11.0pt;line-height:150%;font-family:
«Times New Roman»,serif;mso-fareast-font-family:»Times New Roman»‘>style=’mso-list:Ignore’>1. 11.0pt;line-height:150%;font-family:»Times New Roman»,serif’>Открыть
холодильник.text-indent:35.45pt;line-height:150%;mso-list:l0 level1 lfo2’>style=’font-size:14.0pt;mso-bidi-font-size:11.0pt;line-height:150%;font-family:
«Times New Roman»,serif;mso-fareast-font-family:»Times New Roman»‘>style=’mso-list:Ignore’>2. 11.0pt;line-height:150%;font-family:»Times New Roman»,serif’>Взять семгу и
вынуть ее из холодильника.text-indent:35.45pt;line-height:150%;mso-list:l0 level1 lfo2’>style=’font-size:14.0pt;mso-bidi-font-size:11.0pt;line-height:150%;font-family:
«Times New Roman»,serif;mso-fareast-font-family:»Times New Roman»‘>style=’mso-list:Ignore’>3. 11.0pt;line-height:150%;font-family:»Times New Roman»,serif’>Закрыть
холодильник.text-indent:35.45pt;line-height:150%;mso-list:l0 level1 lfo2’>style=’font-size:14.0pt;mso-bidi-font-size:11.0pt;line-height:150%;font-family:
«Times New Roman»,serif;mso-fareast-font-family:»Times New Roman»‘>style=’mso-list:Ignore’>4. 11.0pt;line-height:150%;font-family:»Times New Roman»,serif’>Открыть ящик с
ножами, достать из него нож.text-indent:35.45pt;line-height:150%;mso-list:l0 level1 lfo2’>style=’font-size:14.0pt;mso-bidi-font-size:11.0pt;line-height:150%;font-family:
«Times New Roman»,serif;mso-fareast-font-family:»Times New Roman»‘>style=’mso-list:Ignore’>5. 11.0pt;line-height:150%;font-family:»Times New Roman»,serif’>Держа семгу в
левой руке, правой рукой нарезать ее кусочками, 4 штуки и т.д.150%’>font-family:»Times New Roman»,serif’>Это программа: мы обозначили каждое
действие, и машина обязана его сделать, и перечислили все необходимое, что
требуется машине для решения каждой подзадачи. Однако представим, что мы
объясняем человеку, как сделать бутерброд с семгой. Наши инструкции будут
следующими:text-indent:35.45pt;line-height:150%;mso-list:l1 level1 lfo3’>style=’font-size:14.0pt;mso-bidi-font-size:11.0pt;line-height:150%;font-family:
«Times New Roman»,serif;mso-fareast-font-family:»Times New Roman»‘>style=’mso-list:Ignore’>1. 11.0pt;line-height:150%;font-family:»Times New Roman»,serif’>Достаньте хлеб и
семгу.text-indent:35.45pt;line-height:150%;mso-list:l1 level1 lfo3’>style=’font-size:14.0pt;mso-bidi-font-size:11.0pt;line-height:150%;font-family:
«Times New Roman»,serif;mso-fareast-font-family:»Times New Roman»‘>style=’mso-list:Ignore’>2. 11.0pt;line-height:150%;font-family:»Times New Roman»,serif’>Достаньте нож, и с
помощью ножа нарежьте семгу на 4 ровных куска.text-indent:35.45pt;line-height:150%;mso-list:l1 level1 lfo3’>style=’font-size:14.0pt;mso-bidi-font-size:11.0pt;line-height:150%;font-family:
«Times New Roman»,serif;mso-fareast-font-family:»Times New Roman»‘>style=’mso-list:Ignore’>3. 11.0pt;line-height:150%;font-family:»Times New Roman»,serif’>Разрежьте ножом
хлеб на такое же количество частей, как и семгу: на 4.text-indent:35.45pt;line-height:150%;mso-list:l1 level1 lfo3’>style=’font-size:14.0pt;mso-bidi-font-size:11.0pt;line-height:150%;font-family:
«Times New Roman»,serif;mso-fareast-font-family:»Times New Roman»‘>style=’mso-list:Ignore’>4. 11.0pt;line-height:150%;font-family:»Times New Roman»,serif’>На каждый ломтик
хлеба положите кусочек семги. Готово!150%’>font-family:»Times New Roman»,serif’>Это алгоритм: цепочка команд, необходимых
для выполнения чтобы достичь цели ( в частности, приготовить бутерброд с семгой).
Заметим, что алгоритм – вещь куда абстрактней, чем программа. Программа говорит
роботу, что, откуда и куда нужно что положить и/или разрезать, чтобы все это
приготовить и удовлетворить нужды заказчика; также она применима к конкретной
кухне. Алгоритм же, в отличие от программы, можно применить на любой другой
кухне с разными наборами элементов (колбаса это, или семга)[9].150%’>font-family:»Times New Roman»,serif’>Таким образом, normal’>алгоритм – это совокупность последовательных шагов, схема действий,
приводящих к желаемому результату.150%’>mso-bidi-font-size:11.0pt;line-height:150%;font-family:»Times New Roman»,serif’>Программаstyle=’font-size:14.0pt;mso-bidi-font-size:11.0pt;line-height:150%;font-family:
«Times New Roman»,serif’> – это совокупность машинных инструкций, которые
понимает компьютер, благодаря чему способно выполнять вычисления, управлять
программами, выполнять синхронизацию процессов, создавать многопоточные команды
и пр.150%’>font-family:»Times New Roman»,serif’>Говоря на языке схемы данных, алгоритм
имеет связь «один ко многим» - один алгоритм может выполнять множество программ
или людей, а программа, чаще всего, имеет связь «один к одному» - каждому
аппаратному обеспечению соответствует своя программа, оно писалось под нее.150%’>font-family:»Times New Roman»,serif’>Далее следует пояснить вопрос анализа
биометрических данных. Известно, что биометрия – это способ распознавания
человека по его индивидуальным свойствам: физическим, поведенческим,
психическим. Биометрия получила столь широкое распространение по причине того,
что с помощью биометрии можно управлять информационными технологиями, имея при
себе идентификатор доступа (который и генерируется из совокупности определенных
человеческих характеристик).150%’>font-family:»Times New Roman»,serif’>Данная область разработки является
относительно новой для ведущих стран Европы и США и абсолютно новой для России.
Анализ информации, связанной с биометрическими данными напрямую связан с анализом
той информации, которая поступает непосредственно из результатов биометрической
идентификации (биометрической аутентификации). Отметим, что для грамотного
прохождения биометрической аутентификации нужна большая база данных. Чем больше
база данных, тем выше процент того, что данные соответствуют изначально
заявленным критериям. Другими словами, каждый из образцов должен иметь сопоставление
«один ко многим».150%’>font-family:»Times New Roman»,serif’>Способы аутентификации в основном делятся
на 3 типа: факторы знания (то, что можно запомнить своим умом), факторы
признака (уникальный идентификатор человека) и факторы владения (материальные
блага)(рисунок 1.2):line-height:150%’> src=»file:///C:/Users/mwu309/AppData/Local/Temp/msohtmlclip1/01/clip_image004.jpg»
 v:shapes=»Рисунок_x0020_1″>style=’mso-ignore:vglayout’ clear=ALL>
font-family:»Times New Roman»,serif’>Рис. 1.2 – Основные способы аутентификации150%’>Системы
биометрической аутентификации могут быть либо статическими (основанные на
физиологических свойствах человека), либо динамическими (основанные на
свойствах, определяющих поведение и психику индивидуума).150%’>mso-bidi-font-weight:bold’>К статической группе характеристик относят такие
характеристики как font-family:»Times New Roman»,serif’>отпечатки пальцев, свойства глаза
(радужная оболочка, сетчатка), индивидуальный рисунок вен, расположение линий
на руках и ладонях, ДНК, геометрия лица в целом и по отдельности и т.д.150%’>mso-bidi-font-weight:bold’>К динамической группе характеристик можно отнести:
почерк и формат подписи, сердечный ритм, голос человека, его тембр, частота,
сила, высота и пр., также распознавание языка жестов и даже скорость набора
символов на компьютере[2].