Дипломная работа (ВКР) — бакалавр, специалист на тему Разработка ПО для визуализации аналитических данных (любой язык программирования)
-
Оформление работы
-
Список литературы по ГОСТу
-
Соответствие методическим рекомендациям
-
И еще 16 требований ГОСТа,которые мы проверили
Введи почту и скачай архив со всеми файлами
Ссылку для скачивания пришлем
на указанный адрес электронной почты
Содержание:
Введение…………………………………………………………………………………………. 3
1 Основные подходы к
визуализации аналитических данных……………… 6
1.1 Визуализация данных
как метод анализа предметной области в аналитической работе………………………………………………………………………………………….. 6
1.2 Классификация
подходов к визуализации аналитических данных.. 8
1.3 Визуализация данных
как инструмент анализа предметной области при разработке информационных систем…………………………………………….. 11
1.4 Выводы по разделу………………………………………………………………… 13
2 Инструментальные
средства визуализации аналитических данных в области 14
2.1 Анализ
существующего программного обеспечения для визуализации аналитических данных…………………………………………………………………. 14
2.1.1 Свободно
распространяемое ПО для решения задачи визуализации аналитических данных с
открытым кодом…………………………………… 14
2.1.2 Сравнительный
анализ ПО решения задачи визуализации аналитических данных……………………………………………………………………………………… 23
2.1.3 Коммерческое
использование прикладного ПО для визуализации аналитических данных……………………………………………………………….. 25
2.2 Обоснование выбора
инструментария разработки программного обеспечения для визуализации
аналитических данных………………………………………. 28
2.3 Структурные
свойства бизнес–процессов реализуемого программного обеспечения………………………………………………………………………………… 29
2.4 Информационная
модель предметной области…………………………. 30
2.5 Выводы по разделу………………………………………………………………… 33
3 Функциональность
программного обеспечения для визуализации аналитических данных…………………………………………………………………………………………. 34
3.1 Используемые
средства при разработке модели визуализации аналитических данных……………………………………………………………………………………….. 34
3.1.1 HTML и CSS…………………………………………………………………….. 34
3.1.2 Язык
программирования…………………………………………………… 35
3.1.3 База данных……………………………………………………………………… 37
3.1.4 CSS-фреймворки
для быстрого оформления сайта………………. 39
3.1.5 Выбранные
инструментальные средства……………………………… 41
3.2 Структурные
характеристики модулей разрабатываемого ПО….. 41
3.3 Интерфейсы
ввода–вывода данных в приложении……………………. 63
3.4 Интерфейсные формы
разрабатываемого приложения……………… 65
3.5 Сценарий
тестирования функциональности разрабатываемого ПО 68
3.6 Выводы по разделу………………………………………………………………… 76
Заключение…………………………………………………………………………………… 80
Список использованных
источников……………………………………………….. 81
Приложение А………………………………………………………………………………. 84
Введение:
Визуализация данных (ВД) – это представление данных в виде,
который обеспечивает наиболее эффективную работу человека по их изучению [1].
Визуализация данных находит широкое применение в научных и
статистических исследованиях (в частности, в прогнозировании, интеллектуальном
анализе данных, бизнес-анализе), в педагогическом дизайне для обучения и
тестирования, в новостных сводках и аналитических обзорах.
ВД связана с визуализацией информации, инфографикой,
визуализацией научных данных, разведочным анализом данных и статистической
графикой.
Термины «визуализация данных» и «инфографика» часто
считаются синонимами, однако специалисты в области представления информации
проводят между ними различие. В одном из подходов ВД считается частью
инфографики, которая, согласно этой точке зрения, представляет собой комбинацию
ВД, иллюстраций, рисунков и текста, служащую для подачи целостного сообщения.
Другой подход условно проводит разграничение между этими
понятиями по методу создания, эстетическим качествам и количеству данных.
Согласно этому подходу, инфографика относится к представлениям данных, которые:
созданы при участии человека, специфичны по отношению к представляемой
информации, высокоэстетичны и не содержат много данных.
Напротив, визуализация данных относится к представлениям,
которые созданы алгоритмическим путём, легко воспроизводимы для разных выборок
и схожих типов данных, не содержат много декоративных элементов, но отражают
большие объёмы данных.
Истоки представления данных в виде таблиц, диаграмм и карт
прослеживаются с древнейших времён. Ощутимая потребность в качественном
представлении информации стала возникать еще в эпоху Возрождения, с появлением
больших количеств данных и визуальной информации из географии, астрономии,
геометрии, статистики и других наук.
В первой половине XIX века наблюдался значительный рост
работ, в которых использовалось графическое отображение данных [2]. К середине
века были изобретены все основные типы представления данных: столбчатые и
круговые диаграммы, гистограммы, линейные графики, графики временных рядов,
контурные диаграммы и т. д.
Тенденция роста пошла на спад в начале XX века, уступив
место точной математике. Тем не менее, именно в этот период стали появляться
учебники и курсы по графическим методам представления данных, а сами графики
стали использоваться не только для представления результатов, но и для
исследования информации и выдвижения гипотез в астрономии, физике, биологии и других
науках.
Новый виток визуализация получила в третьей четверти XX века
благодаря появлению вычислительных машин, к которым были разработаны эффективные
средства вывода (перьевые графопостроители, графические терминалы и пр.).
Современный мир также невозможно себе представить без
визуализации данных. Она повсюду: в финансовых отчетах компаний, в
маркетинговых исследованиях, статистических данных, обучении и т.д.
К способам визуального или графического представления данных
относят графики, диаграммы, таблицы, отчеты, списки, структурные схемы, карты и
т.д.
Именно поэтому тема разработки программного обеспечения (ПО)
для визуализации аналитических данных является актуальной.
Цель работы: разработка программного обеспечения для
визуализации аналитических данных.
Для достижения поставленной цели нужно решить следующие
задачи:
· провести анализ предметной области;
· провести анализ существующего программного обеспечения для
визуализации аналитических данных;
· выбрать инструментарий разработки программного
обеспечения для визуализации аналитических данных;
· составить информационную модель предметной области;
· определить входные и выходные данные ПО, его
функционал;
· разработать пользовательский интерфейс;
· разработать и реализовать программные модули ПО;
· провести тестирование разработанного ПО.
Заключение:
В данной работе было разработано программного обеспечения для
визуализации аналитических данных.
Данное ПО предоставляет пользователю интерфейс выбора вида
визуализации, а также интерфейс загрузки файла с данными, после чего
пользователь может наблюдать на странице сервиса требуемое изображение, которое
может скопировать и использовать в своих документах.
В ходе выполнения работы была поставлена цель – разработка
программного обеспечения для визуализации аналитических данных.
Для достижения поставленной цели были решены следующие
задачи:
· проведен анализ предметной области;
· проведен анализ существующего программного обеспечения для
визуализации аналитических данных;
· выбран инструментарий разработки программного
обеспечения для визуализации аналитических данных;
· составлена информационная модель предметной области;
· определены входные и выходные данные ПО, его
функционал;
· разработан пользовательский интерфейс;
· разработаны и реализованы программные модули ПО;
· проведено тестирование разработанного ПО.
По результатам тестирования можно сделать вывод, что
разработанное ПО дает возможность пользователям получить изображение, соответствующее
выбранному виду визуализации и предоставленным данным.
Фрагмент текста работы:
1 Основные подходы к визуализации аналитических
данных
1.1 Визуализация данных как метод анализа предметной
области в аналитической работе
Анализ информации является неотъемлемой частью ведения
бизнеса и одним из важных факторов повышения его конкурентоспособности. При
этом в подавляющем большинстве случаев анализ сводится к применению одних и тех
же базовых механизмов. Они являются универсальными и применимы к любой
предметной области, благодаря чему имеется возможность создания унифицированной
программной платформы, в которой реализованы основные механизмы анализа.
Обычно анализ производят аналитики и эксперты предметной
области предприятия. Они подготавливают данные к пригодному для анализа виду,
применяют к ним различные методы анализа, приводят результаты к легко
воспринимаемому виду. Результаты анализа необходимы лицам предприятия,
принимающим решения, например, руководителям отделов, менеджерам. Они могут
совершенно не разбираться в методах анализа, но у них есть потребность в их результатах.
Таким образом, требуется, с одной стороны, выделить и
формализовать знание эксперта о предметной области, с другой, обеспечить
возможность использовать эти знания человеком, не разбирающимся в особенностях
использования механизмов анализа, т.е. решить проблему тиражирования знаний.
Этапу визуализации данных обычно предшествуют и другие
важные этапы. Рассмотрим все этапы анализа данных [1]:
1) Формулирование цели.
Каждое исследование должно отвечать на ряд поставленных
вопросов.
2) Сбор данных.
На этом этапе аналитик или работает с уже
собранными данными, или участвует в процессе постановки задания
на сбор данных (фактически решает, какая информация ему необходима
и в каком виде).
В первом случае особое внимание уделяют правильной
интерпретации данных, которые записаны в базу, и определяют формат
данных, дизайн таблиц и т. д. Во втором случае аналитик
сталкивается с проблемой построения грамотного сценария сбора данных –
он может особенно перестараться в планировании А/В-тестов, логировании
событий и т. п. Здесь важна коммуникация с программистами,
которые могут помочь в понимании процессов и оценке масштабов
планируемых записей.
3) Подготовка данных.
«Мусор на входе – мусор на выходе» – правило,
о котором всегда нужно помнить. Структурирование, устранение ошибок,
изменение форматов содержимого, разбор аномальных результатов, очистка
от выбросов, устранение дубликатов, интеграции данных из разных
источников – одни из важнейших пунктов в анализе данных.
Иногда требуется расширение метрик, например добавление
вычислительной информации (прирост, ранг, номер и т. п.). Иногда
следует сократить количество признаков (переменных) или перейти
к вспомогательным переменным, принимающим одно из двух значений: true
(1)/false(0).
На этом этапе сырые данные превращаются в полезную
входную информацию для моделирования и анализа.
4) Исследование данных.
Для правильной интерпретации многомерных данных необходимо
посмотреть на них в разрезе как конкретного признака, так
и группы признаков. Также следует представить ключевые показатели
в динамике с планами и фактическими результатами. Именно на этом
этапе подбирается формат будущей визуализации.
5) Визуализация и построение выводов.
Каждое исследование должно заканчиваться результатами
и выводами. Даже если они негативные, их стоит проговорить
и обсудить. При этом правильная постановка задачи, методика проведения
сбора данных, правильная интерпретация результатов, выявленные ошибки
и многое другое должны послужить базой для последующих исследований.
Время, затрачиваемое аналитиком на каждую фазу, зависит
от многих переменных: начиная от опыта работы и уровня знания
данных, заканчивая перечнем используемых инструментов и технических
характеристик ПК.
Необходимо также понимать, что процесс анализа данных имеет
итерационный характер и может быть представлен циклом из описанных этапов.
Чтобы сформулировать окончательные выводы, иногда необходимо
пройтись по циклу несколько раз. Каждый раз уточняя данные, перестраивая
модели обработки и представления данных, получая всё новые знания
об анализируемой сущности.