Курсовая теория на тему Современные методы аналитической обработки данных
-
Оформление работы
-
Список литературы по ГОСТу
-
Соответствие методическим рекомендациям
-
И еще 16 требований ГОСТа,которые мы проверили
Введи почту и скачай архив со всеми файлами
Ссылку для скачивания пришлем
на указанный адрес электронной почты
Содержание:
Введение 3
1. Интерактивная аналитическая обработка OLAP 5
1.1. Функционал и этапы построения OLAP-систем 5
1.2. Информационно-аналитические системы на базе OLAP-технологий 8
2. Технология интеллектуального анализа данных Data Mining 11
2.1. Современные методы интеллектуального анализа данных 11
2.2. Средства анализа Statistica Data Miner 16
Заключение 23
Список использованной литературы 25
Введение:
Актуальность выбранной темы обуславливается тем, что современные компании на протяжении многих лет своей работы используют мощные информационные программные учетные системы, накапливающие большие объемы данных, эффективно использующиеся в текущей работе различных подразделений: отделов планирования и реализации, бухгалтерии и пр. Однако, в рамках реализации стратегических целей, эти данные являются так называемой «вещью в себе». Легко ли можно получить ответ на, казалось бы, простой вопрос: «Какая группа ваших продуктов, в каком регионе и по каким группам потребителей приносит наибольшую прибыль?», или: «Какие торговые представители в каждом регионе добились лучших результатов по месяцам прошлого года?». Современный деловой мир сталкивается с необходимостью принимать множество решений, опираясь на громадные объемы данных, которые необходимо обрабатывать в сжатые сроки. Накопленные данные могут стать базой для принятия стратегических решений, но для реализации этого намерения необходим комплекс средств и методов аналитической обработки данных
К наиболее прогрессивным методам, используемым в аналитической обработке данных относятся методы, основанные на технологиях Data Mining и OLAP (online analytical processing).
Средства аналитической обработки данных в реальном времени (OLAP) в сочетании с хранилищами данных и репозиториями – это некое подмножество промышленных приложений, которые гибкостью и скоростью превосходят реляционные базы данных и финансовые отчеты.
Целью данной работы является изучение современных методов аналитической обработки данных.
Для достижения поставленной цели необходимо решить ряд задач:
• Рассмотреть функционал и специфику построения систем, основанных на интерактивной аналитической обработке данных OLAP,
• Изучить существующие информационно-аналитические системы, построенные на базе OLAP-технологий,
• Раскрыть сущность технология интеллектуального анализа данных Data Mining,
• Рассмотреть современные методы интеллектуального анализа данных,
• Изучить возможности программного средства анализа Statistica Data Miner.
Объектом исследования в данной работе является процесс аналитической обработки данных.
Предмет исследования – методы аналитической обработки данных, используемые в различных сферах деятельности.
В структуру данной работы входит: введение, основная часть, состоящая из двух глав, объединяющих четыре параграфа, заключение и список использованной литературы.
Заключение:
Исходя из рассмотренного в работе материала, можно сделать ряд выводов:
1) Традиционные статистические методы анализа баз данных или системы оперативной аналитической обработки (OLAP) направлены на проверку заранее поставленных задач и гипотез.
OLAP (OnLine Analytical Processing) – технология по обработке больших массивов данных и подготовке аналитической информации в реальном времени. Для расчетов используется многомерный учет, из данных формируются OLAP-кубы. За счет внедрения OLAP-решений происходит автоматизация управления компанией на стратегическом уровне.
Приложения OLAP интуитивны для пользователя благодаря представлению массивов данных в виде наглядных многомерных кубов (Cubes). В качестве системы координат используются критерии анализируемого бизнес-процесса. Например, месяца, года, наименования товаров, объем продаж в различных торговых точках, процент выполнения планов представительствами и другие необходимые оси развертывания данных.
Важно, что пользователь может перекраивать такой куб по своему усмотрению, получая необходимый ему результат. Манипуляции с ячейками куба, заполненными необходимой информацией могут быть любыми, при этом, результаты сводов данных будут независимыми или наоборот, спровоцированными предыдущими действиями.
2) Data mining — это процесс, при помощи которого из старых данных можно извлечь нечто новое и нетривиальное. Методы, используемые в данном случае, основываются на разработках в области искусственного интеллекта и статистики, используются при работе с базами данных. В результате, благодаря анализу уже имеющихся данных, выявляются новые закономерности, которые помогают обнаружить новую информацию.
Принципиальное отличие рассмотренной в работе технологии МАД заключается в возможности самостоятельно обнаруживать такие закономерности и выстраивать гипотезы. Таким образом, методы интеллектуальной обработки информации справляются с более сложной задачей: формулировкой самой гипотезы.
Интеллектуальный анализ данных широко применяется в мировом сообществе при проведении исследований во многих областях, например, в генетике, биоинформатике, астрономии, медицине, экономике, образовании, информатике и других. Чтобы проводить эффективные эксперименты, получая конкурентоспособные и доказательные результаты, специалисты должны обладать знаниями и навыками в области интеллектуального анализа данных. Можно говорить о том, что внедрение методов интеллектуального анализа данных – очередной этап процесса, развивающегося с начала XX века. Игнорировать интеллектуальный анализ данных невозможно. Применяемые для него методы многочисленны, а преимущества, открываемые в результате выявления новых знаний, – огромны.
Фрагмент текста работы:
1. Интерактивная аналитическая обработка OLAP
1.1. Функционал и этапы построения OLAP-систем
OLAP – это технология интерактивной обработки данных. Возможности технологии сосредоточены в её быстродействии, с которым OLAP анализирует сложные пользовательские запросы к хранилищу данных. Для расчетов используется многомерный учет, из данных формируются OLAP-кубы . За счет внедрения OLAP-решений происходит автоматизация управления компанией на стратегическом уровне. Также, технология включает в себя возможность развертывания разнообразных отчетов и документов.
Типичные задачи, которые реализуются OLAP-системами :
• Анализ продаж – данные по марже, динамике выручки и ее соответствию плану. Формирование отчетности для управления эффективностью продаж
• Анализ цен и контроль закупок – регулирование ценообразования, информация по закупкам, усиление переговорных позиций с поставщиками
• Стратегическое планирование – какие направления деятельности выгодны для компании, и чем ей заниматься через 3, 5, 10 лет
• Управление бюджетом – оптимизация расходов компании
• Анализ прибыльности – какие направления эффективны, а какие нужно оптимизировать или ликвидировать
• Управление логистикой – анализ логистических затрат, оптимизация логистической сети.
OLAP-технологии за счет визуализации данных находят слабые места в работе любой компании, либо наоборот позволяют масштабировать успешные направления деятельности предприятия. От использования технологии финансовые службы предприятия получают ряд преимуществ:
• Прогнозы с несколькими версиями их развития
• Простую настройку отчетов – у каждого пользователя свой доступ для составления отчета с необходимой информацией
• Отслеживание причинно-следственных связей для анализа рабочих процессов компании
• Выявление скрытых зависимостей, влияющих на работу компании
• Анализ рабочих процессов и формирование прогнозов. К примеру, прогнозы по закупкам, продажам и плану стратегического развития.
С точки зрения пользователя, средства OLAP – простые в применении, графически представленные и конкретно сориентированные – удобнее, чем запросы по реляционной базе данных. Главное в реляционных БД – эффективность, а в БД OLAP – производительность .
Термин «OLAP» предложил Е. Кодд (E. F. Codd) в 1993 г. Он называл двенадцать главных особенностей OLAP: многомерность; прозрачность сервера; доступность; стабильные доступ и работа; архитектура «клиент-сервер»; видовая размерность; управление разреженностью данных; многопользовательский режим; операции с измерениями; интуитивное манипулирование данными; гибкая запись и редактирование; несколько измерений и уровней . Немногим позже, критерии были сформированы в тест, получивший название FASMI.