Прикладная информатика Отчёт по практике Информатика

Отчёт по практике на тему Технология больших данных в образовании (Научно-исследовательская работа)

  • Оформление работы
  • Список литературы по ГОСТу
  • Соответствие методическим рекомендациям
  • И еще 16 требований ГОСТа,
    которые мы проверили
Нажимая на кнопку, я даю согласие
на обработку персональных данных
Фрагмент работы для ознакомления
 

Содержание:

 

Введение 3
1. Теоретические аспекты технологии больших данных 5
1.1. Большие данные: понятие, сущность и основные характеристики 5
1.2. Применение больших данных 9
1.3. Технологии и методики анализа больших данных 14
2. Анализ использования больших данных в образовании 18
2.1. Возможности больших данных в образовании 18
2.2. Перспективы использования больших данных 20
Заключение 25
Список используемых источников 26

 

  

Введение:

 

Введение
Актуальность темы. С появлением новейших технологий, инструментов и коммуникационных средств, к примеру, социальных сетей, объемы данных, используемых людьми, повышается экспоненциально с каждым годом. Отношение коэффициента полезности уменьшается. Поэтому все сгенерированные данные могут быть использованы для конкретных целей лишь после предварительной и тщательной обработки.
Понятие «большие данные» или «big data» обозначает большие объемы (коллекция, поток) данных, которые не могут быть обработаны классическими компьютерными методами. Данное понятие включает в себя всевозможные инструменты, методы и платформы.
Большие данные охватывают сведения, создаваемые разными системами и приложениями. В результате термин «большие данные» включает в себя большой объем, высокую скорость обработки и большое многообразие сведений и делится на 3 составляющих: структурные сведений — реляционные базы данных; полуструктурированные сведения -XML-файлы; неструктурированные данные — Word, PDF, Text и media log-файлы.
«Big data» обладают решающим значением для жизни человека и становятся одной из самых главных технологий в настоящее время. Наиболее распространенными и хорошо известными являются лишь некоторые преимущества. Например, используя информацию, хранящуюся в социальных сетях, маркетинговые агентства изучают отзывы о своих кампаниях, акциях и других рекламных носителях.
Большие данные получили глобальное распространение во многих областях человеческой деятельности. Они используются в медицине, телекоммуникациях, торговой деятельности, логистике, финансовых организациях и государственном управлении. Также большие данные нашли свое мести и в современном образовании. Большой объем данных содержит информацию о множестве учащихся и студентах и сотнях образовательных учреждениях. Эта информация, накапливаясь, дает очень много сведений, которые можно использовать для эффективного управления образовательным процессом. Исходя из вышесказанного тема работы является актуальной.
Цель работы – проанализировать технологию больших данных в образовании.
Задачи работы:
 рассмотреть большие данные: понятие, сущность и основные характеристики;
 изучить применение больших данных в образовании;
 изучить технологии и методики анализа больших данных;
 проанализировать возможности больших данных в образовании;
 проанализировать перспективы использования больших данных в образовании.
Теоретико-методологической основой работы является исследование больших данных, которому посвящены работы как зарубежных, так и российских ученых: Якова Маньика, Михаила Чуйского, Бодрова А. А., Топоркова В. В., Будзко В. И. и др.
Значительный вклад в изучение этой технологии вносят крупные мировые компании, такие как McKinsey & Company, CNews Analytics, SAP, Oracle, IBM, Microsoft, Teradata и многие другие. Они занимаются обработкой и анализом данных, а также создают программно-аппаратные комплексы на основе больших данных.
Структура работы. Работа состоит из введения, двух глав, заключения, списка использованных источников.
Объем работы – 27 страниц.

 

Не хочешь рисковать и сдавать то, что уже сдавалось?!
Закажи оригинальную работу - это недорого!

Заключение:

 

Таким образом, большие данные – это совокупность подходов, инструментов и методов обработки структурированных и неструктурированных данных огромных объемов и значительного разнообразия с целью получения воспринимаемых человеком результатов, эффективных в условиях непрерывного роста объема информации.
Кроме того, эти данные неоднородны и передаются в различных форматах: текст, документы, изображения, видео и многое другое. Управление данными и их анализ дают любой организации, независимо от ее размера и сферы деятельности, значительные преимущества и большие перспективы.
Обучающий анализ данных (EDM) описывает область исследования, связанную с применением интеллектуального анализа данных, машинного обучения и статистики к информации, получаемой из учебных заведений (например, университетов и интеллектуальных систем обучения). На высоком уровне эта область стремится разработать и улучшить методы исследования этих данных, которые часто имеют несколько уровней значимой иерархии, чтобы открыть новое понимание того, как люди учатся в контексте таких параметров. При этом, EDM внес свой вклад в теории обучения, исследованные исследователями в области педагогической психологии и изучение наук.
Новые приложения EDM будут нацелены на то, чтобы позволить нетехническим пользователям использовать и участвовать в инструментах и действиях по интеллектуальному анализу данных, делая сбор и обработку данных более доступными для всех пользователей EDM. Примеры включают статистические и визуальные инструменты, которые анализируют социальные сети и их влияние на результаты обучения и производительность.

 

 

Фрагмент текста работы:

 

1. Теоретические аспекты технологии больших данных
1.1. Большие данные: понятие, сущность и основные характеристики
Большие данные – это один из основных факторов (стимулов) развития информационно-коммуникационных технологий (ИКТ). Это сравнительно новое для России направление в развитии информационно-коммуникационных технологий приобрело популярность в зарубежных странах. Это основано на том, что в эпоху информационных технологий, в частности после бума социальных сетей, стал накапливаться значительный и все возрастающий объем информации, относящейся к каждому пользователю Интернета, что в конечном итоге породило направление больших данных [3].
Большие данные – это не отдельная технология, а скорее сочетание проверенных и проверенных технологий, которые позволяют компаниям извлекать информацию из существующих данных для использования в своей деятельности.
Большие данные можно определить в качестве способности управлять большими объемами разнородных данных со скоростью, достаточной для анализа таких данных в режиме реального времени и своевременного реагирования. Большие данные имеют три основные характеристики [8]:
 volume объем: объем данных;
 speed скорость: скорость обработки данных;
 variability вариативность: количество разных типов данных.
Термин «большие данные» является спорным. Многие исследователи считают, что этот термин описывает только объем накопленной информации, но не забывают и о технической стороне: названное направление развития ИКТ включает в себя технологии хранения и вычислительной техники, а также услуги.
Следует отметить, что эта область включает в себя обработку большого объема информации, которую трудно обрабатывать традиционными способами. К примеру, международной исследовательской компанией Forrester данный термин определяется как технология в сфере аппаратного и программного обеспечения, которая комбинирует, организует, управляет и анализирует данные, характеризующиеся «четырьмя V»: объемом, разнообразием, изменчивостью и скоростью [4]:
 volume объем-это очень большой объем информации, накопленной в базах данных, ее сложно обрабатывать и хранить с помощью традиционных инструментов СУБД, поэтому востребованы новые подходы и усовершенствованные инструменты обработки этих данных;
 variety многообразие-это разнообразие форматов данных (основной критерий больших данных): большие объемы данных поступают из разных источников в разных форматах, различная степень структурированности — табличные данные в СУБД, иерархические данные, текстовые документы, видео, изображения, аудиофайлы и т.д. поэтому востребована возможность одновременной обработки структурированной и неструктурированной многоформатной информации.
Главное отличие структурированной информации заключается в том, что ее можно классифицировать. Примером могут выступать сведения о клиентских транзакциях. Неструктурированные сведения включают в себя видеоданные, аудио информацию, свободный текст и информацию, поступающую из социальной сети. Сегодня 80% информации, которая появляется, является неструктурированной. Такая информация должна быть всесторонне проанализирована, чтобы сделать ее полезной для дальнейшей обработки [7]:
 variability вариативность — изменчивость информации: например, это информация, которая непрерывно поступает с датчиков определенных устройств или из интернета и важна для анализа, прогнозирования и принятия решений;
 velocity скорость — скорость по накоплению и обработке данных; этот показатель указывает как на возрастающую скорость накопления данных (90% информации было собрано за последние 2 года), так и на скорость их обработки. В последнее время технологии обработки данных в реальном времени стали все более популярными в ряде задач. К перечисленным свойствам больших данных сегодня добавим:
 ver veracity-надежность данных: пользователи начали придавать все большее значение надежности существующих данных. Например, у интернет-компаний есть проблема с разделением действий, выполняемых на сайте компании роботом и человеком, что в конечном итоге затрудняет анализ данных;
 value ценность-ценность накопленной информации: большие данные должны быть полезны компаниям и приносить им определенные выгоды, например, они должны помогать в совершенствовании бизнес-процессов, отчетности или оптимизации расходов. Таким образом, при соблюдении указанных выше условий накопленные объемы данных можно считать большими.
Первым этапом цикла управления большими данными является сбор данных с последующей их систематизацией и обобщением. Затем данные могут быть проанализированы для конкретной задачи. Особое значение имеет сбор систематизация обобщение и анализ данных валидационных действий. При объединении данных из разных источников убедитесь, что они связаны друг с другом. Кроме того, некоторые источники данных могут содержать конфиденциальную информацию, требующую соответствующего уровня защиты и управления.
Большие данные — это огромные объемы данных, которые на порядок больше (объем); более разнообразны, включая структурированные, полуструктурированные и неструктурированные данные (диверсификация), и быстрее (скорость передачи и обработки), чем любые данные, с которыми организация еще не имела дело. Этот поток данных генерируется подключенными устройствами, от ПК и смартфонов до датчиков, таких как считыватели RFID и уличные камеры. Кроме того, эти данные неоднор

Важно! Это только фрагмент работы для ознакомления
Скачайте архив со всеми файлами работы с помощью формы в начале страницы

Похожие работы