Реферат на тему Дискриптивная статистика: меры центральной тенденции
-
Оформление работы
-
Список литературы по ГОСТу
-
Соответствие методическим рекомендациям
-
И еще 16 требований ГОСТа,которые мы проверили
Введи почту и скачай архив со всеми файлами
Ссылку для скачивания пришлем
на указанный адрес электронной почты
Содержание:
Введение 2
1. Определение понятия дескриптивная (описательная) статистика 4
2. Основные типы описательной статистики 5
2.1 Измерения частоты 5
2.2 Меры центральной тенденции 5
2.3 Расчет мер центральной тенденции 6
2.4 Медиана 6
2.5 Мода 6
2.6 Стандартное отклонение и дисперсия 7
2.7 Стандартная ошибка 7
2.8 Квартили и межквартильный размах 8
2.9 Процентиль 9
2.10 Диапазон 9
3. Нормальность данных и тестирование 10
4. Статистические методы анализа данных в решении практических задач 17
Заключение 21
Список использованных источников 22
Введение:
Меры центральной тенденции (measures of central tendency) — способы осмысления центральной или средней позиции множества наблюдений, оценок, группы чисел и т.д.
На практике существует, большое разнообразие мер центральной тенденции, например, взвешенное, винсоризованное, гармоническое, геометрическое средние, среднее Колмогорова, но чаще всего встречаются:
мода;
среднее арифметическое;
медиана.
Мода — типичность — максимальная частота — наиболее часто встречающееся значение в совокупности наблюдений. Применяется, например, для определения размера одежды, обуви, калибра патронов, пользующихся популярностью у покупателей, анализа технических экспериментов, а также определение часто встречающегося значения среди данных, имеющих не числовую природу происхождения (например, цвета: синий, красный, желтый, синий, зеленый…).
Среднее арифметическое — сумма всех чисел, деленное на их количество, зависимое от разброса наблюдений.
Недостатком данной меры является чувствительность к различным отклонениям и неоднородностям в выборке, другими словами, оно подвержено существенным искажениям со стороны «отщепенцев» (значений) резко отклоняющихся от центра распределения. Для распределений с большим коэффициентом асимметрии может не соответствовать понятию среднего.
Медиана — середина — уровень показателя, который делит набор данных на 2 равные половины (50/50). Она не присваивает наблюдениям весовые коэффициенты исходя из того, на сколько они отдалены от средней точки, а лишь оценивает их в зависимости от расположения.
Развивая мысль можно также делить медиану на четверти — квартили:
0,25 квантиль — первый (нижний) квартиль;
0,5 квантиль — медиана — второй квартиль;
0,75 квантиль — третий (верхний) квартиль.
Еще один вариант разделить на децили, каждый из которых включает в себя 10% наблюдений. Например, если ваш расход топлива бензинового двигателя автомобиля в верхнем дециле общего распределения расходов топлива всех бензиновых двигателей, то это означает, ваш двигатель сжигает топлива больше, чем 90% остальных двигателей.
При выборе меры центральной тенденции нужно учитывать ее устойчивость к значениям, резко отклоняющихся от центра применяемых в каждом конкретном случае. Нужно определить какое влияние оказывают «отщепенцы»: искажают его или наоборот играют важную роль.
Окончательный выбор меры центральной тенденции всегда лежит за исследователем.
Посему актуальность работы очевидна – исследователь должен сам выбрать меру центральной тенденции и понимать, что от этого зависит исход исследования.
Цель работы – изучение дескриптивной статистики и мер центральной тенденции.
Для достижения поставленной цели необходимо решить ряд задач:
1. Дать определение понятию дескриптивная (описательная) статистика
2. Рассмотреть основные типы описательной статистики.
3. Изучить нормальность данных и тестирование
4. Рассмотреть, как статистические методы анализа данных применяются в решении практических задач
Объект исследования: методы описательной (дескриптивной) статистики.
Предмет исследования: меры центральной тенденции в описательной статистике.
Заключение:
Описательная статистика-это статистический метод для правильного и содержательного обобщения данных. Хорошая и адекватная мера важна не только для данных, но и для статистических методов, используемых для проверки гипотез. Для непрерывных данных проверка нормальности очень важна, поскольку на основе статуса нормальности решаются меры центральной тенденции, дисперсии и выбора параметрического/непараметрического теста. Хотя существуют различные методы для проверки нормальности, но для небольшого размера выборки (n <50), тест Шапиро–Уилка, так как он имеет больше власти, чтобы обнаружить норму и это наиболее популярный и широко используемый метод. Когда наши выборки (н) составляет не менее 50, любые другие способы (тест Колмогорова–Смирнова, коэффициент асимметрии, эксцесс, Z-значение асимметрии и эксцесса, гистограммы, диаграммы, р–р земельный участок, М–м участке, и SD по отношению к виду) можно использовать для проверки нормальности непрерывных данных.
Описательная статистика является важной частью биомедицинских исследований, которая используется для описания основных особенностей данных в исследовании. Они предоставляют простые резюме о выборке и мерах. Для описания количественных данных используются показатели центральной тенденции и дисперсии. Для непрерывных данных проверка нормальности является важным этапом для принятия решения о мерах центральной тенденции и статистических методах анализа данных. Когда наши данные следуют нормальному распределению, параметрические тесты в противном случае непараметрические методы используются для сравнения групп. Существуют различные методы, используемые для проверки нормальности данных, в том числе численные и визуальные методы, и каждый метод имеет свои преимущества и недостатки.
Фрагмент текста работы:
1. Определение понятия дескриптивная (описательная) статистика
Набор данных — это совокупность данных по отдельным случаям или субъектам. Обычно нет смысла представлять такие данные по отдельности, поскольку это не приведет к каким-либо важным выводам. Вместо индивидуальной презентации кейса мы представляем сводную статистику нашего набора данных с аналитической формой или без нее, которая может быть легко усвоена аудиторией. Статистика, представляющая собой науку о сборе, анализе, представлении и интерпретации данных, имеет две основные ветви: описательную статистику и статистику умозаключений.[1]
Сводные показатели или сводные статистические данные или описательные статистические данные используются для обобщения набора наблюдений, с тем, чтобы как можно проще передать наибольший объем информации. Описательная статистика-это вид информации, представленный всего в нескольких словах, для описания основных характеристик данных в исследовании, таких как среднее и стандартное отклонение (SD).[2,3]
Другая — это статистика умозаключений, которая делает выводы из данных, подверженных случайному изменению (например, ошибки наблюдений и выборочное изменение). В инфинитивной статистике большинство прогнозов делается на будущее и обобщения о популяции путем изучения меньшей выборки.[2,4] Чтобы сделать вывод из участников исследования с точки зрения различных групп и т.д., используются статистические методы. Эти статистические методы имеют некоторые допущения, включая нормальность непрерывных данных. Существуют различные методы, используемые для проверки нормальности данных, в том числе численные и визуальные методы, и каждый метод имеет свои преимущества и недостатки.[5] Описательная статистика и статистика умозаключений используются в научном анализе данных и в равной степени важны в статистике.