Описательная статистика
Материал из MachineLearning.
Описательная статистика — один из разделов статистической науки, в рамках которого изучаются методы описания и представления основных свойств данных. Позволяет обобщать первичные результаты, полученные при наблюдении или в эксперименте. Применение описательной статистики включает следующие этапы:
- Сбор данных
- Категоризация данных
- Обобщение данных
- Представление данных
Для более глубоких выводов о природе рассматриваемых данных используется индуктивная статистика.
В рамках описательной статистики применяются следующие простейшие техники:
- Графическое представление данных.
- Табличное представление данных.
- Использование обобщающих статистик, таких, как математическое ожидание, медиана, дисперсия и т.д.
Обобщающие статистики используются для решения двух основных задач:
- Показать общее в характере совокупности данных.
- Показать, в чём и насколько данные различны.
При обобщении количественных величин, таких, как длина, вес или возраст, для решения первой задачи чаще всего применяются среднее арифметическое, медиана или мода, если распределение унимодально. Используются так же квантили – числовые характеристики функции распределения. Для решения второй задачи применяют такие меры неоднородности данных, как дисперсия, квадратный корень из дисперсии – стандартное отклонение, интерквантильный размах, стандартная ошибка среднего.