Описательная статистика
Описательная статистика или дескриптивная статистика (англ. descriptive statistics) занимается обработкой эмпирических данных, их систематизацией, наглядным представлением в форме графиков и таблиц, а также их количественным описанием посредством основных статистических показателей.
Противопоставляется статистическому выводу в том смысле, что не делает выводов о генеральной совокупности на основании результатов исследования частных случаев. Статистический вывод же предполагает, что свойства и закономерности, выявленные при исследовании объектов выборки, также присущи генеральной совокупности.
Методы агрегирования данных
Описательная статистика использует три основных метода агрегирования данных:
- Табличное представление
- Графическое изображение
- Расчет статистических показателей
Табличное представление
Статистическая таблица — система строк и столбцов, в которой в определенной последовательности излагается статистическая информация о социально-экономических явлениях.
Сводные статистические характеристики
Есть две основные формы описания случайной величины: функция распределения и плотность вероятности (одна дифференциальная, другая интегральная).
Сводные статистические характеристики — это дополнительные или альтернативные описатели гистограмм и кумулятивных распределений.
Статистические характеристики — это сводные значения, которые рассчитывается на основе выборки наблюдений, которые обычно, но необязательно является оценкой некоторого параметра совокупности.
Как правило сводная статистика подразделяются на три категории:
- меры местоположения или центрированности (если распределение симметричное все три характеристики равны друг другу)
- Среднее значение
- Математическое ожидание
- Медиана (не подвержена "выбросам", инструмент для избавления от "выбросов")
- Мода
- меры разброса или рассеивания/местоположения
- Дисперсия случайной величины - средний квадрат от среднего, так как квадратичная мера наименее надежна (как среднее не явл. устойчивой характеристикой так и дисперсия, "выбросы сказываются" на дисперсии)
- Среднеквадратическое отклонение (практически равна дисперсии)
- Минимум, Максимум(экстремальные значения)
- Интерквантильный размах
- Размах вариации
- Интервал
- Доверительный интервал
- меры формы
Дискретные и непрерывные распределения
Распределение бывает как дискретным, так и непрерывным. В случае дискретного распределения, это такое распределение, когда вероятность каждого из значений случайной величины одна и таже. Если есть N количество возможных значений.
Пример моделирования равномерного распределения. Стоим на остановке, там есть интервал движения 10 минут. В каждый случайный момент (когда подходим к остановке) вероятность того, что автобус пойдет в течение 1 минуты 1/10. А вероятность того, что автобус пойдет в течение 4 минут? Точно такая же - 1/10. Чтобы задать случайную величину нужно задать плотность распределения вероятности на данном отрезке.
См. также
Литература
- Елисеева И. И., Юзбашев М. М. Общая теория статистики: Учебник / Под ред. И. И. Елисеевой. — 5-е изд., перераб. и доп. — М.: Финансы и статистика, 2004. — 656 с: ил. ISBN 5-279-02414-7
- Bol, Georg. Deskriptive Statistik. — Oldenbourg: Oldenburg Verlag, 2004. — ISBN 3-486-57612-7. (нем.)
- Аладьев В. З., Харитонов В. Н. Курс общей теории статистики. — Palo Alto: Fultus Books, 2006. — 250 с: ил. ISBN 1-59682-086-1