Лекция 7. Проверка статистической гипотезы
Статистическая гипотеза - некоторое предположение о законе распределения случайной величины или о параметрах этого закона в рамках данной выборки.
Пример статистической гипотезы: "генеральная совокупность распределена по нормальному закону", "различие между дисперсиями двух выборок незначимо" и т.д.
При аналитических расчетах часто необходимо выдвигать и проверять гипотезы. Проверка статистической гипотезы осуществляется с помощью статистического критерия в соответствии со следующим алгоритмом:
Метод проверки статистической гипотезы:
1. Формулировка гипотезы
Гипотеза формулируется в терминах различия величин. Например, есть случайная величина x и константа a. Они не равны (арифметически), но нужно установить, значимо ли статистически между ними различие?
Существует два типа критериев:
1) двухсторонний критерий вида:
2) односторонний критерий вида: или
Необходимо отметить, что знаки >, <, = здесь используются не в арифметическом, а в "статистическом" смысле. Их необходимо читать "значимо больше", "значимо меньше", "различие незначимо".
2. Установка закона распределения
Далее необходимо установить или постулировать закон распределения. Подробнее о проверке вида распределения - в следующих лекциях.
Существуют также критерии, которые не зависят от вида распределения - так называемые непараметрические критерии.
3. Вычисление тестовой статистики
Тестовая статистика - некоторая функция от рассматриваемых величин, закон распределения которой точно известен и ее можно сравнить с табличным значением. Например, при сравнении двух дисперсий по критерию Фишера (см. лекцию 4) тестовая статистика вычисляется по следующей формуле:
4. Сравнение с табличным значением
Затем тестовая статистика сравнивается с табличным значением
Тестовая статистика всегда зависит от доверительной вероятности, и, в некоторых случаях, от дополнительных параметров. Так, в приведенном выше примере сравнения двух дисперсий тестовая статистика сравнивается с табличным значением критерия Фишера ("критическим" значением), которое зависит от доверительной вероятности p и числа степеней свободы дисперсий f1 и f2.
5. Вывод
На основании сравнения делается вывод о том, выполняется ли гипотеза (например, значимо ли различие и т.д.)
Примеры статистических гипотез:
Сравнение случайной (нормально распределенной величины) и константы - критерий Стьюдента
Сравнение двух случайных (нормально распределенных величин) - критерий Стьюдента
Сравнение двух дисперсий - критерий Фишера
лекции читает А.В.Гармаш, химический факультет МГУ
Дата: 16 января 2013