Лекция 12. Корреляционный анализ. Коэффициент корреляции

Корреляционный анализ - метод, позволяющий обнаружить зависимость между несколькими случайными величинами.

Допустим, проводится независимое измерение различных параметров у одного типа объектов. Из этих данных можно получить качественно новую информацию - о взаимосвязи этих параметров.

Например, измеряем рост и вес человека, каждое измерение представлено точкой в двумерном пространстве:

положительная корреляция роста и веса

Несмотря на то, что величины носят случайный характер, в общем наблюдается некоторая зависимость - величины коррелируют.

В данном случае это положительная корреляция (при увеличении одного параметра второй тоже увеличивается). Возможны также такие случаи:

Отрицательная корреляция:

отрицательная корреляция

Отсутствие корреляции:

отсутствие корреляции

Взаимосвязь между переменными необходимо охарактеризовать численно, чтобы, например, различать такие случаи:

низкая корреляция

высокая корреляция

Для этого вводится коэффициент корреляции. Он рассчитывается следующим образом:

Есть массив из n точек {x1,i, x2,i}

Рассчитываются средние значения для каждого параметра: средние значения

И коэффициент корреляции: коэффициент корреляции

r изменяется в пределах от -1 до 1. В данном случае это линейный коэффициент корреляции, он показывает линейную взаимосвязь между x1 и x2: r равен 1 (или -1), если связь линейна.

Коэффициент r является случайной величиной, поскольку вычисляется из случайных величин. Для него можно выдвигать и проверять следующие гипотезы:

1. Коэффициент корреляции значимо отличается от нуля (т.е. есть взаимосвязь между величинами):

Тестовая статистика вычисляется по формуле:

критерий значимого отличия от нуля

и сравнивается с табличным значением коэффициента Стьюдента t(p = 0.95, f = бесконечность) = 1.96

Если тестовая статистика больше табличного значения, то коэффициент значимо отличается от нуля. По формуле видно, что чем больше измерений n, тем лучше (больше тестовая статистика, вероятнее, что коэффициент значимо отличается от нуля)

2. Отличие между двумя коэффициентами корреляции значимо:

Тестовая статистика:

сравнение двух коэффициентов корреляции

Также сравнивается с табличным значением t(p,бесконечность)

Методами корреляционного анализа решаются следующие задачи:

1) Взаимосвязь. Есть ли взаимосвязь между параметрами?

2) Прогнозирование. Если известно поведение одного параметра, то можно предсказать поведение другого параметра, коррелирующего с первым.

3) Классификация и идентификация объектов. Корреляционный анализ помогает подобрать набор независимых признаков для классификации.

лекции читает А.В.Гармаш, химический факультет МГУ

корреляция

Получила коэффициеент корреляции Пирсона, где взять таблицу значений коэффициентов (выборка из 40 чел, при каком коэффициенте можно говорить о взаимосвязи)? заранее спасибо!!!

Коэффициент корреляции

Скажите, пожалуйста, могу ли я вычислять коэффициент корреляции от 10 пар значений?

Дата: 16 февраля 2013



 

Добавить комментарий

Имя

E-mail

Комментарий

Контрольный вопрос:
Сколько будет: 8*7-2