Коэффициенты корреляции
До сих пор мы выясняли лишь сам факт существования статистической зависимости между двумя признаками. Далее мы попробуем выяснить, какие заключения можно сделать о силе или слабости этой зависимости, а также о ее виде и направленности. Критерии количественной оценки зависимости между переменными называются коэффициентами корреляции или мерами связанности. Две переменные коррелируют между собой положительно, если между ними существует прямое, однонаправленное соотношение. При однонаправленном соотношении малые значения одной переменной соответствуют малым значениям другой переменной, большие значения – большим. Две переменные коррелируют между собой отрицательно, если между ними существует обратное, разнонаправленное соотношение. При разнонаправленном соотношении малые значения одной переменной соответствуют большим значениям другой переменной и наоборот. Значения коэффициентов корреляции всегда лежат в диапазоне от -1 до +1.
В качестве коэффициента корреляции между переменными, принадлежащими порядковой шкале применяется коэффициент Спирмена, а для переменных, принадлежащих к интервальной шкале – коэффициент корреляции Пирсона (момент произведений). При этом следует учесть, что каждую дихотомическую переменную, то есть переменную, принадлежащую к номинальной шкале и имеющую две категории, можно рассматривать как порядковую.
Для начала мы проверим существует ли корреляция между переменными sex и psyche из файла studium.sav. При этом мы учтем, что дихотомическую переменную sex можно считать порядковой. Выполните следующие действия:
- Выберите в меню команды Analyze (Анализ) › Descriptive Statistics (Дескриптивные статистики) › Crosstabs… (Таблицы сопряженности)
- Перенесите переменную sex в список строк, а переменную psyche – в список столбцов.
- Щелкните на кнопке Statistics… (Статистика). В диалоге Crosstabs: Statistics установите флажок Correlations (Корреляции). Подтвердите выбор кнопкой Continue.
- В диалоге Crosstabs откажитесь от вывода таблиц, установив флажок Supress tables (Подавлять таблицы). Щелкните на кнопке ОК.
Будут вычислены коэффициенты корреляции Спирмена и Пирсона, а также проведена проверка их значимости:
Symmetric Measures (Симметричные меры)
Value (Значение) | Asympt. Std. Error(а) Асимптотическая стандартная ошибка) | Approx. Т(b) (Приблиз. Т) | Approx. Sig. (Приблизительная значимость) | ||
Interval by Interval (Интервальный – интервальный) | Pearson's R (R Пирсона) | 0.441 | 0.081 | 5.006 | 0.000(с) |
Ordinal by Ordinal (Порядковый – порядковый) | Spearman Correlation (Корреляци я по Спирмену) | 0.439 | 0.083 | 4.987 | 0.000(с) |
N of Valid Cases (Кол-во допустимых случаев) | 106 |
- a. Not assuming the null hypothesis (Нулевая гипотеза не принимается).
- b. Using the asymptotic standard error assuming the null hypothesis (Используется асимптотическая стандартная ошибка с принятием нулевой гипотезы).
- с. Based on normal approximation (На основе нормальной аппроксимации).
Так как здесь нет переменных с интервальной шкалой, мы рассмотрим коэффициент корреляции Спирмена. Он составляет 0.439 и является максимально значимым (р<0.001).
Для словесного описания величин коэффициента корреляции применяется следующая таблица:
Значение коэффициента корреляции r | 0 < г <= 0.2 | 0.2 < г <= 0.5 | 0.5 < г <= 0.7 | 0.7 < г <= 0.9 | 0.9 < г <= 1 |
Интерпретация | Очень слабая корреляция | Слабая корреляция | Средняя корреляция | Сильная корреляция | Очень сильная корреляция |
Исходя из вышеприведенной таблицы, можно сделать следующие заключения: Между переменными sex и psyche существует слабая корреляция (заключение о силе зависимости), переменные коррелируют положительно (заключение о направлении зависимости).
В переменной psyche меньшие значения соответствуют отрицательному психическому состоянию, а большие – положительному. В переменной sex, в свою очередь, значение "1" соответствует женскому полу, а "2" – мужскому.
Следовательно, однонаправленность соотношения можно интерпретировать следующим образом: студентки оценивают свое психическое состояние более негативно, чем '.х коллеги-мужчины или, что вероятнее всего, в большей степени склонны согласиться на такую оценку при проведении анкетирования. Строя подобные интерпретации, нужно учитывать, что корреляция между двумя признаками не обязательно равнозначна их Функциональной или причинной зависимости. Подробнее об этом см. в разделе 15.3.
Теперь проверим корреляцию между переменными alter и semester. Применим методику, описанную выше. Мы получим следующие коэффициенты:
Symmetric Measures
Value | Asympt. Std. Error(a) | Approx. Т(b) | Approx. Sig. | ||
Interval by Interval | Pearson's R | 0.807 | 0.041 | 13.930 | <0.000(c) |
Ordinal by Ordinal | Spearman Correlation | 0.743 | 0.060 | 11.310 | 0.000(c) |
N of Valid Cases | 106 |
- a. Not assuming the null hypothesis (Нулевая гипотеза не принимается).
- э. Using the asymptotic standard error assuming the null hypothesis (Используется асимптотическая стандартная ошибка с принятием нулевой гипотезы).
- с. Based on normal approximation (На основе нормальной аппроксимации).
Так как переменные alter и semester являются метрическими, мы рассмотрим коэффициент Пирсона (момент произведений). Он составляет 0.807. Между переменными alter и semester существует сильная корреляция. Переменные коррелируют положительно. Следовательно, старшие по возрасту студенты учатся на старших курсах, что, собственно, не является неожиданным выводом.
Проверим на корреляцию переменные sozial (оценку социального положения) и psyche. Мы получим следующие коэффициенты:
Symmetric Measures
Value | Asympt. Std. Error(a) | Approx. Т(b) | Approx. Sig. | ||
Interval by Interval | Pearson's R | -0.688 | 0.057 | -9.703 | 0.000(c) |
Ordinal by Ordinal | Spearman Correlation | -0.703 | 0.059 | -10.123 | 0.000(c) |
N of Valid Cases | 107 |
- a. Not assuming the null hypothesis (Нулевая гипотеза не принимается).
- b. Using the asymptotic standard error assuming the null hypothesis (Используется асимптотическая стандартная ошибка с принятием нулевой гипотезы).
- с. Based on normal approximation (На основе нормальной аппроксимации).
В этом случае мы рассмотрим коэффициент корреляции Спирмена; он составляет – 0.703. Между переменными sozial и psyche существует средняя или сильная корреляция (граничное значение 0.7). Переменные коррелируют отрицательно, то есть чем больше значения первой переменной, тем меньше значения второй и наоборот. Так как малые значения переменной sozial характеризуют позитивное состояние (1 = очень хорошее, 2 = хорошее), а большие значения psyche – отрицательное состояние (1 = крайне неустойчивое, 2 = неустойчивое), следовательно, психологические затруднения во многом обусловлены социальными проблемами.