Меры связанности для переменных с номинальной шкалой
Коэффициент корреляции нельзя применять в качестве характеристики зависимости между переменными, если эти переменные принадлежат к номинальной шкале и имеют более двух категорий, потому что между их кодировками невозможно установить порядкового отношения и, следовательно, они не могут быть расположены в определенном, рационально объяснимом порядке.
Наилучшим средством для анализа таких зависимостей считается представленный в разделе 11.3.1 тест хи-квадрат, после которого при необходимости можно провести анализ наблюдаемых и ожидаемых частот, а также нормированных остатков. Этот анализ был описан в разделе 8.7.2.
Тем не менее и в этом случае также производились попытки разработать критерии количественной оценки степени связанности двух переменных, поставленных во взаимное соответствие. Эти критерии показывают степень взаимной зависимости или независимости двух переменных, принадлежащих к с номинальной шкале, причем значение 0 соответствует полной независимости переменных, а 1 – их максимальной зависимости. Меры связанности не могут иметь отрицательных значений, так как при отсутствии порядкового отношения нельзя дать ответа на вопрос о направлении зависимости.
В опросе членов городской организации одной из политических партий среди прочего выяснялось их занятие и определялось, выполняет ли респондент какую-либо партийную функцию. Выдержка из ответов респондентов-мужчин содержится в файле partei.sav.
- Загрузите файл partei.sav и создайте таблицу сопряженности с переменной funk в строках и переменной beruf в столбцах.
- Задайте вывод ожидаемых частот, стандартизованных остатков, процентов по столбцам и критерия хи-квадрат.
Занятие * Партийная работа. Crosstabulation (Таблица сопряженности)
Занятие | Total | |||||
Наемный работник | Государственный служащий | Предприниматель | ||||
Партийная работа | да | Count | 13 | 16 | 7 | 36 |
Expected Count | 12.4 | 10.1 | 13.5 | 36.0 | ||
% от Занятие | 59.1% | 88.9% | 29.2% | 56.3% | ||
Std. Residual | 0.2 | 1.8 | -1.8 | |||
нет | Count | 9 | 2 | 17 | 28 | |
Expected Count | 9.6 | 7.9 | 10.5 | 28.0 | ||
% от Занятие | 40.9% | 11.1% | 70.8% | 43.8% | ||
Std. Residual | -0.2 | -2.1 | 2.0 | |||
Total | Count | 22 | 18 | 24 | 64 | |
Expected Count | 22.0 | 18.0 | 24.0 | 64.0 | ||
% от Занятие | 100.0% | 100.0% | 100.0% | 100.0% |
Chi-Square Tests
Value | df | Asymp. Sig. (2-sided) | |
Pearson Chi-Square (Критерий хи-квадрат по Пирсону) | 15.01 7(a) | 2 | 0.001 |
Likelihood Ratio (Отношение правдоподобия) | 16.421 | 2 | 0.000 |
Li near-by-Li near Association (Зависимость линейный-линейный) | 4.420 | 1 | 0.036 |
N of Valid Cases | 64 |
- а. и cells (,0%) have expected count less than 5. The minimum expected count is 11.50. (0 ячеек (,0%) имеют ожидаемую частоту менее 5. Минимальная ожидаемая частота 7.88.)
Результат получился максимально значимым: участие в партийной работе весьма характерно для государственных служащих, а для предпринимателей – совсем не характерно, тогда как наемные работники находятся посредине. Теперь зададим (кнопкой Statistics…) вывод всех мер связанности для переменных, принадлежащих к номинальной шкале (флажки в группе Nominal).
Directional Measures (Направленные меры)
Value | Asympt. Std. Error(a) | Approx. Т(b) | Approx .sig. | |||
Nominal by Nominal (Номинальный-номинальный) | Lambda (Лямбда) | Symmetric (Симметрическая) | 0.279 | 0.104 | 2.554 | 0.011 |
Партийная работа Dependent (B зависимости от Партийная работа) | 0.357 | 0.140 | 0.211 | 0.035 | ||
Занятие Dependent (В зависимости от Занятие) | 0.225 | 0.106 | 1.930 | 0.054 | ||
Goodman and Kruskal tau (Tay Гудмена-Крускала) | Партийная работа Dependent | 0.235 | 0.093 | 0.001(c) | ||
Занятие Dependent | 0.116 | 0.051 | 0.001(c) | |||
Uncertainty Coefficient (Коэффициент неопределенности) | Симметричный | 0.144 | 0.063 | 2.269 | 0.000(d) | |
Партийная работа Dependent | 0.187 | 0.082 | 2.269 | 0.000(d) | ||
Занятие Dependent | 0.118 | 0.052 | 2.269 | 0.000(d) |
- a. Not assuming the null hypothesis (Нулевая гипотеза не принимается).
- b. Using the asymptotic standard error assuming the null hypothesis (Используется асимптотическая стандартная ошибка с принятием нулевой гипотезы).
- с. Based on chi-square approximation (На основе аппроксимации по распределению хи-квадрат).
- d. Likelihood ratio chi-square probability (Степень правдоподобия при распределении вероятности по закону хи-квадрат).