Сравнение двух независимых выборок. U-тест по методу Манна и Уитни.
В этом разделе описано четыре теста. Наиболее часто применяемым является U-тест Манна и Уитни, который поэтому и будет представлен в первую очередь.
Это самый известный и самый распространенный тест непараметрического сравнения двух независимых выборок. Он основан на использовании одной общей последовательности значений обоих выборок.
Мы хотим проверить, отличаются ли показатели сахара в крови для мужчин и женщин в примере об исследовании гипертонии (файл hyper.sav).
Если Вы построите гистограмму показателя сахара в крови (переменная bz0), то заметите явную деформацию распределения в левую сторону. Тест Колмогорова-Смирнова (см. гл. 14.5) также показывает очень значительное отклонение от нормального распределения. Стало быть, для сравнения обоих выборок следует вместо t-теста Стьюдента применить U-тест по методу Манна и Уитни.
- Откройте файл hyper.sav.
- Выберите в меню Analyze (Анализ) › Nonparametric Tests (Непараметрические тесты) › 2 Independent Samples… (Две независимые выборки)
Появится диалоговое окно Two Independent Samples Tests (Тесты для двух независимых выборок) (см. рис. 14.1).
U-тест по методу Манна и Уитни является предварительной установкой.
- Перенесите переменную bz0 из поля исходных переменных в поле тестируемых переменных, а переменную g в поле групповых переменных.
- После щелчка на кнопке Define Groups (Определить группы). Вы получите возможность внести коды (1 – мужской и 2 – женский), необходимые для идентификации групп.
- После щелчка на Continue Вы опять попадаете в исходное диалоговое окно.
- Запустите программу вычисления путем нажатия на ОК.
В окне просмотра появятся следующие результаты:
Рис. 14.1: Диалоговое окно Two Independent Samples Tests (Тесты для двух независимых выборок)
Ранги
Пол | N | Mean Rank (Усредненный ранг) | Sum of Ranks (Ранговая сумма) | |
Blutzucker, Ausgangswert (Сахар, исходное значение) | maennlich (Мужской) | 59 | 81.66 | 4818.00 |
weiblich Женский | 115 | 90.50 | 10407.00 | |
Total (Сумма) | 174 |
Статистика тестаа
Blutzucker, Ausgangswert (Сахар, исходное значение) | |
Mann-Whitney U jU-тест по Манну и Уитни) | 3048.000 |
W Уилкоксона | 4818.000 |
Z | -1.096 |
Asymp. Sig. (2-tailed) Асимптотическая значимость (2-сторонняя) | 0.273 |
- a Grouping Variable: Geschlecht (Групповая переменная: пол).
Выведенные результаты включают следующие показатели:
- количество наблюдений, усредненные ранги и ранговая сумма для двух выборок (причем большим значениям присваиваются низшие ранговые места),
- тестовую величину U, определенную с помощью теста Манна и Уитни,
- наименьшее значение из обоих ранговых сумм (W-тест Уилкоксона),
- точное значение вероятности ошибки р при количестве наблюдений менее 30 и
- тестовую величину z, определенную по тесту Колмогорова-Смирнова, а также относящуюся к ней вероятность ошибки р, которую следует использовать при количестве наблюдений более 30.
Выясняется, что в рассматриваемом примере разница показателей сахара в крови между полами не является статистически значимой (р = 0.273).
Нажав кнопку Options, Вы можете выбрать дополнительные возможности вывода данных, относящихся к рассмотренному и к другим непараметрическим тестам. Наряду с обычной обработкой пропущенных значений, можно организовать расчет дескриптивных статистик (среднее значение, минимум, максимум, стандартное отклонение, количество наблюдений) и квартилей (25, 50 и 75 процентили). Однако в этом случае характеристики дескриптивной статистики будут определяться одновременно для тестируемых и группирующих переменных. Это абсолютно бесполезно, так как в данном случае дескриптивная статистика имеет смысл только для тестируемых переменных, разбитых на группы по группирующим переменным. К сожалению, данная ошибка не была исправлена и в 10 версии SPSS.
В рассмотренном примере проведения U-теста был бы также очень полезен расчет медиан обеих групп. Медианы определяются с помощью других средств SPSS. В нашем примере медиана показателя сахара для мужчин равна 93, а для женщин 97.