Тест Колмогорова-Смирнова для проверки формы распределения
При помощи этого теста по выбору можно проверить, соответствует ли реальное распределение переменной нормальному, равномерному, экспоненциальному распределению или распределению Пуассона. Разумеется, самым распространенным видом проверки является проверка наличия нормального распределения.
Чтобы продемонстрировать работу данного теста, проверим на предмет наличия нормального распределения исходные значения холестерина, то есть переменную cho10 из файла hyper.sav.
- Откройте файл hyper.sav.
- Выберите в меню Analyze (Анализ) › Nonparametric Tests (Непараметрические тесты) › 1-Sample KS (К-С одной выборки)
Появится диалоговое окно One Sample Kolomgorov-Smirnov Test (Тест Колмогорова-Смирнова для одной выборки) (см. рис. 4.5).
- Перенесите переменную cho10 в поле тестируемых переменных.
- Если Вы щелкните на кнопке Options… (Опции), то сможете дополнительно организовать вывод характеристик дескриптивной статистики и квартилей.
- Щелкните на ОК.
Рис. 14.5: Диалоговое окно One Sample Kolomgorov-Smirnov Test (Тест Колмогорова-Смирнова для одной выборки)
Предварительно установленной является проверка на нормальное распределение. В окне просмотра появятся следующие результаты:
One-Sample Kolmogorov-Smirnov Test (Тест Колмогорова-Смирнова для одной выборки)
Cholesterin, Ausgangswert (Холестерин, исходная величина) | ||
N | 174 | |
Normal Parameters (Параметр нормального распределения)а, b | Mean (Среднее значение) | 237.27 |
Std. Deviation (Стандартное отклонение) | 49.42 | |
Most Extreme Differences (Экстремальные разности) | Absolute (Абсолютные) | 0.057 |
Positive (Положительные) | 0.057 | |
Negative (Отрицательные) | -0.046 | |
Z Колмогорова-Смирнова | 0.756 | |
Asymp. Sig. (2-tailed) (Статистическая значимость (2-сторонняя)) | 0.616 |
- a. Test distribution is Normal. (Тестируемое распределение является нормальным распределением.)
- b. Calculated from data. (Рассчитано исходя из исходных данных.)
Полученные результаты включают:
- среднее значение и стандартное отклонение
- промежуточные результаты, полученные в результате теста Колмогорова-Смирнова
- вероятность ошибки р.
Отклонение от нормального распределения считается существенным при значении р < 0.05; в этом случае для соответствующих переменных следует применять непараметрические тесты. В рассматриваемом примере (значение р = 0.616), то есть вероятность ошибки является не значимой; поэтому значения переменной достаточно хорошо подчиняются нормальному распределению.