Пример из области биологии (три группы)
В предыдущих примерах дискриминантный анализ всегда проводился при наличии лишь двух групп. В этой главе рассматривается пример, в котором групповая переменная имеет больше двух категорий, а именно три.
В файле kaefer.sav содержатся данные о длине и ширине грудной клетки трех видов жуков (обозначенных как А, В и С). Если вы проведете однофакторный дисперсионный анализ с последующими дополнительными тестами (Post-hoc-Tests), то увидите, что три разновидности жуков очень значимо различаются между собой как по длине, так и по ширине, поэтому вполне можно предположить, что этих жуков можно классифицировать между упомянутыми видами на основании их длины и ширины посредством дискриминантного анализа.
- Откройте файл kaefer.sav.
Вы увидите, что 17 жуков из 30 не отнесены ни к иной из групп; поэтому классификация жуков по группам должна быть произведена при помощи дискриминантного анализа.
- В диалоговом окне Discriminant Analysis (Дискриминантный анализ) переменной kaefer (Жук) присвойте статус групповой переменной с пределами от 1 до 3, а переменным laenge (Длина) и breite (Ширина) статус независимых переменных. Оставьте активной установку по умолчанию Enter independents together (Независимые переменные вводить одновременно).
- В диалоговом окне Discriminant Analysis: Statistics (Дискриминантный анализ: Статистики) в разделе Descriptives (Дискриптивние статистики) активируйте опции: Means (Средние значения), Univariate ANOVAs (Одномерные тесты ANOVA) и в разделе Function Coefficients (Коэффициенты функции) опцию Unstandardized (Не стандартизированные).
- В диалоговом окне Discriminant Analysis: Classify (Дискриминантный анализ: Классифицировать) сделайте запрос на Case-wise results (Результаты для отдельных наблюдений) и Summary table (Сводную таблицу) и в разделе Plots (Графики) активируйте опцию Territorial map (Территориальная карта). Эта опция служит для построения классификационной диаграммы, так называемой территориальной карты (Territorial map). Построение этой диаграммы типично для случая с более чем двумя группами.
- В заключение, в диалоговом окне Discriminant Analysis: Save (Дискриминантный анализ: Сохранить), активируйте все опции, находящиеся там, с целью создания соответствующих переменных в исходном файле.
Из всей гаммы приводимых результатов расчета мы рассмотрим только самые важные. Из групповых статистик можно узнать, что в семейство А входят самые большие, а в семейство В самые маленькие жуки.
Group Statistics (Статистики для групп)
KAEFEP (Жук) | Mean (Среднее значение) | Std. Deviation (Стандартное отклонение) | Valid N (listwise) (Действительные значения (по списку)) | ||
Unweighted (Не взвешенное) | Weighted (Взвешенное) | ||||
1 (Семейство А) | LAENGE (Длина) | 1.6226 | 5.968e-02 | 42 | 42.000 |
BREITE (Ширина) | 1.2607 | 4J54E-02 | 42 | 42.000 | |
2 Семейство В) | LAENGE (Длина) | 1.3089 | 7.634e-02 | 45 | 45.000 |
BREITE (Ширина) | 1.0122 | 4.415e-02 | 45 | 45.000 | |
3 Семейство С) | LAENGE (Длина) | 1.4788 | 6.029e-02 | 26 | 26.000 |
BREITE (Ширина) | 1.1192 | 5.114e-02 | 26 | 26.000 | |
Total | LAENGE (Длина) | 1.4646 | 0.1535 | 113 | 113.000 |
BREITE (Ширина) | 1.1292 | 0.1191 | 113 | 113.000 |
Статистика Лямбда Уилкса (>i) свидетельствует о том, что жуки очень значимо делятся на группы как по длине, так и по ширине.
Tests of Equality of Group Means (Тест на равенство средних значений групп)
Wilks' Lambda (Лямбда Уилкса) | F | df1 | df2 | Sig. (Значимость) | |
LAENGE (Длина) | 0.187 | 239.154 | 2 | 110 | 0.000 |
BREITE (Ширина) | 0.153 | 303.326 | 2 | 110 | 0.000 |
Если насчитывается более двух классификационных групп, то можно образовать больше одной дискриминантной функции; при трех группах, как в приведенном примере, их будет две.