Пример из области биологии
Дискриминантный анализ очень часто применяется для обработки данных из области биологии. В следующем типичном примере для некоторого количества индивидуумов принадлежность к группе уже известна, на основании чего и строится дискриминантная функция. Далее она используется для того, чтобы оценить принадлежность к определенной группе тех индивидуумов, для которых она еще не известна.
В файле vogel.sav хранятся данные о половой принадлежности, длине крыла, длине клюва, размере головы, длине лап и весе 245 птиц определенного вида. Причем пол смогли определить только для 51 особи. Кодировка пола соответствует 1 = мужской и 2 = женский; отсутствие данных кодируется 9.
Если для перечисленных параметров Вы рассчитаете средние значения для самцов и самок, то для самок получите более высокие показатели. Исходя из этого, при помощи дискриминантного анализа можно попытаться определить пол тех особей, для которых этого нельзя было сделать ранее.
- Откройте файл vogel.sav.
- В диалоговом окне Discriminant Analysis (Дискриминантный анализ) переменной geschl (Пол) присвойте статус групповой переменной с пределами от 1 до 2, а переменным fluegel (Длина крыла), schnl (Длина клюва), kopfl (Размер головы), fuss (Длина лап) и gew (Вес) – статус независимых переменных. Выберите пошаговый метод.
- В диалоговом окне Discriminant Analysis: Classify (Дискриминантный анализ: Классифицировать) активируйте Casewise results (Результаты для отдельных наблюдений) с ограничением в 40 наблюдений и Summary table (Сводная таблица).
- Через выключатель Save… (Сохранить) при помощи активирования опций Predicted group membership (Прогнозируемая принадлежности к группе) и Probabilities of group membership (Вероятности принадлежности к группе) затребуйте генерирование соответствующих переменных.
Casewise Statistics (Статистики для наблюдений)
Case Number (Номер случая) | Actual Group (Фактическая группа) | Highest Group (Старшая группа) | Second Highest Group (Вторая по старшинству группа) | Discriminant Scores (Значения дискри-минантной функции) | |||||||
Predicted Group (Прогно-зируемая группа) | P(D>d I e=g) | P(G=9 I D=d) | Squared Mahalanobis Distance to Centraid (Квадрат расстояния Махала-нобиса до центроида) | Group (Группа) | P(G=g | D=d) | Squared Маhalanobis Distance to Centraid (Квадрат расстояния Махала-нобиса до центроида) | Function 1 (Функция 1) | ||||
P | df | ||||||||||
1 | ungrouped (не группированный) | 2 | 0.222 | 1 | 0.990 | 1.489 | 1 | 0.010 | 10.679 | 2.304 | |
2 | ungrouped (не группированный) | 2 | 0.063 | 1 | 0.997 | 3.453 | 1 | 0.003 | 15.254 | 2.942 | |
3 | ungrouped (не группированный) | 2 | 0.064 | 1 | 0.997 | 3.433 | 1 | 0.003 | 15.213 | 2.937 | |
4 | ungrouped (не группированный) | 2 | 0.245 | 1 | 0.989 | 1.353 | 1 | 0.011 | 10.307 | 2.247 | |
5 | ungrouped (не группированный) | 2 | 0.126 | 1 | 0.995 | 2.338 | 1 | 0.005 | 12.792 | 2.613 | |
6 | ungrouped (не группированный) | 2 | 0.319 | 1 | 0.984 | 0.995 | 1 | 0.016 | 9.271 | 2.081 | |
7 | ungrouped (не группированный) | 2 | 0.485 | 1 | 0.971 | 0.489 | 1 | 0.029 | 7.543 | 1.783 | |
8 | 2 | 2 | 0.102 | 1 | 0.996 | 2.673 | 1 | 0.004 | 13.561 | 2.719 | |
9 | ungrouped (не группированный) | 2 | 0.387 | 1 | 0.980 | 0.748 | 1 | 0.020 | 8.482 | 1.949 | |
10 | ungrouped (не группированный) | 2 | 0.576 | 1 | 0.721 | 0.313 | 1 | 0.279 | 2.213 | 0.524 | |
11 | ungrouped (не группированный) | 2 | 0.651 | 1 | 0.954 | 0.205 | 1 | 0.046 | 6.248 | 1.536 | |
12 | ungrouped (не группированный) | 2 | 0.140 | 1 | 0.994 | 2.177 | 1 | 0.006 | 12.411 | 2.559 | |
13 | ungrouped (не группированный) | 2 | 0.435 | 1 | 0.976 | 0.609 | 1 | 0.024 | 7.995 | 1.864 | |
14 | ungrouped (не группированный) | 2 | 0.471 | 1 | 0.973 | 0.519 | 1 | 0.027 | 7.662 | 1.804 | |
15 | ungrouped (не группированный) | 2 | 0.764 | 1 | 0.938 | 0.090 | 1 | 0.062 | 5.510 | 1.384 | |
16 | ungrouped (не группированный) | 2 | 0.481 | 1 | 0.972 | 0.497 | 1 | 0.028 | 7.576 | 1.789 | |
17 | ungrouped (не группированный) | 2 | 0.172 | 1 | 0.993 | 1.868 | 1 | 0.007 | 11.658 | 2.451 | |
18 | 2 | 2 | 0.399 | 1 | 0.979 | 0.712 | 1 | 0.021 | 8.359 | 1.928 | |
19 | ungrouped (не группированный) | 2 | 0.705 | 1 | 0.946 | 0.143 | 1 | 0.054 | 5.884 | 1.462 | |
20 | 2 | 2 | 0.969 | 1 | 0.898 | 0.002 | 1 | 0.102 | 4.355 | 1.123 | |
21 | 2 | 2 | 0.249 | 1 | 0.989 | 1.328 | 1 | 0.011 | 10.238 | -2.236 | |
22 | ungrouped (не группированный) | 2 | 0.121 | 1 | 0.995 | 2.407 | 1 | 0.005 | 12.953 | 2.636 | |
23 | 2 | 2 | 0.071 | 1 | 0.997 | 3.263 | 1 | 0.003 | 14.853 | 2.890 | |
24 | ungrouped (не группированный) | 2 | 0.367 | 1 | 0.981 | 0.815 | 1 | 0.019 | 8.704 | 1.987 | |
25 | ungrouped (не группированный) | 2 | 0.880 | 1 | 0.857 | 0.023 | 1 | 0.143 | 3.598 | 0.933 | |
26 | ungrouped (не группированный) | 2 | 0.537 | 1 | 0.966 | 0.382 | 1 | 0.034 | 7.103 | 1.702 | |
27 | ungrouped (не группированный) | 1 | 0.640 | 1 | 0.955 | 0.218 | 2 | 0.045 | 6.323 | -1.431 | |
28 | 2 | 2 | 0.744 | 1 | 0.806 | 0.107 | 1 | 0.194 | 2.960 | 0.757 | |
29 | ungrouped (не группированный) | 2 | 0.969 | 1 | 0.883 | 0.001 | 1 | 0.117 | 4.035 | 1.045 | |
30 | 1 | 2** | 0.625 | 1 | 0.749 | 0.239 | 1 | 0.251 | 2.428 | 0.595 | |
31 | ungrouped (не группированный) | 2 | 0.646 | 1 | 0.760 | 0.211 | 1 | 0.240 | 2.521 | 0.624 | |
32 | 2 | 2 | 0.173 | 1 | 0.993 | 1.860 | 1 | 0.007 | 11.636 | 2.448 | |
33 | 1 | 2** | 0.504 | 1 | 0.970 | 0.447 | 1 | 0.030 | 7.378 | 1.753 | |
34 | ungrouped (не группированный) | 2 | 0.544 | 1 | 0.966 | 0.368 | 1 | 0.034 | 7.046 | 1.691 | |
35 | ungrouped (не группированный) | 2 | 0.618 | 1 | 0.958 | 0.248 | 1 | 0.042 | 6.480 | 1.582 | |
36 | ungrouped (не группированный) | 2 | 0.727 | 1 | 0.943 | 0.122 | 1 | 0.057 | 5.744 | 1.433 | |
37 | 2 | 2 | 0.458 | 1 | 0.974 | 0.551 | 1 | 0.026 | 7.781 | 1.826 | |
38 | 2 | 2 | 0.362 | 1 | 0.981 | 0.829 | 1 | 0.019 | 8.750 | 1.995 | |
39 | 2 | 2 | 0.814 | 1 | 0.929 | 0.055 | 1 | 0.071 | 5.211 | 1.319 | |
40 | ungrouped (не группированный) | 2 | 0.812 | 1 | 0.930 | 0.057 | 1 | 0.070 | 5.222 | 1.322 |
- ** Misclassified case (** Неверно классифицированный случай)