Пример из области медицины
Далее следует таблица, в которой построчно для каждого наблюдения приводится информация о значении дискриминантной функции и определяется принадлежность к одной из двух групп. Мы здесь ограничились первыми двадцатью наблюдениями.
Группа, к которой фактически принадлежит наблюдение, отображается в колонке с именем "Actual Group" (Фактическая группа). В следующих трех колонках содержится информация о прогнозе принадлежности к группе, сделанном на основании значения дискриминантной функции. Сначала приводится прогнозируемая принадлежность к группе; если она не соответствует фактической принадлежности, то в колонке "Predicted Group" (Прогнозируемая группа) отображаются две звездочки (**).
Casewise Statistics (Статистики для наблюдений)
Case Number (Порядк. номер случая) | Actual Group (Фактич. группа) | Highest Group (Старшая группа) | Second Highest Group (Вторая по старшинству группа) | Discriminant Scores (Значения дискри-минант) | ||||||
Predicted Group (Прогноз. группа) | P(D>d G=g) | P(G=g D=d) | Squared Mahalanobis Distance to Centroid (Квадрат расстояния Махапанобиса до центроида) | Group (Группа) | P(G=g D=d) | Squared Mahalanobis Distance to Centroid (Квадрат расстояния Махаланобиса до центроида) | Function 1 (Функция 1) | |||
р | df | |||||||||
1 | 0 | 1** | 0.727 | 1 | 0.702 | 0.122 | 0 | 0.298 | 1.834 | -0.833 |
2 | 1 | 0** | 0.116 | 1 | 0.889 | 2.464 | 1 | 0.111 | 6.631 | 2.092 |
3 | 0 | 1** | 0.842 | 1 | 0.576 | 0.040 | 0 | 0.424 | 0.650 | -0.284 |
4 | 1 | 1 | 0.310 | 1 | 0.821 | 1.032 | 0 | 0.179 | 4.085 | -1.499 |
5 | 1 | 1 | 0.495 | 1 | 0.767 | 0.465 | 0 | 0.233 | 2.846 | -1.165 |
6 | 1 | 1 | 0.453 | 1 | 0.779 | 0.563 | 0 | 0.221 | 3.081 | -1.234 |
7 | 0 | 1** | 0.635 | 1 | 0.728 | 0.225 | 0 | 0.272 | 2.189 | -0.958 |
8 | 1 | 1 | 0.549 | 1 | 0.752 | 0.359 | 0 | 0.248 | 2.575 | -1.083 |
9 | 1 | 1 | 0.880 | 1 | 0.587 | 0.023 | 0 | 0.413 | 0.729 | -0.332 |
10 | 0 | 1** | 0.952 | 1 | 0.609 | 0.004 | 0 | 0.391 | 0.893 | -0.423 |
11 | 0 | 0 | 0.026 | 1 | 0.940 | 4.980 | 1 | 0.060 | 10.477 | 2.753 |
12 | 1 | 0** | 0.618 | 1 | 0.501 | 0.249 | 1 | 0.499 | 0.256 | 0.023 |
13 | 0 | 0 | 0.930 | 1 | 0.603 | 0.008 | 1 | 0.397 | 0.841 | 0.434 |
14 | 1 | 1 | 0.817 | 1 | 0.676 | 0.053 | 0 | 0.324 | 1.528 | -0.714 |
15 | 1 | 1 | 0.958 | 1 | 0.611 | 0.003 | 0 | 0.389 | 0.908 | -0.431 |
16 | 0 | 1** | 0.685 | 1 | 0.524 | 0.165 | 0 | 0.476 | 0.359 | -0.077 |
17 | 1 | 1 | 0.388 | 1 | 0.798 | 0.745 | 0 | 0.202 | 3.492 | -1.347 |
18 | 0 | 1** | 0.763 | 1 | 0.550 | 0.091 | 0 | 0.450 | 0.496 | -0.182 |
19 | 1 | 1 | 0.748 | 1 | 0.696 | 0.103 | 0 | 0.304 | 1.760 | -0.805 |
20 | 0 | 0 | 0.308 | 1 | 0.822 | 1.037 | 1 | 0.178 | 4.095 | 1.540 |
- ** Мisciassiriea case (Неправильно классифицированное наблюдение)
Далее выводятся две вероятности. Вторая из этих двух вероятностей, обозначенная P(G=g|D=d), является мерой принадлежности к одной из двух групп. Это вероятность того, что некоторой наблюдение принадлежит к прогнозированной группе, которая рассчитывается на основе подстановки в дискриминантную функцию значений набора переменных, соответствующих данному наблюдению. Вероятность того, что данный наблюдение принадлежит к другой группе получается вычитанием меры принадлежности из 1. Она приводится в колонке с названием "Second Highest Group" (Вторая по старшинству группа). Если мы рассмотрим первый наблюдение, то здесь вероятность того, что данный пациент выживет, рассчитанная на основании значении исходных переменных, равна 0.702 (в действительности он скончался).
Первую из двух рассмотренных вероятностей, получившую название Р (D>d|G=g), называют еще и условной вероятностью. Это вероятность того, что пациент, принадлежащий к прогнозируемой группе, действительно имеет значения параметров, соответствующие дискриминантной функции или некоторые другие крайние значения.
В другой колонке приводится квадрат расстояния Махаланобиса до центроида (среднего значения группы значений дискриминантной функции). В правой колонке таблицы приводится соответствующее значение дискриминантной функции. Распределение значения дискриминантной функции отдельно по группам изображается на двух отдельных гистограммах.
Можно заметить, что значения дискриминантной функции для первой группы (скончался) смещены вправо, а значения второй группы (выжил) – влево, что однако свидетельствует об очень сильном смешении.