Пример из области биологии
Из всех результатов, приводимых в окне просмотра, в книге рассматриваются только статистики для каждого наблюдения. По классификационной таблице видно, что для 51 наблюдения с заранее известным полом 44 раза, т.е. в 86.3% наблюдений, пол был спрогнозирован верно (см. следующую таблицу).
Если мы рассмотрим наблюдение 8, то здесь пол известен – женский и в результате прогноза получается женский пол, а вот для наблюдения 30 пол известен как мужской, но прогнозируется как женский. Наблюдения с нераспознанным полом приводятся в таблице как "ungrouped" (не группированные).
Для наблюдения 1, для которого пол оказался неизвестным, он прогнозируется как женский. Значение вероятности прогнозирования, 0.990, указывается в колонке "P(G=g | D=d)" под заголовком "Highest Group" (Старшая группа). Менее достоверным является прогноз пола для наблюдения 10, здесь вероятность прогнозирования составляет только 0.721.
Для того, чтобы хотя бы частично сократить количество ошибочных значений для переменной пола, при анализе вы можете применять прогнозируемую групповую принадлежность только в тех случаях, для которых вероятность прогнозирования принимает некоторое минимально допустимое значение, к примеру, 0.9.
IF (dis_1
=
1
and disl_1
>
=
0.9
)
geschl
=
1
IF (dis_1
=
2
and dis2_1
>
=
0.9
)
geschl
=
2
EXECUTE
Таким образом, в используемом примере можно присвоить половой показатель еще 90-а птицам. Если вы снизите минимально допустимое значение вероятности прогнозирования, то это число станет еще больше.
К файлу были добавлены три новые переменные:
- dis_1: Прогнозируемая группа
- disl_1: Вероятность принадлежности к группе 1
- dis2_1: Вероятность принадлежности к группе 2.