Бинарная логистическая регрессия
Вопрос, на который нам предстоит найти ответ, звучит так: какое влияние на вероятность выздоровления оказывают отобранные переменные.
- Откройте файл lunge.sav.
- После выбора соответствующего меню в диалоговом окне Logistic Regression (Логистическая регрессия) переменной out присвойте статус независимой переменной, а всем остальным (кроме пг) присвойте статус ковариат. Здесь, как и при множественной линейной регрессии, ввод ковариат Вы можете производить по блокам.
Из-за вовлечения в анализ большого количества переменных компьютер должен решить, какие из них в конечном случае будут отобраны для использовании в уравнении вероятности. Поэтому здесь должен быть выбран не метод вложения, который включает в расчет все переменные, а один из пошаговых методов.
Метод прямой селекции начинается с использования одних лишь констант на стартовом этапе, а затем последовательно подключаются переменные, которые демонстрируют сильную корреляцию с зависимыми переменными. Далее опять следует проверка того, какие переменные должны быть исключены, причем в качестве критерия проверки выбирается либо статистика Вальдовского (Wald), либо функция правдоподобия, либо один из вариантов, называемых "условной статистикой" (которые, однако, не рекомендуются). Метод обратной селекции сначала берет в расчет все переменные, а затем в обратном порядке происходит исключение малозначимых переменных.
- Выберите в качестве метода Forward: LR (Прямой: LR) и щелкните на кнопке Categorical… (Категориальные), чтобы поместить переменную ursache в поле, предусмотренное для категориальных ковариат.
Количество образовываемых "фиктивных" дихотомических переменных должно быть всегда на 1 меньше, чем число количество заданных категорий. Категория, оказавшаяся лишней, называется эталонной категорией и, в соответствии с предварительными установками, является последней категорией. При помощи поля контрастов (Contrast) Вы можете управлять особенностями вовлечения в анализ образованных Фиктивных переменных; при контрасте равном Deviation (Отклонение) все категории кроме эталонной будут проверяются относительно суммарного эффекта.
- Установите контраст Deviation (Отклонение) и при помощи щелчка на Continue (Далее) вернитесь в исходное диалоговое окно.
- Начните расчет нажатием ОК.
Вы можете проследить, какие переменные вовлекаются в анализ и как улучшается вероятность прогноза после вовлечения каждой новой переменной. На завершающей стати анализа присутствуют четыре переменные, а именно: возраст, время проведения искусственного дыхания, рост и концентрация кислорода в воздушной массе для искусственного дыхания.
Точность исполнения прогноза, которая достигается при использовании этих четырех переменных, составляет 71.0%; ее можно увидеть в нижеследующей классификационной таблице на стр 25.
Classification Table (Классификационная таблица)а
Observed (Наблюдаемый показатель) | Predicted (Спрогнозировано) | ||||
Outcome (Исход) | Percentage Correct (Процентный показатель верных прогнозов) | ||||
gestorben (скончался) | ueberlebt (выздоровел) | ||||
Step 1 (Шаг) | Outcome (Исход) | gestorben (скончался) | 29 | 34 | 46.0 |
ueberlebt (выздоровел) | 14 | 54 | 79.4 | ||
63.4 | |||||
Overall Percentage (Суммарный процентный показатель) | |||||
Step 2 (Шаг 2) | Outcome (Исход) | gestorben (скончался) | 32 | 31 | 50.8 |
ueberlebt (выздоровел) | 16 | 52 | 76.5 | ||
64.1 | |||||
Overall Percentage (Суммарный процентный показатель) | |||||
Step 3 (Шаг 3) | Outcome (Исход) | gestorben (скончался) | 33 | 30 | 52.4 |
ueberlebt (выздоровел) | 19 | 49 | 72.1 | ||
Overall Percentage (Суммарный процентный показатель) | 62.6 | ||||
Step 4 (Шаг 4) | Outcome (Исход) | gestorben (скончался) | 37 | 26 | 58.7 |
ueberlebt (выздоровел) | 12 | 56 | 82.4 | ||
71.0 | |||||
Overall Percentage (Суммарный процентный показатель) |
- a. The cut value is 0.500 (Разделительное значение равно 0.500)