Иллюстрированный самоучитель по SPSS 10/11

Бинарная логистическая регрессия

Вопрос, на который нам предстоит найти ответ, звучит так: какое влияние на вероятность выздоровления оказывают отобранные переменные.

  • Откройте файл lunge.sav.
  • После выбора соответствующего меню в диалоговом окне Logistic Regression (Логистическая регрессия) переменной out присвойте статус независимой переменной, а всем остальным (кроме пг) присвойте статус ковариат. Здесь, как и при множественной линейной регрессии, ввод ковариат Вы можете производить по блокам.

Из-за вовлечения в анализ большого количества переменных компьютер должен решить, какие из них в конечном случае будут отобраны для использовании в уравнении вероятности. Поэтому здесь должен быть выбран не метод вложения, который включает в расчет все переменные, а один из пошаговых методов.

Метод прямой селекции начинается с использования одних лишь констант на стартовом этапе, а затем последовательно подключаются переменные, которые демонстрируют сильную корреляцию с зависимыми переменными. Далее опять следует проверка того, какие переменные должны быть исключены, причем в качестве критерия проверки выбирается либо статистика Вальдовского (Wald), либо функция правдоподобия, либо один из вариантов, называемых "условной статистикой" (которые, однако, не рекомендуются). Метод обратной селекции сначала берет в расчет все переменные, а затем в обратном порядке происходит исключение малозначимых переменных.

  • Выберите в качестве метода Forward: LR (Прямой: LR) и щелкните на кнопке Categorical… (Категориальные), чтобы поместить переменную ursache в поле, предусмотренное для категориальных ковариат.

Количество образовываемых "фиктивных" дихотомических переменных должно быть всегда на 1 меньше, чем число количество заданных категорий. Категория, оказавшаяся лишней, называется эталонной категорией и, в соответствии с предварительными установками, является последней категорией. При помощи поля контрастов (Contrast) Вы можете управлять особенностями вовлечения в анализ образованных Фиктивных переменных; при контрасте равном Deviation (Отклонение) все категории кроме эталонной будут проверяются относительно суммарного эффекта.

  • Установите контраст Deviation (Отклонение) и при помощи щелчка на Continue (Далее) вернитесь в исходное диалоговое окно.
  • Начните расчет нажатием ОК.

Вы можете проследить, какие переменные вовлекаются в анализ и как улучшается вероятность прогноза после вовлечения каждой новой переменной. На завершающей стати анализа присутствуют четыре переменные, а именно: возраст, время проведения искусственного дыхания, рост и концентрация кислорода в воздушной массе для искусственного дыхания.

Точность исполнения прогноза, которая достигается при использовании этих четырех переменных, составляет 71.0%; ее можно увидеть в нижеследующей классификационной таблице на стр 25.

Classification Table (Классификационная таблица)а

Observed (Наблюдаемый показатель) Predicted (Спрогнозировано)
Outcome (Исход) Percentage Correct (Процентный показатель верных прогнозов)
gestorben (скончался) ueberlebt (выздоровел)
Step 1 (Шаг) Outcome (Исход) gestorben (скончался) 29 34 46.0
ueberlebt (выздоровел) 14 54 79.4
    63.4
Overall Percentage (Суммарный процентный показатель)  
Step 2 (Шаг 2) Outcome (Исход) gestorben (скончался) 32 31 50.8
ueberlebt (выздоровел) 16 52 76.5
    64.1
Overall Percentage (Суммарный процентный показатель)  
Step 3 (Шаг 3) Outcome (Исход) gestorben (скончался) 33 30 52.4
ueberlebt (выздоровел) 19 49 72.1
Overall Percentage (Суммарный процентный показатель)       62.6
Step 4 (Шаг 4) Outcome (Исход) gestorben (скончался) 37 26 58.7
ueberlebt (выздоровел) 12 56 82.4
    71.0
Overall Percentage (Суммарный процентный показатель)  
  • a. The cut value is 0.500 (Разделительное значение равно 0.500)
Если Вы заметили ошибку, выделите, пожалуйста, необходимый текст и нажмите CTRL + Enter, чтобы сообщить об этом редактору.