Бинарная логистическая регрессия
Рассчитанная вероятность для всех случаев и связанная с ней принадлежность к группе кодировка 1 для болен и 2 для здоров) добавлены к файлу под именами рге_1 и pgr_l.
Теперь подключим к нашему анализу тест LAI. Дополнительно к переменной tzell теперь в поле ковариат поместите и переменную lai.
Расчет выдаст сначала заметно снизившееся значение -2LL (хи-квадрат = 25.668) и следующую классификационную таблицу. Доля правильно спрогнозированных диагнозов незначительно выросла (с 77.8% до 80.0%).
Classification Table (Классификационная таблица)а
Observed (Наблюдаемый показатель) | Predicted (Спрогнозировано) | ||||
Группа | Percentage Correct (Процентный показатель верных показателей) | ||||
Krank (болен) | Gesund (здоров) | ||||
Шаг 1 | GRUPPE (Группа) | Krank (болен) | 20 | 4 | 83.3 |
Gesund (здоров) | 5 | 16 | 76.2 | ||
Overall Percentage (Суммарный процентный показатель) | 80.0 |
- а. The cut value is 0.500 (Разделительное значение равно 0.500)
Количество ложно отрицательных диагнозов снизилось на 2, а количество ложно положительных повысилось на 1. Для коэффициентов получим:
Variables in the Equation (Переменные в уравнении)
В (Коэффициент регрессии В) | S.E. Стандартная ошибка) | Wald (Вальд) | df | Sig. (Значимость) | Ехр (В) | ||
Step 1 (Шаг 1) | TZELL | 0.201 | 0.094 | 4.574 | 1 | 0.32 | 1.222 |
LAI | 2.205 | 0.877 | 6.324 | 1 | 0.012 | 9.074 | |
Constant (Константа) | -14.645 | 6.328 | 5.356 | 1 | 0.021 | 0.000 |
- a. Variable(s) entered on step 1: TZELL, LAI. (Переменные, вводимые на шаге 1: TZELL, LAI)
Для обследуемого с типизированным числом Т-клеток равным 72 получилась вероятность оказаться здоровым р = 0.735. Если в дополнении к этому и тест LAI отрицателен (кодировка 1), то эта же вероятность рассчитывается следующим образом:
Вероятность, оказаться здоровым, при наличии данных уже двух диагностических методов значительно возросла.
Еще один пример из области медицины, теперь уже с большим количеством независимых переменных, должен помочь нам разобраться в пошаговом методе анализа. Кроме того, в состав независимых переменных будет включена категориальная переменная.
Для данного примера в некоторой клинике со специальными автоматизированными методиками лечения были накоплены данные о пациентах с тяжелыми (или даже смертельными) повреждениями легких. Из большого количества переменных были выбраны следующие:
Имя переменной | Расшифровка |
out | Исход (0 = скончался, 1 = выздоровел) |
Alter (возраст) | Возраст |
bzeit | Время проведения искусственного дыхания в часах |
kob | Концентрация кислорода в воздушной массе для искусственного дыхания |
адд | Интенсивность искусственного дыхания |
gesch (пол) | Пол (1 = мужской, 2 = женский) |
gr | Рост |
ursache (причина) | Причина повреждения легких (1 = несчастный случай, 2 = воспаление легких, 3 = прочее) |
Наряду с переменной out (исход), имеются переменные, при первом же взгляде на которые можно понять, что они с ней связаны. Причина повреждения легких является категориальной переменной, которая перед проведением анализа должна быть преобразована в несколько дихотомических переменных (к примеру, несчастный случай: да – нет).