Иллюстрированный самоучитель по SPSS 10/11

Бинарная логистическая регрессия

С помощью метода бинарной логистической регрессии можно исследовать зависимость дихотомических переменных от независимых переменных, имеющих любой вид шкалы.

Как правило, в случае с дихотомическими переменными речь идет о некотором событии, которое может произойти или не произойти; бинарная логистическая регрессия в таком случае рассчитывает вероятность наступления события в зависимости от значений независимых переменных.

Вероятность наступления события для некоторого случая рассчитывается по формуле:

Иллюстрированный самоучитель по SPSS 10/11 › Регрессионный анализ › Бинарная логистическая регрессия

Где z= b1*X1 + b2хХ2+…+ bnxXn+ a, X1 – значения независимых переменных, b1 – коэффициенты, расчет которых является задачей бинарной логистической регрессии, а – некоторая константа.

Если для р получится значение меньшее 0.5, то можно предположить, что событие не наступит; в противном случае предполагается наступление события.

В качестве примера рассмотрим два диагностических теста из области медицины на предмет обнаружения карциномы (злокачественной опухоли) мочевого пузыря: подсчет количества (типизация) Т-клеток и тест LAI. Результатами первого теста являются значения, принадлежащие к интервальной шкале, а тест LAI дает дихотомический результат: "положительно" или "отрицательно".

Оба теста были проведены со здоровыми людьми и заведомо больными пациентами. Результаты представлены в следующей таблице:

Коллектив Типизация t-клеток LAI Коллектив Типизация t-клеток LAI
болен 48.5 положительно болен 73.5 положительно
болен 55.5 положительно здоров 61.1 положительно
болен 57.5 положительно здоров 62.5 отрицательно
болен 58.5 положительно здоров 63.5 отрицательно
болен 61.0 положительно здоров 64.5 положительно
болен 61.5 положительно здоров 69.5 положительно
болен 61.5 положительно здоров 70.0 отрицательно
болен 62.0 положительно здоров 70.0 отрицательно
болен 62.0 положительно здоров 71.0 положительно
болен 62.0 положительно здоров 71.5 положительно
болен 62.5 положительно здоров 71.5 отрицательно
болен 63.0 положительно здоров 72.0 отрицательно
болен 63.5 положительно здоров 73.0 отрицательно
болен 65.0 положительно здоров 76.0 отрицательно
болен 65.0 отрицательно здоров 72.5 отрицательно
болен 66.5 отрицательно здоров 73.0 отрицательно
болен 66.5 отрицательно здоров 73.5 отрицательно
болен 66.5 положительно здоров 74.0 отрицательно
болен 68.5 положительно здоров 75.0 отрицательно
болен 69.0 отрицательно здоров 77.0 отрицательно
болен 71.0 положительно здоров 77.0 отрицательно
болен 71.0 положительно здоров 78.5 отрицательно
болен 71.0 положительно      

Если сначала посмотреть на результаты типизации Т-клеток, то можно заметить, что здесь для здоровых людей значения в среднем выше, чем для больных. Следовательно, исходя из значений, получившихся при типизации Т-клеток, можно попытаться, вывести вероятность наличия карциномы мочевого пузыря.

Если Вы заметили ошибку, выделите, пожалуйста, необходимый текст и нажмите CTRL + Enter, чтобы сообщить об этом редактору.