Бинарная логистическая регрессия
С помощью метода бинарной логистической регрессии можно исследовать зависимость дихотомических переменных от независимых переменных, имеющих любой вид шкалы.
Как правило, в случае с дихотомическими переменными речь идет о некотором событии, которое может произойти или не произойти; бинарная логистическая регрессия в таком случае рассчитывает вероятность наступления события в зависимости от значений независимых переменных.
Вероятность наступления события для некоторого случая рассчитывается по формуле:
Где z= b1*X1 + b2хХ2+…+ bnxXn+ a, X1 – значения независимых переменных, b1 – коэффициенты, расчет которых является задачей бинарной логистической регрессии, а – некоторая константа.
Если для р получится значение меньшее 0.5, то можно предположить, что событие не наступит; в противном случае предполагается наступление события.
В качестве примера рассмотрим два диагностических теста из области медицины на предмет обнаружения карциномы (злокачественной опухоли) мочевого пузыря: подсчет количества (типизация) Т-клеток и тест LAI. Результатами первого теста являются значения, принадлежащие к интервальной шкале, а тест LAI дает дихотомический результат: "положительно" или "отрицательно".
Оба теста были проведены со здоровыми людьми и заведомо больными пациентами. Результаты представлены в следующей таблице:
Коллектив | Типизация t-клеток | LAI | Коллектив | Типизация t-клеток | LAI |
болен | 48.5 | положительно | болен | 73.5 | положительно |
болен | 55.5 | положительно | здоров | 61.1 | положительно |
болен | 57.5 | положительно | здоров | 62.5 | отрицательно |
болен | 58.5 | положительно | здоров | 63.5 | отрицательно |
болен | 61.0 | положительно | здоров | 64.5 | положительно |
болен | 61.5 | положительно | здоров | 69.5 | положительно |
болен | 61.5 | положительно | здоров | 70.0 | отрицательно |
болен | 62.0 | положительно | здоров | 70.0 | отрицательно |
болен | 62.0 | положительно | здоров | 71.0 | положительно |
болен | 62.0 | положительно | здоров | 71.5 | положительно |
болен | 62.5 | положительно | здоров | 71.5 | отрицательно |
болен | 63.0 | положительно | здоров | 72.0 | отрицательно |
болен | 63.5 | положительно | здоров | 73.0 | отрицательно |
болен | 65.0 | положительно | здоров | 76.0 | отрицательно |
болен | 65.0 | отрицательно | здоров | 72.5 | отрицательно |
болен | 66.5 | отрицательно | здоров | 73.0 | отрицательно |
болен | 66.5 | отрицательно | здоров | 73.5 | отрицательно |
болен | 66.5 | положительно | здоров | 74.0 | отрицательно |
болен | 68.5 | положительно | здоров | 75.0 | отрицательно |
болен | 69.0 | отрицательно | здоров | 77.0 | отрицательно |
болен | 71.0 | положительно | здоров | 77.0 | отрицательно |
болен | 71.0 | положительно | здоров | 78.5 | отрицательно |
болен | 71.0 | положительно |
Если сначала посмотреть на результаты типизации Т-клеток, то можно заметить, что здесь для здоровых людей значения в среднем выше, чем для больных. Следовательно, исходя из значений, получившихся при типизации Т-клеток, можно попытаться, вывести вероятность наличия карциномы мочевого пузыря.