Взвешенное оценивание (оценка с весами)
В линейном регрессионном анализе, рассмотренном до настоящего времени, все наблюдения входят в модель равнозначно. При этом, исходной предпосылкой является тот факт, что все наблюдения должны иметь одинаковую дисперсию.
Если это условие не выполняется и дисперсия увеличивается с ростом значения независимой переменной, то отдельные точки можно взвесить так, чтобы наблюдения с большой дисперсией имели меньшее влияние.
В качестве примера рассмотрим тест, проверяющий знания детей в области географии. Дети в возрасте от 3 до 14 лет должны были в течение двух минут назвать как можно больше городов Германии. Результаты теста сведены в нижеследующей таблице, причем количество детей в каждой возрастной группе варьируется от двух до пяти:
Возраст | Количество названных городов |
3 | 2, 1, 0, 4 |
4 | 4, 2, 6 |
5 | 3, 8, 4, 7 |
6 | 3, 8, 9, 5 |
7 | 6, 10 |
8 | 7, 14, 10 |
9 | 9, 16, 10 |
10 | 9, 16, 15, 9 |
11 | 18, 12 |
12 | 22, 11, 14, 16 |
13 | 14, 21 |
14 | 20, 15, 23, 14, 26 |
Эти данные для сорока детей в общей сложности хранятся в переменных Alter (возраст) и staedte (города), которые содержатся в файле snamen.sav.
- Откройте файл snamen.sav.
- Выберите в меню Graphs (Графики) › Scatterplot… (Диаграмма рассеяния)
Рис. 16.26: Диаграмма рассеяния
- Отметьте и постройте простую диаграмму рассеяния с переменной Alter по оси абсцисс и переменной staedte по оси ординат.
Вы увидите, что с ростом возраста растет не только количество названных городов, но и рассеяние, то есть дисперсия, становится больше.
- В соответствии с описанием из главы 16.1 проведите линейный регрессионный анализ, причем переменной staedte присвойте статус зависимой переменной, а переменной Alter – независимой переменной.
- Вы получите следующие результаты:
Model Summary (Сводная таблица по модели)
Model (Модель) | R | R Square (R-квадрат) | Adjusted R Square (Смещенный R-квадрат) | Std. Error of the Estimate (Стандартная ошибка оценки) |
1 | 0.879а | 0.772 | 0.766 | 3.1623 |
- a. Predictors: (Conslant), Alter (Влияющие переменные: (Константа), возраст)
Coefficients (Коэффициенты)а
Model (Модель) | Unstandardized Coefficients (Не стандартизированные коэффициенты) | Standardized Coefficients (Стандартизированные коэффициенты) | Т | Sig. (Значимость) | ||
В | Std. Error (Стандартная ошибка) | ß (Beta) | ||||
1 Depa | (Constant) (Koнстанта) | -2.722 | 1.273 | -2.138 | 0.039 | |
Alter (Возраст) endent Variable | 1.569 (Зависимая переменная) | 0.138 | 0.879 | 11.357 | 0.000 |
Коэффициент корреляции равен 0.879, а мера определенности 0.772.