Веса случаев. Коррекция при отсутствии репрезентативности.
- Теперь описанным выше способом проведем взвешивание, используя только что полученную переменную w, и построим обе частотные таблицы заново:
Пол
Frequency | Percent | Valid Percent | Cumulative Percent | ||
---|---|---|---|---|---|
Valid | женский | 135 | 50.0 | 50.0 | 50.0 |
мужской | 135 | 50.0 | 50.0 | 100.0 | |
Total | 271 | 100.0 | 100.0 |
Занятие
Frequency | Percent | Valid Percent | Cumulative Percent | ||
---|---|---|---|---|---|
Valid | Учащийся | 10 | 3.6 | 3.6 | 3.6 |
Рабочий | 46 | 16.8 | 16.8 | 20.4 | |
Квалифицированный рабочий | 35 | 12.9 | 12.9 | 33.3 | |
Специалист | 3 | 1.0 | 1.0 | 34.4 | |
Служащий | 83 | 30.7 | 30.7 | 65.1 | |
Менеджер | 7 | 2.5 | 2.5 | 67.5 | |
Государственный служащий | 32 | 11.9 | 11.9 | 79.4 | |
Пенсионер | 36 | 13.2 | 13.2 | 92.6 | |
Домохозяйка | 9 | 3.5 | 3.5 | 96.1 | |
Нетрудоспособный | 2 | 0.6 | 0.6 | 96.8 | |
Безработный | 9 | 3.2 | 3.2 | 100.0 | |
Total | 271 | 100.0 | 100.0 |
Хотя общее число наблюдений, 271, опять не изменилось, но суммирование частот по категориям дает несколько другие результаты.
Это особенно заметно для переменной Пол. Так как после определения переменной взвешивания обе категории должны иметь одинаковые частоты, с самого начала ясно, что сумма не может быть нечетной. Для переменной занятие сложение частот по категориям также дает результат 272, что на единицу отличается от общего количества наблюдений – 271, выводимого в окне просмотра. SPSS всегда, в том числе при взвешивании, выдает целочисленные частоты. Поэтому негативное влияние округления будет неизбежным. Другие статистические программы, например, Stata, обходят эту ситуацию, вычисляя взвешенные частоты с дробной частью.
Если сделать выборку наблюдений, то отображаемые программой суммы до и после взвешивания, как правило, также будут различаться. Это связано с тем, что в частичной выборке количество наблюдений обычно не соответствует сумме весовых коэффициентов, попадающих в эту выборку. Это можно проверить, создав на основе открытого файла данных частотную таблицу переменной "Занятие" до взвешивания и после взвешивания, но только для приверженцев партии СДПГ (v22=2). Тогда мы получим соответственно суммы 91 и 83.
Взвешивание для выравнивания характеристик при нарушении репрезентативности применяется в первую очередь при эпидемиологических исследованиях. Так как при весовом коэффициенте, превосходящем единицу, количество наблюдений искусственно увеличивается по сравнению с фактически измеренным, к результатам теста на значимость следует подходить весьма критически.