Кластерный анализ при большом количестве наблюдений
Факторная матрица красноречиво демонстрирует, что отобранные факторы могут быть расположены в следующей смысловой последовательности (по убыванию значимости):
- Приложение
- Программирование
- Использование Интернета
- Игры
Rotated Component Matrixa (Повернутая матрица компонентов)
Component (Компонент) | ||||
1 | 2 | 3 | 4 | |
Textverarbeitung (Обработка текста) | 0.848 | |||
Windows | 0.840 | |||
DOS | 0.653 | |||
WWW | 0.619 | |||
Datenbanken (Базы данных и табличные расчеты) | 0.611 | |||
Multimedia (Мультимедиа) | 0.535 | |||
С | 0.771 | |||
Maschinensprache (Машинные языки) | 0.741 | |||
PASCAL | 0.729 | |||
BASIC | 0.612 | |||
Java | 0.606 | 0.474 | ||
UNIX | 0.587 | 0.504 | ||
Chat | 0.699 | |||
eigene Dienste (Предложение собственных услуг) | 0.696 | |||
Internetsprachen (Программирование для Интернет) | 0.468 | 0.670 | ||
0.584 | 0.609 | |||
ICQ | 0.601 | |||
Szene (Сцены компьютерных игр) | 0.881 | |||
Intensitaet (Интенсивность) | 0.850 |
- Extraction Method: Principal Component Analysis (Метод отбора: Анализ главных компонентов).
- Rotation Method: Varimax with Kaiser Normalization (Метод вращения: варимакс с нормализацией Кайзера).
- a. Rotation converged in 11 iterations (Вращение осуществлено за 11 итераций).
Теперь используем сохраненные нами значения этих четырех факторов для проведения кластерного анализа для студентов. Так как количество наблюдений равное 1085 слишком велико для иерархического кластерного анализа, выберем метод анализа кластерных центров.
- Присвойте переменным fac1_1-fac4_1 метки: "Приложения", "Программирование", "Использование Интернет" и "Игры" соответственно.
- Выберите в меню Analyze (Анализ) › Classify (Классифицировать) › K-Means Cluster… (Кластерный анализ методом к-средних)
Откроется диалоговое окно K-Means Cluster Analysis (Кластерный анализ методом к-средних).
Рис. 20.4: Диалоговое окно K-Means Cluster Analysis (Анализ кластерных центров)
- Переменные от fac1_1 до fac4_1 поместите в поле тестируемых переменных. Теперь Вы подошли к тому месту, где нужно указывать количество кластеров. Подходящим вариантом было бы сперва провести иерархический кластерный анализ для произвольно выбранных наблюдений и получившееся количество кластеров принять за оптимальное. Вы, конечно же, можете провести и несколько опытных, пробных расчетов с различным количеством кластеров и после этого определиться с подходящим вариантом решения.
- Мы остановимся на четырех кластерах; введите это значение в поле Number of Clusters (Количество кластеров).
- Через выключатель Iterate… (Итерации) укажите число итераций равное 99; установленное по умолчанию количество итераций равное 10, оказалось бы недостаточным.
- Щелкните по выключателю Save… (Сохранить), чтобы при помощи дополнительных переменных зафиксировать принадлежность наблюдений к кластеру.
- Щелкните на ОК, чтобы начать расчет.