Иллюстрированный самоучитель по SPSS 10/11 › Кластерный анализ › Кластерный анализ при большом количестве наблюдений [страница - 321] | Самоучители по математическим пакетам

Иллюстрированный самоучитель по SPSS 10/11

Кластерный анализ при большом количестве наблюдений

Факторная матрица красноречиво демонстрирует, что отобранные факторы могут быть расположены в следующей смысловой последовательности (по убыванию значимости):

Приложение
Программирование
Использование Интернета
Игры

Rotated Component Matrix^a (Повернутая матрица компонентов)

	Component (Компонент)
	1	2	3	4
Textverarbeitung (Обработка текста)	0.848
Windows	0.840
DOS	0.653
WWW	0.619
Datenbanken (Базы данных и табличные расчеты)	0.611
Multimedia (Мультимедиа)	0.535
С		0.771
Maschinensprache (Машинные языки)		0.741
PASCAL		0.729
BASIC		0.612
Java		0.606	0.474
UNIX		0.587	0.504
Chat			0.699
eigene Dienste (Предложение собственных услуг)			0.696
Internetsprachen (Программирование для Интернет)		0.468	0.670
Email	0.584		0.609
ICQ			0.601
Szene (Сцены компьютерных игр)				0.881
Intensitaet (Интенсивность)				0.850

Extraction Method: Principal Component Analysis (Метод отбора: Анализ главных компонентов).
Rotation Method: Varimax with Kaiser Normalization (Метод вращения: варимакс с нормализацией Кайзера).
a. Rotation converged in 11 iterations (Вращение осуществлено за 11 итераций).

Теперь используем сохраненные нами значения этих четырех факторов для проведения кластерного анализа для студентов. Так как количество наблюдений равное 1085 слишком велико для иерархического кластерного анализа, выберем метод анализа кластерных центров.

Присвойте переменным fac1_1-fac4_1 метки: "Приложения", "Программирование", "Использование Интернет" и "Игры" соответственно.
Выберите в меню Analyze (Анализ) › Classify (Классифицировать) › K-Means Cluster… (Кластерный анализ методом к-средних)

Откроется диалоговое окно K-Means Cluster Analysis (Кластерный анализ методом к-средних).

Иллюстрированный самоучитель по SPSS 10/11 › Кластерный анализ › Кластерный анализ при большом количестве наблюдений
Рис. 20.4: Диалоговое окно K-Means Cluster Analysis (Анализ кластерных центров)

Переменные от fac1_1 до fac4_1 поместите в поле тестируемых переменных. Теперь Вы подошли к тому месту, где нужно указывать количество кластеров. Подходящим вариантом было бы сперва провести иерархический кластерный анализ для произвольно выбранных наблюдений и получившееся количество кластеров принять за оптимальное. Вы, конечно же, можете провести и несколько опытных, пробных расчетов с различным количеством кластеров и после этого определиться с подходящим вариантом решения.
Мы остановимся на четырех кластерах; введите это значение в поле Number of Clusters (Количество кластеров).
Через выключатель Iterate… (Итерации) укажите число итераций равное 99; установленное по умолчанию количество итераций равное 10, оказалось бы недостаточным.
Щелкните по выключателю Save… (Сохранить), чтобы при помощи дополнительных переменных зафиксировать принадлежность наблюдений к кластеру.
Щелкните на ОК, чтобы начать расчет.