Иллюстрированный самоучитель по SPSS 10/11

Кластерный анализ при большом количестве наблюдений

Факторная матрица красноречиво демонстрирует, что отобранные факторы могут быть расположены в следующей смысловой последовательности (по убыванию значимости):

  • Приложение
  • Программирование
  • Использование Интернета
  • Игры

Rotated Component Matrixa (Повернутая матрица компонентов)

  Component (Компонент)
1 2 3 4
Textverarbeitung (Обработка текста) 0.848      
Windows 0.840      
DOS 0.653      
WWW 0.619      
Datenbanken (Базы данных и табличные расчеты) 0.611      
Multimedia (Мультимедиа) 0.535      
С   0.771    
Maschinensprache (Машинные языки)   0.741    
PASCAL   0.729    
BASIC   0.612    
Java   0.606 0.474  
UNIX   0.587 0.504  
Chat     0.699  
eigene Dienste (Предложение собственных услуг)     0.696  
Internetsprachen (Программирование для Интернет)   0.468 0.670  
Email 0.584   0.609  
ICQ     0.601  
Szene (Сцены компьютерных игр)       0.881
Intensitaet (Интенсивность)       0.850
  • Extraction Method: Principal Component Analysis (Метод отбора: Анализ главных компонентов).
  • Rotation Method: Varimax with Kaiser Normalization (Метод вращения: варимакс с нормализацией Кайзера).
  • a. Rotation converged in 11 iterations (Вращение осуществлено за 11 итераций).

Теперь используем сохраненные нами значения этих четырех факторов для проведения кластерного анализа для студентов. Так как количество наблюдений равное 1085 слишком велико для иерархического кластерного анализа, выберем метод анализа кластерных центров.

  • Присвойте переменным fac1_1-fac4_1 метки: "Приложения", "Программирование", "Использование Интернет" и "Игры" соответственно.
  • Выберите в меню Analyze (Анализ) › Classify (Классифицировать) › K-Means Cluster… (Кластерный анализ методом к-средних)

Откроется диалоговое окно K-Means Cluster Analysis (Кластерный анализ методом к-средних).

Иллюстрированный самоучитель по SPSS 10/11 › Кластерный анализ › Кластерный анализ при большом количестве наблюдений
Рис. 20.4: Диалоговое окно K-Means Cluster Analysis (Анализ кластерных центров)

  • Переменные от fac1_1 до fac4_1 поместите в поле тестируемых переменных. Теперь Вы подошли к тому месту, где нужно указывать количество кластеров. Подходящим вариантом было бы сперва провести иерархический кластерный анализ для произвольно выбранных наблюдений и получившееся количество кластеров принять за оптимальное. Вы, конечно же, можете провести и несколько опытных, пробных расчетов с различным количеством кластеров и после этого определиться с подходящим вариантом решения.
  • Мы остановимся на четырех кластерах; введите это значение в поле Number of Clusters (Количество кластеров).
  • Через выключатель Iterate… (Итерации) укажите число итераций равное 99; установленное по умолчанию количество итераций равное 10, оказалось бы недостаточным.
  • Щелкните по выключателю Save… (Сохранить), чтобы при помощи дополнительных переменных зафиксировать принадлежность наблюдений к кластеру.
  • Щелкните на ОК, чтобы начать расчет.
Если Вы заметили ошибку, выделите, пожалуйста, необходимый текст и нажмите CTRL + Enter, чтобы сообщить об этом редактору.