Иерархический кластерный анализ с более чем двумя переменными
Из следующей таблицы видно, что в первый кластер входят четыре человека, во второй кластер – опять четыре человека, в третий кластер – пять человек и в четвертый кластер – снова пять человек. Неясно еще, что означают эти четыре кластера, то есть о чем говорят результаты 10 тестов, соответственно относящиеся к этим кластерам. Разобраться в значении кластеров нам помогут кластерные профили; они представляют собой средние значения переменных, которые включены в анализ, распределенные по кластерной принадлежности.
Cluster Membership (Принадлежность к кластеру)
Case (Случай) | 4 Clusters (4 кластера) |
1:Volker R | 1 |
2:Sigrid К | 2 |
3:Elmar M | 3 |
4:Peter В | 1 |
5:Otto R | 4 |
6:Elke M | 2 |
7:Sarah К | 4 |
8:PeterT | 4 |
9:Gudrun M | 3 |
10:Siglinde P | 2 |
1 1:Werner W | 3 |
12:Achim Z | 1 |
13:DieterK | 4 |
14:Boris P | 3 |
15:Silke W | 1 |
16:ClaraT | 4 |
17:Manfred К | 2 |
18:Richard M | 3 |
Если Вы рассмотрите данные в редакторе данных, то заметите, что добавилась переменная clu4_l; эта переменная указывает на кластерную принадлежность каждого наблюдения и может быть использована для расчета кластерного профиля.
- Выберите в меню Analyze (Анализ) › Compare Means (Сравнить средние значения) › Means… (Средние значения)
Переменным t1-t10 присвойте статус зависимых переменных, а переменной clu4_1 статус независимой переменной, и начните расчет. В качестве результатов расчета выводятся средние значения и стандартные отклонения итогов десяти тестов для четырех кластеров. Для удобства поместим средние значения в отдельную таблицу.
Кластер 1 | Кластер 2 | Кластер 3 | Кластер 4 | |
Память на числа | 10.00 | 10.00 | 4.20 | 4.80 |
Математические задачи | 10.00 | 10.00 | 4.80 | 4.40 |
Находчивость при прямом диалоге | 9.00 | 4.25 | 10.00 | 4.00 |
Тест на составление алгоритмов | 10.00 | 10.00 | 4.40 | 4.00 |
Уверенность во время выступления | 10.00 | 4.75 | 10.00 | 4.20 |
Командный дух | 9.50 | 4.50 | 4.40 | 10.00 |
Находчивость | 9.25 | 3.75 | 10.00 | 4.40 |
Сотрудничество | 9.75 | 4.25 | 4.00 | 10.00 |
Признание в коллективе | 10.00 | 4.25 | 3.80 | 10.00 |
Сила убеждения | 9.50 | 4.25 | 10.00 | 5.00 |
Тестируемые, входящие в первый кластер имеют очень хорошие показатели во всех тестах. Это те конкурсанты, которые наверняка прошли бы на завершающий отборочный тур. Во второй кластер включены те, кто имеет хорошие показатели по математическим тестам (память на числа, математические задачи, тест на составление алгоритмов), но со слабыми оценками в социальной компетентности и уверенности при выступлениях. В третий кластер вошли те, кто уверенно себя чувствует во время выступления, но имеют слабые показатели в математических тестах и социальной компетентности. В конце концов, в четвертом кластере, собраны люди с высоким уровнем социальной компетентности, но со слабыми результатами в тестах на решение математических задач и на силу убеждения.
В примерах, подобных этому, перед проведением кластерного анализа рекомендуется сократить количество переменных. Подходящим методом для этого является факторный анализ (см. гл. 19), который большое количество переменных заменяет меньшим количеством факторов. Продемонстрируем данный процесс на следующем примере.