Иллюстрированный самоучитель по SPSS 10/11

Меры расстояния и меры сходства. Метрические переменные.

Корреляция Пирсона

Если кластеризация наблюдений осуществляется только на основании двух переменных, то корреляционный коэффициент Пирсона (см. разд. 15.1) со значениями находящимися в пределах от -1 до +1 не годится для использования в качестве меры подобия; он будет давать только значения -1 или +1.

Чебышев (Chebychev)

Разностью двух наблюдений является абсолютное значение максимальной разности последовательных пар переменных, соответствующих этим наблюдениям.

В приведенном примере абсолютная разность значений первой переменной равна 1, а второй переменной – 6. Поэтому разность Чебышева равна 6.

Блок (Block)

Эта дистанционная мера, называемая также дистанцией Манхэттена или в шутку – дистанцией таксиста, определяется суммой абсолютных разностей пар значений. Для двумерного пространства это не прямолинейное евклидова расстояние между двумя точками, а путь, который должен преодолеть Манхэттенский таксист, чтобы проехать от одного дома к другому по улицам, пересекающимся под прямым углом.

Иллюстрированный самоучитель по SPSS 10/11 › Кластерный анализ › Меры расстояния и меры сходства. Метрические переменные.

Для нашего примера имеем:

dfst = | 5 - 4 | + | 4 - 10 | = 7

Минковский (Minkowski)

Расстояние Минковского равно корню r-ой степени из суммы абсолютных разностей пар значений взятых в r-ой степени:

Иллюстрированный самоучитель по SPSS 10/11 › Кластерный анализ › Меры расстояния и меры сходства. Метрические переменные.

В SPSS при расчете этого расстояния допускается применение только квадратного корня, в то время как степень разности значений можно выбрать в пределах от 1 до 4. Если эту степень взять равной 2, то получим евклидово расстояние.

Пользовательская мера

Это обобщенный вариант расстояния Минковского. Это расстояние, называемое также степенным расстоянием, равно корню r-ой степени из суммы абсолютных разностей пар значений взятой в р-ой степени:

Иллюстрированный самоучитель по SPSS 10/11 › Кластерный анализ › Меры расстояния и меры сходства. Метрические переменные.

Здесь как для корня, так и для степени суммы можно выбирать значения от 1 до 4.

Если Вы заметили ошибку, выделите, пожалуйста, необходимый текст и нажмите CTRL + Enter, чтобы сообщить об этом редактору.