Анализ без группирующей переменной
Большую часть статистических характеристик мы уже рассмотрели в главах 6 и 9. Появились новые характеристики:
- 5% усеченное среднее: среднее значение, вычисленное без учета 5% наименьших и 5% наибольших значений.
- 95% доверительный интервал: доверительный интервал, в котором находится среднее значение с вероятностью 95%.
- Межквартильная широта: расстояние между первым и третьим квартилями.
Диаграмма ветвей и листьев представляет собой комбинацию гистограммы и табличного списка. Как на гистограмме, длина каждой строки соответствует количеству наблюдений, попадающих в определенный интервал. Но, сверх этого, на данной диаграмме выводится также наблюдаемое численное значение для каждого наблюдения. Для этой цели численное значения разбиваются на два компонента: ветвь, представляющую собой первую цифру или группу цифр и лист – последующие цифры. Ветвь соответствует тем разрядам численного значения наблюдаемой переменной, которые не изменяются, а листья – разрядам, которые изменяются в пределах избранного интервала. В рассматриваемом примере ветви разбиты на две части – одну для листьев с 0 по 4 и другую – для листьев с 5 по 9.
Коробчатая диаграмма состоит из прямоугольника, занимающего пространство от первого до третьего квартиля (то есть, от 25 до 75 процентиля). Линия внутри этого прямоугольника соответствует медиане. Кроме того, на коробчатой диаграмме отмечаются максимальное и минимальное значения, если только они не являются выбросами (см. ниже).
Значения, удаленные от границ более чем на три длины построенного прямоугольника (экстремальные значения), помечаются на диаграмме звездочками. Значения, удаленные более чем на полторы длины прямоугольника, помечаются кружками.
Теперь посмотрим, какие еще статистические характеристики можно вычислить в дополнение к стандартным.
Рис. 10.2. Коробчатая диаграмма
- В диалоговом окне Explore щелкните на кнопке Statistics… (Статистика).
Откроется диалоговое окно Explore: Statistics (см. рис. 10.3).
- Статистические характеристики, установленные по умолчанию уже вычислены, поэтому флажок для них (Descriptives) можно снять.
- Установите флажки для вычисления М-оценок Губера, Тьюки, Эндрюса и Хампеля (М-estimators), выбросов (Outliers) и процентилей (Percentiles).
- Закройте диалог, щелкнув на Continue, и запустите вычисления кнопкой ОК. Результат этих вычислений приводится ниже.
Рис. 10.3. Диалоговое окно Explore: Statistics