Медиана для концентрированных данных
Для данных, имеющих форму частотной таблицы, определение медианы и остальных процентилей обычным методом будет слишком неточным. В таких случаях есть возможность вычислить медиану и любые другие процентили более точным методом. Мы поясним это на примере стоматологических данных.
- Загрузите файл cpitn.sav, содержащий результаты стоматологического исследования.
Кроме переменных schule и mhfreq, которые определяют уровень образования и то, сколько раз в день обследуемый чистит зубы, этот файл содержит шесть переменных cpitnl-cpitn6, которые указывают степень пародонтального заболевания каждой из шести частей челюсти – так называемый параметр CPITN, задаваемый с помощью следующей кодировочной таблицы:
0 | Здоровый пародонт |
---|---|
1 | Кровоточивость |
2 | Зубные отложения |
3 | Глубина десенных карманов 3.5-5.5 мм |
4 | Глубина десенных карманов 6 мм и более |
- С помощью команд меню Analyze › Descriptive Statistics › Frequencies (Анализ › Дескриптивные статистики › Частоты) создайте частотную таблицу, к примеру, для переменной cpitnl. Если задать вычисление среднего значения и медианы, мы получим следующий результат:
Статистика
CPITN1 | ||
---|---|---|
N | Допустимые | 2548 |
Утерянные | 0 | |
Среднее значение | 2.24 | |
Медиана | 2.00 |
CPITN1
Частота | Проценты | допустимые проценты | накопленные проценты | |
---|---|---|---|---|
Допустимые здоровый | 109 | 4.3 | 4.3 | 4.3 |
кровоточивость | 389 | 15.3 | 15.3 | 19.5 |
отложения | 921 | 36.1 | 36.1 | 55.7 |
глубина карманов | 1042 | 40.9 | 40.9 | 96.6 |
3.5-5.5 глубина карманов >=6 | 87 | 3.4 | 3.4 | 100.0 |
Всего | 2548 | 100.0 | 100.0 |
При определении медианы обычным методом ее значение равно 2. Это значение, хотя формально и правильное, но дает совершенно неудовлетворительный, недостаточно значимый результат. В данном случае, когда данные являются концентрированным, для уточнения медианы применяется следующая расчетная формула:
Здесь:
n | Количество измеренных значений |
---|---|
m | Класс, в котором находится медиана |
u | Нижняя граница класса m |
fm | Абсолютная частота в классе m |
Fm-1 | Накопленная частота вплоть до предыдущего класса m – 1 |
B | Ширина класса |