Вступление. Вычисление новых переменных.
Для проведения анализа часто бывает необходимо выполнить преобразование данных. На основе первоначально собранных данных можно создать новые переменные и изменить кодирование. Подобные преобразования называются модификацией данных.
В SPSS существует много возможностей для модификации данных. К важнейшим из них относятся:
- Вычисление новых переменных путем использования различных арифметических выражений (математических формул)
- Подсчет частоты появлений определенных значений
- Перекодирование значений
- Вычисление новых переменных при выполнении определенного условия
- Агрегирование данных
- Ранговые преобразования
- Вычисление весов наблюдений
Разделы этой главы посвящены всем перечисленным возможностям модификации данных.
Вычисление новых переменных
Путем вычислений в SPSS можно образовать новые переменные и добавить их в файл данных. Так, например, в медицинском исследовании (см. главу 9, файл hyper.sav) в два момента времени (до и после приема лекарства) проводились измерения систолического кровяного давления, которые фиксировались в переменных rrs0 и rrs1.
Если нас интересует изменение давления между двумя этими моментами, было бы глупо каждый раз вычислять разницу двух значений и вручную вводить ее в новую переменную. Эту работу можно переложить на компьютер, который сделает ее быстро и, главное, без ошибок. Для этого поступите следующим образом:
- Загрузите файл hyper.sav в редактор данных.
- Выберите в меню команды Transform › Compute… (Преобразовать › Вычислить) Откроется диалоговое окно Compute Variable (Вычислить переменную).
Рис. 8.1. Диалоговое окно Compute Variable
В поле Target Variable (Выходная переменная) указывается имя переменной, которой присваивается вычисленное значение. В качестве выходной переменной может служить уже существующая или новая переменная. В поле Numeric Expression (Численное выражение) вводится выражение, применяемое для определения значения выходной переменной. 3 этом выражении могут использоваться имена существующих переменных, константы, арифметические операторы и функции.
- Введите в поле Target Variable имя rrsdiff, а в поле Numeric Expression формулу rrs0– rrsl. Эту формулу можно ввести либо вручную, либо используя список переменных и клавиатуру диалогового окна. Кнопка с треугольником позволяет копировать в поле формулы имена переменных, а кнопки клавиатуры – вставлять цифры и знаки.
- Щелкните на кнопке Type&Label… (Тип и метка).
Откроется диалоговое окно Compute Variable: Type and Label (Вычислить переменную: Тип и метка).
Здесь можно задать метку для новой переменной rrsdiff. В поле Label введите текст Изменение сист. кровяного давления и щелкните на кнопке Continue.
- В диалоговом окне Compute Variable щелкните на кнопке ОК.
Рис. 8.2. Диалоговое окно Compute Variable: Type and Label
Примечание
Выбранные опции соответствуют следующему командному синтаксису:
COMPOTE rrsdiff
=
rrs0
-
rrs1
VARIABLE LABELS rrsdiff
=
"Изменение сист. кровяного давления"
EXECUTE
Общий формат команды COMPUTE имеет следующий вид:
COMPUTE целевая_переменная
=
арифметическое_выражение
Команда EXECUTE считывает данные и выполняет предшествующие команды преобразования. В файл данных добавляется новая переменная rrsdiff. Теперь ее, как и прочие переменные, можно применять для вычислений. Для SPSS нет разницы, введены ли значения переменных через редактор данных или вычислены по формуле.
Вместо слова формула мы будем использовать в дальнейшем понятие численное выражение. При формулировке таких численных выражений нужно соблюдать определенные правила, которые представлены в следующем разделе.