Синтаксис в SPSS необходим!
Загляните за пределы стандартного графического интерфейса (GUI) SPSS!
Командный синтаксис (syntax) SPSS — это набор текстовых инструкций (фактически — язык программирования) для командного процессора пакета, которые включают управление настройками пакета, вызовы команд статистического анализа, загрузку, сохранение и преобразованиее данных, обеспечивают программные конструкции (циклы, условия) и взаимодействие пакета SPSS с внешней средой (в том числе и с другими языками программирования). Почти все пункты графического пользовательского меню имеют свои эквиваленты в синтаксисе SPSS. При этом возможность организации обработки данных как последовательности текстовых инструкций (в форме программы) обеспечивает пользователю протоколирование, легкость видоизменения и воспроизведения процедур обработки данных.
Работа через меню GUI удобна, не спорю. Однако, используя возможности синтаксиса наряду со стандартными меню, вы можете повысить свою производительность при решении простых и рутинных задач раз в 5—10. Для более масштабных и сложных вариантов обработки ускорение может достигать и 50 раз. Более того, доступ к некоторым возможностям SPSS даёт лишь синтаксис. Ещё одна приятная особенность: команды, написанные в форме синтаксиса, будут работать во всех версиях SPSS, не только в Windows-версии.
Здесь вы найдёте примеры синтаксиса на все вкусы:
- Какие-то из них делают достаточно простые вещи и снабжены множеством комментариев;
- Какие-то делают сложные вещи и либо не имеют комментариев вовсе, либо, наоборот, прокомментированы со всей тщательностью.
- Прочие находятся где-то между этими крайностями.
Знакомы ли вы с книгой Программирование и управление данными в SPSS (SPSS Programming and Data Management)?
Предложения и ваши примеры синтаксиса приветствуются. Поделитесь своими знаниями и сами узнайте больше!
Файлы синтаксиса сгруппированы по следующим темам:
- Площадь под кривой (Area Under the Curve - AUC)
- Пакетные (*.bat) файлы
- Блочные эксперименты
- Бутстреп оценки (bootstrap) и случайные числа и выборки
- Таблицы и графики
- Кластерный анализ
- Сочетания, перестановки, взаимодействия
- Вычисления
- Конкатенация/модификация переменных (см. также Поэлементный разбор и маркировка данных)
- Редактор данных
- Проверка (валидация) данных
- Дата и время (см. также Упражнения на работу с датами, временем и возрастом)
- Распределения, доверительные интервалы
- Экспорт, импорт (см. также ЧаВо)
- Факторный анализ
- Выделение и отбор наблюдений
- Интерактивные графики — IGRAPH (см. также IGRAPH в разделе скриптов)
- Анализ тестов
- Метки, имена и форматы переменных
- Сопоставление файлов данных
- Работа с матрицами и язык Matrix
- Мета-анализ
- Множественные ответы
- OMS — система управления результатами
- Выбросы
- Поэлементный разбор и маркировка данных (см. также Манипуляция строками)
- Случайный отбор
- Ранжирование, экстремумы, сортировка, группирование
- Чтение, вывод и создание данных
- Регрессия, повторные измерения
- Замена символов, удаление наблюдений-дубликатов и лишних переменных
- Преобразование структуры данных
- Кривые ROC
- Объём выборки, мощность статистического критерия
- Самонастраивающийся синтаксис
- Строки
- Анализ выживаемости
- Показатели неравенства
- Проверка существования файла или переменной
- Временные ряды
- Преобразования переменных
- T-критерии, средние, дисперсионный анализ
- Разное
- Работа с несколькими файлами данных (см. также работу с файлами с помощью скриптов)
- Работа с пропущенными значениями
- Совместный анализ
- Анализ соответствий
Не все файлы до последнего проверены мной на работоспособность. Некоторые я поместил сюда, поскольку они показались мне интересными, но ещё не успел проверить программы в действии. Да, так много программ… так мало времени…
Если такая информация доступна, рядом с файлом синтаксиса, который написал не я, я помещаю имя автора. Обычно я не помещаю сюда e-mail авторов, чтобы снизить количество писем в их адрес. Если кто-то возражает против помещения его имени здесь, тот может написать мне письмо, и я быстренько удалю эту ссылку. С другой стороны, если у вас есть синтаксис, который окажется полезным другим посетителям сайта, я его с радостью выложу и дам ссылку на автора. Лучше, если такой синтаксис будет содержать пример данных внутри себя (в идеале посредством использования операторов DATA LIST или INPUT PROGRAM) и краткое описание своего предназначения.
Чтобы что-то улучшить, надо сначала это оценить!
NB: Файлы со значком
добавлены или обновлены менее, чем 30 дней назад.
Площадь под кривой (Area Under the Curve - AUC)
Пакетные (*.bat) файлы
Блочные эксперименты (прислал Valentim R. Alferes. Спасибо!)
- Полностью рандомизированные планы (с равным или неравным количеством наблюдений на вариант)
- Случайное приписывание объектов к вариантам эксперимента. Для простых и обобщённых рандомизированных блочных планов и полностью рандомизированных планов (с равным числом объектов на вариант).
Бутстреп-оценки (bootstrap) и случайные числа и выборки
Совет: если вы используете генератор случайных чисел и есть необходимость воспроизвести в точности полученные ранее результаты, используйте команду «SET SEED=число.» в начале вашего синтаксиса, где «число» - любое число. Можете, например, генерировать его, используя текущую дату и время: (т.е.«SET SEED=1120722.», если сейчас 7 часов 22 минуты 20 ноября). С такой установкой генератор случайных чисел будет давать одни и те же результаты.
- Доверительный интервал для дисперсии методом бутстреп;
- Доверительный интервал по методу бутстреп для альфы Кронбаха;
- Таблицы сопряжённости для множества бутстреп-выборок;
- Бутстреп-оценки МНК (для метода наименьших квадратов);
- Бутстреп-оценки для среднего и медианы;
- Генерация случайного мултьтиномиального вектора;
- Генерация случайных переменных многомерного гипергеометрического распределения;
- Генерация многомерного нормального вектора с заданной ковариационной матрицей (AnswerNet)
- Генерация триад случайных переменных;
- Случайные выборки разных объёмов и подсчёт выборочных статистик. (Сравнение распределений средних для одного и того же количества выборок разного объёма)
- Случайные выборки одного и того же объёма и подсчёт выборочных статистик. (Сравнение средних для k выборок объёма s)
- Выборочное распределение парного коэффициента корреляции.
Бутстреп-оценки с использованием OMS (Output Management System - системы управления результатами), доступной с версии SPSS 12 - Бутстреп оценки коэффициентов линейной регрессии.
Таблицы и графики
- Независимые столбцовые диаграммы для каждой категории группирующей переменной;
- Отображение пустого столбца и нулевой частоты для пустой категории (из архивов AnswerNet);
- Отображение пустого столбца и нулевой частоты для пустой категории (обобщение на большое число файлов/переменных) (обратите внимание, что показать пустые категории в команде CTABLES не составляет труда. Достоточно указать EMPTY=INCLUDE в подкоманде /Categories);
- Сравнение (наложение) двух гистограмм. Может также быть использовано для построения половозрастной пирамиды (см. пример из раздела IGRAPH ниже);
- Подсчёт выбросов (отображение количества выбросов на ящичковой диаграмме);
- Подавление вывода категорий с малыми частотами в столбцовых диаграммах.
Данный макрос полностью прокомментирован здесь.
Новички, незнакомые с принципами работы макросов, могут прочесть это объяснение; - Несколько гистограмм одинакового масштаба (демонстрация использования макроса Dograph.sps и шаблона Dograph.sct, рекомендуется для версий SPSS до 11 включительно);
- Графики накопленного процента уволившихся к определённому возрасту для разных категорий;
- Отображение накопленного процента на оси X;
- Отображение распределения ответов на вопрос;
- Гистограмма с процентами по оси Y вместо абсолютных частот (синтаксис особенно полезен для «ранних» версий SPSS);
- Помечаем конкретное наблюдение на графике;
- Помечаем конкретное наблюдение на графике (версия 2). Это обобщение приведённого выше синтаксиса с использованием шаблона графика Identify Your Own Data.sct (проверен в версии SPSS 10, для SPSS 12 и выше нужен другой шаблон);
- Вывод текущей даты в заголовок графика;
- Вывод текущей даты и времени в заголовок графика (тот же способ можно применять и для таблиц);
- Печать гистограммы или столбцовой диаграммы в зависимости от типа переменной (хороший пример на использование макросов);
- Вывод в заголовок графика или таблицы названия школы;
- Отображение средних значений на линейном графике;
- Показать 2 категории на одной и той же гистограмме;
- График для иллюстрации закона Зипфа (Zipf's law).
Таблицы - Создание таблицы результатов «вручную» в редакторе данных.SPS (хороший пример реструктурирования данных)
- Создание таблицы результатов «вручную» (пример 2).SPS (нетривиальное решение…)
- Построить частотную таблицу для категорий из множественных строковых переменных.SPS
- Ввести переменные в команду FREQUENCIES по убыванию медиан.SPS
- Вывести название группы в заголовок таблицы.SPS
- Построить таблицу «среднее плюс-минус стандартное отклонение».sps
- Поместить 4 переменные в одну частотную таблицу.SPS
- Отобразить «пустые» категории в таблице.SPS (из AnswerNet) Команда CTABLE для этого не требует дополнительного синтаксиса)
- Отобразить «пустые» категории в таблице (второй способ).SPS
- Указать число действительных наблюдений в примечании к таблице.SPS
- Таблица, где список переменных генерируется макросом. Пример использования конструкции !IF …!ELSE … !IFEND;
- Управление именами и метками переменных и значений в таблицах.
Команда CTABLES (дополнительный модуль Tables) - Статистика по подгруппам переменных;
- Отсортировать категории по убыванию частоты, поставив «Другое» на последнее место;
- Использование макроса и команды CTABLE.
Кластерный анализ
Сочетания, перестановки, взаимодействия
- Все сочетания по 3 числа из 9.SPS (см. обобщение «Найти все сочетания…» ниже)
- Все сочетания по 3 буквы из n.SPS (с возвращением)
- Построить взаимодействия между 2 категориальными переменными.SPS (в контексте регрессионного анализа)
- Создать новую переменную для каждой комбинации значений 2 переменных.SPS
- Найти все сочетания от 1 до n объектов из m объектов.SPS (может быть ресурсоёмким)
- Найти все сочетания по n объектов из m объектов.SPS (может быть ресурсоёмким)
- Найти перестановки чисел от 1 до n.SPS Максимальное число n = 7. В сочетании с командой RECODE, может использоваться для поиска перестановок строк и чисел.
- Сгенерировать случайные последовательности для блочного эксперимента.SPS
- Получить всевозможные произведения пар переменных.SPS (сопровождается комментариями)
Вычисления
- Автоматически рассчитать веса для данных.SPS
- Преобразование Бокса-Кокса.SPS Пересчитать var1, используя 31 значение для лямбда между -2 и 1 (с шагом 0.1).
- Число уникальных значений по 400 переменным.SPS
- Вычислить процент пациентов с переломом определённой категории.SPS
- Вычислить z = x / max(y), где max(y) - максимум по всем наблюдениям.SPS (иногда предпочтительнее использовать этот макрос)
- Подсчёт расстояний между 2 точками на земной поверхности.SPS (спасибо Симону Фрейдину (Simon Freidin))
- Вычислить среднее по m переменным, где m берётся из другой переменной.SPS
- Создать переменную со средними значениями другой переменной.SPS
- Найти кубический корень.SPS
- Обратить порядок цифр в целочисленной переменной.SPS
- Взвешивание по 2 и более переменным.SPS Спасибо Joao Duarte!
Конкатенация/модификация переменных
(см. также Поэлементный разбор и маркировка данных)- Особенность функции CONCAT.SPS Начинающим следует посмотреть этот пример.
- Объединение строковой и числовой переменных.SPS
- Конкатенация.SPS (построение строки-константы, объединяющей все значения второй переменной)
- Объединение данных с одним и тем же идентификатором.SPS
- Сцепление цифр из разных переменных в одну строку.SPS
- Сцепить значения 22 переменных через тире.SPS
- Перевести первую букву каждого слова в верхний регистр.SPS (Спасибо A. Paul Beaulne, который прислал этот код)
- Создать ключ, используя имя и дату рождения.SPS
- «Нормализовать» первые буквы.sps (сделать первую букву каждого слова прописной, остальные - строчными)
- «Нормализовать» строки.SPS (убрать пробелы в начале, точки в конце, сделать все буквы заглавными)
- Убрать инициалы из имени.SPS
- Убрать точку из строки.SPS (можно модифицировать для отсева других символов)
- Преобразовать имена.SPS (поставить фамилию перед инициалами)
- Преобразовать коды ASCII в символы.SPS
Редактор данных
Проверка (валидация данных)
Дата и время
(см. также Упражнения на работу с датами, временем и возрастом)- Добавить 60 дней к дате и найти последний день месяца.SPS
- Добавить ведущие нули к дате в строковом формате.SPS
- Вычислить возраст, если он введён как nnH nnD nnM и nnA.SPS
- Разложить период госпитализации по месяцам.SPS
- Вычислить возраст.SPS
- Вычислить разницу во времени в миллисекундах.SPS
- Вычислить среднюю дату и стандартное отклонение в днях.SPS
- Рассчитать число дней, попадающих в заданный интервал.SPS
- Подсчитать число минут между двумя временными отметками (в том числе, в разных сутках).SPS
- Вычислить число месяцев между 2 датами.SPS
- Вычислить время ожидания, когда время закодировано как hh min.SPS
- Получить число рабочих дней между 2 датами.SPS
- Получить число рабочих дней, исключить праздники.SPS
- Подсчитать время сна.SPS
- Ковертировать дату и время из формата SPSS в ACCESS.SPS
- Конвертация строки в число.SPS (переменная содержит возраст в одном из следующих представлений «7Y» — 7 лет, «3m»— 3 месяца, «28D» — 28 дней. Требуется всё это перевести в года.)
- Конвертация строки вида hhmmss в числовую переменную формата времени.SPS (Спасибо Jim Marks)
- Конвертация строки вида "01Jan1992" в формат даты.SPS
- Конвертация строки вида "1997-08-22" в формат даты.SPS
- Конвертация строки в формат даты и времени.SPS
- Преобразование строк вида «2006-04-28 18:20:01» в переменную формата даты и времени.SPS
- Преобразование строки в дату и отбор дат, выпадающих на выходные.SPS
- Конвертация строки вида 04Apri03 в дату.SPS
- Добавить 3 месяца к дате.SPS
- Что, если даты не убираются на графике.SPS (вариант решения)
- Извлечь время из строки, содержащей дату и время.SPS
- Конвертировать время из формата AM PM к «военному» формату.SPS
- Импорт из MS Excel (конвертировать число дней в дату).SPS
- Сохранить время при записи данных в текстовый файл.SPS
- Записать текущую дату в переменную.SPS
- Сосчитать последовательные 30-минутные интервалы когда наблюдалась гипоксия.SPS
- Вывести текущую дату в заголовок графика.SPS
- Поместить дату и время перед результатами статанализа.SPS
- Вывести день недели вместе с датой.SPS
- Считать время из текстовой строки, содержащей дату и время.SPS
- Сохранить файл с текущей датой в имени файла.SPS
- Отобрать наблюдения, попадающие во временной интервал.SPS
- Работа с системной переменной SPSS $Time.SPS
Распределения, доверительные интервалы
- Добавить переменные с границами доверительного интервала для среднего;
- Байесовские оценки долей и доверительные интервалы. Спасибо Евгению Ивашкевичу (можно построить доверительные интервалы для категории, не представленной в выборке);
- Значимость по хи-квадрат при заданных q и df;
- Вычисление 95% доверительного интервала для медианы (спасибо автору: Marta Garcia-Granero);
- Проверка Мак-Немара хи-квадрат(спасибо автору: Marta);
- Графики доверительных интервалов в случае повторных измерений (WSCI) Спасибо автору: Daniel B. Wright. Это ссылка на домашнюю страницу его книги и синтаксис SPSS;
- Доверительный интвервал Ходжеса-Лимана (Hodges-Lehmann) разности медиан (спасибо автору: Marta Garcia-Granero);
- Доверительные интервалы для долей, разностей долей и связанных с ними величин (ссылка на страницу Dr. Robert G. Newcombe);
- Точный доверительный интервал для параметра биномиального распределения;
- Проверка согласия для распределения Пуассона (спасибо автору — Marta Garcia-Granero);
- Нормализация баллов (raw scores) (автор — Valentim R. Alferes);
- Проверки и доверительные интервалы для долей (спасибо автору: Gwilym Pryce) Реализованы следующие алгоритмы для больших выборок:
- проверка для одной доли;
- доверительный интервал для одной доли;
- проверка равенства двух долей;
- доверительный интервал для разности двух долей. - Проверка линейных ограничений в множественной регрессии (спасибо автору — Johannes Naumann). Макрос проверяет линейные гипотезы общего вида cb=d, где b - вектор коэффициентов регрессии, а c - матрица линейных ограничений;
- Одномерные и многомерные проверки на асимметрию и эксцесс (ссылка на страницу автора — Lawrence T. Decarlo's). Там же найдёте:
- макрос SPSS для многомерных проверок на асимметрию по алгоритму Мардиа (Mardia);
- синтаксис SPSS для моделей обнаружения сигналов как обобщённых линейных моделей.
Подгонка распределений
- Подгонка моделей с избыточной дисперсией (экстра-вариация в распределении Пуассона).
Экспорт, импорт
(см. также ЧаВо и Скрипты)- Экспорт всех таблиц в MS Word.SPS (см. автоматизированное решение на странице Скрипты)
- Экспорт данных в Excel с метками значений вместо самих значений.SPS
- Экспорт содержимого редактора данных на конкретный лист рабочей книги Excel.SPS
- Экспорт из SPSS в ACCESS.SPS
- Экспорт из SPSS в ACCESS (метод 2).SPS
- Экспорт более, чем 256 переменных в Excel.SPS
- Экспорт некоторых переменных из SPSS на несколько листов рабочей книги Excel.SPS
- Импорт из ACCESS или LotusNotes.SPS (не требуется DSN - очень удобно. Спасбо автору - Tom Dierickx)
- Запись данных из файла SPSS 10 в базу данных через ODBC.SPS (из AnswerNet)
Факторный анализ
- Коэффициент конгруэнтности в факторном анализе (ссылка на макрос)
- Определение числа компонент с использованием параллельной процедуры и проверки MAP Велисера (ссылка на сайт Brian P. O'Connor)
- Факторный анализ с матрицей корреляций Спирмена на входе.SPS
Выделение и отбор наблюдений
- Исключить «выбросы» из анализа.SPS (где выбросы определяются как значения, выходящие за 2 станд. откл. от среднего)
- Отметить наблюдения, содержащие в строковой переменной заданное слово.SPS
- Отметить наблюдения, в которых переменные содержат повторяющиеся значения.SPS
- Отметить 5% наиболее высоких зарплат.SPS
- Отметить наблюдение, если оно само, либо предшествующее ему, либо последующее наблюдение для одного и того же человека удовлетворяет некоторому условию.SPS
- Пометить первую и последнюю дату наблюдения (в пределах каждого ID).SPS
- Сохранить только записи пациентов, наблюдавшихся несколько раз.SPS
- Вывести частотную таблицу для n наиболее или наименее часто встречающихся категорий.SPS
- Отобрать пациентов, которым лекарство №1 назначалось перед лекарством №2.SPS
- Отобрать наблюдения, для которых одна и та же буква появлялась в строке дважды.SPS
- Осложнённый поиск в текстовой строке.SPS (данные со сканера, часть символов ошибочно распознана как буквы (например, B) вместо цифр (например, 8); синтаксис отмечает такие случаи)
Интерактивные графики — IGRAPH
(см. также IGRAPH на странице скриптов)- Кластеризованные столбцовые диаграммы с процентами от численности кластера.SPS
- Пример графика поверхности.SPS
- Рисование пользовательской функции.SPS
- Отображение эффекта взаимодействия во множественной регрессии.SPS
- Как ускорить построение графиков.SPS (можно использовать для разных типов графиков)
- Возрастные пирамиды.SPS
- Масштабирование графика.SPS
- Одна ящичковая диаграмма на каждую категорию переменной.SPS (синтаксис можно адаптировать под любой другой тип графика)
Анализ тестов (анализ вариантов)
- Синтаксис для анализа тестов.SPS По материалам SPSS's White Paper on Item Analysis. Использует этот пример данных.
Метки, имена и форматы переменных
- Добавить в имена переменных первый символ (или заменить его).SPS
- Закончить имена переменных обозначением «_99».SPS
- Создать метки значений из значений строковой переменной.sps
- Приписать одну и ту же метку нескольким переменным.SPS
- Приписать порядковые метки значений вектору переменных.SPS
- Скопировать метку переменной и метки её значений на другие переменные.SPS
- Переименовать переменные автоматически.SPS
- Автоматическое переименование или копирование переменных.SPS
- Поменять формат у 600 переменных.SPS
- Изменить формат переменной.SPS (см. также мастер-класс. Если не знакомы с макросами, ознакомьтесь со страничкой для начинающих).
- Создание фиктивных переменных.SPS (называемых также индикаторными или двоичными)
- Создание фиктивных переменных (AnswerNet).SPS
- Создать переменную с частотами значений переменной var1.SPS
- Определить глобальную переменную.SPS (полезный приём в программировании)
- Задать метки переменных через макрос.SPS
- Удалить все метки переменных в заданном .sav-файле.SPS
- Удалить переменные по списку (некоторые могут отсутствовать в файле).SPS
- Удалить переменные, все значения которых равны нулю.SPS
- Переупорядочивание и удаление столбцов (переменных).SPS
- Удаление меток множества переменных.SPS
- Группировка данных и создание соответствующих меток (категоризация).sps
- Перечислить переменные, расположенные между двумя заданными переменными.SPS (раздел избранных макросов)
- Объединить файл описанных переменных и файл данных.SPS
- Вывести метки переменных и значений в одной и той же частотной таблице.SPS
- Прочесть имена и метки переменных и значений из ASCII-формата.SPS
- Продублировать переменные так, что имя var1 становится varx и т.д.SPS
- Удаление символа подчёркивания из имён переменных.SPS (можно адаптировать под любой символ)
- Переименование векторных переменных.SPS
- Переименовать все переменные так, что t2abc становится t1abc и т.д.SPS
- Дать переменным из файла 1 такие же имена, как в файле 2.SPS
- Обратить порядок категорий и их меток.SPS
- Округлить значения и поменять формат у всех числовых переменных.SPS
- Отображение 0.45 вместо .45.SPS
- Расположить переменные в алфавитном порядке (AnswerNet).SPS
- Расположить переменные в алфавитном порядке — 2.sps (автор A. Paul Beaulne)
- Расположить переменные в алфавитном порядке — 3.sps
- Записать метки значений в ASCII-файл (AnswerNet).SPS
- «Развернуть» векторные имена переменных.SPS
Сопоставление файлов данных
- Сравнение 2 файлов данных.SPS Спасибо автору: Simon Freidin
- Записать окончательный файл, если две его версии совпадают.SPS (две версии вводились 2 разными людьми и затем были слиты в один файл)
- Контроль и отсев записей-дубликатов.SPS
- Контроль ошибок ввода в 2 файлах (данные введены дважды).SPS
- Слияние «один-ко-многим» по ключу из 4 переменных.sps
- Слияние двух файлов по условияю вхождения дат.SPS
- Слияние двух файлов по принципу «много-ко-многим».SPS
Работа с матрицами и язык Matrix
- Примеры чтения, записи, создания и преобразования матриц;
- Экспорт ковариационной матрицы в файл ASCII;
- Экспорт ковариационной матрицы в .sav-файл;
- Вычисление обратной матрицы;
- Построение нечёткой таблицы сопряжённости с использованием команды MATRIX (файл .pdf, 256 Кб);
- Макрос, генерирующий исходные данные в пустом редакторе данных. Спасибо автору, Fernando Cartwright;
- Вывод матрицы корреляций переменных и главных компонент в файл данных;
- Максимизация следа матрицы. Может быть ресурсоёмким. Требует проверки всех перестановок строк в поиске максимального следа. Для матрицы 7*7 (максимальный размер, поддерживаемый макросом в ранних версиях SPSS) проверяется 5 040 перестановок;
- Чтение матриц;
- Анализ надёжности (пригодности) на основе корреляционной матрицы;
- Растянуть матрицу в вектор.
Мета-анализ
(см. также страницу с учебными материалами по мета-анализу от David B. Wilson)- [English] META-SPSS.ZIP An exhaustive set of syntax files written by Marta Garcia-Granero as well as sample data files and supporting documents. This is the [English] Read Me First documentation.
- Мета-анализ: модели с постоянными и случайными эффектами. (Спасибо автору — Valentim R. Alferes) Этот синтаксис выполняет метаанализ на наборе исследований с проверками на равенство 2 средних по независимым выборкам. Применяется статистика d Кохена (Cohen's d). Пользователь может комбинировать до 10 режимов ввода агрегированных данных.
Множественные ответы
OMS
(Output Management System - система управления результатами)Выбросы.
Внимание: перед заменой или удалением выбросов прочтите предостережение в начале синтаксиса № 3.Поэлементный разбор и маркировка данных
(см. также Манипуляция строками)- Сделать побитовое разложение целого числа.SPS
- Извлечь часть строки.SPS (строка содержит имя и фамилию. Требуется извлечь первые 3 буквы фамилии)
- Извлечь часть строки, начинающуюся с цифры.SPS
- Извлечь индекс из поля адреса.SPS
- Извлечь 2 числа из строки.SPS (т.е. строка «120/90» становится числами 120 и 90)
- Пометить, если последние символы в строке - 'Esq'.SPS
- Разбить строку на значения односимвольных переменных.SPS
- Выделить в строке числа, разделённые запятыми.SPS
- Разнести по разным переменным данные, разделённые символом «/».SPS
- Извлечь доменное имя из адреса электронной почты.SPS
- Разложить значения, разделённые запятыми, по разным переменным и закодировать результат.SPS
- Разбор строк, имеющих в себе символы возврата строки и перевода каретки.SPS (спасибо Bjarte Aagnes)
- Убрать букву в конце строки и конвертировать остаток в числовую переменную.SPS
- Разбить строку на имена истца и ответчика.SPS
- Разбор строки со значениями, разделёнными символом «/».SPS (переменное число значений в строке)
- Отсеять буквы из строки и преобразовать остаток в число.SPS
Случайный отбор
- Сложный безповторный отбор.sps
- Отбор без возвращения (случайная перестановка номеров).sps
- Генерация случайных телефонных номеров.sps (синтаксис использует файл данных)
- Рандомизированное составление пар для t-проверки.sps
- Найти случайные пары с теми же характеристиками (поиск «близнецов»).sps
- Отметить n случайно отобранных наблюдений из каждой подгруппы.SPS
- Осуществить 2 независимых выборки с отбором по условию.sps
- Осуществить 2 случайных выборки индивидов одного и того же пола, возраста, образования.sps (по сути, аналог предыдущего примера)
- Осуществить n независимых случайных выборок объёма m из одного и того же файла.SPS
- Случайно отобрать x% наблюдений из каждой страты.SPS
- Случайно отобрать n наблюдений из каждой страты.SPS
- Осуществление нескольких выборок из одного и того же файла.sps
- Вывести случайные номера по 10 штук в строке.SPS
- Подобрать контрольную группу, подобную экспериментальной.SPS (Сопоставление на основе т.н. propensity scores. Подбирает наблюдения, которые не обязательно совпадают по ключевому параметру, но имеют похожие значения.)
- Пропорциональный отбор без возвращения.sps
- Пропорциональный случайный отбор.sps
- Пропорциональный отбор без возвращения (версия).sps
- Случайная выборка n мужчин и n женщин.sps
- Случайные выборки с заданными значениями пола, возраста и образования.sps
- Разделить файл на 2 файла случайным образом.SPS
- Рандомизировать переменную n раз и сохранить результаты.SPS
- Переставить цифры в номере социальной страховки.sps
- Отобрать по 2 наблюдения из каждой группы.sps
- Осуществить случайные выборки из каждой группы.sps
- Осуществить n случайных разбиений файла на 2 части.sps
- Случайным образом разбить файл на 10 групп одинакового размера.SPS
- Систематическая выборка заданного объёма.sps
Ранжирование, экстремумы, сортировка, группирование
- Агрегирование с медианой.SPS
- Создать переменную с накопленной суммой другой переменной.SPS
- Вычислить моду в пределах блока вопросов каждого наблюдения.SPS
- Найти число уникальных значений в пределах наблюдения.SPS
- Стандартизировать значения в пределах наблюдения.SPS
- Перекодировка на основе процентилей по подвыборке.SPS
- Вычислить некоторые процентили по подгруппам наблюдений.SPS (Спасибо, Tom Dierickx). Обратите внимание, что процентили появляются в редакторе данных, не в Output.
- Вычислить проценты на основе значений первого наблюдения.SPS
- Группировка на квинтили на основе равных вкладов в общую сумму.SPS
- Для каждого наблюдения найти наиболее раннее значение за предшествующие 7 дней.SPS(сложный алгоритм)
- Найти 5 наибольших значений в пределах одного наблюдения.SPS
- Найти 2 последних значения в ряде повторных измерений.SPS
- Поиск всех модальных значений для подгрупп наблюдений.SPS
- Определить 3 наибольших значения в каждом наблюдении.SPS
- Назвать переменные, содержащие минимум для наблюдения.SPS (Автор: Maciek Lobinski)
- Создать переменную с накопленной суммой в пределах одного id.SPS
- Последовательная нумерация в пределах одного id.SPS
- Случайный порядок.SPS
- Создать интервалы равной ширины между минимумом и максимумом переменной.SPS
- Ранжирование на основе процента положительных ответов.SPS
- Расположить переменные по именам в алфавитном порядке.SPS
- Ранжирование внутри наблюдений.SPS
- Заменить пропущенные значения медианой по строке.SPS
- Округляем в бóльшую сторону до 0.5.SPS
- Сохранить доверительный интервал для среднего (по подгруппам).SPS
- Проверить тест по ключу.SPS (автор: A. Paul Beaulne)
- Сортировка значений в пределах наблюдения (метод «пузырька»).SPS
- Группировка значений в интервалы.SPS
- Сортировка внутри наблюдений: некоторые популярные алгоритмы.SPS (Спасибо Кириллу Орлову)
Чтение, вывод и создание данных
- Добавление новых наблюдений через синтаксис.SPS
- Создание переменной как итоговой функции другой переменной.SPS
- Несколько простых примеров INPUT PROGRAM.SPS (краткий курс)
- Выделение из каждой записи типа 1 новой записи типа 0.SPS
- Добавление записей, продолжающих список.SPS
- Создать константу для каждого непропущенного значения даты.SPS
- Определение новых переменных в пустом файле данных.SPS
- Определение переменных от varX до varY.SPS
- Продублировать наблюдение n раз, где n — значение переменной.SPS (см. также следующий пример)
- Восстановить таблицу сопряжённости в исходный файл данных.SPS (разукрупнить данные)
- Размножить наблюдения x и y раз.SPS например, из наблюдения, где возраст=20, муж=5 и жен=6, сделать 5 наблюдений, где возраст=20 и пол=1 и 6 наблюдений, где возраст=20 и пол=0
- Создать наблюдения с недостающими категориями переменной.SPS
- Генерация случайных дат из заданного интервала.SPS
- Пример INPUT PROGRAM для генерации случайных данных.SPS
- Вставить пропущенные наблюдения (в пределах одного id).SPS
- Вставить наблюдения с пропущенными датами (в пределах одного id).SPS
- Вывод даты и времени в окне результатов.SPS
Чтение данных
- Пример работы DATA LIST.SPS
- Пример работы INPUT PROGRAM.SPS
- Прочесть данные с разным числом записей на одно наблюдение.SPS
- Прочесть файл ASCII (значения каждой переменной собраны в 5 строк шириной в 10 колонок).SPS
- Прочесть файл ASCII с использованием FILE TYPE.SPS
- Прочесть файл ASCII с использованием INPUT PROGRAM.SPS
- Прочесть файл ASCII с косой чертой в качестве разделителя.SPS
- Прочесть файл ASCII с двумя разделителями: запятой и дефисом.SPS
- Прочесть файл ASCII с разными десятичными разделителями: запятой и точкой.SPS
- Прочесть файл ASCII, разделённый запятыми, с запятыми внутри кавычек.SPS
- Прочесть файл ASCII, где есть фиксированный и свободный формат данных.SPS
- Пример чтения файла ASCII с фиксированным форматом данных.SPS
- Читаем файл ASCII с ПОВТОРЯЮЩИМИСЯ блоками данных.SPS
- Импорт файла, разделённого запятыми, с запятыми внутри строковых значений.SPS
- Загрузка данных с комментариями между строк.SPS
- Чтение файла сложной структуры.SPS
- Чтение записей из файла без символов окончания строки.SPS (из AnswerNet). Данные - сплошной поток без разделения на записи, поля и без символов возврата каретки
- Импорт данных с идущими подряд запятыми-разделителями.SPS
- Прочесть файл, созданный скриптом CGI.SPS
- Чтение файла, где каждое наблюдение имеет 4 числовые записи и неопределённое число строковых.SPS (иллюстрирует использование команды REREAD)
- Экспорт смешанного файла, данные по объекту — в разных записях.SPS
- Прочесть текстовый файл, пропустив n ненужных столбцов.SPS (n варьируется от файла к файлу)
- Пропустить первые 6 записей.SPS
- Пропустить одну строку при чтении файла.SPS
Запись данных
- Запись файла с разделителями «,» или TAB.SPS
- Запись частотного распределения в файл данных.SPS
- Запись пропущенных значений как точек в текстовый файл.SPS
- Экспортировать данные в файл ASCII особой структуры.SPS
- Запись меток значений вместо самих значений.SPS
Регрессия, повторные измерения
- Регрессия на уровне наблюдений с записью коэффициентов в файл;
- Проверки Breusch-Pagan & Koenker на гетероскедастичность (спасибо автору — Marta Garcia-Granero);
- Вычисление прогноза (одномерный дисп. анализ);
- Проверка Чоу (Chow test) на равенство параметров регрессии;
- Сравнение коэффициентов регрессии (спасибо автору — A. Paul Beaulne);
- Сопоставить коэффициенты для моделей в разных подгруппах;
- Условная логистическая регрессия;
- Построить все простые уравнения линейной и логистической регрессий (спасибо автору — Marta Garcia-Granero);
- Построить регрессии со всеми комбинациями независимых переменных;
- [English] Generalized Estimation Equations (GEE).zip (thanks to Terry Duncan, PhD, Oregon Research Institute). GEE is a macro for analyzing longitudinal data. The SPSS macro uses the GEE approach of Liang and Zeger (1986) to model longitudinal data for a general class of outcome variables including gaussian, poisson, binary and gamma outcomes;
- Макрос для построения логистической регрессии (см. также этот практикум);
- Нелинейная регрессия (NLR) с дисперсией остатков как функцией потерь (нетривиальное решение);
- Сплайновая (кусочная) регрессия;
- Построение таблицы прогнозных значений;
- Регрессия внутри цикла;
- Регрессия с k «проверочными» (hold-out) наблюдениями;
- Регрессия с корреляционной матрицей на входе;
- Регрессия с нормированными весами;
- Макрос для автоматизации анализа повторных измерений;
- Гребнёвая регрессия (макрос ридж-регрессии поставляется с SPSS);
- Проверки для предикторов в логистической регрессии;
- Гетероскедастично-состоятельные стандартные ошибки в форме Уайта (White's SEs) (спасибо автору — Gwilym Pryce). См. также практикум по гетероскедастичности;
- Проверка Уайта (White's test) на гетероскедастичность: статистика и значимость (спасибо автору — Marta Garcia-Granero).
Замена символов, удаление наблюдений-дубликатов и лишних переменных
- Удаление наблюдений со сторнированными суммами.SPS
- Удаление дубликатов в пределах одного наблюдения.SPS (спасибо автору — Maciek Lobinski) Например, если для данного наблюдения значение var1 совпадает с var2, синтаксис заменит var2 пропуском.
- Ищем и удаляем дубликаты наблюдений.SPS
- Удаление кавычек по краям строковой переменной.SPS
- Удаление дубликатов наблюдений.SPS
- Удаление переменных-констант из нескольких файлов.SPS
- Убрать лишние пробелы.SPS
- Замена отдельных символов в строке.SPS (см. также Упражнения по преобразованию строк)
- Копирование дубликатов во внешний файл.SPS
Преобразование структуры данных.
Часто встречающийся термин «широкие» данные означает структуру, когда повторные измерения одного или нескольких параметров на одном и том же объекте наблюдения представлены в соседних переменных так, что все измерения по объекту убираются в одну строку. Напротив, «узкие» (длинные, высокие) данные — такие, где информация о повторных однотипных измерениях представлена в разных строках; при этом одна переменная обязательно содержит код объекта, к которому относится та или иная строка — примеч. перев.- Распределить dummy-переменные (дихотомии) по 24 часам (часам суток).SPS
- Автоматизированное преобразование данных из «высокой» таблицы в «широкую».SPS
- Реструктурирование данных с сохранением группирующего параметра.SPS (автор: Kevin Hynes)
- Из «длинного» в «широкий» (помещение повторяющихся записей в одно наблюдение).SPS (автор: Hillel Vardi). А это пример данных.
- «Уплотнение» данных множественного ответа за счёт удаления «пустых» переменных.SPS
- Устранить дубликаты, сохранив максимум информации.SPS (маленькая забавная задачка)
- Исправление структуры файла, где каждая переменная занимает 10 колонок и 5 строк.SPS (ещё одна интересная ситуация)
- «Сжать» данные, объединив непрерывные отрезки времени.SPS
- Объединение нескольких наблюдений в одно, пример 1.SPS
- Объединение нескольких наблюдений в одно, пример 2.SPS
- Преобразование данных из «узкого» вида в «широкий» при наличии текстовых значений.SPS
- Преобразование к «широкому» виду с особым порядком переменных.SPS
- Реструктурирование файла от «широкого» к «узкому» виду.SPS
- Из «широкого» к «узкому» с индикатором наличия наблюдения.SPS
- Пример переструктурирования файла данных — 1.SPS
- Пример переструктурирования данных — 2.SPS
- Пример переструктурирования данных — 3.SPS
- Сбор информации об объекте из разных строк в одну с вычислением % вклада каждой категории в общую сумму.SPS
- Переход от «высокого» набора данных к «широкому» — общее решение.SPS (интересный макрос…)
- Реорганизация данных об одновременных активностях испытуемых (временнáя матрица).SPS
- Преобразование данных для вычисления статистики kappa.SPS
- Транспонирование данных со строковыми значениями.SPS
- Преобразование от «широкого» к «узкому» с добавлением старых имён переменных в качестве меток значений.SPS
Следующие примеры требуют версий 12 и выше - Преобразования структуры файла с использованием CASESTOVARS и VARSTOCASES.SPS
Кривые ROC
- Кривые ROC и индекс Юдена (Youden's Index).SPS Синтаксис также вычисляет отношения правдоподобия и расстояния Кульбака-Лейблера для определения диагностического потенциала тестов (требует версии 12 или более поздней).
Объём выборки, мощность статистического критерия
- Примеры анализа мощности критерия.SPS Автор: Bruce Weaver
- Размер выборки для статистических выводов о средних.SPS Автор: Marta Garcia-Granero. Набор макросов, выполняющих расчет размера выборки для построения доверительных интервалов и проверки гипотез (одно- и двухвыборочные критерии, с равными и неравными объемами выборок), а также — расчет мощности статистической проверки.
- Размер выборки для статистических выводов о долях.SPS Автор: Marta Garcia-Granero. Набор макросов, выполняющих расчет размера выборки для доверительных интервалов и проверки гипотез (одно- и двухвыборочные критерии), а также — расчет мощности статистических тестов.
- Размер выборки для проверки гипотез о корреляциях.SPS Спасибо, Марта!
Самонастраивающийся синтаксис
(другие примеры подобного рода раскиданы по всему сайту)- Преобразование структуры данных от «узкой» к «широкой».SPS
- INCLUDE в зависимости от содержимого файла данных.SPS
- Определить из данных конец цикла !DO в макросе.SPS
- Выполнение отдельных блоков синтаксиса.SPS см. также советы по команде INCLUDE
- Из 2 файлов — в один «широкий».SPS
- Изменение алгоритма обработки в зависимости от имени файла.SPS
Строки
- Проверка вхождения в строковую переменную всех слов заданной фразы.SPS
- Проверка наличия в строковой переменной КАЖДОГО из слов заданной фразы.SPS
- Перевод строковых переменных в нижний регистр.SPS
- Преобразование числовых переменных в строковые.SPS
- Перевести строку '250 млн' в число.SPS (или '16 млрд' и т.д.)
- Конвертирование строк в числовую переменную.SPS
- Реализация алгоритма фонетического сравнения Soundex.SPS
Анализ выживаемости
Показатели неравенства
- Индекс различия (показатель расхождения).SPS (формулы взяты из книги Karl and Alma Taeuber "Negroes in Cities" (1965))
- Несколько показателей неравенства (версия 5).SPS (этот шаблон графика подходит для использования с синтаксисом на SPSS до 12 версии)
Этот синтаксис (формулы взяты с poorcity.richcity.org) вычисляет следующие показатели:
- индекс Аткинсона (коэффициент спроса);
- энтропийный коэффициент (показатель избыточности) Тейла;
- коэффициент резервов;
- коэффициент D&R = коэффициент Кульбака-Лейблера;
- показатель избыточности Кульбака-Лейблера (KULLBACK-LIEBLER redundancy);
- коэффициент Хувера (HOOVER coefficient);
- коэффициент Коултера (COULTER coefficient);
- индекс Джини.Строится кривая Лоренца. При наличии данных за ряд периодов коэффициенты можно отобразить в динамике на графике. В конце файла даны 9 примеров использования синтаксиса.
Проверка существования файла или переменной
- Проверка существования файла.SPS
- Подключать синтаксис к обработке в зависимости от наличия переменной.SPS
- Определение имён числовых и строковых переменных.SPS (на выходе — 2 макроса, один из которых содержит имена всех числовых, другой — всех строковых переменных)
Временные ряды
Преобразования переменных
- Трансформация переменной в интервал от 0 до 1;
- Трансформация переменной в заданный интервал. Сначала частное решение, а затем 2 обобщения в макросах;
- Преобразование числа в строку с сохранением ведущих нулей;
- Создание стандартизированной копии переменной;
- Извлечение первой или первых двух цифр из целого числа;
- «Глобальное» автоматическое перекодирование. Перекодирование блока строковых переменных с сохранением единой схемы кодирования (скажем, «a»=1, «b»=2 и т.д.) вне зависимости, встречаются ли все эти значения во всех переменных;
- Подстановка обезличенных кодов вместо персональных идентификационных номеров;
- Замена значений, превосходящих x, на среднее по прочим значениям;
- Замена буквы на «9999» с последующей конвертацией в число;
- Замена буквенных кодов на числовые. («5A» становится «5.1», «7B» — «7.2» и т.д.).
T-критерии, средние, дисперсионный анализ
- Двухфакторный дисперсионный анализ (спасибо автору: Valentim Alferes). Вычисление некоторых дополнительных статистик дисперсионного анализа плана A*B: компоненты дисперсии, меры связи, сила эффекта, наблюдаемая мощность критерия. Работает как с исходными данными, так и с опубликованными агрегированными результатами.
- Воспроизводство результатов однофакторного дисперсионного анализа (автор: Valentim Alferes). Метод 1: даны N, средние, SD. Метод 2: даны N, средние, дисперсии. Метод 3: даны N, средние, стандартные ошибки. Метод 4: даны средние, степени свободы числителя/знаменателя и стандартные ошибки;
- Критические значения для проверок Хартли и Кочрена на равенство дисперсий (это не синтаксис, а просто таблицы значений для 5% и 1% уровней значимости. Спасибо, Marta Garcia-Granero);
- Cравнение данных по каждому наблюдению со средним значением по всем прочим наблюдениям (небольшой макрос);
- t-проверка по обобщенным данным (только средние, стандартные отклонения и размеры выборок, эквивалент с дисперсионным анализом);
- t-проверка с независимыми выборками по агрегированным данным (спасибо, Marta Garcia-Granero). Включает проверку Хартли, стандартный t-критерий и проверку Велча (Welch), а также доверительные интервалы для разности;
- Многомерный критерий T-квадрат Хотеллинга и анализ профилей (спасибо, Richard MacLennan);
- Множественные проверки Манна-Уитни (использование макроса для выполнения процедур «внутри» цикла LOOP);
- Однофакторный дисперсионный анализ по сгруппированным данным (I). Дополнительно выполняются несколько проверок на равенство дисперсий по агрегированным данным. Спасибо, Marta Garcia-Granero;
- Однофакторный дисперсионный анализ по сгруппированным данным (II). Случай нескольких подмассивов в одном файле. Автор: Marta Garcia-Granero;
- Стандартизированные показатели величины эффекта (Гласса, Хеджеса и Кохена) (спасибо, Marta). Показатели эффекта и их стандартные ошибки добавляются в файл данных;
- t-критерий на шкалах Лайкерта: эксперимент;
- Статистика на основе t-критерия: эффект, неперекрытие, мощность (автор: Valentim Alferes). Можно использовать первичные данные, либо воспроизвести выдачу процедуры SPSS T-Test по статистикам из журнальных статей.
Разное
- Поправки для собственных уровней значимости при множественных сравнениях.SPS Спасибо автору: Marta Garcia-Granero за улучшенную версию её программы. Ссылки на литературу прилагаются.
Программа рассчитывает скорректированные p-values с использованием следующих 8 методов:
Одношаговые: Бонферрони, Сидака;
Нисходящие: Бонферрони (Холмса), Сидака (тж. Холмса-Сидака) и Финнера;
Восходящие: Хоммеля, Хокберга, Саймса. - Вычисление процента от суммарного веса вопросов.SPS
- Вычисления с триадами столбцов.SPS
- Макрос расчета канонических корреляций.sps (поставляется с SPSS)
- Заполнение пропусков значениями из предыдущих строк.SPS
- Заполнение пропусков значениями из предыдущих строк с учётом ID.SPS
- Проверка взаимодействия в факторном плане с негауссовой зависимой переменной.SPS Спасибо автору: Marta Garcia-Granero за этот код.
- Временная приостановка и возобновление выдачи в окно результатов (output).SPS
- Найти LAG(var1,var2).SPS (переменный сдвиг)
- Поправки для собственных уровней значимости при множественных сравнениях.SPS Спасибо автору: Marta Garcia-Granero за улучшенную версию её программы. Ссылки на литературу прилагаются.
Работа с несколькими файлами данных
(см. также соответствующий раздел на странице «Скрипты»)- Объединение множества файлов данных с одними и теми же переменными.SPS
- альтернатива 1: этот скрипт работает даже когда имена файлов заранее неизвестны
- альтернатива 2: использовать команду DOS copy *.txt newfile.txt для объединения всех файлов .txt в один в текущей папке (спасибо за совет Скотту Кларку (Scott Clark)) - Слить любое число последовательно поименованных файлов, по 50 файлов за итерацию.SPS
- Объединить множество файлов .xls в один .sav-файл.SPS
- Объединить 2 файла данных по принципу «много-ко-многим».SPS
- Использование шаблонного DATA LIST, который находится вне основного синтаксиса.SPS (пример того, как синтаксис может быть модифицирован через синтаксис)
- Удаление из основного файла данных копий наблюдений, находящися в другом файле.SPS
- Сохранить в основном файле лишь те наблюдения, копии которых есть в другом файле.SPS
- Удаление файлов.SPS
- Первый пример использования команды UPDATE.SPS
- Второй пример использования команды UPDATE.SPS
- Вычислить средние по 3 разным файлам данных.SPS
- Вызвать 200 файлов синтаксиса на исполнение через макрос.SPS
- Макрос для удаления файлов по списку.SPS
- Объединение множества файлов из множества папок.SPS
- Обработать все файлы .xls в заданной папке.sbs (Это скрипт. Он работает вместе с этим файлом синтаксиса)
- Запустить макрос ля обработки нескольких файлов.SPS
- Выбор файла для обработки на основе содержимого файла данных.SPS
- Выполнить макрос для всех файлов, чьи имена перечислены в .sav-файле.SPS
- Сохранить файлы с именами file1, file2, file3, и т.д. с помощью макроса.SPS
- Расщепить большой файл на несколько файлов по категориям.SPS (создать отдельный .sav-файл на каждое уникальное значение категориальной переменной числового формата)
- Расщепить большой файл на несколько файлов по категориям строковой переменной.SPS (создать отдельный .sav-файл на каждое уникальное строковое значение переменной)
- Расщепить файл, имеющий k*n наблюдений на k файлов по n наблюдений в каждом.SPS
- Нестандартное слияние файлов.SPS
- Подсчёт числа различий между 2-мя файлами данных.SPS (контроль двойного ввода).
Дополнительные примеры см. в разделе Сопоставление файлов данных
- Объединение множества файлов данных с одними и теми же переменными.SPS
Работа с пропущенными значениями.
NB! Замена пропущенных значений валидными — не та процедура, которая может быть выполнена полностью автоматически. См. страницу Дэвида Хоуэла (David C. Howell) по этому вопросу: «Обработка пропущенных данных» (англ.)
- Замена пропусков средним значением с дополнительными условиями;
- Замена средним значением с органичением на долю пропусков;
- Удаление «пустых» переменных;
- Определение трёх типов пропущенных значений;
- Замена пропусков по стратам методом «hot deck» (автор программы: Theo van der Weegen);
- Формирование перечня/сводки пропущенных значений;
- Замена определенного числа пропусков в аддитивной шкале средним значением;
- Пропущенные значения и конструкция DO IF;
- Заменить пропусками определенные даты;
- Подстановка данных из предыдущих строк в «пустые» ячейки;
- Подставить среднее значение по категории на место пропуска;
- Замена пропусков медианой по наблюдению;
- Замена пропусков случайными значениями той же переменной (см. метод «hot deck» выше; там дано более универсальное решение);
- Замена пропусков средним значением по наблюдению.
Совместный (Conjoint) анализ
- Методическое приложение (файл .pdf, 708 Кб);
- Пример анализа плана 2 x 2.
Анализ соответствий (Correspondence Analysis)
- Простой и множественный анализ соответствий… (файл .pdf, 1.48 Мб). Выпусная квалификационная работа студента ГУ—ВШЭ Марка Шафира, ныне — директора исследовательской компании «Радар».







