Проектирование повторяющихся мер
статьи первый раздел Возможно, придется переписать . ( Август 2017 г. ) |
План повторных измерений — это план исследования , который включает в себя несколько измерений одной и той же переменной, взятых у одних и тех же или совпадающих субъектов либо в разных условиях, либо в течение двух или более периодов времени. [1] Например, повторные измерения собираются в рамках продольного исследования , в котором оцениваются изменения с течением времени.
Перекрестные исследования
[ редактировать ]Популярным методом повторных измерений является перекрестное исследование . Перекрестное исследование — это продольное исследование , в котором субъекты получают последовательность различных видов лечения (или воздействий). Хотя перекрестные исследования могут быть обсервационными , многие важные перекрестные исследования представляют собой контролируемые эксперименты . Кроссоверные конструкции распространены для экспериментов во многих научных дисциплинах , например, в психологии , образовании , фармацевтике и здравоохранении , особенно в медицине.
Рандомизированные контролируемые перекрестные эксперименты особенно важны в здравоохранении. В рандомизированном клиническом исследовании субъектам случайным образом назначают лечение. Когда такое исследование представляет собой схему с повторными измерениями, испытуемых случайным образом распределяют на последовательность курсов лечения. Перекрестное клиническое исследование представляет собой схему с повторными измерениями, в которой каждому пациенту случайным образом назначается последовательность курсов лечения, включая как минимум два лечения (из которых одно может быть стандартным лечением или плацебо ): Таким образом, каждый пациент переходит от одного лечения другому.
Почти все перекрестные схемы имеют «баланс», что означает, что все субъекты должны получить одинаковое количество процедур и что все субъекты участвуют в течение одинакового количества периодов. В большинстве перекрестных исследований каждый субъект получает все виды лечения.
при лонгитудинальном исследовании последовательных эффектов повторных курсов лечения не обязательно использовать какой-либо « перекрестный метод Однако многие планы повторных измерений не являются перекрестными: например, » (Вонеш и Чинчилли; Джонс и Кенвард).
Использование
[ редактировать ]- Ограниченное количество участников. Схема повторных измерений уменьшает дисперсию оценок эффектов лечения, позволяя делать статистические выводы с меньшим количеством участников. [2]
- Эффективность. Планы с повторяющимися измерениями позволяют проводить многие эксперименты быстрее, поскольку для завершения всего эксперимента требуется обучение меньшего количества групп. Например, эксперименты, в которых каждое условие занимает всего несколько минут, тогда как обучение выполнению заданий занимает столько же, а то и больше времени.
- Продольный анализ. Повторяющиеся схемы измерения позволяют исследователям отслеживать, как участники меняются с течением времени, как в долгосрочных, так и в краткосрочных ситуациях.
Эффекты порядка
[ редактировать ]Эффект порядка может возникнуть, когда участник эксперимента может выполнить задачу, а затем выполнить ее снова. Примеры эффектов порядка включают улучшение или снижение производительности, что может быть связано с эффектом обучения, скукой или усталостью. Влияние эффектов порядка может быть меньшим в долгосрочных лонгитюдных исследованиях или за счет уравновешивания с использованием перекрестного плана .
Уравновешивание
[ редактировать ]В этом методе две группы выполняют одни и те же задачи или испытывают одни и те же условия, но в обратном порядке. При двух задачах или условиях формируются четыре группы.
Задача/Условие | Задача/Условие | Примечания | |
---|---|---|---|
Группа А | 1 | 2 | Группа А сначала выполняет задачу/условие 1, затем задачу/условие 2. |
Группа Б | 2 | 1 | Группа B сначала выполняет Задачу/Условие 2, затем Задачу/Условие 1. |
Уравновешивающие попытки принять во внимание два важных источника систематических изменений в этом типе дизайна: практика и эффект скуки. В противном случае и то, и другое может привести к разным результатам участников из-за знакомства с лечением или усталости от него.
Ограничения
[ редактировать ]Для каждого участника может оказаться невозможным присутствовать во всех условиях эксперимента (т. е. временные ограничения, место проведения эксперимента и т. д.). Субъекты с тяжелым заболеванием, как правило, выбывают из продольных исследований, что потенциально искажает результаты. В этих случаях модели со смешанными эффектами предпочтительнее использовать , поскольку они могут работать с пропущенными значениями.
Регрессия среднего значения может влиять на условия со значительными повторениями. Созревание может повлиять на исследования, которые растягиваются во времени. События вне эксперимента могут изменить реакцию между повторениями.
Повторные измерения ANOVA
[ редактировать ]Дисперсионный анализ повторных измерений (rANOVA) — это широко используемый статистический подход к планированию повторяющихся измерений. [3] В таких планах фактор повторного измерения (качественная независимая переменная) является внутрисубъектным фактором, а зависимая количественная переменная, по которой измеряется каждый участник, является зависимой переменной.
Разделение ошибки
[ редактировать ]Одним из величайших преимуществ RANOVA, как и в случае с планами повторных измерений в целом, является способность выделять изменчивость, обусловленную индивидуальными различиями. Рассмотрим общую структуру F-статистики :
- F = Обработка МС / Ошибка МС = ( Обработка df SS / Обработка )/( Ошибка SS / Ошибка df )
В межсубъектном дизайне присутствует элемент дисперсии, обусловленный индивидуальными различиями, который сочетается с условиями лечения и ошибками:
- SS Итого = Лечение SS + Ошибка SS
- df Всего = n - 1
При планировании повторных измерений можно отделить изменчивость субъекта от условий лечения и ошибок. В таком случае изменчивость можно разбить на изменчивость между курсами лечения (или внутрисубъектные эффекты, исключая индивидуальные различия) и изменчивость внутри курса лечения. Вариабельность внутри лечения можно далее разделить на вариабельность между субъектами (индивидуальные различия) и ошибку (исключая индивидуальные различия): [4]
- SS Итого = Лечение SS (исключая индивидуальные различия) + Субъекты SS SS + Ошибка
- df Всего = df Лечение (внутри субъектов) + df между субъектами df + ошибка = ( k - 1) + ( n - 1) + (( n - k )( n - 1))
Что касается общей структуры F-статистики, ясно, что при разделении вариабельности между субъектами значение F увеличится, поскольку сумма квадратов ошибки будет меньше, что приведет к меньшему значению MSError. Примечательно, что изменчивость разделения уменьшает степени свободы по F-тесту, поэтому изменчивость между субъектами должна быть достаточно значительной, чтобы компенсировать потерю степеней свободы. Если вариабельность между субъектами невелика, этот процесс может фактически снизить значение F. [4]
Предположения
[ редактировать ]Как и при любом статистическом анализе, для обоснования использования этого теста должны быть выполнены конкретные допущения. Нарушения могут от умеренной до серьезной повлиять на результаты и часто приводят к увеличению количества ошибок 1-го типа . При использовании RANOVA применяются стандартные одномерные и многомерные предположения. [5] Одномерные предположения:
- Нормальность. Для каждого уровня внутрисубъектного фактора зависимая переменная должна иметь нормальное распределение .
- Сферичность . Оценки различий, рассчитанные между двумя уровнями внутрисубъектного фактора, должны иметь одинаковую дисперсию для сравнения любых двух уровней. (Это предположение применимо только в том случае, если существует более двух уровней независимой переменной.)
- Случайность. Случаи должны быть получены из случайной выборки, а оценки разных участников должны быть независимы друг от друга.
RANOVA также требует соблюдения определенных многомерных предположений, поскольку многомерный тест проводится на основе разницы оценок. Эти предположения включают в себя:
- Многомерная нормальность. Разностные оценки имеют многомерное нормальное распределение в популяции.
- Случайность. Отдельные случаи должны быть получены из случайной выборки, а различия в баллах для каждого участника не зависят от оценок другого участника.
F-тест
[ редактировать ]Как и в случае с другими дисперсионными тестами, raNOVA использует статистику F для определения значимости. В зависимости от количества внутрииспытуемых факторов и нарушений предположений необходимо выбрать наиболее подходящий из трех тестов: [5]
- Стандартный одномерный тест ANOVA F. Этот тест обычно используется, учитывая только два уровня внутрисубъектного фактора (т. е. момент времени 1 и момент времени 2). Этот тест не рекомендуется проводить при наличии более двух уровней внутрисубъектного фактора, поскольку в таких случаях предположение о сферичности обычно нарушается.
- Альтернативный одномерный тест [6] — Эти тесты учитывают нарушения предположения о сферичности и могут использоваться, когда внутрисубъектный фактор превышает 2 уровня. Статистика F такая же, как и в стандартном одномерном тесте ANOVA F, но связана с более точным значением p. Эта коррекция осуществляется путем уменьшения степеней свободы для определения критического значения F. Обычно используются две поправки: поправка Гринхауса – Гейссера и поправка Хюйна – Фельдта. Поправка Гринхауса-Гейссера более консервативна, но решает общую проблему увеличения изменчивости с течением времени в планах с повторными измерениями. [7] Поправка Хюиня – Фельдта менее консервативна, но не решает проблемы увеличения изменчивости. Было предложено использовать нижний диапазон Хюйна – Фельдта при меньших отклонениях от сферичности, а метод Гринхауса – Гейссера использовать при больших отклонениях.
- Многомерный тест. Этот тест не предполагает сферичности, но также является очень консервативным.
Размер эффекта
[ редактировать ]Одной из наиболее часто сообщаемых статистических величин эффекта для rANOVA является частичный эта-квадрат (η p 2 ). Также часто используется многомерная η 2 когда предположение о сферичности было нарушено, и сообщается статистика многомерного теста. Третья статистика размера эффекта, о которой сообщается, представляет собой обобщенное η 2 , что сравнимо с η p 2 в однофакторном дисперсионном анализе с повторными измерениями. Было показано, что это лучшая оценка размера эффекта по сравнению с другими внутрисубъектными тестами. [8] [9]
Предостережения
[ редактировать ]RANOVA не всегда является лучшим статистическим анализом для планов повторных измерений. RANOVA уязвима к эффектам отсутствующих значений, вменения, неэквивалентных моментов времени между субъектами и нарушений сферичности. [3] Эти проблемы могут привести к систематической ошибке выборки и завышенному уровню ошибок первого рода. [10] В таких случаях лучше рассмотреть возможность использования линейной смешанной модели . [11]
См. также
[ редактировать ]- Дисперсионный анализ
- Протокол клинических испытаний
- Перекрестное исследование
- Планирование экспериментов
- Ожидаемые средние квадраты
- Глоссарий экспериментального дизайна
- Продольное исследование
- Кривая роста
- Отсутствующие данные
- Смешанные модели
- Многомерный анализ
- Наблюдательное исследование
- Оптимальный дизайн
- Панельный анализ
- Панельные данные
- Панельное исследование
- Рандомизация
- Рандомизированное контролируемое исследование
- Последовательность
- Статистический вывод
- Эффект лечения
- Псевдорепликация
Примечания
[ редактировать ]- ^ Краска; Мари (2010), «Проектирование повторяющихся измерений», Энциклопедия дизайна исследований , Калифорния, США: SAGE Publications, Inc., doi : 10.4135/9781412961288.n378 , ISBN 978-1-4129-6127-1 , S2CID 149337088
- ^ Баррет, Джулия Р. (2013). «Твердые частицы и сердечно-сосудистые заболевания: исследователи обращают внимание на микрососудистые изменения» . Перспективы гигиены окружающей среды . 121 (9): а282. дои : 10.1289/ehp.121-A282 . ПМК 3764084 . ПМИД 24004855 .
- ^ Jump up to: а б Георгиева; Кристалл (2004). «Подвинься, ANOVA». Генеральная психиатрия . 61 (3): 310–7. дои : 10.1001/archpsyc.61.3.310 . ПМИД 14993119 .
- ^ Jump up to: а б Хауэлл, Дэвид С. (2010). Статистические методы психологии (7-е изд.). Бельмонт, Калифорния: Томсон Уодсворт. ISBN 978-0-495-59784-1 .
- ^ Jump up to: а б Салкинд, Сэмюэл Б. Грин, Нил Дж. (2011). Использование SPSS для Windows и Macintosh: анализ и понимание данных (6-е изд.). Бостон: Прентис Холл. ISBN 978-0-205-02040-9 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Васи; Тайер (1987). «Постоянная проблема ложных срабатываний при повторных измерениях ANOVA в психофизиологии: многомерное решение». Психофизиология . 24 (4): 479–486. дои : 10.1111/j.1469-8986.1987.tb00324.x . ПМИД 3615759 .
- ^ Парк (1993). «Сравнение подхода обобщенного оценочного уравнения с подходом максимального правдоподобия для повторных измерений». Стат Мед . 12 (18): 1723–1732. дои : 10.1002/сим.4780121807 . ПМИД 8248664 .
- ^ Бейкман (2005). «Рекомендуемая статистика величины эффекта для планов повторных измерений» . Методы исследования поведения . 37 (3): 379–384. дои : 10.3758/bf03192707 . ПМИД 16405133 .
- ^ Олейник; Альгина (2003). «Обобщенная статистика квадратов эта и омега: меры величины эффекта для некоторых распространенных исследовательских проектов». Психологические методы . 8 (4): 434–447. дои : 10.1037/1082-989x.8.4.434 . ПМИД 14664681 . S2CID 6931663 .
- ^ Мюллер; Бартон (1989). «Приблизительная мощность для дисперсионного анализа повторных измерений без сферичности». Журнал Американской статистической ассоциации . 84 (406): 549–555. дои : 10.1080/01621459.1989.10478802 .
- ^ Крюгер; Тиан (2004). «Сравнение общей линейной смешанной модели и ANOVA с повторными измерениями с использованием набора данных с несколькими пропущенными точками данных». Биологические исследования для медсестер . 6 (2): 151–157. дои : 10.1177/1099800404267682 . ПМИД 15388912 . S2CID 23173349 .
Ссылки
[ редактировать ]Планирование и анализ экспериментов
[ редактировать ]- Джонс, Байрон; Кенвард, Майкл Г. (2003). Планирование и анализ перекрестных исследований (второе изд.). Лондон: Чепмен и Холл.
- Вонеш, Эдвард Ф. и Чинчилли, Вернон Г. (1997). Линейные и нелинейные модели для анализа повторяющихся измерений . Лондон: Чепмен и Холл.
Исследование продольных данных
[ редактировать ]- Давидиан, Мари ; Дэвид М. Гилтинан (1995). Нелинейные модели для данных повторяющихся измерений . Монографии Чепмена и Холла / CRC по статистике и прикладной теории вероятности. ISBN 978-0-412-98341-2 .
- Фицморис, Гарретт; Давидиан, Мари; Вербеке, Герт; Моленбергс, Герт, ред. (2008). Продольный анализ данных . Бока-Ратон, Флорида: Чепмен и Холл / CRC. ISBN 978-1-58488-658-7 .
- Джонс, Байрон; Кенвард, Майкл Г. (2003). Планирование и анализ перекрестных исследований (второе изд.). Лондон: Чепмен и Холл.
- Ким, Кевин и Тимм, Нил (2007). « Ограниченная модель MGLM и кривой роста» (глава 7)». Одномерные и многомерные общие линейные модели: теория и приложения с SAS (с 1 компакт-диском для Windows и UNIX) . Статистика: Учебники и монографии (Второе изд.). Бока-Ратон, Флорида: Chapman & Hall/CRC. ISBN 978-1-58488-634-1 .
- Колло, Тыну и фон Розен, Дитрих (2005). « Многомерные линейные модели» (глава 4), особенно «Модель кривой роста и ее расширения» (глава 4.1)». Расширенная многомерная статистика с матрицами . Математика и ее приложения. Том. 579. Нью-Йорк: Спрингер. ISBN 978-1-4020-3418-3 .
- Кширсагар, Анант М. и Смит, Уильям Бойс (1995). Кривые роста . Статистика: Учебники и монографии. Том. 145. Нью-Йорк: Marcel Dekker, Inc. ISBN. 0-8247-9341-2 .
- Пан, Цзянь-Синь и Фанг, Кай-Тай (2002). Модели кривой роста и статистическая диагностика . Серия Спрингера по статистике. Нью-Йорк: Springer-Verlag. ISBN 0-387-95053-2 .
- Себер, GAF и Wild, CJ (1989). « Модели роста (глава 7)» «. Нелинейная регрессия . Серия Уайли по вероятности и математической статистике: Вероятность и математическая статистика. Нью-Йорк: John Wiley & Sons, Inc., стр. 325–367. ISBN 0-471-61760-1 .
- Тимм, Нил Х. (2002). « Общая модель MANOVA (GMANOVA)» (глава 3.6.г)». Прикладной многомерный анализ . Тексты Спрингера в статистике. Нью-Йорк: Springer-Verlag. ISBN 0-387-95347-7 .
- Вонеш, Эдвард Ф. и Чинчилли, Вернон Г. (1997). Линейные и нелинейные модели для анализа повторяющихся измерений . Лондон: Чепмен и Холл. (Комплексное рассмотрение теории и практики)
- Конэуэй, М. (11 октября 1999 г.). Проектирование повторяющихся мер. Получено 18 февраля 2008 г. с сайта http://biostat.mc.vanderbilt.edu/twiki/pub/Main/ClinStat/repmeas.PDF .
- Минке, А. (1997, январь). Проведение анализа повторных измерений: соображения по поводу планирования эксперимента. Получено 18 февраля 2008 г. с сайта Ericae.net: http://ericae.net/ft/tamu/Rm.htm.
- Шонесси, Джей-Джей (2006). Методы исследования в психологии. Нью-Йорк: МакГроу-Хилл.