Последовательный анализ
В статистике последовательный анализ или последовательная проверка гипотез — это статистический анализ , при котором размер выборки не фиксируется заранее. Вместо этого данные оцениваются по мере их сбора, а дальнейший отбор проб прекращается в соответствии с заранее определенным правилом остановки , как только наблюдаются значимые результаты. Таким образом, вывод иногда может быть сделан на гораздо более раннем этапе, чем это было бы возможно при более классической проверке или оценке гипотезы , и, следовательно, с меньшими финансовыми и/или человеческими затратами.
История [ править ]
Метод последовательного анализа впервые приписывается Абрахаму Вальду. [1] с Джейкобом Вулфовицем , У. Алленом Уоллисом и Милтоном Фридманом [2] в то время как в Колумбийского университета Группе статистических исследований в качестве инструмента для более эффективного контроля промышленного качества во время Второй мировой войны . Его ценность для военных действий была немедленно признана, что привело к получению «ограниченной» классификации . [3] В то же время Джордж Барнард возглавил группу, работавшую над оптимальными остановками в Великобритании. Другой ранний вклад в этот метод был сделан К. Дж. Эрроу совместно с Д. Блэквеллом и М. А. Гиршиком . [4]
Подобный подход был независимо разработан на основе первых принципов примерно в то же время Аланом Тьюрингом как часть техники Banburismus , используемой в Блетчли-Парке разные сообщения, закодированные немецкими машинами «Энигма» , для проверки гипотез о том, следует ли соединять и анализировать вместе . Эта работа оставалась секретной до начала 1980-х годов. [5]
Питер Армитидж представил использование последовательного анализа в медицинских исследованиях, особенно в области клинических испытаний. Последовательные методы стали все более популярными в медицине после работы Стюарта Покока , который дал четкие рекомендации о том, как контролировать частоту ошибок первого рода в последовательных проектах. [6]
Альфа-функции расходов [ править ]
Когда исследователи неоднократно анализируют данные по мере добавления новых наблюдений, вероятность ошибки первого рода увеличивается. Поэтому важно корректировать уровень альфа при каждом промежуточном анализе так, чтобы общая частота ошибок типа 1 оставалась на желаемом уровне. Концептуально это похоже на использование поправки Бонферрони , но поскольку повторные просмотры данных являются зависимыми, можно использовать более эффективные поправки для альфа-уровня. Среди самых ранних предложений – граница Покока . Существуют альтернативные способы контроля частоты ошибок типа 1, такие как границы Хейбиттла – Пето , а дополнительная работа по определению границ для промежуточного анализа была проведена О'Брайеном и Флемингом. [7] и Ван и Циатис. [8]
Ограничение таких коррекций, как граница Покока, состоит в том, что количество просмотров данных должно быть определено до их сбора, и что просмотры данных должны быть равномерно распределены (например, через 50, 100, 150 и 200 раз). пациенты). Подход с использованием альфа-функции расходов, разработанный Demets & Lan [9] не имеет этих ограничений и в зависимости от параметров, выбранных для функции расходов, может быть очень похож на границы Покока или поправки, предложенные О'Брайеном и Флемингом. Другой подход, который вообще не имеет таких ограничений, основан на электронных ценностях и электронных процессах .
Приложения последовательного анализа [ править ]
Клинические испытания [ править ]
В рандомизированном исследовании с двумя группами лечения групповое последовательное тестирование может проводиться, например, следующим образом: после того, как n субъектов в каждой группе будут доступны, проводится промежуточный анализ. Для сравнения двух групп проводится статистический тест, и если нулевая гипотеза отвергается, испытание прекращается; в противном случае исследование продолжается, набираются еще n субъектов в группу и снова проводится статистический тест, включая всех субъектов. Если нулевой результат отклоняется, исследование прекращается, а в противном случае оно продолжается с периодическими оценками до тех пор, пока не будет выполнено максимальное количество промежуточных анализов, после чего проводится последний статистический тест и исследование прекращается. [10]
Другие приложения [ править ]
Последовательный анализ также связан с проблемой разорения игроков , которую изучал, в частности, Гюйгенс в 1657 году. [11]
Обнаружение шага — это процесс обнаружения резких изменений среднего уровня временного ряда или сигнала. Обычно его рассматривают как особый вид статистического метода, известный как обнаружение точки изменения . Часто шаг мал, а временной ряд искажается каким-то шумом, и это усложняет задачу, поскольку шаг может быть скрыт шумом. Поэтому часто требуются алгоритмы статистической обработки и/или обработки сигналов. Когда алгоритмы запускаются онлайн по мере поступления данных, особенно с целью создания оповещения, это применение последовательного анализа.
Предвзятость [ править ]
Исследования, которые прекращаются досрочно, поскольку отвергают нулевую гипотезу, обычно переоценивают истинную величину эффекта. [12] Это связано с тем, что в небольших выборках только большие оценки размера эффекта приведут к значительному эффекту и последующему прекращению исследования. Были предложены методы корректировки оценок величины эффекта в отдельных исследованиях. [13] Обратите внимание, что эта систематическая ошибка в основном проблематична при интерпретации отдельных исследований. В метаанализе завышенная величина эффекта из-за ранней остановки уравновешивается недооценкой в исследованиях с поздней остановкой, что привело Шу и Маршнера к выводу, что «раннее прекращение клинических исследований не является существенным источником систематической ошибки в метаанализе». [14]
Значение p-значений в последовательном анализе также меняется, поскольку при использовании последовательного анализа выполняется более одного анализа, и типичное определение p-значения как данных, «по крайней мере столь же экстремальных», как наблюдаются, необходимо переопределить. . Одним из решений является упорядочивание значений p серии последовательных тестов на основе времени остановки и того, насколько высокой была статистика теста при данном просмотре, что известно как поэтапное упорядочение. [12] впервые предложенный Армитиджем .
См. также [ править ]
Примечания [ править ]
- ^ Вальд, Авраам (июнь 1945 г.). «Последовательные проверки статистических гипотез» . Анналы математической статистики . 16 (2): 117–186. дои : 10.1214/aoms/1177731118 . JSTOR 2235829 .
- ^ Бергер, Джеймс (2008). «Последовательный анализ» . (2-е изд.). стр. 438–439. дои : 10.1057/9780230226203.1513 . ISBN 978-0-333-78676-5 .
{{cite book}}
:|journal=
игнорируется ( помощь ) ; Отсутствует или пусто|title=
( помощь ) - ^ Вайгль, Ханс Гюнтер (2013). Абрахам Вальд: статистик как ключевая фигура современной эконометрики (PDF) (докторская диссертация). Университет Гамбурга.
- ^ Кеннет Дж. Эрроу , Дэвид Блэквелл и М. А. Гиршик (1949). «Байесовские и минимаксные решения задач последовательного решения». Эконометрика . 17 (3/4): 213–244. дои : 10.2307/1905525 . JSTOR 1905525 .
- ^ Рэнделл, Брайан (1980), «Колосс», История вычислений в двадцатом веке , стр. 30
- ^ В., Тернбулл, Брюс (2000). Групповые последовательные методы с применением в клинических исследованиях . Чепмен и Холл. ISBN 9780849303166 . OCLC 900071609 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ О'Брайен, Питер С.; Флеминг, Томас Р. (1 января 1979 г.). «Множественная процедура тестирования для клинических испытаний». Биометрия . 35 (3): 549–556. дои : 10.2307/2530245 . JSTOR 2530245 . ПМИД 497341 .
- ^ Ван, Сэмюэл К.; Циатис, Анастасиос А. (1 января 1987 г.). «Приблизительно оптимальные однопараметрические границы для групповых последовательных испытаний». Биометрия . 43 (1): 193–199. дои : 10.2307/2531959 . JSTOR 2531959 . ПМИД 3567304 .
- ^ Демец, Дэвид Л .; Лан, К.К. Гордон (15 июля 1994 г.). «Промежуточный анализ: подход с использованием альфа-функции расходов». Статистика в медицине . 13 (13–14): 1341–1352. дои : 10.1002/сим.4780131308 . ISSN 1097-0258 . ПМИД 7973215 .
- ^ Коростелева, Ольга (2008). Клиническая статистика: введение в клинические испытания, анализ выживаемости и продольный анализ данных (первое издание). Издательство Джонс и Бартлетт . ISBN 978-0-7637-5850-9 .
- ^ Гош, БК; Сен, ПК (1991). Справочник по последовательному анализу . Нью-Йорк: Марсель Деккер . ISBN 9780824784089 . [ нужна страница ]
- ↑ Перейти обратно: Перейти обратно: а б Прощан, Майкл А.; Лан, К.К. Гордан; Виттс, Джанет Терк (2006). Статистический мониторинг клинических исследований: единый подход . Спрингер. ISBN 9780387300597 . OCLC 553888945 .
- ^ Лю, А.; Холл, WJ (1 марта 1999 г.). «Непредвзятая оценка после группового последовательного теста» . Биометрика . 86 (1): 71–78. дои : 10.1093/biomet/86.1.71 . ISSN 0006-3444 .
- ^ Шу, И. Манджула; Маршнер, Ян К. (10 декабря 2013 г.). «Метаанализ клинических испытаний с ранней остановкой: исследование потенциальной систематической ошибки». Статистика в медицине . 32 (28): 4859–4874. дои : 10.1002/сим.5893 . ISSN 1097-0258 . ПМИД 23824994 . S2CID 22428591 .
Ссылки [ править ]
- Вальд, Авраам (1947). Последовательный анализ . Нью-Йорк: Джон Уайли и сыновья .
- Бартрофф Дж., Лай Т.Л. и Ши М.-К. (2013) Последовательные эксперименты в клинических испытаниях: дизайн и анализ. Спрингер.
- Гош, Бхаскар Кумар (1970). Последовательная проверка статистических гипотез . Чтение: Аддисон-Уэсли .
- Чернов, Герман (1972). Последовательный анализ и оптимальное проектирование . СИАМ .
- Зигмунд, Дэвид (1985). Последовательный анализ . Серия Спрингера по статистике. Нью-Йорк: Springer Verlag . ISBN 978-0-387-96134-7 .
- Бейкман Р., Готтман Дж. М. (1997) Наблюдение за взаимодействием: введение в последовательный анализ, Кембридж: Издательство Кембриджского университета.
- Дженнисон К. и Тернбулл Б.В. (2000) Групповые последовательные методы с применением в клинических испытаниях. Чепмен и Холл/CRC.
- Уайтхед, Дж. (1997). Планирование и анализ последовательных клинических исследований, 2-е издание. Джон Уайли и сыновья.
Внешние ссылки [ править ]
- Пакет R: последовательный тест отношения вероятности Уолда от OnlineMarketr.com
- Программное обеспечение для проведения последовательного анализа и применения последовательного анализа при изучении группового взаимодействия в компьютерной коммуникации, доктор Аллан Джонг из Университета штата Флорида.
- Коммерческий
- Программное обеспечение PASS Sample Size включает функции для настройки групповых последовательных планов.