Jump to content

Последовательный тест отношения вероятностей

(Перенаправлено с SPRT )

Последовательный тест отношения вероятностей (SPRT) — это особый последовательный тест гипотезы , разработанный Абрахамом Вальдом. [1] и позже доказали свою оптимальность Уолдом и Джейкобом Вулфовицем . [2] Результат Неймана и Пирсона, полученный в 1933 году, вдохновил Уолда переформулировать его как задачу последовательного анализа. Лемма Неймана-Пирсона, напротив, предлагает эмпирическое правило для случая, когда все данные собраны (и известно их отношение правдоподобия).

Первоначально SPRT был разработан для использования в исследованиях контроля качества в сфере производства, но был разработан для использования при компьютеризированном тестировании испытуемых на людях в качестве критерия прекращения испытаний. [3] [4] [5]

Теория [ править ]

Как и при классической проверке гипотез , SPRT начинается с пары гипотез, скажем и для нулевой и альтернативной гипотез соответственно. Они должны быть указаны следующим образом:

Следующим шагом является вычисление совокупной суммы логарифмического отношения правдоподобия : , по мере поступления новых данных: с , тогда для =1,2,...,

Правило остановки представляет собой простую схему определения порога:

  • : продолжить мониторинг ( критическое неравенство )
  • : Принимать
  • : Принимать

где и ( ) зависят от желаемых ошибок I и II рода , и . Их можно выбрать следующим образом:

и

Другими словами, и должны быть приняты заранее, чтобы правильно установить пороговые значения. Числовое значение будет зависеть от применения. Причина, по которой это только приближение, заключается в том, что в дискретном случае сигнал может пересечь порог между выборками. Таким образом, в зависимости от штрафа за ошибку и частоты дискретизации можно установить более агрессивные пороговые значения. Точные оценки верны в непрерывном случае.

Пример [ править ]

Хрестоматийным примером является оценка параметров функции распределения вероятностей . Рассмотрим экспоненциальное распределение :

Гипотезы

Тогда логарифмическая функция правдоподобия (LLF) для одной выборки равна

Совокупная сумма LLF для всех x равна

Соответственно, правило остановки таково:

После перестановки мы наконец находим

Пороги представляют собой просто две параллельные линии с наклоном. . Выборка должна прекратиться, когда сумма выборок выходит за пределы области продолжения выборки .

Приложения [ править ]

Производство [ править ]

Тест проводится на метрике пропорции и проверяет, переменная p равна ли одной из двух желаемых точек: p 1 или p 2 . Область между этими двумя точками известна как область безразличия (IR). Например, предположим, что вы проводите исследование контроля качества заводской партии виджетов. Руководство хотело бы, чтобы в партии было 3% или менее дефектных виджетов, но 1% или меньше — это идеальная партия, которая пройдет с честью. В этом примере p 1 = 0,01 и p 2 = 0,03 , а область между ними — это IR, поскольку руководство считает эти партии маргинальными и не против их классификации в любом случае. Виджеты будут отбираться из партии по одному (последовательный анализ) до тех пор, пока тест не определит, в пределах приемлемого уровня ошибок, что партия идеальна или ее следует отбраковать.

Тестирование испытуемых-людей [ править ]

SPRT в настоящее время является преобладающим методом классификации испытуемых в компьютерном классификационном тесте переменной длины (CCT). [ нужна ссылка ] . Два параметра - p 1 и p 2 - определяются путем определения минимального показателя (порога) для испытуемых по показателю правильной пропорции и выбора точки выше и ниже этого контрольного показателя. Например, предположим, что для теста порог сокращения установлен на уровне 70%. Мы могли бы выбрать p1 0,65 = и p2 0,75 = . Затем тест оценивает вероятность того, что истинный балл испытуемого по этому показателю равен одному из этих двух баллов. Если у экзаменуемого установлено, что он набрал 75%, он сдает экзамен, и он проваливается, если у него определено, что он набрал 65%.

Эти точки указаны не совершенно произвольно. Оценка всегда должна устанавливаться с помощью юридически оправданного метода, такого как модифицированная процедура Ангоффа . Опять же, область безразличия представляет собой область оценок, с которыми разработчик теста согласен в любом случае (пройден или не пройден). Верхний параметр p2 p1 концептуально является самым высоким уровнем, который разработчик теста готов принять за провал (поскольку все, кто ниже этого уровня, имеют хорошие шансы на провал), а нижний параметр . это самый низкий уровень, который разработчик теста готов принять принять за пропуск (потому что все, кто выше него, имеют приличные шансы пройти). Хотя это определение может показаться относительно небольшим бременем, рассмотрим случай с высокими ставками, связанный с экзаменом на получение лицензии для врачей: в какой именно момент мы должны считать, что кто-то находится на одном из этих двух уровней?

Хотя SPRT впервые был применен к тестированию во времена классической теории тестирования , как и в предыдущем параграфе, Рекейс (1983) предложил теорию ответа на задание использовать для определения параметров p 1 и p 2 . Показатель сокращения и область безразличия определяются на основе метрики скрытых способностей (тэта) и переводятся в метрику пропорции для вычислений. С тех пор в исследованиях ОКТ эта методология применялась по нескольким причинам:

  1. Банки крупных предметов, как правило, калибруются с помощью IRT.
  2. Это позволяет более точно указать параметры.
  3. Используя функцию ответа элемента для каждого элемента, параметры можно легко варьировать между элементами.

Обнаружение аномальных результатов медицинских

Шпигельхальтер и др. [6] показали, что SPRT можно использовать для мониторинга работы врачей, хирургов и других практикующих врачей таким образом, чтобы заранее предупреждать о потенциально аномальных результатах. В своей статье 2003 года они показали, как это могло помочь идентифицировать Гарольда Шипмана как убийцу задолго до того, как его действительно опознали.

Расширения [ править ]

МаксСПРТ [ править ]

Совсем недавно, в 2011 году, появилось расширение метода SPRT под названием Максимизированный последовательный тест отношения вероятностей (MaxSPRT). [7] был представлен. Отличительной особенностью MaxSPRT является допуск сложной односторонней альтернативной гипотезы и введение верхней границы остановки. Этот метод использовался в нескольких медицинских исследованиях. [8]

См. также [ править ]

Ссылки [ править ]

  1. ^ Вальд, Авраам (июнь 1945 г.). «Последовательные проверки статистических гипотез» . Анналы математической статистики . 16 (2): 117–186. дои : 10.1214/aoms/1177731118 . JSTOR   2235829 .
  2. ^ Вальд, А.; Вулфовиц, Дж. (1948). «Оптимальный характер последовательного теста отношения вероятностей» . Анналы математической статистики . 19 (3): 326–339. дои : 10.1214/aoms/1177730197 . JSTOR   2235638 .
  3. ^ Фергюсон, Ричард Л. (1969). Разработка, внедрение и оценка компьютерного разветвленного теста для программы индивидуально предписанного обучения . Неопубликованная докторская диссертация, Питтсбургский университет.
  4. ^ Рекейс, доктор медицины (1983). Процедура принятия решения с использованием специализированного тестирования. В DJ Weiss (ред.), Новые горизонты тестирования: теория скрытых черт и компьютеризированное адаптивное тестирование (стр. 237-254). Нью-Йорк: Академическая пресса.
  5. ^ Эгген, TJHM (1999). «Выбор элементов в адаптивном тестировании с помощью последовательного теста отношения вероятностей». Прикладные психологические измерения . 23 (3): 249–261. дои : 10.1177/01466219922031365 . S2CID   120780131 .
  6. ^ Последовательные тесты отношения вероятностей с поправкой на риск: применение в Бристоле, Шипмане и кардиохирургии у взрослых Шпигельхалтер, Д. и др. Int J Qual Health Care, том 15 7-13 (2003) [ мертвая ссылка ]
  7. ^ Куллдорф, Мартин; Дэвис, Роберт Л.; Колчак †, Маргарет; Льюис, Эдвин; Лью, Трейси; Платт, Ричард (2011). «Максимальный последовательный тест отношения вероятностей для надзора за безопасностью лекарств и вакцин» . Последовательный анализ . 30 : 58–78. дои : 10.1080/07474946.2011.539924 .
  8. ^ Со второго по последний абзац раздела 1: http://www.tandfonline.com/doi/full/10.1080/07474946.2011.539924 Максимизированный последовательный тест отношения вероятности для надзора за безопасностью лекарств и вакцин Куллдорф, М. и др. Последовательный анализ: дизайн Методы и приложения , том 30, выпуск 1

Дальнейшее чтение [ править ]

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8fb9caad9d579404359a3a0dd6fc33b9__1672821360
URL1:https://arc.ask3.ru/arc/aa/8f/b9/8fb9caad9d579404359a3a0dd6fc33b9.html
Заголовок, (Title) документа по адресу, URL1:
Sequential probability ratio test - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)