Jump to content

Правило рандомизированного принятия решения

В статистической теории принятия решений рандомизированное правило принятия решения или смешанное правило принятия решения — это правило принятия решения , которое связывает вероятности с детерминированными правилами принятия решений. В задачах с конечным решением рандомизированные правила принятия решения определяют набор рисков , который представляет собой выпуклую оболочку точек риска нерандомизированных правил принятия решений.

Поскольку рандомизированным правилам Байеса всегда существуют нерандомизированные альтернативы, рандомизация не требуется в байесовской статистике , хотя частотная статистическая теория иногда требует использования рандомизированных правил для удовлетворения условий оптимальности, таких как минимакс , особенно при получении доверительных интервалов и проверке гипотез о дискретных распределениях вероятностей. .

Статистический тест, в котором используется рандомизированное правило принятия решений, называется рандомизированным тестом .

Определение и интерпретация

[ редактировать ]

Позволять быть набором нерандомизированных правил принятия решений со связанными вероятностями . Тогда рандомизированное решающее правило определяется как и связанная с ней функция риска является . [1] Это правило можно рассматривать как случайный эксперимент , в котором правила принятия решений выбираются с вероятностями соответственно. [2]

Альтернативно, рандомизированное правило принятия решений может назначать вероятности непосредственно элементам пространства действий. для каждого члена выборочного пространства. Более формально, обозначает вероятность того, что действие выбран. В соответствии с этим подходом его функция потерь также определяется непосредственно как: . [3]

Таким образом, введение рандомизированных правил принятия решений создает более широкое пространство для принятия решений, из которого статистик может выбирать свое решение. Поскольку нерандомизированные правила принятия решений представляют собой особый случай рандомизированных правил принятия решений, где одно решение или действие имеет вероятность 1, исходное пространство решений является правильным подмножеством нового пространства решений . [4]

Выбор рандомизированных правил принятия решений

[ редактировать ]
Крайние точки набора рисков, обозначенные пустыми кружками, соответствуют нерандомизированным правилам принятия решений, тогда как толстые линии обозначают допустимые правила принятия решений.

Как и в случае с нерандомизированными правилами принятия решений, рандомизированные правила принятия решений могут удовлетворять таким благоприятным свойствам, как допустимость, минимаксность и Байес. Это будет проиллюстрировано на примере конечной задачи решения, т. е. задачи, в которой пространство параметров представляет собой конечный набор, скажем, элементы.Набор рисков, далее обозначаемый как , представляет собой набор всех векторов, в котором каждая запись представляет собой значение функции риска, связанной со рандомизированным правилом принятия решения при определенном параметре: он содержит все векторы вида . Обратите внимание, что по определению рандомизированного правила принятия решений набор рисков представляет собой выпуклую оболочку рисков. . [5]

В случае, когда пространство параметров имеет только два элемента и , это представляет собой подмножество , поэтому его можно нарисовать относительно осей координат и соответствующие рискам, предусмотренным и соответственно. [6] Пример показан справа.

Приемлемость

[ редактировать ]

Допустимым правилом принятия решения является правило, над которым не доминирует какое-либо другое правило принятия решения, т.е. не существует правила принятия решения, которое имело бы такой же или меньший риск, чем оно, для всех параметров и строго меньший риск, чем оно, для некоторого параметра. В конечной задаче принятия решения точка риска допустимого правила решения имеет либо более низкие координаты x или y, чем все остальные точки риска, либо, более формально, это набор правил с точками риска вида такой, что . Таким образом, левая часть нижней границы множества рисков представляет собой множество допустимых решающих правил. [6] [7]

Минимакс

[ редактировать ]

Минимаксное правило Байеса – это правило, которое минимизирует риск супремума. среди всех правил принятия решений в . Иногда в этом отношении рандомизированное правило принятия решения может работать лучше, чем все другие нерандомизированные правила принятия решения. [1]

В конечной задаче решения с двумя возможными параметрами правило минимакса можно найти, рассматривая семейство квадратов . [8] Стоимость для наименьшего из таких квадратов, соприкасающегося — это минимаксный риск, а соответствующая точка или точки в наборе рисков — это правило минимакса.

Если набор рисков пересекает линию , то допустимое решающее правило, лежащее на прямой, является минимаксным. Если или справедливо для каждой точки в наборе рисков, то правило минимакса может быть либо крайней точкой (т. е. нерандомизированным правилом принятия решения), либо линией, соединяющей две крайние точки (нерандомизированным правилом принятия решения). [9] [6]

Рандомизированное правило Байеса – это правило, имеющее минимальный байесовский риск. среди всех правил принятия решений. В особом случае, когда пространство параметров состоит из двух элементов, строка , где и обозначают априорные вероятности и соответственно, представляет собой семейство точек с байесовским риском . Таким образом, минимальный байесовский риск для задачи принятия решения является наименьшим. так, чтобы линия касалась набора рисков. [10] [11] Эта линия может либо касаться только одной крайней точки набора рисков, т. е. соответствовать нерандомизированному правилу принятия решений, либо перекрываться со всей стороной набора рисков, т. е. соответствовать двум нерандомизированным правилам принятия решений и рандомизированным правилам принятия решений, объединяющим их. Это иллюстрируется тремя ситуациями ниже:

Поскольку разные априоры приводят к разным наклонам, набор всех правил Байеса по отношению к некоторому априору совпадает с набором допустимых правил. [12]

Обратите внимание, что невозможна ситуация, в которой не существует нерандомизированного правила Байеса, а существует рандомизированное правило Байеса. Существование рандомизированного правила Байеса подразумевает существование нерандомизированного правила Байеса. Это верно и в общем случае, даже при бесконечном пространстве параметров, бесконечном байесовском риске и независимо от того, может ли быть достигнут минимальный байесовский риск. [3] [12] Это подтверждает интуитивное представление о том, что статистикам не нужно использовать рандомизацию для принятия статистических решений. [4]

На практике

[ редактировать ]

Поскольку рандомизированные правила Байеса всегда имеют нерандомизированные альтернативы, они не нужны в байесовской статистике . Однако в частотной статистике рандомизированные правила теоретически необходимы в определенных ситуациях. [13] и считались полезными на практике, когда они были впервые изобретены: Эгон Пирсон предсказал, что они «не встретят серьезных возражений». [14] Однако в настоящее время лишь немногие статистики реализуют их. [14] [15]

Рандомизированный тест

[ редактировать ]

Рандомизированные тесты не следует путать с тестами перестановок . [16]

В обычной формулировке теста отношения правдоподобия нулевая гипотеза отклоняется всякий раз, когда отношение правдоподобия меньше некоторой константы , и принято иначе. Однако иногда это становится проблематичным, когда дискретна когда при нулевой гипотезе, возможно.

Решение состоит в том, чтобы определить тестовую функцию , значением которого является вероятность принятия нулевой гипотезы: [17] [18]

Это можно интерпретировать как подбрасывание смещенной монеты с вероятностью возвращать головы всякий раз, когда и отклонение нулевой гипотезы, если выпадет решка. [15]

Обобщенная форма леммы Неймана-Пирсона гласит, что этот тест имеет максимальную мощность среди всех тестов на одном и том же уровне значимости. , что такой тест должен существовать для любого уровня значимости и что тест уникален в нормальных ситуациях. [19]

В качестве примера рассмотрим случай, когда базовым распределением является распределение Бернулли с вероятностью , и мы хотели бы проверить нулевую гипотезу против альтернативной гипотезы . Естественно выбрать несколько такой, что и отклонять ноль всякий раз, когда , где это тестовая статистика. Однако следует учитывать случаи, когда , мы определяем тестовую функцию:

где выбирается таким, что .

Рандомизированные доверительные интервалы

[ редактировать ]

Аналогичная проблема возникает при построении доверительных интервалов. Например, интервал Клоппера-Пирсона всегда консервативен из-за дискретного характера биномиального распределения. Альтернативой является нахождение верхнего и нижнего доверительных пределов. и решив следующие уравнения: [14]

где равномерная случайная величина на (0, 1).

См. также

[ редактировать ]
  1. ^ Jump up to: а б Янг и Смит, с. 11
  2. ^ Бикель и Доксум, с. 28
  3. ^ Jump up to: а б Пармиджани, с. 132
  4. ^ Jump up to: а б ДеГрут, стр.128-129.
  5. ^ Бикель и Доксум, стр.29.
  6. ^ Jump up to: а б с Янг и Смит, стр.12.
  7. ^ Бикель и Доксум, с. 32
  8. ^ Бикель и Доксум, стр.30.
  9. ^ Янг и Смит, стр. 14–16.
  10. ^ Янг и Смит, с. 13
  11. ^ Бикель и Доксум, стр. 29–30.
  12. ^ Jump up to: а б Бикель и Доксум, стр.31.
  13. ^ Роберт, стр.66
  14. ^ Jump up to: а б с Агрести и Готтар, стр.367
  15. ^ Jump up to: а б Бикель и Доксум, стр.224.
  16. ^ Онгена, Патрик (30 октября 2017 г.), Бергер, Вэнс В. (ред.), «Тесты рандомизации или тесты перестановки? Историческое и терминологическое уточнение» , Рандомизация, маскирование и сокрытие распределения (1-е изд.), Бока-Ратон , Флорида: Чепмен и Холл/CRC, стр. 209–228, doi : 10.1201/9781315305110-14 , ISBN.  978-1-315-30511-0 , получено 8 октября 2021 г.
  17. ^ Янг и Смит, стр.68.
  18. ^ Роберт, стр.243
  19. ^ Янг и Смит, стр.68.

Библиография

[ редактировать ]
  • Агрести, Алан; Готтард, Анна (2005). «Комментарий: рандомизированные доверительные интервалы и подход Mid-P» (PDF) . Статистическая наука . 5 (4): 367–371. дои : 10.1214/088342305000000403 .
  • Бикель, Питер Дж.; Доксум, Кьелл А. (2001). Математическая статистика: основные идеи и избранные темы (2-е изд.). Река Аппер-Сэддл, Нью-Джерси: Прентис-Холл. ISBN  978-0138503635 .
  • ДеГрут, Моррис Х. (2004). Оптимальные статистические решения . Хобокен, Нью-Джерси: Wiley-Interscience. ISBN  978-0471680291 .
  • Пармиджани, Джованни; Иноуэ, Лурдес Ю.Т. (2009). Теория принятия решений: принципы и подходы . Чичестер, Западный Суссекс: Джон Уайли и сыновья. ISBN  9780470746684 .
  • Роберт, Кристиан П. (2007). Байесовский выбор: от основ теории принятия решений к вычислительной реализации . Нью-Йорк: Спрингер. ISBN  9780387715988 .
  • Янг, Джорджия; Смит, Р.Л. (2005). Основы статистического вывода . Кембридж: Издательство Кембриджского университета. ISBN  9780521548663 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 05e0c01ac8b4b1432630bdab3d729a78__1652352600
URL1:https://arc.ask3.ru/arc/aa/05/78/05e0c01ac8b4b1432630bdab3d729a78.html
Заголовок, (Title) документа по адресу, URL1:
Randomised decision rule - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)