Jump to content

тест Бошлоо

Тест Бошлоо — это проверка статистической гипотезы для анализа таблиц непредвиденных обстоятельств 2х2 . Он исследует связь двух распределенных по Бернулли случайных величин, , и является более мощной альтернативой точному критерию Фишера . Он был предложен в 1970 году Р.Д. Бошлоо. [ 1 ]

Параметр

[ редактировать ]

Таблица непредвиденных обстоятельств 2 × 2 визуализирует независимые наблюдения двух бинарных переменных и :

Распределение вероятностей таких таблиц можно разделить на три отдельных случая. [ 2 ]

  1. Сумма строк и суммы столбцов фиксированы заранее и не случайны.
    Тогда все определяются Если и независимы, следует гипергеометрическому распределению с параметрами
  2. Сумма строк фиксированы заранее, но суммы столбцов нет.
    Тогда все случайные параметры определяются формулой и и следовать биномиальному распределению с вероятностями

  3. Только общее количество фиксировано, но суммы строк и суммы столбцов нет.
    Тогда случайный вектор следует полиномиальному распределению с вектором вероятности

Тип эксперимента 1: Редкий эксперимент по проверке вкуса, полностью ограниченный.

[ редактировать ]

Точный критерий Фишера предназначен для первого случая и, следовательно, является точным условным тестом (поскольку он зависит от сумм в столбцах). Типичным примером такого случая является дама, дегустирующая чай : дама пробует 8 чашек чая с молоком. В 4 из этих чашек перед чаем наливают молоко. В остальные 4 чашки чай наливается первым.

Дама пытается отнести чашки к двум категориям. Следуя нашим обозначениям, случайная величина представляет использованный метод (1 = сначала молоко, 0 = молоко последним) и представляет догадки дамы (1 = молоко угадано первым, 0 = молоко угадано последним). Тогда суммы строк представляют собой фиксированное количество чашек, приготовленных каждым методом: Девушка знает, что в каждой категории по 4 чашки, поэтому назначит по 4 чашки каждому методу. Таким образом, суммы столбцов также фиксированы заранее: Если она не в состоянии заметить разницу, и независимы, а число правильно классифицированных чашек с молоком сначала следует гипергеометрическому распределению

Тип эксперимента 2: Обычный лабораторный контролируемый эксперимент, ограничен только один предел.

[ редактировать ]

Тест Бошлоо предназначен для второго случая и, следовательно, является точным безусловным тестом. Примеры такого случая часто встречаются в медицинских исследованиях, где бинарная конечная точка сравнивается между двумя группами пациентов. Следуя нашим обозначениям, представляет собой первую группу, которая получает интересующие лекарства. представляет вторую группу, получающую плацебо . указывает на излечение пациента (1 = излечение, 0 = отсутствие лечения). Тогда суммы строк равны размерам групп и обычно фиксируются заранее. Суммы в столбцах представляют собой общее количество излечений или продолжений заболевания и не зафиксированы заранее.

Тип эксперимента 3: полевое наблюдение, никаких предельных ограничений.

[ редактировать ]

Критерий хи-квадрат Пирсона (без какой-либо «поправки на непрерывность») является правильным выбором для третьего случая, когда нет ограничений ни на итоги строк, ни на итоги столбцов. Этот третий сценарий описывает большинство наблюдательных исследований или «полевых наблюдений», где данные собираются по мере их доступности в неконтролируемой среде. Например, если кто-то собирается собирать два типа бабочек определенного заранее определенного идентифицируемого цвета, который можно распознать до отлова, однако невозможно отличить бабочку от вида 1 или вида 0; прежде чем ее поймают и внимательно осмотрят: по ее цвету можно просто сказать, что преследуемая бабочка должна принадлежать к одному из двух представляющих интерес видов. Для любого однодневного сбора бабочек нельзя заранее определить, сколько особей каждого вида будет собрано, возможно только общее количество отловов, в зависимости от критерия остановки, установленного сборщиком. Если виды подсчитываются в отдельных строках таблицы, то суммы строк являются неограниченными и независимо биномиально распределяются. Второе различие между пойманными бабочками будет заключаться в том, является ли бабочка самкой (тип 1) или самцом (тип 0), что указано в столбцах. Если ее пол также требует тщательного изучения бабочки, это также является независимым биномиально случайным. Это означает, что из-за В экспериментальном плане суммы в столбцах не ограничены, как и в строках: ни подсчет ни одного из видов, ни подсчет пола пойманных бабочек каждого вида не предопределены процессом наблюдения, и ни одна сумма не ограничивает другую.

Единственное возможное ограничение — это общая сумма всех пойманных бабочек, и даже оно само по себе может быть неограниченным, в зависимости от того, как коллекционер решит остановиться. Но поскольку невозможно заранее достоверно знать для какого-либо конкретного дня на каком-либо конкретном лугу, насколько успешными могут быть поиски в течение времени, доступного для сбора, даже общая сумма может быть неограниченной: это зависит от того, является ли ограничением на собранные данные время доступны для ловли бабочек, или необходимо собрать некую заранее определенную сумму, возможно, для обеспечения достаточно значимой статистики.

Этот тип «эксперимента» (также называемый «полевым наблюдением») почти полностью неконтролируем, поэтому некоторые предпочитают называть его только «наблюдением», а не «экспериментом». Все числа в таблице независимо случайны. Каждая из ячеек таблицы сопряженности представляет собой отдельную биномиальную вероятность, и ни полностью ограниченный «точный» критерий Фишера, ни частично ограниченный критерий Бошлоо не основаны на статистике, полученной в результате плана эксперимента. Критерий хи-квадрат Пирсона является подходящим тестом для неограниченного наблюдательного исследования, а критерий Пирсона, в свою очередь, использует неправильную статистическую модель для двух других типов экспериментов. (Попутно заметим, что к статистике хи-квадрат Пирсона никогда не следует применять какую-либо «поправку на непрерывность», например, «поправку Йейтса»: следствием этой «поправки» будет искажение ее p значений для соответствия тест Фишера, т.е. дать неправильный ответ.)

Проверка гипотезы

[ редактировать ]

Нулевая гипотеза Бошлоо одностороннего критерия (высокие значения в пользу альтернативной гипотезы):

Нулевая гипотеза одностороннего критерия может быть сформулирована и в другую сторону (малые значения в пользу альтернативной гипотезы):

Нулевая гипотеза двустороннего критерия такова:

Не существует универсального определения двусторонней версии точного критерия Фишера. [ 3 ] Поскольку критерий Бошлоо основан на точном тесте Фишера, универсальной двусторонней версии теста Бошло также не существует. Далее мы будем иметь дело с односторонним тестом и .

Идея Бошлоо

[ редактировать ]

Обозначим желаемый уровень значимости через . Точный критерий Фишера является условным критерием и подходит для первого из вышеупомянутых случаев. Но если мы рассмотрим наблюдаемую сумму столбца как установлено заранее, точный критерий Фишера можно применить и ко второму случаю. Истинный размер теста тогда зависит от мешающих параметров. и . Можно показать, что максимальный размер берется в равных пропорциях [ 4 ] и до сих пор контролируется . [ 1 ] Однако Бошлоо заявил, что для небольших размеров выборки максимальный размер часто значительно меньше, чем . Это приводит к нежелательной потере мощности .

Бошлоо предложил использовать точный критерий Фишера с большим номинальным уровнем. . Здесь, должен быть выбран как можно большим, чтобы максимальный размер все еще контролировался : . Этот метод был особенно выгоден на момент публикации Бошлоо, потому что можно найти общие значения и . Это облегчило выполнение теста Бошлоо в вычислительном отношении.

Статистика тестирования

[ редактировать ]

подхода Решающее правило Бошло основано на точном тесте Фишера. Эквивалентный способ формулировки теста — использовать значение p точного критерия Фишера в качестве статистики теста . P-значение Фишера рассчитывается из гипергеометрического распределения (для удобства записи мы пишем вместо ):

Распределение определяется биномиальными распределениями и и зависит от неизвестного мешающего параметра . Для заданного уровня значимости критическое значение это максимальное значение это удовлетворяет . Критическое значение равен номинальному уровню оригинального подхода Бошлоо.

Модификация

[ редактировать ]

Тест Бошлоо касается неизвестного параметра помех. взяв максимум по всему пространству параметров . Процедура Бергера и Бооса использует другой подход, максимизируя над доверительный интервал и добавление . [ 5 ] обычно представляет собой небольшое значение, например 0,001 или 0,0001. В результате получается модифицированный тест Бошлоо, который также является точным. [ 6 ]

Сравнение с другими точными тестами

[ редактировать ]

Все точные тесты имеют определенный уровень значимости, но могут иметь разную мощность в разных ситуациях. Мехротра и др. сравнили мощность некоторых точных тестов в разных ситуациях. [ 6 ] Результаты теста Бошлоо суммированы ниже.

Модифицированный тест Бошлоо.

[ редактировать ]

Тест Бошлоо и модифицированный тест Бошлоо имеют одинаковую мощность во всех рассмотренных сценариях. В некоторых случаях тест Бошлоо имеет немного большую эффективность, а в некоторых – наоборот.

Точный тест Фишера

[ редактировать ]

Тест Бошлоо по своей конструкции одинаково более мощный, чем точный тест Фишера. Для небольших размеров выборки (например, 10 на группу) разница в мощности велика и составляет от 16 до 20 процентных пунктов в рассматриваемых случаях. Разница в мощности меньше для больших размеров выборки.

Точный тест Z-пула

[ редактировать ]

Этот тест основан на статистике теста

где тарифы на групповые мероприятия и — это объединенная частота событий.

Сила этого теста аналогична тесту Бошлоо в большинстве сценариев. В некоторых случаях - Объединенный тест имеет большую мощность, различия в основном составляют от 1 до 5 процентных пунктов. В очень редких случаях разница достигает 9 процентных пунктов.

Этот тест также можно модифицировать с помощью процедуры Бергера и Бооса. Однако полученный тест во всех сценариях имеет очень схожую мощность с немодифицированным тестом.

Точный тест Z-Unpooled

[ редактировать ]

Этот тест основан на статистике теста

где — это тарифы на групповые мероприятия.

Сила этого теста аналогична тесту Бошло во многих сценариях. В некоторых случаях -Необъединенный тест имеет большую мощность, различия варьируются от 1 до 5 процентных пунктов. Однако в некоторых других случаях тест Бошлоо имеет заметно большую мощность, с различиями до 68 процентных пунктов.

Этот тест также можно модифицировать с помощью процедуры Бергера и Бооса. Полученный тест в большинстве сценариев имеет такую ​​же мощность, как и немодифицированный тест. В некоторых случаях мощность значительно увеличивается за счет модификации, но общее сравнение мощности с тестом Бошлоо остается неизменным.

Программное обеспечение

[ редактировать ]

Расчет теста Бошлоо можно выполнить в следующем программном обеспечении:

  • Функция scipy.stats.boschloo_exact из SciPy
  • Пакеты Exact и Exact2x2 языка программирования R
  • StatXact

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б Бошлоо Р.Д. (1970). «Повышенный условный уровень значимости для таблицы 2 x 2 при проверке равенства двух вероятностей». Статистика Неерландики . 24 : 1–35. дои : 10.1111/j.1467-9574.1970.tb00104.x .
  2. ^ Лидерсен, С.; Фагерланд, МВт; Лааке, П. (2009). «Рекомендуемые тесты на ассоциации в таблицах 2×2 ». Статист. Мед . 28 (7): 1159–1175. дои : 10.1002/sim.3531 . ПМИД   19170020 . S2CID   3900997 .
  3. ^ Мартин Андрес А. и И. Эрранс Техедор (1995). «Является ли точный тест Фишера очень консервативным?». Вычислительная статистика и анализ данных . 19 (5): 579–591. дои : 10.1016/0167-9473(94)00013-9 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  4. ^ Финнер Х. и Страсбургер К. (2002). «Структурные свойства UMPU-тестов для таблиц 2х2 и некоторых приложений». Журнал статистического планирования и выводов . 104 : 103–120. дои : 10.1016/S0378-3758(01)00122-7 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  5. ^ Бергер Р.Л. и Боос Д.Д. (1994). «Значения P, максимизированные по доверительному набору для параметра помехи» . Журнал Американской статистической ассоциации . 89 (427): 1012–1016. дои : 10.2307/2290928 . JSTOR   2290928 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  6. ^ Перейти обратно: а б Мехротра Д.В., Чан ISF и Бергер Р.Л. (2003). «Предупреждение о точном безусловном выводе о разнице между двумя независимыми биномиальными пропорциями» . Биометрия . 59 (2): 441–450. дои : 10.1111/1541-0420.00051 . ПМИД   12926729 . S2CID   28556526 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1731d47f300bc94f025a01b0706f0e43__1711072920
URL1:https://arc.ask3.ru/arc/aa/17/43/1731d47f300bc94f025a01b0706f0e43.html
Заголовок, (Title) документа по адресу, URL1:
Boschloo's test - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)