Распределение Беренса – Фишера
Эта статья нуждается в дополнительных цитатах для проверки . ( июль 2022 г. ) |
В статистике распределение Беренса -Фишера , названное в честь Рональда Фишера и Уолтера Беренса , представляет собой параметризованное семейство вероятностных распределений, возникающее в результате решения проблемы Беренса-Фишера, предложенной сначала Беренсом, а несколько лет спустя Фишером. Проблема Беренса-Фишера заключается в статистическом выводе относительно разницы между средними значениями двух нормально распределенных совокупностей , когда соотношение их дисперсий неизвестно (и, в частности, неизвестно, равны ли их дисперсии). [ 1 ]
Определение
[ редактировать ]Распределение Беренса-Фишера представляет собой распределение случайной величины вида
где T 1 и T 2 - независимые случайные величины Стьюдента , каждая из которых имеет t-распределение , с соответствующими степенями свободы ν 1 = n 1 - 1 и ν 2 = n 2 - 1, а θ является константой. Таким образом, семейство распределений Беренса-Фишера параметризуется ν 1 , ν 2 и θ .
Вывод
[ редактировать ]Предположим, что известно, что две дисперсии генеральной совокупности равны, и выборки размеров n 1 и n 2 взяты из двух совокупностей:
где «iid» — независимые и одинаково распределенные случайные величины , а N обозначает нормальное распределение . Два выборочных средних значения :
Обычная « объединенная » несмещенная оценка общей дисперсии σ. 2 тогда
где S 1 2 и С 2 2 представляют собой обычные несмещенные ( скорректированные по Бесселю ) оценки двух генеральных дисперсий.
При этих предположениях основная величина
имеет t-распределение с n 1 + n 2 − 2 степенями свободы . Соответственно, можно найти доверительный интервал для µ 2 − µ 1, конечные точки которого равны
где A — соответствующий квантиль t-распределения.
Однако в задаче Беренса-Фишера неизвестно, что две дисперсии совокупности равны, и их соотношение неизвестно. Фишер считал [ нужна ссылка ] ключевое количество
Это можно записать как
где
представляют собой обычную одновыборочную t-статистику и
и предполагается, что θ находится в первом квадранте. Алгебраические детали таковы:
Тот факт, что сумма квадратов выражений в скобках выше равна 1, означает, что они представляют собой квадраты косинуса и квадрата синуса некоторого угла.
Распределение Берена-Фишера на самом деле является условным распределением величины (1), приведенной выше, с учетом значений величин, обозначенных cos θ и sin θ . По сути, условия Фишера включают вспомогательную информацию .
Затем Фишер нашел « доверительный интервал», конечные точки которого равны
где A — соответствующий процентный пункт распределения Беренса-Фишера. Фишер заявил [ нужна ссылка ] что вероятность того, что µ 2 − µ 1 находится в этом интервале, учитывая данные (в конечном итоге X s), представляет собой вероятность того, что случайная величина, распределенная Беренсом-Фишером, находится между − A и A .
Фидуциальные интервалы и доверительные интервалы
[ редактировать ]Бартлетт [ нужна ссылка ] показал, что этот «доверительный интервал» не является доверительным интервалом, поскольку он не имеет постоянной степени охвата. Фишер не счел это убедительным возражением против использования доверительного интервала. [ нужна ссылка ]
Дальнейшее чтение
[ редактировать ]- Кендалл, Морис Г., Стюарт, Алан (1973) Передовая теория статистики, Том 2: Выводы и взаимосвязи, 3-е издание , Гриффин. ISBN 0-85264-215-6 (глава 21)
Ссылки
[ редактировать ]- ^ Ким, Сок-Хо; Коэн, Аллан С. (декабрь 1998 г.). «О проблеме Беренса-Фишера: обзор» . Журнал образовательной и поведенческой статистики . 23 (4): 356–377. дои : 10.3102/10769986023004356 . ISSN 1076-9986 . S2CID 85462934 .