Леди дегустирует чай

В экспериментов плане статистики « женщина, дегустирующая чай, представляет собой рандомизированный эксперимент , разработанный Рональдом Фишером и описанный в его книге План экспериментов» (1935). [1] Эксперимент представляет собой оригинальное изложение идеи Фишера о нулевой гипотезе , которая «никогда не доказывается и не устанавливается, но, возможно, опровергается в ходе экспериментов». [2] [3]
Пример во многом основан на событии из жизни Фишера. Женщина, о которой идет речь, психолог Мюриэль Бристоль , утверждала, что может определить , чай или молоко было добавлено в чашку первым . Ее будущий муж Уильям Роуч предложил Фишеру подарить ей восемь чашек, по четыре каждого сорта, в случайном порядке. [4] Тогда можно было бы спросить, какова вероятность того, что она выпьет определенное количество чашек, которые она определила правильно (на самом деле все восемь), но просто случайно.
Описание Фишера занимает менее 10 страниц и отличается простотой и полнотой терминологии, расчетов и постановки эксперимента. [5] В качестве теста использовался точный тест Фишера .
Эксперимент [ править ]
В ходе эксперимента испытуемому предлагалось восемь чашек чая в случайном порядке: четыре, приготовленные путем наливания молока, а затем чая, четыре путем наливания чая, а затем молока. Субъект пытается выбрать четыре чашки, приготовленные тем или иным методом, и при желании может сравнивать чашки друг с другом. Методика, использованная в эксперименте, полностью раскрыта испытуемому.
Нулевая гипотеза заключается в том, что испытуемый не способен различать чаи. В подходе Фишера не было альтернативной гипотезы . [2] в отличие от подхода Неймана-Пирсона .
Статистика теста представляет собой простой подсчет количества успешных попыток выбрать четыре чашки, приготовленные данным методом. Распределение возможного числа успехов, если предположить, что нулевая гипотеза верна, можно вычислить, используя количество комбинаций. Используя формулу комбинации , с общее количество чашек и чашки выбраны, есть
возможные комбинации.
Количество успехов | Комбинации выбора | Количество комбинаций |
---|---|---|
0 | оооо | 1 × 1 = 1 |
1 | ох, ох, ох, ох | 4 × 4 = 16 |
2 | оохх, оксокс, оксхо, хохо, хооо, хоох | 6 × 6 = 36 |
3 | оххх, хххх, ххокс, хххo | 4 × 4 = 16 |
4 | хххх | 1 × 1 = 1 |
Общий | 70 |
Частоты возможных чисел успехов, приведенные в последнем столбце этой таблицы, определяются следующим образом. При 0 успехах явно существует только один набор из четырех вариантов (а именно, выбор всех четырех неправильных чашек), дающий этот результат. На один успех и три неудачи приходится четыре правильных чашки, из которых выбирается одна, что по формуле комбинации может произойти в разными способами (как показано в столбце 2, где x обозначает правильную чашку, которая выбрана, а o означает правильную чашку, которая не выбрана); и независимо от этого есть четыре неправильных чашки, из которых выбираются три, что может произойти в способами (как показано во втором столбце, на этот раз x интерпретируется как неправильная чашка, которая не выбрана, а o указывает на неправильную чашку, которая выбрана). Таким образом, выбор любой одной правильной чашки и любых трех неправильных чашек может произойти любым из 4×4 = 16 способов. Соответствующим образом рассчитываются частоты остальных возможных чисел успехов. Таким образом, количество успехов распределяется согласно гипергеометрическому распределению . В частности, для случайной величины равно числу успехов, мы можем написать , где численность населения или общее количество чашек чая, — количество состояний успеха в популяции или четыре чашки любого типа, и количество розыгрышей или четыре кубка. Распределение комбинаций для выбора k из 2k доступных выборов соответствует k- й строке треугольника Паскаля, так что каждое целое число в строке возведено в квадрат. В этом случае, потому что из 8 доступных чашек выбрано 4 чашки.
Критической областью для отклонения нуля при отсутствии способности к различению был единственный случай 4 успехов из 4 возможных, основанный на общепринятом критерии вероятности < 5%. Это критическая область, потому что при отсутствии способности различать 4 успеха имеют 1 шанс из 70 (≈ 1,4% < 5%), тогда как по крайней мере 3 из 4 успехов имеют вероятность (16+1). /70 (≈ 24,3% > 5%).
Таким образом, если и только если дама правильно классифицировала все 8 чашек, Фишер был готов отвергнуть нулевую гипотезу, фактически признав способности дамы на уровне значимости 1,4% (но без количественной оценки ее способностей). Позже Фишер обсудил преимущества большего количества испытаний и повторных тестов.
Дэвид Сальсбург сообщает, что коллега Фишер, Х. Фэрфилд Смит , обнаружил, что в реальном эксперименте женщине удалось правильно идентифицировать все восемь чашек. [6] [7] Вероятность того, что кто-то просто угадает, что все будет правильно, при условии, что он догадается, что любым четверым сначала положили чай, а остальным четверым - молоко, будет только 1 из 70 (комбинации из 8, взятые по 4 за раз).
Леди, дегустирующая Книга « чай »
Дэвид Сальсбург опубликовал научно-популярную книгу под названием «Женщина, дегустирующая чай» . [6] который описывает эксперимент Фишера и идеи рандомизации . Деб Басу писала, что «знаменитый случай с «женщиной, дегустирующей чай» был «одним из двух опорных столпов… рандомизационного анализа экспериментальных данных». [8]
См. также [ править ]
- Гипергеометрическое распределение
- Тест на перестановку
- Случайное задание
- Рандомизационный тест
- Биномиальное распределение
Ссылки [ править ]
- ^ Фишер 1971 , II. Принципы экспериментирования, иллюстрированные психофизическим экспериментом.
- ↑ Перейти обратно: Перейти обратно: а б Фишер 1971 , Глава II. Принципы экспериментирования, иллюстрированные психофизическим экспериментом. Раздел 8. Нулевая гипотеза.
- ^ Цитата OED: 1935 Р. А. Фишер, План экспериментов ii. 19: «Мы можем говорить об этой гипотезе как о «нулевой гипотезе» [...] нулевая гипотеза никогда не доказывается и не устанавливается, но, возможно, опровергается в ходе экспериментов».
- ^ Стердивант, Род. «Женщина дегустирует чай» (PDF) . Архивировано из оригинала (PDF) 10 июля 2004 года . Проверено 2 сентября 2018 г.
- ^ Фишер, сэр Рональд А. (1956) [ План экспериментов (1935)]. «Математика дамы, дегустирующей чай» . В Джеймсе Рое Ньюмане (ред.). Мир математики, том 3 . Публикации Courier Dover. ISBN 978-0-486-41151-4 .
- ↑ Перейти обратно: Перейти обратно: а б Зальсбург (2002)
- ^ Коробка, Джоан Фишер (1978). Р.А. Фишер, Жизнь учёного . Нью-Йорк: Уайли. п. 134. ИСБН 0-471-09300-9 .
- ^ Басу (1980a, стр. 575; 1980b)
- Фишер, Рональд А. (1971) [1935]. План экспериментов (9-е изд.). Макмиллан. ISBN 0-02-844690-9 .
- Басу, Д. (1980a). «Рандомизационный анализ экспериментальных данных: тест рандомизации Фишера». Журнал Американской статистической ассоциации . 75 (371): 575–582. дои : 10.2307/2287648 . JSTOR 2287648 .
- Басу, Д. (1980b). «Рандомизационный тест Фишера», переизданный с новым предисловием в книге «Статистическая информация и правдоподобие: сборник критических эссе» доктора Д. Басу ; Дж. К. Гош , редактор. Спрингер 1988.
- Кемпторн, Оскар (1992). «Интервенционные эксперименты, рандомизация и умозаключения» . На малайском Гоше и Прамоде К. Патхаке (ред.). Актуальные проблемы статистического вывода – очерки в честь Д. Басу . Конспект лекций Института математической статистики - Серия монографий. Хейворд, Калифорния: IMS. стр. 13–31. дои : 10.1214/lnms/1215458836 . ISBN 0-940600-24-2 .
- Зальсбург, Д. (2002) «Женщина, дегустирующая чай: как статистика произвела революцию в науке в двадцатом веке» , WH Freeman / Owl Book. ISBN 0-8050-7134-2