Принцип обусловленности
Принцип обусловленности — это фишеровский принцип статистического вывода , который Аллан Бирнбаум формально определил и изучил в статье в Журнале Американской статистической ассоциации , Бирнбаум (1962) .
Неформально принцип обусловленности можно понимать как утверждение, что
- Эксперименты, которые на самом деле не проводились, не имеют отношения к какому-либо статистическому анализу.
и неявное предостережение о том, что нереализованные эксперименты следует игнорировать: они не включаются в какие-либо расчеты или обсуждение результатов.
Вместе с принципом достаточности версия принципа Бирнбаума подразумевает знаменитый принцип правдоподобия . Хотя актуальность доказательства для анализа данных остается спорной среди статистиков, многие байесовцы и правдоподобисты считают принцип правдоподобия основополагающим для статистических выводов.
Историческая справка
[ редактировать ]Некоторые статистики в середине 20-го века предположили, что действительный статистический анализ должен включать все возможные эксперименты, которые могли быть проведены. Возможно, серия желаемых экспериментов, каждый из которых требует некоторой неопределенной возможности для проведения. Неопределенным фактором может быть что-то вроде хорошей погоды для своевременного астрономического наблюдения («эксперимент» представляет собой поиск на телескопическом изображении следов какого-либо типа объекта) или наличие дополнительных ресурсов данных, таких как вероятность открытия какое-то новое ископаемое, которое предоставит больше доказательств для ответа на вопрос, заданный в другом палеонтологическом исследовании. Другой проблемой ресурсов может быть необходимость специального доступа к частным данным (например, медицинским записям пациентов) от одного из нескольких возможных учреждений, большинство из которых, как ожидается, откажут в разрешении; характер данных, которые могут быть предоставлены, и правильная статистическая модель для их анализа будут зависеть от того, какое учреждение предоставило доступ и как оно собирало и обрабатывало частные данные, которые могли стать доступными для исследования (технически, в данном случае « эксперимент» уже проведен медицинским учреждением, а какая-то другая сторона анализирует собранные данные, чтобы ответить на свой собственный исследовательский вопрос).
Все эти примеры иллюстрируют обычные проблемы того, как неконтролируемая случайность определяет характер эксперимента, который действительно может быть проведен. Некоторые анализы статистической значимости результатов конкретных экспериментов учитывали влияние таких случайных событий на полученные данные. Многим статистикам эта идея не нравилась, и они были склонны молчаливо игнорировать, казалось бы, посторонние случайные эффекты в своих анализах; многие ученые и исследователи были сбиты с толку тщательно продуманными попытками некоторых статистиков учесть косвенные эффекты при статистическом анализе своих экспериментов, которые исследователи считали несущественными. [ нужна ссылка ]
Несколько статистиков в 1960-х и 1970-х годах пошли еще дальше и предположили, что в эксперименте можно намеренно спроектировать случайный фактор, обычно путем использования некоторой вспомогательной статистики . например, бросок игральной кости или подбрасывание монеты, и что искусственное случайное событие может быть позже включено в анализ данных и каким-то образом улучшить предполагаемую значимость наблюдаемого результата. Большинству статистиков эта идея не понравилась, а подавляющее большинство ученых и исследователей сочли ее нелепой и продолжают по сей день опровергать эту идею и отвергать любой анализ, основанный на ней. [ нужна ссылка ]
Принцип обусловленности представляет собой формальный отказ от идеи о том, что «непройденный путь» может быть релевантным: по сути, он исключает из статистического анализа любое рассмотрение эффектов от деталей плана экспериментов, которые не проводились, даже если они могли иметь место. было запланировано или подготовлено. Принцип обусловленности отбрасывает все спекулятивные соображения о том, что могло произойти, и позволяет только статистический анализ полученных данных включать процедуры, обстоятельства и детали конкретного фактически проведенного данные эксперимента, в результате которого были получены фактически собранные . Эксперименты, которые просто планировались, но не проводились, или упущенные возможности для планов получения данных — все это не имеет значения, а статистические расчеты, которые их включают, предположительно ошибочны.
Формулировка
[ редактировать ]Принцип обусловленности утверждает о сложном эксперименте: который можно описать как набор или совокупность нескольких составляющих экспериментов. индекс — некоторая вспомогательная статистика , то есть статистика, распределение вероятностей которой не зависит от каких-либо неизвестных значений параметров. Это означает, что получение наблюдения за каким-то конкретным результатом всего эксперимента требует сначала наблюдения за значением для а затем сделать наблюдение из указанного компонентного эксперимента
Формально принцип обусловленности можно сформулировать следующим образом:
- Принцип обусловленности :
- Если Любой эксперимент, имеющий форму смеси составных экспериментов тогда для каждого результата из доказательное значение любого результата любого эксперимента со смесью то же самое, что и соответствующий результат соответствующего компонентного эксперимента фактически проводится, игнорируя общую структуру смешанного эксперимента; см. Бирнбаум (1962) .
Примеры
[ редактировать ]Иллюстрацию принципа обусловленности в контексте биоинформатики дает Баркер (2014) .
- Пример сценария
Вспомогательная статистика может быть бросок кубика , значение которого будет одним из Этот случайный выбор эксперимента на самом деле является мудрой предосторожностью, направленной на сдерживание влияния предубеждений исследователя, если есть основания подозревать, что исследователь может сознательно или неосознанно выбрать эксперимент, который, по его мнению, может дать данные, подтверждающие предпочитаемая гипотеза. Результат броска игральной кости затем определяет, какой из шести возможных экспериментов это тот, который фактически проводится для получения данных исследования.
Предположим, что на кубике выпало «3». В этом случае результат, наблюдаемый для на самом деле результат эксперимента Ни один из остальных пяти экспериментов никогда не проводится, и ни один из других возможных результатов никогда не наблюдается, это могло бы наблюдаться, если бы выпало какое-то другое число, кроме «3». Фактический наблюдаемый результат, на него не влияют никакие аспекты остальных пяти подэкспериментов, которые не проводились, а только процедуры и экспериментальный дизайн подэксперимент, который был проведен для сбора данных, имело какое-либо влияние на результат статистического анализа, независимо от того факта, что планы экспериментов , которые могли быть проведены, были подготовлены во время фактического эксперимента. и с такой же вероятностью могло быть выполнено.
Принцип обусловленности гласит, что все детали должны быть исключены из статистического анализа фактического наблюдения и даже тот факт, что эксперимент 3 был выбран путем броска игральной кости: (бросок игральной кости) также может быть включен в анализ. Единственное, что определяет правильную статистику, которая будет использоваться для анализа данных, — это эксперимент. и единственные данные, которые следует учитывать, это нет
Цитаты
[ редактировать ]Ссылки
[ редактировать ]- Баркер, Д. (2014). «Видеть за деревьями лес: философские аспекты классического, байесовского и вероятностного подходов в статистических выводах и некоторые последствия для филогенетического анализа». Биология и философия . 30 (4): 505–525. дои : 10.1007/s10539-014-9455-x . hdl : 10023/6999 . S2CID 54867268 .
- Бергер, Дж. О.; Вулперт, Р.Л. (1988). Принцип правдоподобия (2-е изд.). Хейвуд, Калифорния: Институт математической статистики. ISBN 978-0-940600-13-3 .
- Бирнбаум, А. (1962). «Об основах статистического вывода». Журнал Американской статистической ассоциации . 57 (298): 269–326. дои : 10.2307/2281640 . JSTOR 2281640 . МР 0138176 .
С обсуждением.
- Кальбфляйш, JD (1975). «Достаточность и обусловленность». Биометрика . 62 (2): 251–259. дои : 10.1093/biomet/62.2.251 .