Jump to content

Частотный вывод

(Перенаправлено из Классической статистики )

Частотный вывод — это тип статистического вывода , основанный на частотной вероятности , который рассматривает «вероятность» в терминах, эквивалентных «частоте», и делает выводы на основе выборочных данных посредством подчеркивания частоты или доли результатов в данных. Частотный вывод лежит в основе частотной статистики хорошо зарекомендовавшие себя методологии проверки статистических гипотез и доверительные интервалы , в которой основаны .

История часто встречающейся статистики

[ редактировать ]

Первичная формулировка частотности исходит из предположения, что статистика может восприниматься как вероятностная частота. Эта точка зрения была в первую очередь развита Рональдом Фишером и командой Ежи Неймана и Эгона Пирсона . Рональд Фишер внес свой вклад в частотную статистику, разработав частотную концепцию «тестирования значимости», которая представляет собой исследование значимости показателя статистики по сравнению с гипотезой. Нейман-Пирсон распространил идеи Фишера на несколько гипотез, предположив, что соотношение вероятностей гипотез при максимизации разницы между двумя гипотезами приводит к максимизации превышения заданного значения p, а также обеспечивает основу типа I и типа II. ошибок . Дополнительную информацию см. на странице «Основы статистики» .

Определение

[ редактировать ]

Для статистического вывода статистика, о которой мы хотим сделать выводы, равна , где случайный вектор является функцией неизвестного параметра, . Параметр далее разбивается на ( ), где представляет собой интересующий параметр , и является параметром помехи . Для конкретики, может быть среднее значение численности населения, и параметр помехи стандартное отклонение генеральной совокупности, . [1]

Таким образом, статистический вывод связан с ожиданием случайного вектора , .

Для построения областей неопределенности в частотном выводе используется ось , определяющая область вокруг который можно использовать для определения интервала для оценки неопределенности. Разворот – это такая вероятность, что для разворота , которая является функцией, которая строго увеличивается в , где является случайным вектором. Это позволяет, что для некоторых 0 < < 1, мы можем определить , что представляет собой вероятность того, что функция поворота меньше некоторого четко определенного значения. Это подразумевает , где это верхний предел для . Обратите внимание, что представляет собой диапазон исходов, которые определяют односторонний предел для , и это является двусторонним пределом для , когда мы хотим оценить диапазон результатов, где может произойти. Это строго определяет доверительный интервал , который представляет собой диапазон результатов, относительно которых мы можем сделать статистические выводы.

Сокращение по Фишериану и операционные критерии Неймана-Пирсона

[ редактировать ]

Двумя взаимодополняющими концепциями частотного вывода являются редукция Фишера и операционные критерии Неймана-Пирсона. Вместе эти концепции иллюстрируют способ построения частотных интервалов, определяющих пределы . Сокращение Фишера — это метод определения интервала, в пределах которого истинное значение может лгать, в то время как операционные критерии Неймана-Пирсона представляют собой правило принятия решений о принятии априорных вероятностных предположений.

Сокращение Фишера определяется следующим образом:

  • Определить функцию правдоподобия (обычно это просто сбор данных);
  • Свести к достаточной статистике того же измерения, что и ;
  • Найдите функцию который имеет распределение, зависящее только от ;
  • Инвертируйте это распределение (это дает кумулятивную функцию распределения или CDF), чтобы получить пределы для при произвольном наборе уровней вероятности;
  • Используйте условное распределение приведенных данных неофициально или формально, чтобы оценить адекватность формулировки. [2]

По сути, сокращение Фишера предназначено для того, чтобы определить, где можно использовать достаточную статистику для определения диапазона результатов, при которых может произойти в распределении вероятностей, которое определяет все потенциальные значения . Это необходимо для формулирования доверительных интервалов, где мы можем найти диапазон результатов, по которым вероятно, произойдет в долгосрочной перспективе.

Операционные критерии Неймана-Пирона представляют собой еще более конкретное понимание диапазона результатов, в которых соответствующая статистика, можно сказать, что это произойдет в долгосрочной перспективе. Операционные критерии Неймана-Пирсона определяют вероятность того, что этот диапазон действительно является адекватным или неадекватным. Критерий Неймана-Пирсона определяет диапазон распределения вероятностей, который, если существует в этом диапазоне, все еще ниже истинной статистики населения. Например, если распределение из редукции Фишера превышает порог, который мы считаем априори неправдоподобным, то оценка этого распределения с помощью редукции Неймана-Пирсона может быть использована для вывода о том, где рассмотрение только распределений редукции Фишера может дать нам неточные результаты. . Таким образом, сокращение Неймана-Пирсона используется для нахождения вероятности типа I и типа II ошибок . [3] В качестве отправной точки, дополнением к этому в байесовской статистике является минимальный критерий байесовского риска .

Из-за того, что критерии Неймана-Пирсона зависят от нашей способности найти диапазон результатов, при которых вероятность того, что произойдет, подход Неймана-Пирсона возможен только там, где может быть достигнуто сокращение по Фишеру. [4]

Экспериментальный дизайн и методология

[ редактировать ]

Частотные выводы связаны с применением частотной вероятности при планировании и интерпретации эксперимента , и, в частности, с той точкой зрения, что любой данный эксперимент можно рассматривать как один из бесконечной последовательности возможных повторений одного и того же эксперимента, каждое из которых способно давать статистически независимые результаты. [5] С этой точки зрения, частотный подход к получению выводов на основе данных фактически состоит в том, чтобы требовать, чтобы правильный вывод был сделан с заданной (высокой) вероятностью среди этого условного набора повторений.

Однако точно такие же процедуры можно разработать в несколько иной формулировке. Здесь рассматривается точка зрения, предшествовавшая эксперименту. Можно утверждать, что план эксперимента должен включать в себя еще до его проведения решения о том, какие именно шаги будут предприняты для достижения вывода на основе еще не полученных данных. Эти шаги могут быть определены ученым так, чтобы существовала высокая вероятность принятия правильного решения, где в этом случае вероятность относится к еще не произошедшему набору случайных событий и, следовательно, не зависит от частотной интерпретации вероятности. Эту формулировку обсуждал Нейман. [6] среди других. Это особенно актуально, поскольку значимость частотного теста может меняться в зависимости от выбора модели, что является нарушением принципа правдоподобия.

Статистическая философия частотности

[ редактировать ]

Частотность — это исследование вероятности с предположением, что результаты возникают с заданной частотой в течение некоторого периода времени или при повторной выборке. По существу, частотный анализ должен быть сформулирован с учетом предположений о проблеме, которую пытается анализировать частотный анализ. Для этого необходимо выяснить, касается ли рассматриваемый вопрос понимания разнообразия статистики или определения истинного значения статистики. Разница между этими предположениями имеет решающее значение для интерпретации проверки гипотезы . Следующий абзац подробно расскажет об этом.

В целом существует два лагеря статистических выводов: эпистемический подход и эпидемиологический подход . Эпистемический подход – это изучение изменчивости ; а именно, как часто мы ожидаем, что статистика будет отклоняться от некоторого наблюдаемого значения. Эпидемиологический подход занимается изучением неопределенности ; в этом подходе значение статистики фиксировано, но наше понимание этой статистики является неполным. [7] Для конкретики представьте, что вы пытаетесь измерить котировку фондового рынка, а не оценить цену актива. Фондовый рынок колеблется настолько сильно, что пытаться точно определить, какой будет цена акций, бесполезно: фондовый рынок лучше понять, используя эпистемический подход, при котором мы можем попытаться количественно оценить его непостоянные движения. И наоборот, цена актива может не сильно меняться изо дня в день: лучше определить истинную стоимость актива, чем найти диапазон цен, и, следовательно, эпидемиологический подход лучше. Разница между этими подходами нетривиальна для целей вывода.

При эпистемическом подходе мы формулируем проблему так, как будто хотим приписать гипотезе вероятность. Это можно сделать только с помощью байесовской статистики, где интерпретация вероятности проста, поскольку байесовская статистика зависит от всего выборочного пространства, тогда как частотное тестирование касается всего плана эксперимента. Частотная статистика зависит не только от данных, но и от плана эксперимента . [8] В частотной статистике порог для понимания частоты возникновения определяется на основе семейного распределения, используемого при планировании эксперимента. Например, биномиальное распределение и отрицательное биномиальное распределение могут использоваться для анализа одних и тех же данных, но поскольку их концы различны, частотный анализ будет реализовывать разные уровни статистической значимости для одних и тех же данных, что предполагает разные распределения вероятностей. Эта разница не возникает в байесовском выводе. Для получения дополнительной информации см. принцип правдоподобия , который по своей сути нарушает частотная статистика. [9]

Что касается эпидемиологического подхода, необходимо обсудить центральную идею, лежащую в основе частотной статистики. Частотная статистика разработана таким образом, чтобы в долгосрочной перспективе можно было понять частоту статистики, а в долгосрочной перспективе можно сделать вывод о диапазоне истинного среднего значения статистики. Это приводит к сокращению Фишериана и операционным критериям Неймана-Пирсона, обсуждавшимся выше. Когда мы определяем редукцию Фишера и операционные критерии Неймана-Пирсона для любой статистики, мы оцениваем, по мнению этих авторов, вероятность того, что истинное значение статистики будет иметь место в заданном диапазоне результатов, предполагая количество повторений наших результатов. метод выборки. [8] Это позволяет сделать вывод, при котором в долгосрочной перспективе мы можем определить, что объединенные результаты множественных частотных выводов означают, что 95% доверительный интервал буквально означает, что истинное среднее значение находится в доверительном интервале в 95% случаев, но не то, что среднее значение находится в определенном доверительном интервале с вероятностью 95%. Это популярное заблуждение.

Очень часто эпистемический и эпидемиологический взгляды считаются взаимоконвертируемыми. Это явно неверно. Во-первых, эпистемический взгляд сосредоточен на критериях значимости Фишера, которые предназначены для предоставления индуктивных доказательств против нулевой гипотезы. , в одном эксперименте и определяется p-значением Фишера. И наоборот, эпидемиологический подход, основанный на проверке гипотезы Неймана-Пирсона, предназначен для минимизации ошибок ложного принятия типа II в долгосрочной перспективе путем обеспечения минимизации ошибок, которая работает в долгосрочной перспективе. Разница между ними имеет решающее значение, поскольку эпистемический подход подчеркивает условия, при которых мы можем найти одно значение статистически значимым; в то же время эпидемиологический взгляд определяет условия, при которых долгосрочные результаты представляют собой достоверные результаты. Это совершенно разные выводы, поскольку одноразовые эпистемические выводы не приводят к долгосрочным ошибкам, а долгосрочные ошибки не могут использоваться для подтверждения того, имеют ли смысл одноразовые эксперименты. Допущение одноразовых экспериментов в отношении долгосрочных событий является неверным, а предположение о долгосрочных тенденциях в отношении индивидуальных экспериментов является примером экологической ошибки. [10]

Связь с другими подходами

[ редактировать ]

Частотные выводы отличаются от других типов статистических выводов, таких как байесовские выводы и фидуциальные выводы . Хотя иногда считается, что « байесовский вывод » включает в себя подход к выводам, ведущим к оптимальным решениям , здесь для простоты используется более ограниченный взгляд.

Байесовский вывод

[ редактировать ]

Байесовский вывод основан на байесовской вероятности , которая рассматривает «вероятность» как эквивалент «достоверности», и, таким образом, существенное различие между частотным выводом и байесовским выводом такое же, как и разница между двумя интерпретациями того, что такое «вероятность». означает. Однако там, где это уместно, байесовские выводы (имеются в виду в данном случае применение теоремы Байеса ) используются теми, кто использует частотную вероятность .

Есть два основных различия между частотным и байесовским подходами к выводу, которые не включены в приведенное выше рассмотрение интерпретации вероятности:

  1. В частотном подходе к выводу неизвестные параметры обычно рассматриваются как фиксированные, а не как случайные переменные . Напротив, байесовский подход позволяет связать вероятности с неизвестными параметрами, при этом эти вероятности иногда могут иметь не только частотно-вероятностную но и байесовскую, интерпретацию . Байесовский подход позволяет интерпретировать эти вероятности как представление убеждения ученого в том, что данные значения параметра верны (см. Байесовская вероятность — Персональные вероятности и объективные методы построения априорных значений ).
  2. Результатом байесовского подхода может быть распределение вероятностей того, что известно о параметрах с учетом результатов эксперимента или исследования. Результатом частотного подхода является либо решение на основе теста значимости , либо доверительного интервала .

См. также

[ редактировать ]
  1. ^ Кокс (2006) , стр. 1–2.
  2. ^ Кокс (2006) , стр. 24, 47.
  3. ^ «ОпенСтакс CNX» . cnx.org . Проверено 14 сентября 2021 г.
  4. ^ Кокс (2006) , с. 24.
  5. ^ Эверитт (2002) .
  6. ^ Ежи (1937) , стр. 236, 333–380.
  7. ^ Ромейн, Ян-Виллем (2017), «Философия статистики» , в Залте, Эдвард Н. (редактор), Стэнфордская энциклопедия философии (изд. весной 2017 г.), Лаборатория метафизических исследований, Стэнфордский университет , получено 9 сентября 2021 г. 14
  8. ^ Перейти обратно: а б Вагенмейкерс и др. (2008) .
  9. ^ Видакович, Брани. «Принцип правдоподобия» (PDF) .
  10. ^ Хаббард, Р.; Баярри, MJ (2003). «Путаница в отношении мер доказательности (p) и ошибок (α) в классическом статистическом тестировании» (PDF) . Американский статистик . 57 : 171–182.

Библиография

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ed1d2099077942ccffe52c98e17ae92e__1706632860
URL1:https://arc.ask3.ru/arc/aa/ed/2e/ed1d2099077942ccffe52c98e17ae92e.html
Заголовок, (Title) документа по адресу, URL1:
Frequentist inference - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)