Метод КЛ (физика элементарных частиц)
В физике элементарных частиц CL [1] представляет собой статистический метод установки верхних пределов (также называемых пределами исключения). [2] модели ) параметров — особая форма интервальной оценки, используемая для параметров, которые могут принимать только неотрицательные значения. Хотя считается, что CL относятся к уровням уверенности , «название метода… вводит в заблуждение, поскольку область исключения CL не является доверительным интервалом ». [3] Впервые он был введен физиками, работавшими над экспериментом LEP в ЦЕРН, и с тех пор использовался во многих экспериментах по физике высоких энергий . Это частотный метод в том смысле, что свойства предела определяются с помощью вероятностей ошибок , однако он отличается от стандартных доверительных интервалов тем, что установленный доверительный уровень интервала не равен вероятности его охвата . Причина этого отклонения заключается в том, что стандартные верхние пределы, основанные на наиболее мощном тесте, обязательно создают пустые интервалы с некоторой фиксированной вероятностью, когда значение параметра равно нулю, и это свойство считается нежелательным большинством физиков и статистиков. [4]
Верхние пределы, полученные методом CL, всегда содержат нулевое значение параметра и, следовательно, вероятность покрытия в этой точке всегда равна 100%. Определение CL не следует из какой-либо точной теоретической основы статистического вывода и поэтому иногда описывается как ad hoc . Однако это очень похоже на концепции статистических данных. [5] предложен статистиком Алланом Бирнбаумом .
Определение
[ редактировать ]Пусть X — случайная выборка из распределения вероятностей с действительным неотрицательным параметром. . Верхний предел CL с для параметра θ уровнем достоверности , является статистикой (т. е. наблюдаемой случайной величиной ) который имеет свойство:
( 1 ) |
Неравенство используется в определении для учета случаев, когда распределение X дискретно и равенство не может быть достигнуто точно. Если распределение X непрерывно , то это следует заменить равенством. Обратите внимание, что из определения следует, что вероятность покрытия всегда больше, чем .
Эквивалентное определение можно дать, рассмотрев проверку нулевой гипотезы. против альтернативы . Тогда числитель в ( 1 ), при оценке в , соответствуют вероятности ошибки I рода ( ) теста (т.е. отклоняется, когда ) и знаменатель в степени ( ). Критерий отказа таким образом, требуется, чтобы соотношение будет меньше, чем . Интуитивно это можно интерпретировать как утверждение, что исключено, поскольку это менее вероятно наблюдать такой экстремальный результат, как X , когда верно, чем когда альтернатива это правда.
Расчет верхнего предела обычно выполняется путем построения тестовой статистики. и найти значение для чего
где наблюдаемый результат эксперимента.
Использование в физике высоких энергий
[ редактировать ]Верхние пределы, основанные на методе CL, использовались в многочисленных публикациях экспериментальных результатов, полученных в экспериментах на ускорителях частиц, таких как LEP , Tevatron и LHC , наиболее заметных в поисках новых частиц.
Источник
[ редактировать ]Первоначальная мотивация CL была основана на расчете условной вероятности, предложенном физиком Г. Цехом. [6] для эксперимента по подсчету событий. Предположим, эксперимент состоит из измерения события, исходящие от сигнальных и фоновых процессов, описываемых распределениями Пуассона с соответствующими скоростями и , а именно . предполагается известным и – параметр, который необходимо оценить с помощью эксперимента. Стандартная процедура установки верхнего предела учитывая экспериментальный результат состоит из исключения значений для чего , что гарантирует как минимум покрытие. Рассмотрим, например, случай, когда и события наблюдаются, то обнаруживается, что исключается на уровне достоверности 95%. Но это подразумевает, что исключается, а именно все возможные значения . Такой результат трудно интерпретировать, поскольку эксперимент по существу не может различить очень малые значения из гипотезы только фона, и поэтому заявление об исключении таких малых значений (в пользу гипотезы только фона) кажется неуместным. Чтобы преодолеть эту трудность, Зех предложил обусловить вероятность того, что на замечании, что , где — это (неизмеримое) количество фоновых событий. Причиной этого является то, что когда мала, процедура с большей вероятностью выдаст ошибку (т. е. интервал, не охватывающий истинное значение), чем когда велико, а распределение сам по себе независим от . То есть следует сообщать не общую вероятность ошибки, а условную вероятность с учетом имеющихся знаний о количестве фоновых событий в выборке. Эта условная вероятность
которые соответствуют приведенному выше определению CL. Первое равенство просто использует определение условной вероятности , а второе равенство исходит из того факта, что если а количество фоновых событий по определению не зависит от мощности сигнала.
Обобщение условного аргумента
[ редактировать ]Условный аргумент Зеха можно формально распространить на общий случай. Предположим, что — это тестовая статистика , из которой выводится доверительный интервал, и пусть
где результат, наблюдаемый в эксперименте. Затем можно рассматривать как неизмеримую (поскольку неизвестно) случайная величина, распределение которой равномерно между 0 и 1 независимо от . Если тест беспристрастный, то результат подразумевает
откуда, аналогично обуславливанию в предыдущем случае получается
Отношение к основополагающим принципам
[ редактировать ]![]() | Этот раздел , возможно, содержит обобщение материала не , который достоверно или не относится упоминает основную тему ( Апрель 2016 г. ) |
Приведенные выше аргументы можно рассматривать как следующие духу принципа обусловленности статистического вывода, хотя они выражают более обобщенное понятие обусловленности, которое не требует существования вспомогательной статистики . Однако принцип обусловленности , уже в своей первоначальной, более ограниченной версии, формально подразумевает принцип правдоподобия — результат, который, как известно, продемонстрировал Бирнбаум . [7] CL не подчиняется принципу правдоподобия , и поэтому такие соображения могут использоваться только для предположения правдоподобия, но не теоретической полноты с фундаментальной точки зрения. (Однако то же самое можно сказать и о любом частотном методе, если принцип обусловленности считается необходимым).
Сам Бирнбаум в своей статье 1962 года предположил, что соотношение CLs следует использовать в качестве меры силы статистических данных, полученных с помощью тестов значимости, а не один. Это следует из простого применения принципа правдоподобия : если результат эксперимента должен быть сообщен только в форме решения «принять»/«отклонить», то вся процедура эквивалентна эксперименту, в котором есть только два возможных решения. результаты, с вероятностями , и , под . Отношение правдоподобия, связанное с результатом «отклонить "поэтому и, следовательно, должен определить доказательную интерпретацию этого результата. (Поскольку для проверки двух простых гипотез отношение правдоподобия является компактным представлением функции правдоподобия ). С другой стороны, если принципу правдоподобия следует следовать последовательно, то следует использовать отношение правдоподобия исходного результата, а не , что делает основание такой интерпретации сомнительным. Позже Бирнбаум описал это как имеющее «в лучшем случае эвристическое, но не существенное значение для интерпретации доказательств».
Более прямой подход, ведущий к аналогичному выводу, можно найти в формулировке Бирнбаума принципа уверенности , который, в отличие от более распространенной версии, относится к вероятностям ошибок обоих видов. Об этом говорится следующим образом: [8]
«Концепция статистических данных неправдоподобна, если она не содержит «веских доказательств того, что в отличие от 'с небольшой вероятностью когда верно, и с гораздо большей вероятностью когда это правда».
Такое определение уверенности, естественно, может показаться удовлетворительным при определении CL. Остается верным, чтои эта, и более распространенные (связанные с теорией Неймана - Пирсона ) версии принципа уверенности несовместимы с принципом правдоподобия, и поэтому ни один частотный метод не может рассматриваться как действительно полное решение проблем, возникающих при рассмотрении условных свойств доверительные интервалы.
Расчет в пределе большой выборки
[ редактировать ]Если соблюдены определенные условия регулярности, то общая функция правдоподобия станет функцией Гаусса в пределе большой выборки. В таком случае верхний предел CL на доверительном уровне (полученный из наиболее мощного теста ) определяется выражением [9]
где — стандартное нормальное кумулятивное распределение , это максимального правдоподобия оценка и — его стандартное отклонение ; последнее можно оценить, используя обратную информационную матрицу Фишера или используя метод «Азимова». [9] набор данных. Этот результат оказывается эквивалентным байесовскому доверительному интервалу , если однородный априорный интервал для используется.
Ссылки
[ редактировать ]- ^ Рид, А.Л. (2002). «Представление результатов поиска: метод CL (s)». Журнал физики G: Ядерная физика и физика элементарных частиц . 28 (10): 2693–2704. Бибкод : 2002JPhG...28.2693R . дои : 10.1088/0954-3899/28/10/313 .
- ^ Физика элементарных частиц к 300-летию Михаила Ломоносова , с. 13, в Google Книгах.
- ^ Амнон Харель. «Статистические методы поиска в CMS» (PDF) . indico.cern.ch . Проверено 10 апреля 2015 г.
- ^ Марк Манделькерн (2002). «Установка доверительных интервалов для ограниченных параметров» . Статистическая наука . 17 (2): 149–159. дои : 10.1214/сс/1030550859 . JSTOR 3182816 .
- ^ Рональд Н. Гир (1977). «Концепция статистических данных Аллана Бирнбаума» . Синтезируйте . 36 (1): 5–13. дои : 10.1007/bf00485688 . S2CID 46973213 .
- ^ Г. Зех (1989). «Верхние пределы в экспериментах с фоном или ошибками измерения» (PDF) . Нукл. Инструмент. Методы Физ. Рез. А. 277 (2–3): 608–610. Бибкод : 1989NIMPA.277..608Z . дои : 10.1016/0168-9002(89)90795-X .
- ^ Бирнбаум, Аллан (1962). «Об основах статистического вывода». Журнал Американской статистической ассоциации . 57 (298): 269–326. дои : 10.2307/2281640 . JSTOR 2281640 . МР 0138176 . (С обсуждением.)
- ^ Бирнбаум, Аллан (1977). «Теория Неймана-Пирсона как теория принятия решений и как теория вывода; с критикой аргумента Линдли-Сэвиджа в пользу байесовской теории» . Синтезируйте . 36 (1): 19–49. дои : 10.1007/bf00485690 . S2CID 35027844 .
- ^ Jump up to: а б Г. Коуэн; К. Кранмер; Э. Гросс; О. Вителлс (2011). «Асимптотические формулы для основанных на правдоподобии тестов новой физики». Евро. Физ. Джей Си . 71 (2): 1554. arXiv : 1007.1727 . Бибкод : 2011EPJC...71.1554C . дои : 10.1140/epjc/s10052-011-1554-0 .
Дальнейшее чтение
[ редактировать ]- Леон Джей Глесер (2002). «[Установка доверительных интервалов для ограниченных параметров]: комментарий» . Статистическая наука . 17 (2): 161–163. дои : 10.1214/ss/1030550859 . JSTOR 3182818 .
- Фрейзер, DAS; Рид Н.; Вонг, ACM (2004). «Вывод для ограниченных параметров». Физ. Преподобный Д. 69 (3): 033002. arXiv : физика/0303111 . дои : 10.1103/PhysRevD.69.033002 . S2CID 18947032 .
- Роберт Д. Казинс (2011). «Отрицательно смещенные соответствующие подмножества, вызванные наиболее мощными односторонними верхними доверительными пределами для ограниченного физического параметра». arXiv : 1109.2023 [ physical.data-an ].