Джеффрис приор
В байесовской статистике является априорное распределение Джеффриса неинформативным априорным распределением для пространства параметров . Назван в честь сэра Гарольда Джеффриса . [1] его функция плотности пропорциональна квадратному корню из определителя информационной матрицы Фишера :
Его ключевой особенностью является то, что он инвариантен при изменении координат вектора параметров. . То есть относительная вероятность, присвоенная объему вероятностного пространства с использованием априора Джеффриса, будет одинаковой независимо от параметризации, используемой для определения априора Джеффриса. Это делает его особенно интересным для использования с параметрами масштаба . [2] В качестве конкретного примера: распределение Бернулли может быть параметризовано вероятностью появления p или отношением шансов . Наивный однородный априор в этом случае не инвариантен к этой репараметризации, а априор Джеффриса инвариантен.
Было показано, что при оценке максимального правдоподобия экспоненциальных семейных моделей штрафные члены, основанные на априоре Джеффриса, уменьшают асимптотическую погрешность в точечных оценках. [3] [4]
Репараметризация
[ редактировать ]Однопараметрический случай
[ редактировать ]Если и две возможные параметризации статистической модели, и является непрерывно дифференцируемой функцией , мы говорим, что предшествующий является «инвариантным» относительно репараметризации, если то есть если приоры и связаны обычной теоремой о замене переменных .
Поскольку информация Фишера при перепараметризации преобразуется как определяя априоры как и дает нам желаемую «инвариантность». [5]
Многопараметрический случай
[ редактировать ]Аналогично однопараметрическому случаю, пусть и быть двумя возможными параметризациями статистической модели, причем непрерывно дифференцируемая функция . Мы звоним предшествующему «инвариант» относительно перепараметризации, если где - матрица Якобиана с элементами Поскольку информационная матрица Фишера при перепараметризации преобразуется как у нас есть это и, таким образом, определяя априоры как и дает нам желаемую «инвариантность».
Атрибуты
[ редактировать ]С практической и математической точки зрения, веская причина использовать этот неинформативный априор вместо других, например, полученных с помощью предела в сопряженных семействах распределений, заключается в том, что относительная вероятность объема вероятностного пространства не зависит от набор переменных параметров, выбранный для описания пространства параметров.
Иногда априор Джеффриса не может быть нормализован и, таким образом, является неправильным априором . Например, априор Джеффриса для среднего распределения является однородным по всей действительной линии в случае гауссовского распределения с известной дисперсией.
Использование априора Джеффриса нарушает строгую версию принципа правдоподобия , которую принимают многие, но далеко не все статистики. При использовании априора Джеффриса выводы о зависят не только от вероятности наблюдаемых данных как функции , но также и во вселенной всех возможных результатов эксперимента, определенных планом эксперимента, поскольку информация Фишера вычисляется на основе ожиданий по выбранной вселенной. Соответственно, априор Джеффриса и, следовательно, выводы, сделанные с его помощью, могут быть разными для двух экспериментов, в которых участвуют одни и те же параметр, даже если функции правдоподобия для двух экспериментов одинаковы, что является нарушением принципа сильного правдоподобия.
Минимальная длина описания
[ редактировать ]В подходе к статистике, основанном на минимальной длине описания , цель состоит в том, чтобы описать данные как можно более компактно, при этом длина описания измеряется в битах используемого кода. Для параметрического семейства распределений код сравнивается с лучшим кодом, основанным на одном из распределений параметризованного семейства. Основной результат состоит в том, что в экспоненциальных семействах , асимптотически для большого размера выборки, оптимальным является код, основанный на распределении, представляющем собой смесь элементов экспоненциального семейства с априором Джеффриса. Этот результат справедлив, если ограничить набор параметров компактным подмножеством внутри полного пространства параметров. [ нужна ссылка ] . Если используется полный параметр, следует использовать модифицированную версию результата.
Примеры
[ редактировать ]Априор Джеффриса для параметра (или набора параметров) зависит от статистической модели.
Распределение Гаусса со средним параметром
[ редактировать ]Для гауссовского распределения реальной стоимости с фиксировано, априор Джеффриса для среднего значения является То есть, Джеффрисы до не зависит от ; это ненормализованное равномерное распределение на действительной прямой — распределение, равное 1 (или некоторой другой фиксированной константе) для всех точек. Это неправильный априор и, с точностью до выбора константы, является уникальным трансляционно -инвариантным распределением действительных чисел ( мера Хаара относительно сложения действительных чисел), соответствующим среднему значению, являющемуся мерой местоположения и трансляционной инвариантности. соответствует отсутствию информации о местоположении.
Распределение Гаусса с параметром стандартного отклонения
[ редактировать ]Для гауссовского распределения реальной стоимости с фиксировано, априорное значение Джеффриса для стандартного отклонения является Аналогично, Джеффрисы до — это ненормализованное равномерное распределение на действительной прямой, поэтому это распределение также известно как логарифмический априор . Точно так же Джеффрисы до также однороден. Это уникальный (вплоть до кратного) априор (в положительных действительных числах), который является масштабно -инвариантным ( мера Хаара относительно умножения положительных действительных чисел), что соответствует стандартному отклонению, являющемуся мерой масштаба , и масштабной инвариантности, соответствующей нет информации о масштабе. Как и в случае с равномерным распределением действительных чисел, это неправильный априор .
Распределение Пуассона с параметром скорости
[ редактировать ]Для распределения Пуассона неотрицательного целого числа , априор Джеффриса для параметра скорости является Аналогично, Джеффрисы до — ненормализованное равномерное распределение на неотрицательной действительной линии.
Суд над Бернулли
[ редактировать ]Для монеты, которая с вероятностью выпадет орлом и с вероятностью "решка" , для данного вероятность . Приор Джеффриса для параметра является
Это арксинусное распределение и бета-распределение с . Кроме того, если затем То есть, Джеффрисы до является равномерным на интервале . Эквивалентно, равномерен по всему кругу .
N -сторонняя игральная кость со смещенными вероятностями
[ редактировать ]Аналогично, для броска двусторонний кубик с вероятностями исхода , каждый неотрицательный и удовлетворяющий , Джеффрис приор для представляет собой распределение Дирихле, в котором все (альфа) параметры равны половине. Это равносильно использованию псевдосчета , равного половине для каждого возможного результата.
Эквивалентно, если мы напишем для каждого , то Джеффрис приор для является однородным по -мерная единичная сфера ( т. е . она однородна на поверхности -мерный единичный шар ).
Обобщения
[ редактировать ]Предварительное сопоставление вероятностей
[ редактировать ]В 1963 году Уэлч и Пирс показали, что для скалярного параметра θ априор Джеффриса является «вероятностным сопоставлением» в том смысле, что апостериорные прогностические вероятности согласуются с частотными вероятностями, а достоверные интервалы выбранной ширины совпадают с частотными доверительными интервалами . [6] В дальнейшем Пирс показал, что это неверно для многопараметрического случая. [7] вместо этого это приводит к идее априорного сопоставления вероятностей, где лишь неявно определяются как распределение вероятностей, решающее определенное уравнение в частных производных, включающее информацию Фишера . [8]
α-параллельный априор
[ редактировать ]Используя инструменты информационной геометрии , априор Джеффриса можно обобщить с целью получения априоров, кодирующих геометрическую информацию статистической модели, чтобы быть инвариантными при изменении координаты параметров. [9] Особый случай, так называемый априор Вейля, определяется как форма объема на многообразии Вейля . [10]
Ссылки
[ редактировать ]- ^ Джеффрис Х (1946). «Инвариантная форма априорной вероятности в задачах оценки». Труды Лондонского королевского общества . Серия А, Математические и физические науки. 186 (1007): 453–461. Бибкод : 1946RSPSA.186..453J . дои : 10.1098/rspa.1946.0056 . JSTOR 97883 . ПМИД 20998741 .
- ^ Джейнс ET (сентябрь 1968 г.). «Априорные вероятности» (PDF) . Транзакции IEEE по системным наукам и кибернетике . 4 (3): 227–241. дои : 10.1109/TSSC.1968.300117 .
- ^ Ферт, Дэвид (1992). «Уменьшение предвзятости, приор Джеффриса и GLIM». В Фармейре, Людвиг; Фрэнсис, Брайан; Гилкрист, Роберт; Тутц, Герхард (ред.). Достижения в области GLIM и статистического моделирования . Нью-Йорк: Спрингер. стр. 91–100. дои : 10.1007/978-1-4612-2952-0_15 . ISBN 0-387-97873-9 .
- ^ Магис, Дэвид (2015). «Заметка о взвешенном правдоподобии и модальной оценке Джеффриса уровней квалификации в моделях ответов на политомические задания». Психометрика . 80 : 200–204. дои : 10.1007/s11336-013-9378-5 .
- ^ Роберт CP, Шопен Н, Руссо Дж (2009). «Возвращение к теории вероятностей Гарольда Джеффриса» . Статистическая наука . 24 (2). arXiv : 0804.3173 . дои : 10.1214/09-STS284 .
- ^ Уэлч, БЛ; Пирс, HW (1963). «О формулах для точек уверенности на основе интегралов взвешенных правдоподобий». Журнал Королевского статистического общества . Серия Б (Методическая). 25 (2): 318–329. дои : 10.1111/j.2517-6161.1963.tb00512.x .
- ^ Пирс, HW (1965). «О точках уверенности и точках байесовской вероятности в случае нескольких параметров». Журнал Королевского статистического общества . Серия Б (Методическая). 27 (1): 9–16. дои : 10.1111/j.2517-6161.1965.tb00581.x .
- ^ Скриччоло, Катя (1999). «Априоры вероятностного соответствия: обзор». Журнал Итальянского статистического общества . 8 . 83. дои : 10.1007/BF03178943 .
- ^ Такеучи, Дж.; Амари, С. (2005). «α-параллельный приор и его свойства». Транзакции IEEE по теории информации . 51 (3): 1011–1023. дои : 10.1109/TIT.2004.842703 .
- ^ Цзян, Жуйчао; Таваколи, Джавад; Чжао, Ицян (2020). «Вейль Прайор и байесовская статистика» . Энтропия . 22 (4). 467. дои : 10.3390/e22040467 . ПМК 7516948 .
Дальнейшее чтение
[ редактировать ]- Касс Р.Э., Вассерман Л. (1996). «Выбор предшествующих распределений по формальным правилам». Журнал Американской статистической ассоциации . 91 (435): 1343–1370. дои : 10.1080/01621459.1996.10477003 .
- Ли, Питер М. (2012). «Правило Джеффриса». Байесовская статистика: Введение (4-е изд.). Уайли. стр. 96–102. ISBN 978-1-118-33257-3 .