Байесовский экспериментальный план
Часть серии о |
Байесовская статистика |
---|
![]() |
Апостериорный = Вероятность × Априорный ÷ Доказательства |
Фон |
Модельное здание |
Апостериорное приближение |
Оценщики |
Приближение доказательств |
Оценка модели |
Байесовский план эксперимента обеспечивает общую теоретико-вероятностную основу, на основе которой могут быть выведены другие теории планирования эксперимента . Он основан на байесовском выводе для интерпретации наблюдений/данных, полученных в ходе эксперимента. Это позволяет учитывать как любые предварительные знания об определяемых параметрах, так и неопределенности в наблюдениях.
Теория байесовского планирования эксперимента [1] в определенной степени основан на теории принятия оптимальных решений в условиях неопределенности . Целью при планировании эксперимента является максимизация ожидаемой полезности результатов эксперимента. Полезность чаще всего определяется как мера точности информации, полученной в результате эксперимента (например, информация Шеннона или отрицательная дисперсия ) , но может также включать такие факторы, как финансовые затраты на проведение эксперимента. Каким будет оптимальный план эксперимента, зависит от конкретного выбранного критерия полезности.
Связь с более специализированной теорией оптимального проектирования
[ редактировать ]Линейная теория
[ редактировать ]Если модель линейна, априорная функция плотности вероятности (PDF) однородна, а ошибки наблюдений нормально распределены , теория упрощается до классической теории оптимального планирования эксперимента .
Приблизительная нормальность
[ редактировать ]В многочисленных публикациях по байесовскому плану экспериментов предполагается (часто неявно), что все апостериорные вероятности будут примерно нормальными. Это позволяет рассчитывать ожидаемую полезность с использованием линейной теории, усредняя по пространству параметров модели. [2] Однако при применении этого метода следует соблюдать осторожность, поскольку приблизительную нормальность всех возможных апостериорных результатов трудно проверить даже в случаях нормальных ошибок наблюдения и однородной априорной вероятности.
Заднее распределение
[ редактировать ]Во многих случаях апостериорное распределение недоступно в закрытой форме и должно быть аппроксимировано с использованием численных методов. Наиболее распространенный подход - использовать методы Монте-Карло цепи Маркова для генерации апостериорных выборок, которые затем можно использовать для аппроксимации ожидаемой полезности.
Другой подход — использовать вариационную байесовскую аппроксимацию апостериорной функции, которую часто можно рассчитать в закрытой форме. Преимущество этого подхода состоит в том, что он более эффективен в вычислительном отношении, чем методы Монте-Карло, но недостатком является то, что аппроксимация может быть не очень точной.
Некоторые авторы предложили подходы, которые используют апостериорное прогнозируемое распределение для оценки влияния новых измерений на неопределенность прогноза. [3] [4] в то время как другие предлагают максимизировать взаимную информацию между параметрами, прогнозами и потенциальными новыми экспериментами. [5]
Математическая формулировка
[ редактировать ]
|
Учитывая вектор параметров для определения, априорная вероятность по этим параметрам и вероятности для наблюдения , при заданных значениях параметров и план эксперимента , апостериорную вероятность можно вычислить с помощью теоремы Байеса
где - предельная плотность вероятности в пространстве наблюдения
Ожидаемая полезность эксперимента с дизайном тогда можно определить
где - некоторый действительный функционал апостериорной вероятности после наблюдения использование плана эксперимента .
Получение информации Шеннона как полезности
[ редактировать ]Полезность можно определить как априорно-апостериорный выигрыш в информации Шеннона.
Другая возможность состоит в том, чтобы определить полезность как
расхождение Кульбака -Лейблера априорного и апостериорного распределения. Линдли (1956) отметил, что ожидаемая полезность тогда будет независима от координат и может быть записана в двух формах:
из которых последняя может быть оценена без необходимости оценки отдельной апостериорной вероятности для всех возможных наблюдений . [6] Стоит отметить, что второй член во второй строке уравнения не будет зависеть от конструкции. , пока не возникает неопределенности наблюдений. С другой стороны, интеграл в первой форме является постоянной для всех , поэтому, если цель состоит в том, чтобы выбрать схему с наибольшей полезностью, этот член вообще не нужно вычислять. Некоторые авторы рассматривали численные методы оценки и оптимизации этого критерия. [7] [8] Обратите внимание, что
ожидаемый прирост информации представляет собой в точности взаимную информацию между параметром θ и наблюдением y . Пример байесовского дизайна для распознавания линейной динамической модели приведен в Bania (2019) . [9] С было трудно вычислить, его нижнюю границу использовали в качестве функции полезности. Затем нижняя граница максимизируется при ограничении энергии сигнала. Предлагаемый байесовский дизайн также сравнивался с классическим средним D-оптимальным дизайном. Было показано, что байесовский план превосходит D-оптимальный план.
Критерий Келли описывает также такую функцию полезности для игрока, стремящегося максимизировать прибыль, которая используется в теории азартных игр и информации ; Ситуация Келли идентична предыдущей, с дополнительной информацией, или «частной телеграфной связью», заменяющей эксперимент.
См. также
[ редактировать ]- Байесовская оптимизация
- Оптимальный дизайн
- Активное обучение
- Ожидаемая ценность выборочной информации
Ссылки
[ редактировать ]- ^ Ли, Се Юн (2024). «Использование байесовской статистики в подтверждающих клинических исследованиях в нормативных рамках: обзор учебного пособия» . Методология BMC Med Res . 24 (1): 110. дои : 10.1186/s12874-024-02235-0 . ПМЦ 11077897 . ПМИД 38714936 .
- ^ Подход, рассмотренный в Чалонер, Кэтрин; Вердинелли, Изабелла (1995), «Байесовский экспериментальный план: обзор» (PDF) , Statistical Science , 10 (3): 273–304, doi : 10.1214/ss/1177009939
- ^ Ванлиер; Тиманн; Хильберс; ван Риель (2012), «Байесовский подход к планированию целевых экспериментов», Bioinformatics , 28 (8): 1136–1142, doi : 10.1093/bioinformatics/bts092 , PMC 3324513 , PMID 22368245
- ^ Тибо; Лалой; Херманс (2021), «Новая основа для планирования экспериментов с использованием байесовского доказательного обучения: случай зоны защиты устья скважины», Journal of Hydrology , 603 : 126903, arXiv : 2105.05539 , Bibcode : 2021JHyd..60326903T , doi : 10.1016/j. jгидрол.2021.126903 , hdl : 1854/LU-8759542 , S2CID 234469903
- ^ Лиепе; Филиппи; Коморовский; Штумпф (2013), «Максимизация информативности экспериментов в системной биологии», PLOS Computational Biology , 9 (1): e1002888, Bibcode : 2013PLSCB...9E2888L , doi : 10.1371/journal.pcbi.1002888 , PMC 3561087 , PMID 23382663
- ^ Линдли, Д.В. (1956), «О мере информации, предоставляемой экспериментом», Annals of Mathematical Статистика , 27 (4): 986–1005, doi : 10.1214/aoms/1177728069
- ^ ван ден Берг; Кертис; Трамперт (2003), «Оптимальный нелинейный байесовский эксперимент: приложение к экспериментам по амплитуде и смещению», Geophysical Journal International , 155 (2): 411–421, Bibcode : 2003GeoJI.155..411V , doi : 10.1046/j.1365 -246x.2003.02048.x
- ^ Райан, К.Дж. (2003), «Оценка ожидаемого прироста информации для экспериментальных проектов с применением к модели случайного предела усталости», Журнал вычислительной и графической статистики , 12 (3): 585–603, doi : 10.1198/1061860032012 , S2CID 119889630
- ^ Баниа, П. (2019), «Байесовский дизайн входных данных для дискриминации линейной динамической модели», Entropy , 21 (4): 351, Bibcode : 2019Entrp..21..351B , doi : 10.3390/e21040351 , PMC 7514835 , PMID 33267065
Дальнейшее чтение
[ редактировать ]- ДасГупта, А. (1996), «Обзор оптимальных байесовских планов» (PDF) , Гош, С.; Рао, Ч.Р. (ред.), Планирование и анализ экспериментов , Справочник по статистике, том. 13, Северная Голландия, стр. 1099–1148, ISBN. 978-0-444-82061-7
- Рейнфорт, Том; и др. (2023), Современный байесовский экспериментальный дизайн , arXiv : 2302.14545