Байесовская линейная регрессия — это тип условного моделирования , при котором среднее значение одной переменной описывается линейной комбинацией других переменных с целью получения апостериорной вероятности коэффициентов регрессии (а также других параметров, описывающих распределение регрессии). ) и в конечном итоге позволяет за пределами выборки прогнозировать регрессию как (часто обозначаемую ) при условии наблюдаемых значений регрессоров (обычно ). Самая простая и наиболее широко используемая версия этой модели — нормальная линейная модель , в которой данный распределяется по Гауссу . В этой модели и при определенном выборе априорных вероятностей параметров — так называемых сопряженных априорных вероятностей — апостериорная вероятность может быть найдена аналитически. При более произвольно выбранных априорных значениях апостериорные значения обычно приходится аппроксимировать.
где это матрица проектирования , каждая строка которой является вектором-предсказателем ; и это столбец -вектор .
Это частотный подход, который предполагает, что имеется достаточно измерений, чтобы сказать что-то значимое о . В байесовском подходе данные дополняются дополнительной информацией в виде априорного распределения вероятностей . Априорное убеждение о параметрах объединяется с функцией правдоподобия данных в соответствии с теоремой Байеса, чтобы получить апостериорное убеждение о параметрах. и . Априорное значение может принимать различные функциональные формы в зависимости от предметной области и информации, которая доступна априорно .
Поскольку данные включают в себя как и внимание сосредоточено только на распределении при условии нуждается в обосновании. Фактически, «полный» байесовский анализ потребовал бы совместного определения правдоподобия. вместе с предшествующим , где символизирует параметры распределения для . Только в предположении (слабой) экзогенности можно учитывать совместную вероятность. . [1] Последняя часть обычно игнорируется в предположении непересекающихся наборов параметров. Более того, при классических предположениях считаются выбранными (например, в спланированном эксперименте) и поэтому имеют известную вероятность без параметров. [2]
Для произвольного априорного распределения может не существовать аналитического решения для апостериорного распределения . В этом разделе мы рассмотрим так называемое сопряженное априорное распределение , для которого апостериорное распределение можно получить аналитически.
Предыдущий сопряжена этой функции правдоподобия , если она имеет ту же функциональную форму относительно и . Поскольку логарифмическое правдоподобие квадратично по , логарифмическое правдоподобие перезаписывается так, что правдоподобие становится нормальным в . Писать
Теперь, когда априорное значение указано, апостериорное распределение можно выразить как
С некоторой перестановкой, [3] апостериорное значение можно переписать так, чтобы апостериорное среднее значение вектора параметров может быть выражено через оценку наименьших квадратов и априорное среднее , при этом сила априора указана матрицей априорной точности
Чтобы оправдать это действительно является апостериорным средним, квадратичные члены в экспоненте можно переставить в квадратичную форму в . [4]
Модель доказательства - вероятность данных с учетом модели . Он также известен как предельное правдоподобие и априорная плотность прогнозирования . Здесь модель определяется функцией правдоподобия и априорное распределение по параметрам, т.е. . Доказательства модели отражают в одном числе, насколько хорошо такая модель объясняет наблюдения. Доказательства модели байесовской линейной регрессии, представленные в этом разделе, можно использовать для сравнения конкурирующих линейных моделей путем сравнения байесовских моделей . Эти модели могут различаться количеством и значениями переменных-предсказателей, а также их априорными значениями параметров модели. Сложность модели уже учтена в доказательствах модели, поскольку она исключает параметры путем интегрирования по всем возможным значениям и .
Этот интеграл можно вычислить аналитически, и решение дается в следующем уравнении. [5]
Здесь обозначает гамма-функцию . Поскольку мы выбрали сопряженный априор, предельное правдоподобие также можно легко вычислить, вычислив следующее равенство для произвольных значений и .
Обратите внимание, что это уравнение представляет собой не что иное, как переформулировку теоремы Байеса . Вставка формул для априорного значения, правдоподобия и апостериорного значения и упрощение полученного выражения приводит к аналитическому выражению, приведенному выше.
Гельман, Эндрю ; и др. (2013). «Введение в регрессионные модели». Байесовский анализ данных (Третье изд.). Бока-Ратон, Флорида: Чепмен и Холл/CRC. стр. 353–380. ISBN 978-1-4398-4095-5 .
Джекман, Саймон (2009). «Регрессионные модели». Байесовский анализ для социальных наук . Уайли. стр. 99–124. ISBN 978-0-470-01154-6 .
Росси, Питер Э.; Алленби, Грег М.; Маккалок, Роберт (2006). Байесовская статистика и маркетинг . Джон Уайли и сыновья. ISBN 0470863676 .
О'Хаган, Энтони (1994). Байесовский вывод . Продвинутая теория статистики Кендалла. Том. 2Б (Первое изд.). Холстед. ISBN 0-340-52922-9 .
Arc.Ask3.Ru Номер скриншота №: 8dc6e031b3275b7c7461e81771c8502d__1703047800 URL1:https://arc.ask3.ru/arc/aa/8d/2d/8dc6e031b3275b7c7461e81771c8502d.html Заголовок, (Title) документа по адресу, URL1: Bayesian linear regression - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)