Лучший линейный несмещенный прогноз
В статистике лучший линейный несмещенный прогноз ( BLUP ) используется в линейных смешанных моделях для оценки случайных эффектов . BLUP был разработан Чарльзом Роем Хендерсоном в 1950 году, но термин «лучший линейный несмещенный предиктор» (или «прогноз»), похоже, не использовался до 1962 года. [1] «Наилучшие линейные несмещенные прогнозы» (BLUP) случайных эффектов аналогичны лучшим линейным несмещенным оценкам (BLUE) (см. теорему Гаусса – Маркова ) фиксированных эффектов. Различие возникает потому, что принято говорить об оценке фиксированных эффектов, а не о прогнозировании случайных эффектов, но в остальном эти два термина эквивалентны. (Это немного странно, поскольку случайные эффекты уже «реализованы»; они уже существуют. Использование термина «предсказание» может быть связано с тем, что в области разведения животных, в которой работал Хендерсон, случайные эффекты обычно были генетическими. , что можно было бы использовать для прогнозирования качества потомства (Робинсон [1] стр. 28)). Однако уравнения для «фиксированных» эффектов и для случайных эффектов различны.
На практике часто бывает так, что параметры, связанные с термином(ами) случайного эффекта(ов), неизвестны; эти параметры представляют собой дисперсии случайных эффектов и остатков. Обычно параметры оцениваются и подключаются к предиктору, что приводит к эмпирическому лучшему линейному несмещенному предиктору (EBLUP). Обратите внимание, что при простом включении оцененного параметра в предиктор дополнительная изменчивость не учитывается, что приводит к чрезмерно оптимистичным отклонениям прогноза для EBLUP. [ нужна ссылка ]
Лучшие линейные несмещенные прогнозы аналогичны эмпирическим байесовским оценкам случайных эффектов в линейных смешанных моделях, за исключением того, что в последнем случае, когда веса зависят от неизвестных значений компонентов дисперсии, эти неизвестные дисперсии заменяются оценками на основе выборки.
Пример
[ редактировать ]Предположим, что модель наблюдений { Y j ; j = 1, ..., n } записывается как
где является средним значением всех наблюдений , а ξ j и ε j представляют собой случайный эффект и ошибку наблюдения для наблюдения j и предположим, что они некоррелированы и имеют известные дисперсии σ ξ 2 и видишь 2 , соответственно. Далее, x j — вектор независимых переменных для j -го наблюдения и — вектор параметров регрессии.
Задача BLUP о предоставлении оценки значения без ошибок наблюдения для k -го наблюдения:
можно сформулировать как требование, чтобы коэффициенты линейного предиктора, определяемые как
следует выбирать так, чтобы минимизировать дисперсию ошибки прогнозирования,
при условии, что предиктор несмещен,
БЛУП против СИНЕГО
[ редактировать ]В отличие от случая наилучшей линейной несмещенной оценки , «оцениваемая величина» , имеет вклад не только случайный элемент, но и одна из наблюдаемых величин, а именно что способствует , также имеет вклад того же случайного элемента.
В отличие от BLUE, BLUP учитывает известные или предполагаемые отклонения. [2]
История BLUP в селекции
[ редактировать ]Хендерсон исследовал разведение со статистической точки зрения. Его работа способствовала разработке индекса селекции (SI) и оценки племенной ценности (EBV). Эти статистические методы повлияли на рейтинги производителей искусственного осеменения, используемые в Соединенных Штатах. Эти ранние статистические методы путают с BLUP, широко распространенным сейчас в животноводстве.
Фактический термин BLUP возник в результате работы Дэниела Соренсена и Брайана Кеннеди в Университете Гвельфа в Канаде, в которой они распространили результаты Хендерсона на модель, включающую несколько циклов отбора. [3] Эта модель была популяризирована Университетом Гвельфа в молочной промышленности под названием BLUP. Дальнейшая работа университета показала превосходство BLUP над EBV и SI, что привело к тому, что он стал основным генетическим предиктором. [ нужна ссылка ] .
Таким образом, существует путаница между популяризированной выше моделью BLUP и лучшим статистическим методом линейного несмещенного прогнозирования, который был слишком теоретическим для общего использования. Модель поставлялась для использования на компьютерах фермерам.
В Канаде все молочные предприятия отчитываются на национальном уровне. Генетика в Канаде была общей, что сделало ее крупнейшим генетическим фондом и, следовательно, источником улучшений. Это и BLUP привели к быстрому увеличению качества голштинского скота .
См. также
[ редактировать ]Примечания
[ редактировать ]- ^ Jump up to: а б Робинсон, ГК (1991). «Этот BLUP — хорошая вещь: оценка случайных эффектов» . Статистическая наука . 6 (1): 15–32. дои : 10.1214/ss/1177011926 . JSTOR 2245695 . МР 1108815 . Збл 0955.62500 .
- ^ Станек, Эдвард Дж. III; Ну, Арнольд; Окен, Ира (1999). «Почему бы регулярно не использовать лучшие линейные несмещенные предикторы (BLUP) для оценки уровня холестерина, процента жира от ккал и физической активности?». Статистика в медицине . 18 (21): 2943–2959. doi : 10.1002/(sici)1097-0258(19991115)18:21<2943::aid-sim241>3.0.co;2-0 . ПМИД 10523752 .
- ^ Соренсен, Д.А.; Кеннеди, BW (1 мая 1984 г.). «Оценка реакции на выбор с использованием метода наименьших квадратов и смешанной модели» . Журнал зоотехники . 58 (5): 1097–1106. дои : 10.2527/jas1984.5851097x .
Ссылки
[ редактировать ]- Хендерсон, ЧР (1975). «Лучшая линейная несмещенная оценка и прогноз в рамках модели выбора». Биометрия . 31 (2): 423–447. дои : 10.2307/2529430 . JSTOR 2529430 . ПМИД 1174616 .
- Лю, Сюй-Цин; Ронг, Цзянь-Ин; Лю, Сю-Ин (2008). «Лучший линейный несмещенный прогноз для линейных комбинаций в общих смешанных линейных моделях». Журнал многомерного анализа . 99 (8): 1503–1517. дои : 10.1016/j.jmva.2008.01.004 .