Неоднородная гауссова регрессия
Неоднородная Гауссова регрессия ( NGR ) [1] [2] — это тип статистического регрессионного анализа, используемый в науках об атмосфере как способ преобразования ансамблевых прогнозов в вероятностные прогнозы . [3] По сравнению с простой линейной регрессией , NGR использует разброс ансамбля в качестве дополнительного предиктора, который используется для улучшения прогнозирования неопределенности и позволяет прогнозируемой неопределенности варьироваться от случая к случаю. Прогноз неопределенности в NGR получается как на основе статистики прошлых ошибок прогноза, так и на основе разброса ансамбля. NGR изначально был разработан для прогнозирования средней температуры в конкретном регионе. [1] но с тех пор также применяется для среднесрочного прогнозирования ветра на конкретном участке. [4] и сезонным прогнозам, [5] и был адаптирован для прогнозирования осадков. [6] Внедрение NGR стало первой демонстрацией того, что вероятностные прогнозы, учитывающие различный разброс по ансамблю, могут обеспечить более высокие оценки навыков, чем прогнозы, основанные на подходах статистики выходных данных стандартной модели, применяемых к среднему значению ансамбля.
Интуиция
[ редактировать ]Прогнозы погоды , создаваемые с помощью компьютерного моделирования атмосферы и океана, обычно состоят из ансамбля отдельных прогнозов. Ансамбли используются как способ попытаться уловить и количественно оценить неопределенности в процессе прогнозирования погоды, такие как неопределенность в начальных условиях и неопределенность в параметризации модели . Для точечных прогнозов нормально распределенных переменных можно суммировать ансамблевый прогноз со средним значением и стандартным отклонением ансамбля. Среднее значение ансамбля часто является лучшим прогнозом, чем любой из отдельных прогнозов, а стандартное отклонение ансамбля может указывать на неопределенность прогноза.
Однако прямые результаты компьютерного моделирования атмосферы нуждаются в калибровке, прежде чем их можно будет значимо сравнить с наблюдениями за погодными переменными. Этот процесс калибровки часто называют статистикой выходных данных модели (MOS). Самая простая форма такой калибровки заключается в исправлении систематических ошибок с использованием коррекции систематической ошибки, рассчитанной на основе прошлых ошибок прогноза. Коррекция смещения может применяться как к отдельным членам ансамбля, так и к среднему значению ансамбля. Более сложная форма калибровки заключается в использовании прошлых прогнозов и прошлых наблюдений для обучения простой модели линейной регрессии , которая сопоставляет среднее значение ансамбля с наблюдениями. В такой модели неопределенность прогноза выводится исключительно из статистических свойств прошлых ошибок прогноза. Однако ансамблевые прогнозы строятся с надеждой, что разброс ансамбля может содержать дополнительную информацию о неопределенности, помимо информации, которая может быть получена в результате анализа прошлых результатов прогноза. В частности, поскольку разброс по ансамблю обычно различен для каждого последующего прогноза, было высказано предположение, что разброс по ансамблю может служить основой для прогнозирования различных уровней неопределенности в разных прогнозах, что трудно сделать на основе прошлых оценок неопределенности, основанных на характеристиках. Содержит ли разброс ансамбля информацию о неопределенности прогноза и сколько информации он содержит, зависит от многих факторов, таких как система прогноза, переменная прогноза, разрешение и время заблаговременности прогноза.
NGR — это способ включения информации из разброса ансамбля в калибровку прогноза путем прогнозирования будущей неопределенности как взвешенной комбинации неопределенности, оцененной с использованием прошлых ошибок прогноза, как в MOS, и неопределенности, оцененной с использованием разброса ансамбля. Веса двух источников информации о неопределенности калибруются с использованием прошлых прогнозов и прошлых наблюдений в попытке получить оптимальные весовые коэффициенты.
Обзор
[ редактировать ]Рассмотрим серию прошлых наблюдений за погодой. в течение периода дней (или другой временной интервал):
и соответствующую серию прошлых ансамблевых прогнозов, характеризующихся выборочным средним значением и стандартное отклонение ансамбля:
- .
Также рассмотрим новый ансамблевый прогноз из той же системы со средним значением по ансамблю. и стандартное отклонение ансамбля , предназначенный для предсказания неизвестного будущего наблюдения за погодой. .
Простой способ калибровки выходных параметров нового ансамблевого прогноза и составить калиброванный прогноз для заключается в использовании простой модели линейной регрессии, основанной на среднем значении ансамбля. , обученный с использованием прошлых наблюдений за погодой и прошлых прогнозов:
Эта модель имеет эффект смещения, корректирующий среднее значение по ансамблю и регулирующий уровень изменчивости прогноза.Его можно применить к новому ансамблевому прогнозу. для создания точечного прогноза для с использованием
или получить вероятностный прогноз распределения возможных значений для на основе нормального распределения со средним и дисперсия :
Использование регрессии для калибровки прогнозов погоды таким образом является примером выходной статистики модели .
Однако эта простая модель линейной регрессии не использует стандартное отклонение ансамбля. и, следовательно, пропускает любую информацию о неопределенности прогноза, которую может содержать стандартное отклонение ансамбля. Модель NGR была представлена как способ потенциально улучшить прогноз неопределенности в прогнозе путем включения информации, извлеченной из стандартного отклонения ансамбля. Это достигается путем обобщения простой модели линейной регрессии на:
или
затем это можно использовать для калибровки новых параметров ансамблевого прогноза. используя либо
или
соответственно. Неопределенность прогноза теперь определяется двумя членами: член постоянен во времени, а Срок варьируется по мере изменения разброса ансамбля.
Оценка параметров
[ редактировать ]В научной литературе четыре параметра NGR были оценены либо по методу максимального правдоподобия, либо по методу максимального правдоподобия. [1] или по максимальному показателю непрерывной ранжированной вероятности (CRPS). [2] Также обсуждались плюсы и минусы этих двух подходов. [7]
История
[ редактировать ]Первоначально NGR был разработан в частном секторе учеными компании Risk Management Solutions Ltd с целью использования информации в ансамблевом разбросе для оценки производных погодных условий . [1]
Терминология
[ редактировать ]Первоначально NGR назывался «регрессией распространения», а не NGR. [1] Последующие авторы, однако, сначала представили альтернативные названия Статистика вывода ансамблевой модели (EMOS). [2] а потом НГР. [8] Первоначальное название «регрессия распространения» теперь вышло из употребления, EMOS обычно используется для обозначения любого метода, используемого для калибровки ансамблей, а NGR обычно используется для обозначения метода, описанного в этой статье. [4] [7]
Ссылки
[ редактировать ]- ^ Jump up to: а б с д и ж г Джусон, С.; Брикс, А.; Циманн, К. (2004). «Новая параметрическая модель для оценки и калибровки среднесрочных ансамблевых прогнозов температуры» . Письма об атмосферной науке . 5 (5): 96–102. arXiv : физика/0308057 . дои : 10.1002/asl.69 .
- ^ Jump up to: а б с д Гнейтинг, Т.; Рафтери, А.; Вествельд, А.; Гольдман, Т. (2005). «Калиброванное вероятностное прогнозирование с использованием выходной статистики ансамблевой модели и минимальной оценки CRPS» . Ежемесячный обзор погоды . 133 (5): 1098. дои : 10.1175/MWR2904.1 .
- ^ «Калибровка и объединение ансамблевых прогнозов» (PDF) . Лаборатория исследования системы Земли NOAA . США: Национальное управление океанических и атмосферных исследований .
- ^ Jump up to: а б Тораринсдоттир, Т.; Джонсон, М. (2012). «Вероятностное прогнозирование порывов ветра с использованием неоднородной гауссовой регрессии» . Ежемесячный обзор погоды . 140 (3): 889–897. дои : 10.1175/MWR-D-11-00075.1 .
- ^ Лалич, Б.; Фирани Сремак, А.; Декич, Л.; Эйцингер, Дж. (2017). «Сезонное прогнозирование компонентов зеленой воды и урожайности озимой пшеницы в Сербии и Австрии» . Журнал сельскохозяйственной науки . 156 (5): 645–657. дои : 10.1017/S0021859617000788 . ПМК 6199547 . ПМИД 30369628 .
- ^ Шойерер, М. (2013). «Вероятностный количественный прогноз осадков с использованием выходной статистики ансамблевой модели». Ежеквартальный журнал Королевского метеорологического общества . 140 (680): 1086–1096. arXiv : 1302.0893 . дои : 10.1002/qj.2183 . S2CID 88512854 .
- ^ Jump up to: а б Гебетсбергер, М.; Месснер, Дж.; Майр, Г.; Зейлейс, А. (2018). «Методы оценки для моделей неоднородной регрессии: минимальный показатель непрерывной ранжированной вероятности в сравнении с максимальным правдоподобием» . Ежемесячный обзор погоды . 146 (12): 4323–4338. дои : 10.1175/MWR-D-17-0364.1 .
- ^ Уилкс, DS (22 августа 2006 г.). «Сравнение методов ансамблевой МОП в установке Лоренца '96» . Метеорологические приложения . 13 (3): 243. дои : 10.1017/s1350482706002192 . ISSN 1350-4827 .