Диаграмма Тейлора

Диаграммы Тейлора — это математические диаграммы , предназначенные для графического указания того, какое из нескольких приблизительных представлений (или моделей) системы, процесса или явления является наиболее реалистичным. Эта диаграмма, изобретенная Карлом Э. Тейлором в 1994 году (опубликована в 2001 году). [1] ) облегчает сравнительную оценку различных моделей. Он используется для количественной оценки степени соответствия между смоделированным и наблюдаемым поведением с точки зрения трех статистических данных: коэффициента корреляции Пирсона , ошибки среднеквадратической ошибки (RMSE) и стандартного отклонения .

Хотя диаграммы Тейлора в основном использовались для оценки моделей, предназначенных для изучения климата и других аспектов окружающей среды Земли, [2] их можно использовать для целей, не связанных с наукой об окружающей среде (например, для количественной оценки и визуального отображения того, насколько хорошо модели термоядерной энергии отражают реальность). [3] ).

Диаграммы Тейлора можно построить с помощью ряда различных пакетов программного обеспечения с открытым исходным кодом и коммерческих программ, включая: GrADS, [4] [5] МВУ, [6] МАТЛАБ, [7] [8] [9] НКЛ, [10] Питон, [11] [12] Р, [13] и ЦДАТ. [14]

Пример диаграммы [ править ]

Пример диаграммы Тейлора, показанной на рисунке 1. [15] представляет собой краткое описание относительной способности , с которой несколько моделей глобального климата моделируют пространственную структуру среднегодовых осадков. Сравниваются восемь моделей, каждая из которых обозначена на диаграмме отдельной буквой, и расстояние между каждой моделью и точкой, помеченной как «наблюдаемая», является мерой того, насколько реалистично каждая модель воспроизводит наблюдения. Для каждой модели строятся три статистические данные: коэффициент корреляции Пирсона (определяющий сходство картины между смоделированными и наблюдаемыми полями) связан с азимутальным углом (синие контуры); центрированная среднеквадратическая ошибка в моделируемом поле пропорциональна расстоянию от точки на оси X, обозначенной как «наблюдаемая» (зеленые контуры); а стандартное отклонение моделируемого шаблона пропорционально радиальному расстоянию от начала координат (черные контуры). Например, из этой диаграммы видно, что для модели F коэффициент корреляции составляет около 0,65, среднеквадратическая ошибка составляет около 2,6 мм/день, а стандартное отклонение составляет около 3,3 мм/день. Стандартное отклонение модели F явно превышает стандартное отклонение наблюдаемого поля (обозначено пунктирным контуром на радиальном расстоянии 2,9 мм/день).

Рис. 1: Образец диаграммы Тейлора, показывающий статистическое сравнение с наблюдениями восьми модельных оценок глобальной структуры среднегодовых осадков.

Относительные преимущества различных моделей можно сделать из рисунка 1. Смоделированные закономерности, которые хорошо согласуются с наблюдениями, будут лежать ближе всего к точке, помеченной как «наблюдаемая» на оси X. Эти модели имеют относительно высокую корреляцию и низкие среднеквадратические ошибки. Модели, лежащие на пунктирной дуге, имеют правильное стандартное отклонение (что указывает на то, что вариации модели имеют правильную амплитуду). На рисунке 1 видно, что модели A и C в целом лучше всего согласуются с наблюдениями, каждая из которых имеет примерно одинаковую среднеквадратичную ошибку. Модель A, однако, имеет несколько более высокую корреляцию с наблюдениями и имеет то же стандартное отклонение, что и наблюдаемое, тогда как модель C имеет слишком небольшую пространственную изменчивость (со стандартным отклонением 2,3 мм/день по сравнению с наблюдаемым значением 2,9 мм/день). ). Из моделей с худшими характеристиками модель E имеет низкую корреляцию моделей, в то время как модель D имеет вариации, которые намного больше, чем наблюдаемые, что в обоих случаях приводит к относительно большой (~ 3 мм/день) центрированной среднеквадратической ошибке в полях осадков. Хотя модели D и B имеют примерно одинаковую корреляцию с наблюдениями, модель B моделирует амплитуду изменений (т. е. стандартное отклонение) гораздо лучше, чем модель D, что приводит к меньшей среднеквадратической ошибке.

Теоретическая основа [ править ]

Диаграммы Тейлора отображают статистику, полезную для оценки сходства переменной, моделируемой моделью (в более общем смысле, «тестового» поля) с ее наблюдаемым аналогом (в более общем смысле, «эталонным» полем). Математически три статистики, отображаемые на диаграмме Тейлора, связаны формулой распространения ошибки (которую можно получить непосредственно из определения статистики, появляющейся в ней):

,

где ρ — коэффициент корреляции между тестовым и эталонным полями, E ’ — центрированная среднеквадратическая разница между полями (с предварительно удаленной любой разницей в средних значениях), и и – стандартные отклонения эталонного и тестового полей соответственно. Закон косинусов ,

(где a , b и c — длины сторон треугольника, а — угол между сторонами a и b ) дает ключ к формированию геометрической взаимосвязи между четырьмя величинами, лежащими в основе диаграммы Тейлора (показанной на рисунке 2).

Рис. 2: Геометрическая связь между статистиками, построенными на диаграммах Тейлора по закону косинусов.

Стандартное отклонение наблюдаемого поля сторона a — стандартное отклонение тестового поля. является стороной b , центрированная среднеквадратическая разница между двумя полями ( E ′) равна стороне c , а косинус угла между сторонами a и b является коэффициентом корреляции ( ρ ).

Средние значения полей вычитаются перед вычислением их статистики второго порядка, поэтому диаграмма не предоставляет информацию об общих отклонениях ( средняя ошибка ), а характеризует исключительно центрированную ошибку шаблона.

Тейлора Варианты диаграммы

Среди нескольких предложенных незначительных вариаций диаграммы (см. Taylor, 2001) [1] ):

  • расширение на второй «квадрант» (слева от квадранта, показанного на рисунке 1) для учета отрицательных корреляций;
  • нормализация размерных величин (деление среднеквадратической разности и стандартного отклонения «тестового» поля на стандартное отклонение наблюдений) так, чтобы «наблюдаемая» точка была нанесена на единичное расстояние от начала координат вдоль оси x, и статистика по разным полям (с разными единицами измерения) может отображаться на одном графике;
  • отсутствие на схеме изолиний, чтобы было легче увидеть нанесенные точки;
  • использование стрелки для соединения двух связанных точек на диаграмме. Например, можно провести стрелку от точки, представляющей более старую версию модели, к более новой версии, что позволяет более четко указать, движется ли модель к «истине», как это определено наблюдениями.

Одним из основных ограничений диаграммы Тейлора является отсутствие явной информации о предвзятости прогноза. Вариант диаграммы Тейлора, учитывающий погрешность прогноза, представлен солнечной диаграммой (см. Wadoux et al., 2022). [16] ).

Ссылки [ править ]

  1. ^ Jump up to: Перейти обратно: а б Тейлор, К.Э. (2001). «Объявление нескольких аспектов производительности модели на одной диаграмме». Дж. Геофиз. Рез. 106 : 7183–7192. Бибкод : 2001JGR...106.7183T . дои : 10.1029/2000JD900719 .
  2. ^ «Гугл Академика» . ученый.google.com .
  3. ^ Терри, П.В.; и др. (2008). «Валидация исследований термоядерного синтеза: к рекомендациям и передовому опыту». Физ. Плазма . 15 . arXiv : 0801.2787 . Бибкод : 2008PhPl...15f2503T . дои : 10.1063/1.2928909 .
  4. ^ «Рассчитать статистику, используемую в диаграмме Тейлора в GrADS» .
  5. ^ «Построение диаграммы Тейлора в GrADS» .
  6. ^ «Создание диаграммы Тейлора» . www.idlcoyote.com .
  7. ^ «Диаграмма Тейлора» . www.mathworks.com .
  8. ^ «ПитерРочфорд/SkillMetricsToolbox» . www.mathworks.com .
  9. ^ «SkillMetricsToolbox» . 27 октября 2021 г. — через GitHub.
  10. ^ «Графика NCL: диаграммы Тейлора» . www.ncl.ucar.edu .
  11. ^ «Проект SkillMetrics» . 6 ноября 2021 г. — через GitHub.
  12. ^ "geocat.viz.taylor.TaylorDiagram" . geocat-viz.readthedocs.io . Проверено 16 ноября 2023 г.
  13. ^ Лемон, Джим; Болкер, Бен; Ом, Сандер; Кляйн, Эдуардо; Роулингсон, Барри; Уикхэм, Хэдли; Тьяги, Анупам; Этеррадосси, Оливье; Гротендик, Габор; Тэйвс, Майкл; Кейн, Джон; Тернер, Рольф; Витхофт, Карл; Стандер, Джулиан; Петцольдт, Томас; Дуурсма, Ремко; Бьянкотто, Элиза; Леви, Офир; Дутан, Кристоф; Солимос, Питер; Энгельманн, Робби; Хекер, Майкл; Стейнбек, Феликс; Борхерс, Ганс; Зингманн, Хенрик; Тоал, Тед; Огл, Дерек; Барал, Даршан; Грёмпинг, Ульрике ; Венейблс, Билл (8 сентября 2021 г.). «plotrix: различные функции построения графиков» — через пакеты R.
  14. ^ "Тейлор_Диаграммы" . cdat.llnl.gov .
  15. ^ «Букварь по диаграммам Тейлора (2005), К.Э. Тейлор» (PDF) .
  16. ^ Ваду, AMJ-C; Уолворт, DJJ; Брус, диджей (2022). «Комплексный подход к оценке количественных почвенных карт с помощью диаграмм Тейлора и солнечных диаграмм». Геодерма . 405 : 115332. doi : 10.1016/j.geoderma.2021.115332 .

Внешние ссылки [ править ]