Суррогатные данные
Суррогатные данные , иногда называемые аналогичными данными , [1] обычно относится к данным временных рядов , которые создаются с использованием четко определенных (линейных) моделей, таких как процессы ARMA , которые воспроизводят различные статистические свойства, такие как структура автокорреляции набора измеренных данных. [2] Полученные суррогатные данные затем можно использовать, например, для проверки нелинейной структуры эмпирических данных; это называется тестированием суррогатных данных .
Суррогатные или аналогичные данные также относятся к данным, используемым для дополнения имеющихся данных, на основе которых математическая модель строится . Согласно этому определению, они могут быть сгенерированы (т. е. синтетические данные ) или преобразованы из другого источника. [1]
Использование
[ редактировать ]Суррогатные данные используются в экологических и лабораторных условиях, когда данные исследования из одного источника используются для оценки характеристик другого источника. [3] Например, его использовали для моделирования популяционных тенденций видов животных. [4] Его также можно использовать для моделирования биоразнообразия, поскольку было бы сложно собрать фактические данные обо всех видах на определенной территории. [5]
Суррогатные данные могут использоваться в прогнозировании. Данные из аналогичных рядов могут быть объединены для повышения точности прогнозов. [6] Использование суррогатных данных может позволить модели учитывать закономерности, не наблюдаемые в исторических данных. [7]
Другое использование суррогатных данных — проверка моделей на нелинейность. Термин «тестирование суррогатных данных» относится к алгоритмам, используемым для анализа моделей таким образом. [8] Эти тесты обычно включают генерацию данных, тогда как суррогатные данные в целом могут быть получены или собраны разными способами. [1]
Методы
[ редактировать ]Один из методов суррогатных данных — найти источник со схожими условиями или параметрами и использовать эти данные при моделировании. [4] Другой метод — сосредоточиться на закономерностях базовой системы и искать аналогичную закономерность в связанных источниках данных (например, закономерностях в других родственных видах или областях окружающей среды). [5]
Вместо использования существующих данных из отдельного источника суррогатные данные могут быть получены с помощью статистических процессов. [2] который может включать генерацию случайных данных [1] используя ограничения модели или системы. [8]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с д Кафер, Пол Э. (2015). Преобразование данных аналоговых временных рядов для повышения точности прогнозов спроса на природный газ (магистерская диссертация). Университет Маркетта. Архивировано из оригинала 12 марта 2016 г. Проверено 18 февраля 2016 г.
- ^ Jump up to: а б Причард; Тайлер (1994). «Создание суррогатных данных для временных рядов с несколькими одновременно измеряемыми переменными» (PDF) . Письма о физических отзывах . 73 (7): 951–954. arXiv : комп-газ/9405002 . Бибкод : 1994PhRvL..73..951P . дои : 10.1103/physrevlett.73.951 . ПМИД 10057582 . S2CID 32748996 .
- ^ «Значение суррогатных данных» . Columbia Analytical Services, Inc., ныне ALS Environmental. Архивировано из оригинала 16 февраля 2017 года . Проверено 15 февраля 2017 г.
Что такое суррогатные данные? Данные исследований тестовых организмов или тестируемого вещества, которые используются для оценки характеристик или воздействия на другой организм или вещество.
- ^ Jump up to: а б Эрнандес-Камачо, Клаудия Х.; Баккер, Виктория. Дж.; Ауриолес-Гамбоа, Давид; Лааке, Джефф; Гербер, Лия Р. (сентябрь 2015 г.). Аарон В. Рид (ред.). «Использование суррогатных данных в анализе жизнеспособности демографической популяции: пример калифорнийских морских львов» . ПЛОС ОДИН . 10 (9): e0139158. Бибкод : 2015PLoSO..1039158H . дои : 10.1371/journal.pone.0139158 . ПМЦ 4587556 . ПМИД 26413746 .
- ^ Jump up to: а б Вера, ДП; Уокер, Пенсильвания (1996). «Разнообразие окружающей среды: о наилучшем использовании суррогатных данных для оценки относительного биоразнообразия наборов территорий». Биоразнообразие и сохранение . 5 (4). Спрингер Природа: 399–415. Бибкод : 1996BiCon...5..399F . дои : 10.1007/BF00056387 . S2CID 24066193 .
- ^ Дункан, Джордж Т.; Горр, Уилпен Л.; Щипула, Януш (2001). «Прогнозирование аналогичных временных рядов». В Дж. Скотте Армстронге (ред.). Принципы прогнозирования: Справочник для исследователей и практиков . Академическое издательство Клювер. стр. 195–213. ISBN 0-7923-7930-6 .
- ^ Кафер, Пол Э.; Ишола, Бабатунде; Браун, Рональд Х.; Корлисс, Джордж Ф. (2015). Использование суррогатных данных для снижения рисков прогнозирования природного газа в необычные дни (PDF) . Международный институт прогнозистов: 35-й Международный симпозиум по прогнозированию. прогнозеры.org/isf . Архивировано (PDF) из оригинала 17 мая 2021 г. Проверено 20 июля 2022 г.
- ^ Jump up to: а б Шрайбер, Томас; Шмитц, Андреас (1999). «Суррогатный временной ряд». Физика Д. 142 (3–4): 346–382. arXiv : чао-дин/9909037 . Бибкод : 2000PhyD..142..346S . CiteSeerX 10.1.1.46.3999 . дои : 10.1016/s0167-2789(00)00043-9 . S2CID 13889229 .
Дальнейшее чтение
[ редактировать ]- Шрайбер, Т.; Шмитц, А. (1996). «Улучшенные суррогатные данные для тестов на нелинейность». Письма о физических отзывах . 77 (4): 635–638. arXiv : чао-дин/9909041 . Бибкод : 1996PhRvL..77..635S . дои : 10.1103/PhysRevLett.77.635 . ПМИД 10062864 . S2CID 13193081 .