Jump to content

Высокочастотные данные

Высокочастотные данные относятся к данным временных рядов, собранным в чрезвычайно мелком масштабе. Благодаря развитию вычислительной мощности в последние десятилетия, высокочастотные данные могут быть точно собраны с эффективной скоростью для анализа. [1] Высокочастотные данные, широко используемые в финансовой сфере, предоставляют наблюдения через очень частые интервалы, которые можно использовать для понимания поведения, динамики и микроструктур рынка. [2]

Коллекции высокочастотных данных изначально были сформулированы путем накопления потиковых рыночных данных, в которых каждое отдельное «событие» (транзакция, котировка, движение цен и т. д.) характеризуется «тиком» или одной логической единицей информации. Из-за большого количества тиков за один день сбор данных с высокой частотой обычно содержит большой объем данных, что обеспечивает высокую статистическую точность. [3] Высокочастотные наблюдения за один день ликвидного рынка могут равняться объему ежедневных данных, собираемых за 30 лет. [3]

Использовать

[ редактировать ]
Данные, собираемые с высокой частотой, информируют и обновляют статистику запасов в режиме реального времени.

Благодаря внедрению электронных форм торговли и поставщиков данных через Интернет , высокочастотные данные стали гораздо более доступными и позволяют следить за формированием цен в режиме реального времени. Это привело к появлению новой большой области исследований в области высокочастотных данных, где ученые и исследователи используют характеристики высокочастотных данных для разработки адекватных моделей для прогнозирования будущих рыночных движений и рисков. [3] Прогнозы модели охватывают широкий спектр поведения рынка, включая объем , волатильность , движение цен и оптимизацию размещения. [4]

Как регулирующие органы, так и научные круги проявляют постоянный интерес к данным о транзакциях и данным книги лимитных заказов , из которых более серьезные последствия для торгового и рыночного поведения, а также рыночные результаты и динамика могут быть оценены с использованием моделей высокочастотных данных. Регулирующие органы проявляют большой интерес к этим моделям из-за того, что риски ликвидности и цен не до конца понятны с точки зрения новых форм автоматизированных торговых приложений. [4]

Исследования данных с высокой частотой имеют ценность в их способности отслеживать нерегулярную рыночную деятельность в течение определенного периода времени. Эта информация позволяет лучше понять цену, торговую активность и поведение. Из-за важности выбора времени для рыночных событий, высокочастотные данные требуют анализа с использованием точечных процессов , которые зависят от наблюдений и истории для характеристики случайных возникновения событий. [4] Это понимание было впервые развито лауреатом Нобелевской премии по экономике 2003 года Робертом Фраем Энглом III , который специализируется на разработке методов финансового эконометрического анализа с использованием финансовых данных и точечных процессов. [4]

Высокочастотные формы данных

[ редактировать ]

Высокочастотные данные в основном используются в финансовых исследованиях и анализе фондового рынка . Всякий раз при обработке сделки, котировки или электронного заказа соответствующие данные собираются и вводятся в формате временных рядов . По существу, высокочастотные данные часто называют данными транзакций. [4]

Существует пять широких уровней высокочастотных данных, которые собираются и используются в исследованиях и анализе рынка:

Торговые данные

[ редактировать ]

Индивидуальные торговые данные, собранные через определенный интервал в пределах временного ряда. [4] Существует две основные переменные для описания одной точки торговых данных: время транзакции и вектор, известный как «метка», который характеризует детали события транзакции. [5]

Данные о торговле и котировках

[ редактировать ]

Собранные данные содержат подробную информацию как о сделках, так и о котировках, включая изменения и направление цен, отметки времени и объемы. Такую информацию можно найти в базе данных TAQ ( торговля и котировки ), управляемой NYSE . [4] В то время как торговые данные подробно описывают обмен самой транзакции, данные котировок детализируют оптимальные торговые условия для данной биржи. Эта информация может указывать на остановку бирж, а также котировок открытия и закрытия. [6]

Данные книги заказов фиксированного уровня

[ редактировать ]

Используя полностью компьютеризированные системы, глубину рынка можно оценить по действиям лимитных ордеров , которые происходят на фоне данного рынка. [4]

Сообщения обо всех действиях лимитных ордеров

[ редактировать ]

Этот уровень данных отображает полную информацию о действиях лимитных ордеров и может воспроизводить торговый поток в любой момент времени, используя информацию о временных отметках, отмене и идентификации покупателя/продавца. [4]

Данные по снимкам книги заказов

[ редактировать ]

Снимки активности книги заказов могут быть записаны в равноудаленных сетках, чтобы ограничить необходимость воспроизведения книги заказов. Однако это ограничивает возможности анализа торговли и, следовательно, более полезно для понимания динамики, чем взаимодействия книг и торговли. [4]

Свойства в финансовом анализе

[ редактировать ]

В финансовом анализе высокочастотные данные могут быть организованы в различных временных масштабах — от минут до лет. [3] Поскольку высокочастотные данные поступают в значительной степени дезагрегированной форме по временным рядам по сравнению с более частотными методами сбора данных, они содержат различные уникальные характеристики, которые меняют способ понимания и анализа данных. Роберт Фрай Энгл III классифицирует эти отличительные характеристики как нерегулярный временной интервал, дискретность, суточные закономерности и временную зависимость. [7]

Высокочастотные данные, отображаемые с течением времени на графике индекса FTSE 100.

Нерегулярный временной интервал

[ редактировать ]

В высокочастотных данных используется сбор большой суммы данных в течение временного ряда, и поэтому частота сбора единичных данных имеет тенденцию распределяться во времени нерегулярно. Это особенно очевидно при анализе финансового рынка, где транзакции могут происходить последовательно или после длительного периода бездействия. [7]

Дискретность

[ редактировать ]

Высокочастотные данные в основном включают в себя цены и транзакции, резкий рост или падение которых в течение короткого периода времени предотвращаются институциональными правилами. Это приводит к изменению данных на основе измерения одного тика. [7] Эта уменьшенная способность к колебаниям делает данные более дискретными при их использовании, например, на фондовой бирже, где популярные акции имеют тенденцию оставаться в пределах 5 тиков движения. обычно присутствует высокий уровень эксцесса . Из-за уровня дискретности высокочастотных данных в наборе [7]

Суточные закономерности

[ редактировать ]

Анализ, впервые проведенный Энглом и Расселом в 1998 году, отмечает, что высокочастотные данные следуют суточному графику , при этом продолжительность между сделками наименьшая на открытии и закрытии рынка. Некоторые зарубежные рынки, которые работают 24 часа в сутки, по-прежнему демонстрируют суточный график в зависимости от времени суток. [7]

Временная зависимость

[ редактировать ]

В основном из-за дискретности цен высокочастотные данные зависят от времени. Спред, вызванный небольшой разницей в ценах покупки и продажи, создает тренд, который толкает цену в определенном направлении. Точно так же продолжительность и скорость транзакций между сделками имеют тенденцию группироваться, что указывает на зависимость от временных изменений цены. [7]

Сверхвысокочастотные данные

[ редактировать ]

По наблюдению, отмеченному Робертом Фраем Энглом III , доступность более высоких частот данных с течением времени вызвала переход от лет к месяцам и к очень частым интервалам сбора финансовых данных. Однако это движение не является бесконечным при переходе к более высоким частотам, но сталкивается с пределом, когда все транзакции в конечном итоге записываются. [5] Энгл назвал этот предельный уровень частоты сверхвысокочастотными данными . Выдающимся качеством этой максимальной частоты являются чрезвычайно неравномерно расположенные данные из-за большого разброса во времени, который возникает при дезагрегированном сборе данных. [5] Вместо того, чтобы разбивать последовательность сверхвысокочастотных данных по временным интервалам, что по существу привело бы к потере данных и снижению частоты набора, методы и модели, такие как авторегрессионная модель условной продолжительности, можно использовать для учета изменения времени ожидания между сбор данных. [5] Эффективная обработка сверхвысокочастотных данных может использоваться для повышения точности эконометрического анализа. Этого можно добиться с помощью двух процессов: очистки данных и управления данными. [6]

Очистка данных

[ редактировать ]

Очистка данных или очистка данных — это процесс использования алгоритмических функций для удаления ненужных, нерелевантных и неправильных данных из наборов данных с высокой частотой. [6] Для анализа сверхвысокочастотных данных требуется чистая выборка записей, чтобы ее можно было использовать для изучения. По мере увеличения скорости сбора сверхвысоких частот в сборе, вероятно, будет обнаружено больше ошибок и нерелевантных данных. [6] Возникающие ошибки могут быть отнесены к человеческой ошибке , как преднамеренной (например, «фиктивные» кавычки), так и непреднамеренной (например, опечатка ), или компьютерной ошибке, которая возникает при технических сбоях. [8]

Управление данными

[ редактировать ]

Управление данными относится к процессу выбора конкретного интересующего временного ряда в наборе сверхвысокочастотных данных, которые необходимо извлечь и организовать с целью анализа. О различных транзакциях можно сообщать одновременно и по разным уровням цен, а эконометрические модели обычно требуют одного наблюдения в каждую отметку времени, что требует некоторой формы агрегирования данных для надлежащего анализа. [6] Усилия по управлению данными могут быть эффективными для исправления характеристик сверхвысокочастотных данных, включая неравномерный интервал, отскок спроса и предложения, а также открытие и закрытие рынка. [6]

Альтернативное использование вне финансовой торговли

[ редактировать ]

Исследование, опубликованное в журнале Freshwater Biology, посвященное эпизодическим воздействиям погоды на озера, подчеркивает использование высокочастотных данных для дальнейшего понимания метеорологических факторов и последствий «событий» или внезапных изменений физических, химических и биологических параметров озера. [9] Благодаря достижениям в технологии сбора данных и человеческим сетям в сочетании с размещением станций высокочастотного мониторинга на различных типах озер эти события можно изучать более эффективно. Отмечается, что использование высокочастотных данных в этих исследованиях является важным фактором, позволяющим анализировать быстро происходящие изменения погоды на озерах, такие как скорость ветра и количество осадков, улучшая понимание возможностей озера справляться с событиями после усиления шторма и изменение климата . [9]

Было обнаружено, что высокочастотные данные полезны для прогнозирования инфляции. Исследование Мишеля Мондуньо, опубликованное в Международном журнале прогнозирования, показывает, что использование ежедневных и ежемесячных данных с высокой частотой в целом улучшило точность прогноза общей инфляции ИПЦ в Соединенных Штатах. [10] В исследовании использовалось сравнение моделей с более низкой частотой и моделью, в которой учитывались все переменные с высокой частотой. В конечном итоге было обнаружено, что повышенная точность высоковолатильных транспортных и энергетических компонентов цен в модели высокочастотной инфляции привела к повышению производительности и более точным результатам. [10]

Использование оценки периода полураспада для оценки скорости возврата к среднему значению экономических и финансовых переменных столкнулось с проблемами в отношении выборки, поскольку период полураспада около 13,53 года потребует 147 лет годовых данных в соответствии с ранними моделями процесса AR . [11] В результате некоторые ученые использовали высокочастотные данные для оценки годовых данных о периоде полураспада. Хотя использование высокочастотных данных может столкнуться с некоторыми ограничениями при определении истинного периода полураспада, в основном из-за систематической ошибки оценщика , было обнаружено, что использование высокочастотной модели ARMA последовательно и эффективно оценивает период полураспада с длинными годовыми данными. [11]

См. также

[ редактировать ]
  1. ^ Руи С. Цай (2000) Введение редактора в групповую дискуссию по анализу высокочастотных данных, Журнал деловой и экономической статистики , 18:2, 139-139, дои : 10.1080/07350015.2000.10524855
  2. ^ Андерсен, Т.Г. (2000). Некоторые размышления об анализе высокочастотных данных. Журнал деловой и экономической статистики , 18 (2), 146–153. дои : 10.1080/07350015.2000.10524857
  3. ^ Перейти обратно: а б с д Дакоронья, ММ (2001). Введение в высокочастотные финансы. Сан-Диего: Академическая пресса.
  4. ^ Перейти обратно: а б с д и ж г час я дж Хаутч Н. и SpringerLink (онлайн-сервис). (2012;2011;). Эконометрика финансовых высокочастотных данных (изд. 2012 г.). Гейдельберг;Берлин;: Springer. дои : 10.1007/978-3-642-21925-2
  5. ^ Перейти обратно: а б с д Энгл, РФ (2000). Эконометрика сверхвысокочастотных данных. Эконометрика , 68(1), 1-22. дои : 10.1111/1468-0262.00091
  6. ^ Перейти обратно: а б с д и ж Браунлис, Коннектикут, и Галло, генеральный директор (2006). Финансовый эконометрический анализ на сверхвысокой частоте: проблемы обработки данных. Вычислительная статистика и анализ данных, 51 (4), 2232–2245. два : 10.1016/j.csda.2006.09.030
  7. ^ Перейти обратно: а б с д и ж Р. Рассел, Джеффри и Ф. Энгл, Роберт. (2010). Анализ высокочастотных данных. Справочник по финансовой эконометрике, том 1. 383–426. 10.1016/В978-0-444-50897-3.50010-9.
  8. ^ Верусис Т. и Ап Гвилим О. (2010). Улучшенный алгоритм очистки сверхвысокочастотных данных. Журнал деривативов и хедж-фондов , 15 (4), 323–340. два : 10.1057/jdhf.2009.16
  9. ^ Перейти обратно: а б ДЖЕННИНГС Э., ДЖОНС С., АРВОЛА Л., СТАЕР П.А., ГЕЙЗЕР Э., ДЖОНС И.Д., Teknisk-naturvetenskapliga vetenskapsområdet. (2012). Влияние эпизодических явлений, связанных с погодой, на озера: анализ, основанный на высокочастотных данных. Пресноводная биология , 57(3), 589-601. два : 10.1111/j.1365-2427.2011.02729.x
  10. ^ Перейти обратно: а б Модуньо, М. (2013). Текущий прогноз инфляции с использованием высокочастотных данных. Международный журнал прогнозирования , 29 (4), 664-675. doi : 10.1016/j.ijforecast.2012.12.003
  11. ^ Перейти обратно: а б Хуан М., Ляо С. и Линь К. (2015). Расширенная оценка периода полураспада на основе высокочастотных данных. Журнал прогнозирования , 34 (7), 523-532. два : 10.1002/для.2342
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1c7948327472b30f30e5209ed6dd0f46__1714416300
URL1:https://arc.ask3.ru/arc/aa/1c/46/1c7948327472b30f30e5209ed6dd0f46.html
Заголовок, (Title) документа по адресу, URL1:
High frequency data - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)