Высокочастотные данные
Высокочастотные данные относятся к данным временных рядов, собранным в чрезвычайно мелком масштабе. Благодаря развитию вычислительной мощности в последние десятилетия, высокочастотные данные могут быть точно собраны с эффективной скоростью для анализа. [1] Высокочастотные данные, широко используемые в финансовой сфере, предоставляют наблюдения через очень частые интервалы, которые можно использовать для понимания поведения, динамики и микроструктур рынка. [2]
Коллекции высокочастотных данных изначально были сформулированы путем накопления потиковых рыночных данных, в которых каждое отдельное «событие» (транзакция, котировка, движение цен и т. д.) характеризуется «тиком» или одной логической единицей информации. Из-за большого количества тиков за один день сбор данных с высокой частотой обычно содержит большой объем данных, что обеспечивает высокую статистическую точность. [3] Высокочастотные наблюдения за один день ликвидного рынка могут равняться объему ежедневных данных, собираемых за 30 лет. [3]
Использовать
[ редактировать ]Благодаря внедрению электронных форм торговли и поставщиков данных через Интернет , высокочастотные данные стали гораздо более доступными и позволяют следить за формированием цен в режиме реального времени. Это привело к появлению новой большой области исследований в области высокочастотных данных, где ученые и исследователи используют характеристики высокочастотных данных для разработки адекватных моделей для прогнозирования будущих рыночных движений и рисков. [3] Прогнозы модели охватывают широкий спектр поведения рынка, включая объем , волатильность , движение цен и оптимизацию размещения. [4]
Как регулирующие органы, так и научные круги проявляют постоянный интерес к данным о транзакциях и данным книги лимитных заказов , из которых более серьезные последствия для торгового и рыночного поведения, а также рыночные результаты и динамика могут быть оценены с использованием моделей высокочастотных данных. Регулирующие органы проявляют большой интерес к этим моделям из-за того, что риски ликвидности и цен не до конца понятны с точки зрения новых форм автоматизированных торговых приложений. [4]
Исследования данных с высокой частотой имеют ценность в их способности отслеживать нерегулярную рыночную деятельность в течение определенного периода времени. Эта информация позволяет лучше понять цену, торговую активность и поведение. Из-за важности выбора времени для рыночных событий, высокочастотные данные требуют анализа с использованием точечных процессов , которые зависят от наблюдений и истории для характеристики случайных возникновения событий. [4] Это понимание было впервые развито лауреатом Нобелевской премии по экономике 2003 года Робертом Фраем Энглом III , который специализируется на разработке методов финансового эконометрического анализа с использованием финансовых данных и точечных процессов. [4]
Высокочастотные формы данных
[ редактировать ]Высокочастотные данные в основном используются в финансовых исследованиях и анализе фондового рынка . Всякий раз при обработке сделки, котировки или электронного заказа соответствующие данные собираются и вводятся в формате временных рядов . По существу, высокочастотные данные часто называют данными транзакций. [4]
Существует пять широких уровней высокочастотных данных, которые собираются и используются в исследованиях и анализе рынка:
Торговые данные
[ редактировать ]Индивидуальные торговые данные, собранные через определенный интервал в пределах временного ряда. [4] Существует две основные переменные для описания одной точки торговых данных: время транзакции и вектор, известный как «метка», который характеризует детали события транзакции. [5]
Данные о торговле и котировках
[ редактировать ]Собранные данные содержат подробную информацию как о сделках, так и о котировках, включая изменения и направление цен, отметки времени и объемы. Такую информацию можно найти в базе данных TAQ ( торговля и котировки ), управляемой NYSE . [4] В то время как торговые данные подробно описывают обмен самой транзакции, данные котировок детализируют оптимальные торговые условия для данной биржи. Эта информация может указывать на остановку бирж, а также котировок открытия и закрытия. [6]
Данные книги заказов фиксированного уровня
[ редактировать ]Используя полностью компьютеризированные системы, глубину рынка можно оценить по действиям лимитных ордеров , которые происходят на фоне данного рынка. [4]
Сообщения обо всех действиях лимитных ордеров
[ редактировать ]Этот уровень данных отображает полную информацию о действиях лимитных ордеров и может воспроизводить торговый поток в любой момент времени, используя информацию о временных отметках, отмене и идентификации покупателя/продавца. [4]
Данные по снимкам книги заказов
[ редактировать ]Снимки активности книги заказов могут быть записаны в равноудаленных сетках, чтобы ограничить необходимость воспроизведения книги заказов. Однако это ограничивает возможности анализа торговли и, следовательно, более полезно для понимания динамики, чем взаимодействия книг и торговли. [4]
Свойства в финансовом анализе
[ редактировать ]В финансовом анализе высокочастотные данные могут быть организованы в различных временных масштабах — от минут до лет. [3] Поскольку высокочастотные данные поступают в значительной степени дезагрегированной форме по временным рядам по сравнению с более частотными методами сбора данных, они содержат различные уникальные характеристики, которые меняют способ понимания и анализа данных. Роберт Фрай Энгл III классифицирует эти отличительные характеристики как нерегулярный временной интервал, дискретность, суточные закономерности и временную зависимость. [7]
Нерегулярный временной интервал
[ редактировать ]В высокочастотных данных используется сбор большой суммы данных в течение временного ряда, и поэтому частота сбора единичных данных имеет тенденцию распределяться во времени нерегулярно. Это особенно очевидно при анализе финансового рынка, где транзакции могут происходить последовательно или после длительного периода бездействия. [7]
Дискретность
[ редактировать ]Высокочастотные данные в основном включают в себя цены и транзакции, резкий рост или падение которых в течение короткого периода времени предотвращаются институциональными правилами. Это приводит к изменению данных на основе измерения одного тика. [7] Эта уменьшенная способность к колебаниям делает данные более дискретными при их использовании, например, на фондовой бирже, где популярные акции имеют тенденцию оставаться в пределах 5 тиков движения. обычно присутствует высокий уровень эксцесса . Из-за уровня дискретности высокочастотных данных в наборе [7]
Суточные закономерности
[ редактировать ]Анализ, впервые проведенный Энглом и Расселом в 1998 году, отмечает, что высокочастотные данные следуют суточному графику , при этом продолжительность между сделками наименьшая на открытии и закрытии рынка. Некоторые зарубежные рынки, которые работают 24 часа в сутки, по-прежнему демонстрируют суточный график в зависимости от времени суток. [7]
Временная зависимость
[ редактировать ]В основном из-за дискретности цен высокочастотные данные зависят от времени. Спред, вызванный небольшой разницей в ценах покупки и продажи, создает тренд, который толкает цену в определенном направлении. Точно так же продолжительность и скорость транзакций между сделками имеют тенденцию группироваться, что указывает на зависимость от временных изменений цены. [7]
Сверхвысокочастотные данные
[ редактировать ]По наблюдению, отмеченному Робертом Фраем Энглом III , доступность более высоких частот данных с течением времени вызвала переход от лет к месяцам и к очень частым интервалам сбора финансовых данных. Однако это движение не является бесконечным при переходе к более высоким частотам, но сталкивается с пределом, когда все транзакции в конечном итоге записываются. [5] Энгл назвал этот предельный уровень частоты сверхвысокочастотными данными . Выдающимся качеством этой максимальной частоты являются чрезвычайно неравномерно расположенные данные из-за большого разброса во времени, который возникает при дезагрегированном сборе данных. [5] Вместо того, чтобы разбивать последовательность сверхвысокочастотных данных по временным интервалам, что по существу привело бы к потере данных и снижению частоты набора, методы и модели, такие как авторегрессионная модель условной продолжительности, можно использовать для учета изменения времени ожидания между сбор данных. [5] Эффективная обработка сверхвысокочастотных данных может использоваться для повышения точности эконометрического анализа. Этого можно добиться с помощью двух процессов: очистки данных и управления данными. [6]
Очистка данных
[ редактировать ]Очистка данных или очистка данных — это процесс использования алгоритмических функций для удаления ненужных, нерелевантных и неправильных данных из наборов данных с высокой частотой. [6] Для анализа сверхвысокочастотных данных требуется чистая выборка записей, чтобы ее можно было использовать для изучения. По мере увеличения скорости сбора сверхвысоких частот в сборе, вероятно, будет обнаружено больше ошибок и нерелевантных данных. [6] Возникающие ошибки могут быть отнесены к человеческой ошибке , как преднамеренной (например, «фиктивные» кавычки), так и непреднамеренной (например, опечатка ), или компьютерной ошибке, которая возникает при технических сбоях. [8]
Управление данными
[ редактировать ]Управление данными относится к процессу выбора конкретного интересующего временного ряда в наборе сверхвысокочастотных данных, которые необходимо извлечь и организовать с целью анализа. О различных транзакциях можно сообщать одновременно и по разным уровням цен, а эконометрические модели обычно требуют одного наблюдения в каждую отметку времени, что требует некоторой формы агрегирования данных для надлежащего анализа. [6] Усилия по управлению данными могут быть эффективными для исправления характеристик сверхвысокочастотных данных, включая неравномерный интервал, отскок спроса и предложения, а также открытие и закрытие рынка. [6]
Альтернативное использование вне финансовой торговли
[ редактировать ]Исследование, опубликованное в журнале Freshwater Biology, посвященное эпизодическим воздействиям погоды на озера, подчеркивает использование высокочастотных данных для дальнейшего понимания метеорологических факторов и последствий «событий» или внезапных изменений физических, химических и биологических параметров озера. [9] Благодаря достижениям в технологии сбора данных и человеческим сетям в сочетании с размещением станций высокочастотного мониторинга на различных типах озер эти события можно изучать более эффективно. Отмечается, что использование высокочастотных данных в этих исследованиях является важным фактором, позволяющим анализировать быстро происходящие изменения погоды на озерах, такие как скорость ветра и количество осадков, улучшая понимание возможностей озера справляться с событиями после усиления шторма и изменение климата . [9]
Было обнаружено, что высокочастотные данные полезны для прогнозирования инфляции. Исследование Мишеля Мондуньо, опубликованное в Международном журнале прогнозирования, показывает, что использование ежедневных и ежемесячных данных с высокой частотой в целом улучшило точность прогноза общей инфляции ИПЦ в Соединенных Штатах. [10] В исследовании использовалось сравнение моделей с более низкой частотой и моделью, в которой учитывались все переменные с высокой частотой. В конечном итоге было обнаружено, что повышенная точность высоковолатильных транспортных и энергетических компонентов цен в модели высокочастотной инфляции привела к повышению производительности и более точным результатам. [10]
Использование оценки периода полураспада для оценки скорости возврата к среднему значению экономических и финансовых переменных столкнулось с проблемами в отношении выборки, поскольку период полураспада около 13,53 года потребует 147 лет годовых данных в соответствии с ранними моделями процесса AR . [11] В результате некоторые ученые использовали высокочастотные данные для оценки годовых данных о периоде полураспада. Хотя использование высокочастотных данных может столкнуться с некоторыми ограничениями при определении истинного периода полураспада, в основном из-за систематической ошибки оценщика , было обнаружено, что использование высокочастотной модели ARMA последовательно и эффективно оценивает период полураспада с длинными годовыми данными. [11]
См. также
[ редактировать ]- Высокочастотный трейдинг
- Алгоритмическая торговля
- Анализ рынка
- Финансовая эконометрика
- Роберт Ф. Энгл
Ссылки
[ редактировать ]- ^ Руи С. Цай (2000) Введение редактора в групповую дискуссию по анализу высокочастотных данных, Журнал деловой и экономической статистики , 18:2, 139-139, дои : 10.1080/07350015.2000.10524855
- ^ Андерсен, Т.Г. (2000). Некоторые размышления об анализе высокочастотных данных. Журнал деловой и экономической статистики , 18 (2), 146–153. дои : 10.1080/07350015.2000.10524857
- ^ Перейти обратно: а б с д Дакоронья, ММ (2001). Введение в высокочастотные финансы. Сан-Диего: Академическая пресса.
- ^ Перейти обратно: а б с д и ж г час я дж Хаутч Н. и SpringerLink (онлайн-сервис). (2012;2011;). Эконометрика финансовых высокочастотных данных (изд. 2012 г.). Гейдельберг;Берлин;: Springer. дои : 10.1007/978-3-642-21925-2
- ^ Перейти обратно: а б с д Энгл, РФ (2000). Эконометрика сверхвысокочастотных данных. Эконометрика , 68(1), 1-22. дои : 10.1111/1468-0262.00091
- ^ Перейти обратно: а б с д и ж Браунлис, Коннектикут, и Галло, генеральный директор (2006). Финансовый эконометрический анализ на сверхвысокой частоте: проблемы обработки данных. Вычислительная статистика и анализ данных, 51 (4), 2232–2245. два : 10.1016/j.csda.2006.09.030
- ^ Перейти обратно: а б с д и ж Р. Рассел, Джеффри и Ф. Энгл, Роберт. (2010). Анализ высокочастотных данных. Справочник по финансовой эконометрике, том 1. 383–426. 10.1016/В978-0-444-50897-3.50010-9.
- ^ Верусис Т. и Ап Гвилим О. (2010). Улучшенный алгоритм очистки сверхвысокочастотных данных. Журнал деривативов и хедж-фондов , 15 (4), 323–340. два : 10.1057/jdhf.2009.16
- ^ Перейти обратно: а б ДЖЕННИНГС Э., ДЖОНС С., АРВОЛА Л., СТАЕР П.А., ГЕЙЗЕР Э., ДЖОНС И.Д., Teknisk-naturvetenskapliga vetenskapsområdet. (2012). Влияние эпизодических явлений, связанных с погодой, на озера: анализ, основанный на высокочастотных данных. Пресноводная биология , 57(3), 589-601. два : 10.1111/j.1365-2427.2011.02729.x
- ^ Перейти обратно: а б Модуньо, М. (2013). Текущий прогноз инфляции с использованием высокочастотных данных. Международный журнал прогнозирования , 29 (4), 664-675. doi : 10.1016/j.ijforecast.2012.12.003
- ^ Перейти обратно: а б Хуан М., Ляо С. и Линь К. (2015). Расширенная оценка периода полураспада на основе высокочастотных данных. Журнал прогнозирования , 34 (7), 523-532. два : 10.1002/для.2342