Самоподобие анализа сетевых данных
![]() | Эта статья включает список литературы , связанную литературу или внешние ссылки , но ее источники остаются неясными, поскольку в ней отсутствуют встроенные цитаты . ( Март 2013 г. ) |
В компьютерных сетях самоподобие является особенностью динамики сетевой передачи данных. При моделировании динамики сетевых данных традиционные модели временных рядов, такие как модель авторегрессионного скользящего среднего, не подходят. Это связано с тем, что эти модели предоставляют только ограниченное число параметров в модели и, следовательно, взаимодействие в конечном временном окне, но сетевые данные обычно имеют временную структуру , зависящую от дальнего действия . Самоподобный процесс — это один из способов моделирования динамики сетевых данных с такой дальней корреляцией. В данной статье определяется и описывается динамика передачи сетевых данных в контексте самоподобного процесса. Показаны свойства процесса и приведены методы построения графиков и оценки параметров, моделирующих самоподобие сетевых данных.
Определение
[ редактировать ]Предполагать быть слабостационарным (стационарным 2-го порядка) процессом со средним , дисперсия и автокорреляционная функция .Предположим, что автокорреляционная функция имеет форму как , где и — медленно меняющаяся функция на бесконечности , т.е. для всех .Например, и являются медленно меняющимися функциями.
Позволять ,где , обозначают агрегированную серию точек по непересекающимся блокам размера , для каждого является положительным целым числом .
Точно самоподобный процесс
[ редактировать ]- называется точно самоподобным процессом, если существует самоподобный параметр такой, что имеет то же распределение, что и . Пример точно самоподобного процесса с это дробный гауссовский шум (FGN) с .
Определение: дробный гауссов шум (FGN).
называется дробным гауссовским шумом, где является дробным броуновским движением . [1]
точно самоподобный процесс второго порядка
[ редактировать ]- называется самоподобным процессом ровно второго порядка, если существует самоподобный параметр такой, что имеет ту же дисперсию и автокорреляцию, что и .
асимптотический самоподобный процесс второго порядка
[ редактировать ]- называется асимптотическим самоподобным процессом второго порядка с самоподобным параметром если как ,
Некоторые относительные ситуации самоподобных процессов
[ редактировать ]Дальнодействующая зависимость (LRD)
[ редактировать ]Предполагать — слабостационарный (стационарный процесс 2-го порядка) со средним и дисперсия . Автокорреляционная функция (ACF) задержки дается
Определение:
Слабо стационарный процесс называется «дальнобойной зависимостью», если
Процесс, который удовлетворяет как Говорят, что он имеет долгосрочную зависимость. Функция спектральной плотности дальнодействующей зависимости подчиняется степенному закону вблизи начала координат. Эквивалентно , имеет дальнодействующую зависимость, если функция спектральной плотности автокорреляционной функции, , имеет вид как где , медленно меняется на 0.
Медленно убывающая дисперсия
[ редактировать ]
Когда автокорреляционная функция самоподобного процесса удовлетворяет условию как , это означает, что оно также удовлетворяет как , где — конечная положительная константа, не зависящая от m, и 0<β<1.
Оценка параметра самоподобия «H»
[ редактировать ]R/S-анализ
[ редактировать ]Предположим, что основной процесс это дробный гауссовский шум. Рассмотрим серию , и пусть .
Выборочная дисперсия является
Определение: статистика R/S.
Если это FGN, тогда
Рассмотрите возможность установки регрессионной модели: , где
В частности, для временного ряда длиной разделить данные временного ряда на группирует каждую по размеру , вычислить для каждой группы.
Таким образом, для каждого n мы имеем пары данных ( ).Есть баллы за каждый , поэтому мы можем использовать регрессионную модель для оценки точнее. Если наклон линии регрессии находится в пределах 0,5–1, это самоподобный процесс.
График изменения времени
[ редактировать ]Дисперсия выборочного среднего определяется выражением .
Для оценки H рассчитайте выборочные средние значения. для подсерия длины .
Общее среднее значение можно определить по формуле , выборочная дисперсия .
Графики зависимости времени от времени получаются путем построения графика против и мы можем провести простую линию наименьших квадратов через полученные точки на плоскости, игнорируя малые значения k.
Для больших значений , ожидается, что точки на графике будут разбросаны вокруг прямой линии с отрицательным наклоном. .Для ближней зависимости или независимости наблюдений наклон прямой равен -1.
О самоподобии можно судить по значениям предполагаемого наклона, который асимптотически находится между –1 и 0, а оценка степени самоподобия дается выражением
Анализ на основе периодограммы
[ редактировать ]Приблизительная оценка максимального правдоподобия Уиттла ( MLE ) применяется для решения параметра Херста через плотность спектральную . Это не только инструмент для визуализации параметра Херста, но и метод, позволяющий сделать некоторые статистические выводы о параметрах с помощью асимптотических свойств MLE. В частности, следует гауссовскому процессу . Пусть спектральная плотность , , где , и построить модель авторегрессии временных рядов с коротким диапазоном (AR), то есть ,с .
Таким образом, оценка Уиттла из сводит к минимумуфункция , где обозначает периодограмму X как и . Эти интегрирования можно оценить суммой Римана.
Затем асимптотически следует нормальному распределению, если может быть выражен как форма модели бесконечного скользящего среднего.
Чтобы оценить , сначала нужно вычислить эту периодограмму. С является оценкой спектральной плотности, ряд с дальнодействующей зависимостью должен иметь периодограмму, пропорциональную близко к источнику. График периодограммы получается путем построения графика против .
Затем подготавливаем регрессионную модель на должен давать наклон . Наклон подобранной прямой также является оценкой . Таким образом, оценка получается.
Примечание:
При применении метода периодограммы возникают две распространенные проблемы. Во-первых, если данные не соответствуют распределению Гаусса, преобразование данных может решить проблемы такого рода. Во-вторых, спектр образца, который отклоняется от предполагаемой спектральной плотности, является другим. Для решения этой проблемы предлагается метод агрегирования. Если является гауссовским процессом, а функция спектральной плотности удовлетворяет как , функция, , сходится по распределению к FGN как .
Ссылки
[ редактировать ]- П. Уиттл, «Оценка и информация в стационарных временных рядах», Ст. Мат. 2, 423–434, 1953.
- К. ПАРК, В. ВИЛЛИНГЕР, Самоподобная оценка сетевого трафика и производительности, WILEY, 2000.
- У. Е. Леланд, В. Виллинджер, М. С. Такку, Д. В. Уилсон, «О самоподобной природе трафика Ethernet», ACM SIGCOMM Computer Communication Review 25,202-213,1995.
- В. Виллингер, М. С. Такку, В. Е. Леланд, Д. В. Уилсон, «Самоподобие в высокоскоростном пакетном трафике: анализ и моделирование измерений трафика Ethernet», Statistical Science 10,67-85, 1995.
- ^ У. Е. Леланд, В. Виллинджер, М. С. Такку, Д. В. Уилсон, «О самоподобной природе трафика Ethernet», ACM SIGCOMM Computer Communication Review 25,202-213,1995.