Samopodobieństwo analizy danych sieciowych

W sieciach komputerowych samopodobieństwo jest cechą dynamiki przesyłu danych w sieci. Podczas modelowania dynamiki danych w sieci tradycyjne modele szeregów czasowych, takie jak autoregresyjny model średniej ruchomej, nie są odpowiednie. Dzieje się tak dlatego, że te modele zapewniają tylko skończoną liczbę parametrów w modelu, a tym samym interakcję w skończonym oknie czasowym, ale dane sieciowe mają zwykle zależny od dalekiego zasięgu struktura czasowa. Samopodobny proces jest jednym ze sposobów modelowania dynamiki danych sieciowych z korelacją o tak dużym zasięgu. W tym artykule zdefiniowano i opisano dynamikę transferu danych w sieci w kontekście procesu samopodobnego. Pokazano właściwości procesu oraz podano metody tworzenia wykresów i estymacji parametrów modelujących samopodobieństwo danych sieciowych.

Definicja

Załóżmy, będzie to (stacjonarny drugiego rzędu ze wariancją i funkcją autokorelacji . że funkcja autokorelacji ma postać jak , gdzie jest zmieniającą funkcją w nieskończoności ,
dla wszystkich . Na przykład i są powoli różne funkcje. Pozwalać , gdzie oznaczają zagregowaną serię punktów na nienakładających się blokach wielkości każdego dodatnią liczbą całkowitą .

Dokładnie samopodobny proces

  • nazywany jest dokładnie samopodobnym procesem, jeśli istnieje samopodobny parametr taki, że ma taka sama dystrybucja jak . Przykładem dokładnie samopodobnego procesu z ułamkowy gaussowski (FGN) z .

Definicja: ułamkowy szum gaussowski (FGN)

nazywa się ułamkowym szumem gaussowskim, gdzie jest ułamkowym ruchem Browna

proces samopodobny dokładnie drugiego rzędu

  • , jeśli istnieje parametr samopodobny taki, że ma taką samą wariancję i autokorelację jak .

asymptotyczny proces samopodobny drugiego rzędu

  • nazywany jest asymptotycznym samopodobnym procesem rzędu z parametrem samopodobnym, jeśli jak ,

Niektóre względne sytuacje procesów samopodobnych

Zależność dalekiego zasięgu (LRD)

Załóżmy drugiego rzędu i . Funkcja autokorelacji (ACF) opóźnienia przez

Definicja:

Mówi się, że proces słabo stacjonarny jest „zależnością dalekiego zasięgu”, jeśli

Proces, który spełnia jako ma zależność dalekiego zasięgu. Funkcja gęstości widmowej zależności dalekiego zasięgu jest zgodna z prawem potęgowym w pobliżu początku. Równoważnie , ma zależność dalekiego zasięgu, jeśli funkcja gęstości widmowej funkcji autokorelacji _ postać jak gdzie , jest powoli zmienna w punkcie 0.

Zobacz także

Powoli zanikające różnice


Gdy funkcja autokorelacji procesu samopodobnego spełnia jako , co oznacza, że ​​​​spełnia również as , gdzie jest niezależną od m i 0 <β <1.

Szacowanie parametru samopodobieństwa „H”

Analiza R/S

że podstawowym procesem jest szum gaussowski. Rozważ szereg .

Wariancja próbki wynosi n

Definicja: statystyka R/S



ja FGN, to Rozważ dopasowanie modelu regresji :
gdzie W szczególności dla szeregu czasowego o długości podzielić dane szeregów czasowych na grupuje każdą o rozmiarze , oblicz
dla każdej grupy. Zatem dla każdego n mamy pary danych ( ). Istnieją dla każdego więc możemy dopasować model regresji oszacować dokładniej. Jeśli nachylenie linii regresji wynosi od 0,5 do 1, jest to proces samopodobny.

Wykres wariancji w czasie


Wariancja średniej próbki jest dana przez . Aby oszacować H, oblicz średnie próbki
m podseria długości . Ogólną średnią można podać jako próby
. Wykresy wariancji-czasu uzyskuje się przez wykreślenie przeciwko i możemy dopasować prostą linię najmniejszych kwadratów przez wynikowe punkty na płaszczyźnie, ignorując małe wartości k.


W przypadku dużych wartości punkty na wykresie będą rozproszone wokół linii prostej o ujemnym nachyleniu . między obserwacji, nachylenie linii prostej jest równe -1. Samopodobieństwo można wywnioskować z wartości oszacowanego nachylenia, które jest asymptotycznie między –1 a 0, a oszacowanie stopnia samopodobieństwa jest określone przez

Analiza oparta na periodogramie

estymator największej wiarygodności Whittle'a ( MLE ) jest stosowany do parametru Hursta za pomocą gęstości widmowej . Jest to nie tylko narzędzie do wizualizacji parametru Hursta, ale także metoda wnioskowania statystycznego o parametrach poprzez asymptotyczne właściwości MLE. szczególności za procesem Gaussa . gęstość , , gdzie i skonstruować model autoregresji (AR) szeregów czasowych krótkiego zasięgu, czyli z .

Whittle'a minimalizuje funkcję , gdzie oznacza periodogram X jako i . Całki te można ocenić za pomocą sumy Riemanna.

Wtedy asymptotycznie podąża za rozkładem normalnym, jeśli można wyrazić jako postać nieskończonego modelu średniej ruchomej.

Aby oszacować należy obliczyć ten periodogram. Ponieważ estymatorem gęstości widmowej, szereg z zależnością dalekiego zasięgu powinien mieć periodogram blisko początku. Wykres periodogramu uzyskuje się przez wykreślenie
przeciwko . Następnie dopasowanie modelu regresji dziennika ⁡ ( nachylenie . Nachylenie dopasowanej linii prostej jest również oszacowaniem . W uzyskuje się .


Uwaga: Podczas stosowania metody periodogramu występują dwa typowe problemy. Po pierwsze, jeśli dane nie mają rozkładu Gaussa, transformacja danych może rozwiązać tego rodzaju problemy. Po drugie, widmo próbki, które odbiega od założonej gęstości widmowej, jest kolejnym widmem. Aby rozwiązać ten problem, proponuje się metodę agregacji. X jest procesem Gaussa, a funkcja gęstości widmowej ) jak , funkcja, jako .

  • P. Whittle, „Estymacja i informacja w stacjonarnych szeregach czasowych”, art. Mata. 2, 423-434, 1953.
  • K. PARK, W. WILLINGER, samopodobna ocena ruchu sieciowego i wydajności, WILEY,2000.
  • WE Leland, W. Willinger, MS Taqqu, DV Wilson, „O samopodobnym charakterze ruchu Ethernet”, ACM SIGCOMM Computer Communication Review 25,202-213,1995.
  • W. Willinger, MS Taqqu, WE Leland, DV Wilson, „Samopodobieństwo w ruchu pakietów o dużej prędkości: analiza i modelowanie pomiarów ruchu w sieci Ethernet”, Statistical Science 10,67-85,1995.