Losowy model surfowania

Model losowego przeglądania to model grafu opisujący prawdopodobieństwo, że przypadkowy użytkownik odwiedzi stronę internetową . Model próbuje przewidzieć prawdopodobieństwo, że przypadkowy internauta trafi na stronę, klikając link lub bezpośrednio wchodząc na stronę, na przykład bezpośrednio wpisując adres URL witryny w pasku adresu. Z tego powodu przyjmuje się założenie, że wszyscy użytkownicy surfujący po Internecie w końcu przestaną korzystać z linków na rzecz całkowitego przejścia na inną stronę. Model jest podobny do łańcucha Markowa , gdzie stany łańcucha to strony internetowe, na które trafia użytkownik, a przejścia to równie prawdopodobne łącza między tymi stronami.

Opis

Użytkownik porusza się po Internecie na dwa podstawowe sposoby; użytkownik może uzyskać bezpośredni dostęp do witryny, wprowadzając adres URL witryny lub klikając zakładkę , lub użytkownik może skorzystać z szeregu hiperłączy, aby przejść do żądanej strony. Model losowego internauty zakłada, że ​​link, który użytkownik wybierze jako następny, jest wybierany losowo. Model zakłada również, że liczba kolejnych linków nie jest nieskończona – użytkownik w pewnym momencie straci zainteresowanie i opuści dotychczasową witrynę do zupełnie nowej.

Model losowego internauty jest przedstawiony jako seria węzłów wskazujących strony internetowe, do których użytkownicy mogą uzyskać dostęp w sposób losowy. Nowy węzeł jest dodawany do wykresu po opublikowaniu nowej witryny internetowej. Ruch wokół węzłów wykresu jest modelowany poprzez losowy wybór węzła początkowego, a następnie wykonanie krótkiego i losowego przechodzenia przez węzły lub błądzenie losowe . To przechodzenie jest analogiczne do użytkownika uzyskującego dostęp do strony internetowej, a następnie podążającego za hiperłączem tyle razy, aż użytkownik opuści stronę lub całkowicie przejdzie do innej witryny. Połączenia z innymi węzłami na tym grafie powstają, gdy na stronie umieszczane są linki wychodzące.

Definicje wykresów

W modelu losowego przeglądania wykresy internetowe są przedstawiane jako sekwencja grafów skierowanych tak, że ma i . Proces definiowania wykresów jest sparametryzowany z prawdopodobieństwem niech .

pojedynczo, tworząc połączenia z istniejącym wykresem . W niektórych modelach połączenia reprezentują krawędzie skierowane, aw innych połączenia reprezentują krawędzie niekierowane. od pojedynczego mają pętle . oznacza wierzchołek dodany w , a oznacza całkowitą liczbę wierzchołków

Model 1. (chodnik 1-stopniowy z pętlą)

czasie wierzchołek tworzy połączenia przez iteracje następujących kroków: t

  1. Wybierz istniejący węzeł losowo z
  2. Z prawdopodobieństwem pozostań w ; z prawdopodobieństwem idź 1 krok do przypadkowego sąsiada
  3. krawędź z do bieżącego węzła

kierowane z istniejącego wykresu. Krawędzie są nieskierowane w odpowiednich grafach nieskierowanych.

Model 2. (Spacery losowe z rzutami monetą)

czasie wierzchołek tworzy połączenia przez iteracje następujących kroków: t

  1. Wybierz istniejący węzeł losowo
  2. Rzuć monetą uprzedzeń
  3. Jeśli moneta wypadnie orzeł, dodaj krawędź od i zatrzymaj się
  4. Jeśli moneta wypadnie reszka, przejdź do losowego sąsiada bieżącego węzła i wróć do kroku 2

kierowane z istniejącego wykresu. Krawędzie są nieskierowane w odpowiednich grafach nieskierowanych.

Ograniczenia

Istnieją pewne zastrzeżenia do standardowego modelu losowego internauty, z których jednym jest to, że model ignoruje zawartość stron wybieranych przez użytkowników – ponieważ model zakłada, że ​​linki są wybierane losowo. Ponieważ użytkownicy zwykle mają na uwadze cel podczas surfowania w Internecie, zawartość witryn, do których prowadzą łącza, jest czynnikiem decydującym o tym, czy użytkownik kliknie łącze.

Aplikacja

Znormalizowana centralność wektora własnego w połączeniu z założeniem losowego modelu surfera o przypadkowych skokach stworzyło podstawę algorytmu Google PageRank .

Zobacz też

Linki zewnętrzne