Funkcja wzrostu

Funkcja wzrostu , zwana także współczynnikiem rozbicia lub liczbą rozbicia , mierzy bogactwo zbioru rodziny . Jest szczególnie używany w kontekście statystycznej teorii uczenia się , gdzie mierzy złożoność klasy hipotez. Termin „funkcja wzrostu” został ukuty przez Vapnika i Chervonenkisa w ich pracy z 1968 r., w której udowodnili również wiele jej właściwości. Jest to podstawowa koncepcja uczenia maszynowego .

Definicje

Definicja rodziny zestawów

Niech rodziną zestawów) i . Ich przecięcie jest zdefiniowane jako następująca rodzina zestawów:

Rozmiar skrzyżowania (zwany także indeksem ) odniesieniu do to . Jeśli zestaw to indeks wynosi co najwyżej 2 . Jeśli indeks wynosi dokładnie 2 m , to zbiór mówi się, że jest rozbity przez H. wszystkie podzbiory, tj.:

Funkcja wzrostu mierzy rozmiar jako funkcja . Formalnie:

Definicja klasy hipotezy

Równoważnie, niech (zbiorem funkcji binarnych) elementami . Ograniczeniem do jest funkcji binarnych na można wyprowadzić z \ displaystyle

rozmiar funkcję :

Przykłady

1. Dziedziną jest linia rzeczywista . Rodzina zestawów wszystkie półproste (promienie) od liczby do dodatniej nieskończoności, tj. wszystkie zbiory postaci dla pewnego . Dla dowolnego zestawu do m {\ , przecięcie zawiera zbiory: zbiór , zbiór zawierający największy element , zestaw zawierający dwa największe elementy tak dalej. Zatem: . To samo dotyczy tego, czy , zamknięte półproste, czy oba

2. Domena to segment . Rodzina zestawów wszystkie otwarte zbiory dowolnego skończonego zbioru rzeczywistych przecięcie zawiera wszystkie podzbiory do Istnieją więc .

3. Dziedziną jest przestrzeń euklidesowa . Rodzina zestawów wszystkie półprzestrzenie postaci: φ wektorem . Wtedy , gdzie Comp to liczba składników w podziale n-wymiarowej przestrzeni przez m hiperpłaszczyzn .

4. Dziedziną jest linia rzeczywista . Rodzina zestawów zbiory postaci dla pewnego . Dla dowolnego zestawu rzeczywistych , przecięcie zawiera wszystkie przebiegi między 0 a kolejne elementy do . Liczba takich przebiegów to , więc .

Wielomian lub wykładniczy

Główną właściwością, która sprawia, że ​​funkcja wzrostu jest interesująca, jest to, że może być wielomianowa lub wykładnicza - nic pośredniego.

Poniżej znajduje się właściwość rozmiaru skrzyżowania:

  • Jeśli dla pewnego zestawu dla pewnej liczby \ , -
  • wtedy istnieje podzbiór o rozmiarze takim, że .

Implikuje to następującą właściwość funkcji Growth. Dla każdej rodziny istnieją dwa przypadki:

  • Przypadek wykładniczy : identycznie.
  • Przypadek wielomianu : przez , gdzie jest najmniejszą liczbą całkowitą, dla której .

Inne właściwości

Trywialna górna granica

Dla każdego skończonego :

ponieważ dla każdego liczba elementów w najwyżej . Dlatego funkcja wzrostu jest interesująca głównie wtedy, gdy .

Wykładnicza górna granica

Dla każdego niepustego :

Tj. funkcja wzrostu ma wykładniczą górną granicę.

że rodzina zestawów rozbija zbiór jeśli ich przecięcie zawiera wszystkie możliwe podzbiory , tj. . Jeśli rozbija się o rozmiar to , co jest górną granicą.

Przecięcie kartezjańskie

Zdefiniuj kartezjańskie przecięcie dwóch rodzin zbiorów jako:

.

Następnie:

Unia

Dla każdych dwóch rodzin zestawów:

wymiar VC

Wymiar VC jest definiowany zgodnie z tymi dwoma przypadkami:

  • W przypadku wielomianu VCDim = największa liczba całkowita dla której .
  • W przypadku wykładniczym .

Więc jeśli i tylko jeśli .

Funkcję wzrostu można uznać za udoskonalenie koncepcji wymiaru VC. Wymiar VC mówi nam tylko, czy równy lub mniejszy niż , podczas gdy funkcja wzrostu mówi nam dokładnie, jak w funkcji .

Inny związek między funkcją wzrostu a wymiarem VC daje lemat Sauera – Szelacha :

Jeśli to:
dla :

W szczególności,

m :
więc gdy wymiar VC jest skończony, funkcja wzrostu rośnie wielomianowo z .

ciasna, tj. dla wszystkich istnieje taki wymiar VC, że: >

Entropia

Podczas gdy funkcja wzrostu jest związana z maksymalnym rozmiarem skrzyżowania, entropia jest związana ze średnim rozmiarem skrzyżowania:

Rozmiar skrzyżowania ma następującą właściwość. Dla każdej rodziny zestawów :

Stąd:

Co więcej, sekwencja zbiega się do stałej do kiedy .

zmiennej losowej koncentruje się w pobliżu do .

Zastosowania w teorii prawdopodobieństwa

Niech będzie którym prawdopodobieństwa . Niech będzie rodziną podzbiorów (= rodzina zdarzeń).

wybieramy zestaw zawiera gdzie każdy element jest wybierany zgodnie z , niezależnie od innych (tj. z zamianami). Dla każdego zdarzenia porównujemy następujące dwie wielkości:

  • częstotliwość w . ;
  • Jego prawdopodobieństwo .

Interesuje nas różnica . Ta różnica spełnia następującą górną granicę:

co jest równoważne z:

Słownie: prawdopodobieństwo, że dla wszystkich zdarzeń w , jest ograniczone dolnym wyrażeniem zależnym od funkcji wzrostu .

Następstwem tego jest to, że jeśli funkcja wzrostu jest wielomianem w . istnieje coś , że ), to powyższe prawdopodobieństwo zbliża się do 1 jako . To znaczy rodzina jednostajna zbieżność prawdopodobieństwa .