Funkcja wzrostu , zwana także współczynnikiem rozbicia lub liczbą rozbicia , mierzy bogactwo zbioru rodziny . Jest szczególnie używany w kontekście statystycznej teorii uczenia się , gdzie mierzy złożoność klasy hipotez. Termin „funkcja wzrostu” został ukuty przez Vapnika i Chervonenkisa w ich pracy z 1968 r., w której udowodnili również wiele jej właściwości. Jest to podstawowa koncepcja uczenia maszynowego .
Definicje
Definicja rodziny zestawów
Niech rodziną zestawów) i . Ich przecięcie jest zdefiniowane jako następująca rodzina zestawów:
Rozmiar skrzyżowania (zwany także indeksem ) odniesieniu do to . Jeśli zestaw to indeks wynosi co najwyżej 2 . Jeśli indeks wynosi dokładnie 2 m , to zbiór mówi się, że jest rozbity przez H. wszystkie podzbiory, tj.:
Funkcja wzrostu mierzy rozmiar jako funkcja . Formalnie:
Definicja klasy hipotezy
Równoważnie, niech (zbiorem funkcji binarnych) elementami . Ograniczeniem do jest funkcji binarnych na można wyprowadzić z \ displaystyle
rozmiar funkcję :
Przykłady
1. Dziedziną jest linia rzeczywista . Rodzina zestawów wszystkie półproste (promienie) od liczby do dodatniej nieskończoności, tj. wszystkie zbiory postaci dla pewnego . Dla dowolnego zestawu do m {\ , przecięcie zawiera zbiory: zbiór , zbiór zawierający największy element , zestaw zawierający dwa największe elementy tak dalej. Zatem: . To samo dotyczy tego, czy , zamknięte półproste, czy oba
2. Domena to segment . Rodzina zestawów wszystkie otwarte zbiory dowolnego skończonego zbioru rzeczywistych przecięcie zawiera wszystkie podzbiory do Istnieją więc .
3. Dziedziną jest przestrzeń euklidesowa . Rodzina zestawów wszystkie półprzestrzenie postaci: φ wektorem . Wtedy , gdzie Comp to liczba składników w podziale n-wymiarowej przestrzeni przez m hiperpłaszczyzn .
4. Dziedziną jest linia rzeczywista . Rodzina zestawów zbiory postaci dla pewnego . Dla dowolnego zestawu rzeczywistych , przecięcie zawiera wszystkie przebiegi między 0 a kolejne elementy do . Liczba takich przebiegów to , więc .
Wielomian lub wykładniczy
Główną właściwością, która sprawia, że funkcja wzrostu jest interesująca, jest to, że może być wielomianowa lub wykładnicza - nic pośredniego.
Poniżej znajduje się właściwość rozmiaru skrzyżowania:
- Jeśli dla pewnego zestawu dla pewnej liczby \ , -
- wtedy istnieje podzbiór o rozmiarze takim, że .
Implikuje to następującą właściwość funkcji Growth. Dla każdej rodziny istnieją dwa przypadki:
- Przypadek wykładniczy : identycznie.
- Przypadek wielomianu : przez , gdzie jest najmniejszą liczbą całkowitą, dla której .
Inne właściwości
Trywialna górna granica
Dla każdego skończonego :
ponieważ dla każdego liczba elementów w najwyżej . Dlatego funkcja wzrostu jest interesująca głównie wtedy, gdy .
Wykładnicza górna granica
Dla każdego niepustego :
Tj. funkcja wzrostu ma wykładniczą górną granicę.
że rodzina zestawów rozbija zbiór jeśli ich przecięcie zawiera wszystkie możliwe podzbiory , tj. . Jeśli rozbija się o rozmiar to , co jest górną granicą.
Przecięcie kartezjańskie
Zdefiniuj kartezjańskie przecięcie dwóch rodzin zbiorów jako:
-
.
Następnie:
Unia
Dla każdych dwóch rodzin zestawów:
wymiar VC
Wymiar VC jest definiowany zgodnie z tymi dwoma przypadkami:
- W przypadku wielomianu VCDim = największa liczba całkowita dla której .
- W przypadku wykładniczym .
Więc jeśli i tylko jeśli .
Funkcję wzrostu można uznać za udoskonalenie koncepcji wymiaru VC. Wymiar VC mówi nam tylko, czy równy lub mniejszy niż , podczas gdy funkcja wzrostu mówi nam dokładnie, jak w funkcji .
Inny związek między funkcją wzrostu a wymiarem VC daje lemat Sauera – Szelacha :
- Jeśli to:
- dla :
W szczególności,
- m :
- więc gdy wymiar VC jest skończony, funkcja wzrostu rośnie wielomianowo z .
ciasna, tj. dla wszystkich istnieje taki wymiar VC, że: >
Entropia
Podczas gdy funkcja wzrostu jest związana z maksymalnym rozmiarem skrzyżowania, entropia jest związana ze średnim rozmiarem skrzyżowania:
Rozmiar skrzyżowania ma następującą właściwość. Dla każdej rodziny zestawów :
Stąd:
Co więcej, sekwencja zbiega się do stałej do kiedy .
zmiennej losowej koncentruje się w pobliżu do .
Zastosowania w teorii prawdopodobieństwa
Niech będzie którym prawdopodobieństwa . Niech będzie rodziną podzbiorów (= rodzina zdarzeń).
wybieramy zestaw zawiera gdzie każdy element jest wybierany zgodnie z , niezależnie od innych (tj. z zamianami). Dla każdego zdarzenia porównujemy następujące dwie wielkości:
-
częstotliwość w . ;
- Jego prawdopodobieństwo .
Interesuje nas różnica . Ta różnica spełnia następującą górną granicę:
co jest równoważne z:
Słownie: prawdopodobieństwo, że dla wszystkich zdarzeń w , jest ograniczone dolnym wyrażeniem zależnym od funkcji wzrostu .
Następstwem tego jest to, że jeśli funkcja wzrostu jest wielomianem w . istnieje coś , że ), to powyższe prawdopodobieństwo zbliża się do 1 jako . To znaczy rodzina jednostajna zbieżność prawdopodobieństwa .