Margines (uczenie maszynowe)



H 1 nie rozdziela klas. H 2 tak, ale tylko z niewielkim marginesem. H 3 oddziela je maksymalnym marginesem.

W uczeniu maszynowym margines pojedynczego punktu danych jest definiowany jako odległość od punktu danych do granicy decyzyjnej . Należy pamiętać, że istnieje wiele odległości i granic decyzyjnych, które mogą być odpowiednie dla określonych zestawów danych i celów. Klasyfikator marginesu to klasyfikator, który jawnie wykorzystuje margines każdego przykładu podczas uczenia się klasyfikatora. Istnieją uzasadnienia teoretyczne (oparte na wymiarze VC ), dlaczego maksymalizacja marginesu (przy pewnych odpowiednich ograniczeniach) może być korzystna dla algorytmów uczenia maszynowego i wnioskowania statystycznego.

Istnieje wiele hiperpłaszczyzn, które mogą klasyfikować dane. Jednym z rozsądnych wyborów najlepszej hiperpłaszczyzny jest ta, która reprezentuje największą separację lub margines między dwiema klasami. Wybieramy więc hiperpłaszczyznę tak, aby odległość od niej do najbliższego punktu danych po każdej stronie była zmaksymalizowana. Jeśli taka hiperpłaszczyzna istnieje, jest znana jako hiperpłaszczyzna maksymalnego marginesu , a definiowany przez nią klasyfikator liniowy jest znany jako klasyfikator maksymalnego marginesu ; lub równoważnie, perceptron optymalnej stabilności. [ potrzebne źródło ]