Wybór modelu

Selekcja modeli polega na wybraniu modelu spośród różnych kandydatów na podstawie kryterium wydajności w celu wybrania najlepszego. W kontekście uczenia się może to być wybór modelu statystycznego ze zbioru modeli kandydujących, danych danych. W najprostszych przypadkach brany jest pod uwagę istniejący wcześniej zestaw danych. Jednak zadanie to może również obejmować zaprojektowanie eksperymentów w taki sposób, aby zebrane dane były dobrze dopasowane do problemu wyboru modelu. Biorąc pod uwagę modele kandydujące o podobnej mocy predykcyjnej lub wyjaśniającej, najprostszy model najprawdopodobniej będzie najlepszym wyborem ( brzytwa Ockhama ).

Konishi i Kitagawa (2008 , s. 75) stwierdzają: „Większość problemów wnioskowania statystycznego można uznać za problemy związane z modelowaniem statystycznym”. W związku z tym Cox (2006 , s. 197) powiedział: „Sposób, w jaki odbywa się tłumaczenie problemu przedmiotowego na model statystyczny, jest często najbardziej krytyczną częścią analizy”.

Wybór modelu może również odnosić się do problemu wyboru kilku reprezentatywnych modeli z dużego zestawu modeli obliczeniowych w celu podejmowania decyzji lub optymalizacji w warunkach niepewności.

Wstęp

Cykl obserwacji naukowych.

W swoich najbardziej podstawowych formach wybór modelu jest jednym z podstawowych zadań badań naukowych . Określenie zasady wyjaśniającej serię obserwacji jest często bezpośrednio powiązane z modelem matematycznym przewidującym te obserwacje. Na przykład, gdy Galileusz przeprowadzał eksperymenty na płaszczyźnie pochyłej , wykazał, że ruch kul pasuje do paraboli przewidzianej przez jego model [ potrzebne źródło ] .

Spośród niezliczonej liczby możliwych mechanizmów i procesów, które mogły wytworzyć dane, jak w ogóle zacząć wybierać najlepszy model? Powszechnie stosowane podejście matematyczne decyduje o zestawie modeli kandydujących; ten zestaw musi być wybrany przez badacza. Często stosuje się proste modele, takie jak wielomiany , przynajmniej początkowo [ potrzebne źródło ] . Burnham i Anderson (2002) w całej swojej książce podkreślają znaczenie wyboru modeli opartych na solidnych podstawach naukowych, takich jak zrozumienie fenomenologicznych procesów lub mechanizmów (np. reakcji chemicznych) leżących u podstaw danych.

Po wybraniu zestawu kandydujących modeli analiza statystyczna pozwala nam wybrać najlepszy z tych modeli. To, co rozumie się przez najlepsze, jest kontrowersyjne. Dobra technika wyboru modelu zrównoważy dobroć dopasowania z prostotą [ potrzebne źródło ] . Bardziej złożone modele będą w stanie lepiej dostosować swój kształt do danych (na przykład wielomian piątego rzędu może dokładnie pasować do sześciu punktów), ale dodatkowe parametry mogą nie reprezentować niczego użytecznego. (Być może te sześć punktów jest tak naprawdę rozłożonych losowo wokół linii prostej). Dobroć dopasowania jest ogólnie określana za pomocą ilorazu wiarygodności lub jego przybliżenie, prowadzące do testu chi-kwadrat . Złożoność jest ogólnie mierzona przez zliczanie liczby parametrów w modelu.

Techniki wyboru modelu można uznać za estymatory pewnej wielkości fizycznej, takiej jak prawdopodobieństwo, że model wytworzy dane. Odchylenie i wariancja są ważnymi miarami jakości tego estymatora ; Często brana jest pod uwagę także efektywność .

Standardowym przykładem wyboru modelu jest dopasowanie krzywej , gdzie mając zbiór punktów i inną wiedzę podstawową (np. punkty są wynikiem iid próbek), musimy wybrać krzywą opisującą funkcję, która wygenerowała punkty.

Dwa kierunki wyboru modelu

Istnieją dwa główne cele wnioskowania i uczenia się na podstawie danych. Jednym z nich jest odkrycie naukowe, zwane także wnioskowaniem statystycznym, zrozumienie podstawowego mechanizmu generowania danych i interpretacja natury danych. Innym celem uczenia się na podstawie danych jest przewidywanie przyszłych lub niewidocznych obserwacji, zwanych również przewidywaniami statystycznymi. W drugim celu data science niekoniecznie dotyczy dokładnego probabilistycznego opisu danych. Oczywiście można też być zainteresowanym w obu kierunkach.

Zgodnie z dwoma różnymi celami wybór modelu może mieć również dwa kierunki: wybór modelu do wnioskowania i wybór modelu do predykcji. Pierwszym kierunkiem jest zidentyfikowanie najlepszego modelu danych, który najlepiej zapewni wiarygodną charakterystykę źródeł niepewności dla interpretacji naukowej. W tym celu niezwykle ważne jest, aby wybrany model nie był zbyt wrażliwy na wielkość próby. W związku z tym odpowiednim pojęciem do oceny wyboru modelu jest spójność wyboru, co oznacza, że ​​najbardziej solidny kandydat zostanie konsekwentnie wybrany przy wystarczającej liczbie próbek danych.

Drugim kierunkiem jest wybór modelu jako maszyny, która zapewni doskonałą wydajność predykcyjną. Jednak w przypadku tych ostatnich wybrany model może być po prostu szczęśliwym zwycięzcą wśród kilku bliskich konkurentów, ale wydajność predykcyjna może być nadal najlepsza z możliwych. Jeśli tak, wybór modelu jest odpowiedni dla drugiego celu (predykcji), ale użycie wybranego modelu do wglądu i interpretacji może być bardzo niewiarygodne i wprowadzające w błąd. Co więcej, dla tak dobranych bardzo złożonych modeli nawet przewidywania mogą być nieracjonalne dla danych tylko nieznacznie różniących się od tych, na podstawie których dokonano selekcji.

Metody wspomagające wybór zbioru modeli kandydujących

Kryteria

Poniżej znajduje się lista kryteriów wyboru modelu. Najczęściej stosowanymi kryteriami są (i) kryterium informacyjne Akaike oraz (ii) czynnik Bayesa i/lub kryterium informacyjne Bayesa (które w pewnym stopniu przypomina czynnik Bayesa), przegląd patrz Stoica i Selen (2004 ) .

Spośród tych kryteriów walidacja krzyżowa jest zazwyczaj najdokładniejsza i najdroższa obliczeniowo w przypadku problemów z uczeniem nadzorowanym. [ potrzebne źródło ]

Burnham i Anderson (2002 , §6.3) mówią, co następuje:

Istnieje wiele metod wyboru modeli. Jednak z punktu widzenia statystycznej wydajności metody i zamierzonego kontekstu jej użycia, istnieją tylko dwie odrębne klasy metod: Zostały one oznaczone jako wydajne i spójne . (...) Zgodnie z częstościowym paradygmatem selekcji modeli generalnie istnieją trzy główne podejścia: (I) optymalizacja niektórych kryteriów selekcji, (II) testy hipotez oraz (III) metody ad hoc.

Zobacz też

Notatki