Identyfikacja zestawu

W statystyce i ekonometrii identyfikacja zbiorów (lub identyfikacja częściowa ) rozszerza pojęcie identyfikowalności (lub „identyfikowalności punktowej”) w modelach statystycznych na sytuacje, w których rozkład obserwowalnych zmiennych nie informuje o dokładnej wartości parametru , ale zamiast tego ogranicza parametr leżeć w ścisłym podzbiorze przestrzeni parametrów. Modele statystyczne, które są zestawami identyfikowanymi, pojawiają się w różnych kontekstach ekonomicznych , w tym teoria gier i model przyczynowy Rubina .

Chociaż użycie identyfikacji zestawów datuje się na artykuł Ragnara Frischa z 1934 r ., Metody te zostały znacznie rozwinięte i promowane przez Charlesa Manskiego począwszy od lat 90. Manski opracował metodę granic najgorszego przypadku, aby uwzględnić błąd selekcji . W przeciwieństwie do metod, które przyjmują dodatkowe założenia statystyczne, takie jak korekta Heckmana , granice najgorszego przypadku opierają się tylko na danych w celu wygenerowania zakresu obsługiwanych wartości parametrów.

Definicja

Niech modelem statystycznym , w którym przestrzeń parametrów jest skończony lub nieskończenie wymiarowy. Załóżmy, prawdziwą wartością parametru. Mówimy, że \ displaystyle \ takie, że ; to znaczy, że wartości parametrów w nie są obserwacyjnie równoważne z . W takim przypadku zidentyfikowany zestaw to zbiór wartości parametrów, które są obserwacyjnie równoważne .

Przykład: brakujące dane

Ten przykład pochodzi od Tamera (2010) . Załóżmy , że istnieją dwie binarne zmienne losowe , Y i Z. Ekonometrysta jest zainteresowany . Istnieje z brakującymi danymi : Y można zaobserwować tylko wtedy, gdy .

Zgodnie z prawem całkowitego prawdopodobieństwa ,

Jedynym nieznanym obiektem jest , który jest ograniczony do leżenia między 0 a 1. Dlatego zidentyfikowany zestaw to

Biorąc pod uwagę ograniczenie brakujących danych, ekonometryk może tylko powiedzieć, że . Wykorzystuje to wszystkie dostępne informacje.

Wnioskowanie statystyczne

Estymacja zbioru nie może opierać się na zwykłych narzędziach wnioskowania statystycznego opracowanych dla estymacji punktowej . Literatura w dziedzinie statystyki i ekonometrii bada metody wnioskowania statystycznego w kontekście modeli identyfikujących zbiory, koncentrując się na konstruowaniu przedziałów ufności lub regionów ufności o odpowiednich właściwościach. Na przykład metoda opracowana przez Chernozhukova, Honga i Tamera (2007) (i którą Lewbel (2019) opisuje jako skomplikowany) konstruuje regiony ufności, które pokrywają zidentyfikowany zbiór z zadanym prawdopodobieństwem.

Notatki

  •   Czernożukow, Wiktor ; Hong, Han; Pogromca, Elie (2007). „Regiony oszacowań i ufności dla zestawów parametrów w modelach ekonometrycznych”. Ekonometria . Towarzystwo Ekonometryczne. 75 (5): 1243–1284. doi : 10.1111/j.1468-0262.2007.00794.x . hdl : 1721.1/63545 . ISSN 0012-9682 .
  •   Lewbel, Arthur (2019-12-01). „Zoo identyfikacji: znaczenie identyfikacji w ekonometrii”. Dziennik Literatury Ekonomicznej . Amerykańskie Stowarzyszenie Ekonomiczne. 57 (4): 835–903. doi : 10.1257/jel.20181361 . ISSN 0022-0515 .
  • Tamer, Elie (2010). „Częściowa identyfikacja w ekonometrii” . Roczny przegląd ekonomii . 2 (1): 167–195. doi : 10.1146/annurev.economics.050708.143401 .

Dalsza lektura