Identyfikacja zestawu

W statystyce i ekonometrii identyfikacja zbiorów (lub identyfikacja częściowa ) rozszerza pojęcie identyfikowalności (lub „identyfikowalności punktowej”) w modelach statystycznych na sytuacje, w których rozkład obserwowalnych zmiennych nie informuje o dokładnej wartości parametru , ale zamiast tego ogranicza parametr leżeć w ścisłym podzbiorze przestrzeni parametrów. Modele statystyczne, które są zestawami identyfikowanymi, pojawiają się w różnych kontekstach ekonomicznych , w tym teoria gier i model przyczynowy Rubina .

Chociaż użycie identyfikacji zestawów datuje się na artykuł Ragnara Frischa z 1934 r ., Metody te zostały znacznie rozwinięte i promowane przez Charlesa Manskiego począwszy od lat 90. Manski opracował metodę granic najgorszego przypadku, aby uwzględnić błąd selekcji . W przeciwieństwie do metod, które przyjmują dodatkowe założenia statystyczne, takie jak korekta Heckmana , granice najgorszego przypadku opierają się tylko na danych w celu wygenerowania zakresu obsługiwanych wartości parametrów.

Definicja

Niech ${\ Displaystyle {\ mathcal {P}} = \ {P _ {\ theta}: \ theta \ in \ Theta \}} będzie$ modelem statystycznym , w którym przestrzeń parametrów ${\ styl wyświetlania \Theta }$ jest skończony lub nieskończenie wymiarowy. Załóżmy, $że$ prawdziwą wartością parametru. Mówimy, że \ displaystyle \ ${0}}$ ${\ Displaystyle \ theta \ in \ Theta}$ takie, że ${\ Displaystyle P _ {\ teta} \ neq P _ {\ theta _ {0}}}$ ; to znaczy, że $displaystyle$ wartości parametrów w nie są obserwacyjnie równoważne z $\ theta _ {0}}$ . W takim przypadku zidentyfikowany zestaw to zbiór wartości parametrów, które są obserwacyjnie równoważne ${\ displaystyle \ theta _ {0}}$ .

Przykład: brakujące dane

Ten przykład pochodzi od Tamera (2010) . Załóżmy , że istnieją dwie binarne zmienne losowe , $Y$ i $Z.$ Ekonometrysta jest zainteresowany ${\ Displaystyle \ operatorname {P} (Y = 1)}$ . Istnieje z brakującymi danymi : $Y$ można zaobserwować tylko wtedy, gdy ${\ displaystyle Z = 1}$ .

Zgodnie z prawem całkowitego prawdopodobieństwa ,

{\ Displaystyle \ operatorname {P} (Y = 1) = \ operatorname {P} (Y = 1 \ środek Z = 1) \ operatorname {P} (Z = 1) + \ operatorname {P} (Y = 1 \ mid Z=0)\mathrm {P} (Z=0).}

Jedynym nieznanym obiektem jest , który jest ograniczony do leżenia między 0 a 1. Dlatego zidentyfikowany zestaw to ${\ Displaystyle \ operatorname {P} (Y = 1 \ mid Z = 0)}$

{\ Displaystyle \ Theta _ {I} = \ {p \ w [0,1]: p = \ operatorname {P} (Y = 1 \ środek Z = 1) \ operatorname {P} (Z = 1) + q \mathrm {P} (Z=0),{\text{ dla pewnego }}q\in [0,1]\}.}

Biorąc pod uwagę ograniczenie brakujących danych, ekonometryk może tylko powiedzieć, że ${\ Displaystyle \ operatorname {P} (Y = 1) \ in \ Theta _ {I}}$ . Wykorzystuje to wszystkie dostępne informacje.

Wnioskowanie statystyczne

Estymacja zbioru nie może opierać się na zwykłych narzędziach wnioskowania statystycznego opracowanych dla estymacji punktowej . Literatura w dziedzinie statystyki i ekonometrii bada metody wnioskowania statystycznego w kontekście modeli identyfikujących zbiory, koncentrując się na konstruowaniu przedziałów ufności lub regionów ufności o odpowiednich właściwościach. Na przykład metoda opracowana przez Chernozhukova, Honga i Tamera (2007) (i którą Lewbel (2019) opisuje jako skomplikowany) konstruuje regiony ufności, które pokrywają zidentyfikowany zbiór z zadanym prawdopodobieństwem.

Notatki

Czernożukow, Wiktor ; Hong, Han; Pogromca, Elie (2007). „Regiony oszacowań i ufności dla zestawów parametrów w modelach ekonometrycznych”. Ekonometria . Towarzystwo Ekonometryczne. 75 (5): 1243–1284. doi : 10.1111/j.1468-0262.2007.00794.x . hdl : 1721.1/63545 . ISSN 0012-9682 .
Lewbel, Arthur (2019-12-01). „Zoo identyfikacji: znaczenie identyfikacji w ekonometrii”. Dziennik Literatury Ekonomicznej . Amerykańskie Stowarzyszenie Ekonomiczne. 57 (4): 835–903. doi : 10.1257/jel.20181361 . ISSN 0022-0515 .
Tamer, Elie (2010). „Częściowa identyfikacja w ekonometrii” . Roczny przegląd ekonomii . 2 (1): 167–195. doi : 10.1146/annurev.economics.050708.143401 .

Dalsza lektura

Hej, Kate ; Rosen, Adam M. (2017). „Częściowa identyfikacja w badaniach stosowanych: korzyści i wyzwania” (PDF) . In Honore, Bo ; Pakes, Ariel ; Piazzesi, Monika ; Samuelson, Larry (red.). Postępy w ekonomii i ekonometrii (PDF) . Cambridge: Cambridge University Press. s. 307–359. doi : 10.1017/9781108227223.010 . ISBN 978-1-108-22722-3 .
Manski, Charles F. (maj 1990). „Nieparametryczne granice efektów leczenia”. The American Economic Review: dokumenty i postępowania . 80 (2): 319–323. ISSN 0002-8282 . JSTOR 2006592 .
Manski, Charles F .; Pieprz, John V. (lipiec 2000). „Monotoniczne zmienne instrumentalne: z zastosowaniem do powrotów do nauki” (PDF) . Ekonometria . 68 (4): 997–1010. doi : 10.1111/1468-0262.00144 . ISSN 0012-9682 . JSTOR 2999533 .
Manski, Charles F. (2003). Częściowa identyfikacja rozkładów prawdopodobieństwa . Nowy Jork: Springer-Verlag. ISBN 978-0-387-00454-9 .