Przedział tolerancji

Przedział tolerancji ( TI ) jest statystycznym przedziałem , w którym przy pewnym poziomie ufności mieści się określona próba proporcjonalna populacji . „Mówiąc dokładniej, 100 × p %/100 × (1-α) zapewnia granice, w których przynajmniej pewna część ( p ) populacji mieści się przy danym poziomie ufności (1-α).” „Przedział tolerancji ( p , 1−α) oparty na próbce jest skonstruowany tak, aby obejmował co najmniej proporcję p badanej populacji z ufnością 1−α; taki TI jest zwykle określany jako TI zawartości p - (1-α) pokrycia. populacji”.

Obliczenie

Jednostronne normalne przedziały tolerancji mają dokładne rozwiązanie pod względem średniej próbki i wariancji próbki w oparciu o niecentralny rozkład t . Dwustronne normalne przedziały tolerancji można uzyskać na podstawie niecentralnego rozkładu chi-kwadrat .

Stosunek do innych interwałów

„W przypadku znanych parametrów 95% przedział tolerancji i 95% przedział predykcji są takie same”. Gdybyśmy znali dokładne parametry populacji, bylibyśmy w stanie obliczyć zakres, w którym mieści się pewna część populacji. populacja ma rozkład normalny ze średnią i odchyleniem standardowym , to przedział obejmuje 95% populacji (1,96 to wynik z dla 95% pokrycia populacji o rozkładzie normalnym).

tylko próbkę z populacji, znamy tylko próbki i odchylenie standardowe próbki , które są jedynie szacunkami prawdziwych parametrów. W takim przypadku % populacji ze względu na rozbieżności w Przedział tolerancji ogranicza tę wariancję, wprowadzając poziom ufności , czyli pewność, z jaką ten przedział faktycznie obejmuje określoną część populacji. W przypadku populacji o rozkładzie normalnym wynik z można przekształcić w „ k ” lub współczynnik tolerancji dla danej lub kilku wzorów aproksymacyjnych. „Gdy stopnie swobody zbliżają się do nieskończoności, przedziały przewidywania i tolerancji stają się równe”.

Przedział tolerancji jest mniej znany niż przedział ufności i przedział przewidywania , sytuacja, nad którą ubolewali niektórzy pedagodzy, ponieważ może prowadzić do niewłaściwego wykorzystania innych przedziałów, w których przedział tolerancji jest bardziej odpowiedni.

Przedział tolerancji różni się od przedziału ufności tym, że przedział ufności ogranicza jednowartościowy parametr populacji ( na przykład średnią lub wariancję ) z pewną pewnością, podczas gdy przedział tolerancji ogranicza zakres wartości danych, który obejmuje określoną proporcję populacja. Podczas gdy wielkość przedziału ufności jest całkowicie spowodowana błędem próbkowania i będzie zbliżać się do przedziału o zerowej szerokości przy parametrze prawdziwej populacji wraz ze wzrostem wielkości próby, wielkość przedziału tolerancji jest częściowo spowodowana błędem próbkowania, a częściowo rzeczywistą wariancją w populacji, i będzie zbliżać się do przedziału prawdopodobieństwa populacji wraz ze wzrostem wielkości próby.

Przedział tolerancji jest powiązany z przedziałem predykcji w tym sensie, że oba wyznaczają granice zmienności w przyszłych próbkach. Jednak przedział predykcji ogranicza tylko jedną przyszłą próbkę, podczas gdy przedział tolerancji ogranicza całą populację (odpowiednik dowolnej sekwencji przyszłych próbek). średnio określony odsetek populacji , podczas gdy przedział tolerancji obejmuje go z pewnym poziomem ufności , co sprawia, że ​​przedział tolerancji jest bardziej odpowiedni, jeśli pojedynczy przedział ma objąć wiele przyszłych próbek.

Przykłady

podaje następujący przykład:

Rozważmy więc jeszcze raz przysłowiowy scenariusz testu przebiegu EPA , w którym kilka nominalnie identycznych samochodów określonego modelu jest testowanych w celu uzyskania wartości przebiegu . Jeśli takie dane są przetwarzane w celu uzyskania 95% przedziału ufności dla średniego przebiegu modelu, możliwe jest na przykład wykorzystanie go do prognozowania średniego lub całkowitego zużycia benzyny dla wyprodukowanej floty takich samochodów w ciągu pierwszych 5000 mil użytkowania. Taka przerwa nie byłaby jednak zbyt pomocna dla osoby wynajmującej jeden z tych samochodów i zastanawiającej się, czy (pełny) 10-litrowy bak paliwa wystarczy, aby przewieźć go 350 mil do celu. W przypadku tego zadania interwał przewidywania byłby znacznie bardziej użyteczny. (Rozważ różne implikacje bycia „w 95% pewnym”, że w przeciwieństwie do bycia „pewnym w 95%”, że .) Ale ani przedział ufności dla ani przedział predykcji dla pojedynczy dodatkowy przebieg jest dokładnie tym, czego potrzebuje inżynier projektujący, którego zadaniem jest określenie, jak duży zbiornik gazu naprawdę potrzebuje model, aby zagwarantować, że 99% wyprodukowanych samochodów będzie miało zasięg przelotowy 400 mil. Inżynier naprawdę potrzebuje przedziału tolerancji dla ułamka przebiegów takich aut.

Inny przykład podaje:

Poziomy ołowiu w powietrzu zostały zebrane . Zauważono, że przekształcone logarytmicznie poziomy ołowiu dobrze pasowały do ​​rozkładu normalnego (to znaczy dane pochodzą z rozkładu logarytmiczno- 2 \ displaystyle \ oznaczają średnią populacji i wariancję dla danych przekształconych logarytmicznie.Jeśli oznacza odpowiednią zmienną losową, mamy zatem . Zauważmy, że ołowiu Przedział ufności dla skonstruować w zwykły sposób, w oparciu rozkład t ; to z kolei zapewni przedział ufności dla średniego poziomu ołowiu w powietrzu. Jeśli i oznaczają średnią próbki i odchylenie standardowe danych przekształconych w logarytm dla próbki o rozmiarze n, 95% przedział ufności dla określony przez t oznacza kwantyl rozkładu t ze stopniami swobody Interesujące może być również wyprowadzenie 95% górnej granicy ufności dla średniego poziomu ołowiu w powietrzu. Taka granica dla jest dana przez . W związku z tym 95% górna granica ufności dla średniego odprowadzenia powietrza jest określona przez . Załóżmy teraz, że chcemy przewidzieć poziom ołowiu w powietrzu w określonym obszarze w laboratorium. 95% górna granica predykcji dla przekształconego logarytmicznie poziomu ołowiu jest dana przez . W podobny sposób można obliczyć dwustronny przedział predykcji. Znaczenie i interpretacja tych odstępów są dobrze znane. przedział _ obliczane wielokrotnie z niezależnych próbek, 95% obliczonych w ten sposób przedziałów będzie zawierać prawdziwą wartość , na dłuższą metę. Innymi słowy, interwał ma dostarczać informacji dotyczących parametru tylko. Przedział predykcji ma podobną interpretację i ma na celu dostarczenie informacji dotyczących tylko jednego poziomu wyprzedzenia. Załóżmy teraz, że chcemy użyć próby, aby stwierdzić, czy co najmniej 95% poziomów ołowiu w populacji jest poniżej progu. Przedział ufności i przedział predykcji nie mogą odpowiedzieć na to pytanie, ponieważ przedział ufności dotyczy tylko mediany poziomu wiodącego, a przedział predykcji dotyczy tylko jednego poziomu wiodącego. Wymagany jest przedział tolerancji; dokładniej, górna granica tolerancji. Górna granica tolerancji jest obliczana pod warunkiem, że co najmniej 95% poziomów ołowiu w populacji jest poniżej granicy, przy pewnym poziomie ufności, powiedzmy 99%.

Zobacz też

Dalsza lektura

  •   Hahn, Gerald J.; Meeker, William Q.; Escobar, Luis A. (2017). Przedziały statystyczne: przewodnik dla praktyków i badaczy (wyd. 2). John Wiley & Sons, Incorporated. ISBN 978-0-471-68717-7 .