CumFreq

CumFreq
Deweloperzy Instytut Rekultywacji i Poprawy Gruntów (ILRI)
Napisane w Delfy
System operacyjny Microsoft Windows
Dostępne w język angielski
Typ Oprogramowanie statystyczne
Licencja Zastrzeżone oprogramowanie bezpłatne
Strona internetowa CumFreq

W statystyce i analizie danych aplikacja CumFreq jest narzędziem do skumulowanej analizy częstości pojedynczej zmiennej i dopasowania rozkładu prawdopodobieństwa .

Pierwotnie metoda została opracowana do analizy pomiarów hydrologicznych o wielkościach zmiennych przestrzennie (np. przewodność hydrauliczna gleby) oraz wielkości zmiennych w czasie (np. opady atmosferyczne, przepływy rzeczne ) w celu znalezienia okresów ich powrotu . Można go jednak używać do wielu innych rodzajów zjawisk, w tym do tych, które zawierają ujemne .

Funkcje oprogramowania

Sitodruk arkusza wejściowego

CumFreq wykorzystuje metodę wykreślania pozycji do oszacowania skumulowanej częstotliwości każdej obserwowanej wielkości w serii danych zmiennej.

Program komputerowy umożliwia wyznaczenie najlepiej dopasowanego rozkładu prawdopodobieństwa . Alternatywnie zapewnia użytkownikowi opcję wyboru rozkładu prawdopodobieństwa do dopasowania. Uwzględniono następujące rozkłady prawdopodobieństwa: normalny , logarytmicznie normalny , logistyczny , loglogistyczny , wykładniczy , Cauchy'ego , Frécheta , Gumbela , Pareto , Weibulla , uogólniony rozkład wartości ekstremalnych , rozkład Laplace'a , rozkład Burra (odzwierciedlenie Daguma), rozkład Daguma (odzwierciedlenie Burra), rozkład Gompertza dystrybucja , dystrybucja studencka i inne.

Inną cechą CumFreq jest to, że zapewnia opcję użycia dwóch różnych rozkładów prawdopodobieństwa, jednego dla niższego zakresu danych, a drugiego dla wyższego. Zakresy są oddzielone punktem przerwania. Wykorzystanie takich złożonych (nieciągłych) rozkładów prawdopodobieństwa może być przydatne, gdy dane badanego zjawiska uzyskano w różnych warunkach.

Dystrybucja złożona (nieciągła) z pasem pewności

Podczas fazy wprowadzania użytkownik może wybrać liczbę przedziałów potrzebnych do wyznaczenia histogramu . Może również zdefiniować próg uzyskania rozkładu obciętego .

Sekcja wyjściowa zawiera kalkulator ułatwiający interpolację i ekstrapolację .

Ponadto daje możliwość zobaczenia wykresu Q – Q pod względem obliczonych i zaobserwowanych skumulowanych częstotliwości.

ILRI podaje przykłady zastosowania do wielkości takich jak plony , głębokość lustra wody , zasolenie gleby , przewodność hydrauliczna , opady deszczu i przepływ rzek .

Rozkłady uogólniające

Program może tworzyć uogólnienia rozkładów normalnych, logistycznych i innych, przekształcając dane przy użyciu wykładnika, który jest zoptymalizowany w celu uzyskania najlepszego dopasowania .

Ta funkcja nie jest powszechna w innych programach dopasowujących dystrybucję, które zwykle obejmują jedynie transformację logarytmiczną danych uzyskujących rozkłady, takie jak lognormalny i loglogistyczny .

Uogólnienie rozkładów symetrycznych (takich jak normalny i logistyczny ) sprawia, że ​​można je stosować do danych o rozkładzie skośnym w prawo (przy użyciu wykładnika <1), jak również do danych o rozkładzie skośnym w lewo (przy użyciu wykładnik >1). Zwiększa to wszechstronność rozkładów symetrycznych.

(A) Pochylenie rozkładu prawdopodobieństwa Gumbela w prawo i (B) Lustrzane pochylenie Gumbela w lewo

Odwracanie rozkładów

Rozkłady skośne można odzwierciedlić przez odwrócenie rozkładu (patrz funkcja przeżycia lub funkcja rozkładu komplementarnego ), aby zmienić skośność z dodatniej na ujemną i odwrotnie. Zwiększa to liczbę odpowiednich rozkładów i zwiększa szansę na znalezienie lepszego dopasowania. CumFreq korzysta z tej możliwości.

Przesuwanie rozkładów

Gdy występują dane ujemne, które nie są poparte rozkładem prawdopodobieństwa, model wykonuje przesunięcie rozkładu na stronę dodatnią, a po dopasowaniu rozkład jest cofany.

Dziewięć krzywych okresu zwrotu 50-letnich próbek z teoretycznego zapisu 1000-letniego (linia bazowa)

Pasy zaufania

Oprogramowanie wykorzystuje rozkład dwumianowy do określenia przedziału ufności odpowiedniej funkcji rozkładu skumulowanego .

Prognozie okresu zwrotu , która jest przedmiotem zainteresowania szeregów czasowych , towarzyszy również pas ufności. Konstrukcja pasów zaufania nie występuje w większości innych programów.

Rysunek po prawej stronie pokazuje zmienność, która może wystąpić podczas uzyskiwania próbek zmiennej zgodnej z określonym rozkładem prawdopodobieństwa. Dane dostarczył Benson.

Lista rozkładów prawdopodobieństwa uszeregowanych według dobroci dopasowania, przykład

Pas ufności wokół eksperymentalnej krzywej skumulowanej częstotliwości lub okresu powrotu daje wyobrażenie o regionie, w którym można znaleźć prawdziwy rozkład.

Wyjaśnia również, że eksperymentalnie znaleziony najlepiej dopasowany rozkład prawdopodobieństwa może odbiegać od prawdziwego rozkładu.

Histogram i gęstość prawdopodobieństwa zbioru danych pasującego do rozkładu GEV

Dobroć dopasowania

Cumfreq tworzy listę rozkładów uszeregowanych według dobroci dopasowania .

Histogram i funkcja gęstości

Z skumulowanej funkcji dystrybucji (CDF) można wyprowadzić histogram i funkcję gęstości prawdopodobieństwa (PDF).

Kalkulator

Kalkulator rozkładu prawdopodobieństwa używany w oprogramowaniu CumFreq

Oprogramowanie oferuje możliwość skorzystania z kalkulatora rozkładu prawdopodobieństwa. Skumulowana częstotliwość i okres powrotu są podane jako funkcja wartości danych wejściowych. Dodatkowo pokazane są przedziały ufności. Odwrotnie wartość prezentowana jest po podaniu skumulowanej częstotliwości lub okresu zwrotu.

Zobacz też