Dane zastępcze
Dane zastępcze , czasami nazywane danymi analogicznymi , zwykle odnoszą się do danych szeregów czasowych , które są tworzone przy użyciu dobrze zdefiniowanych (liniowych) modeli, takich jak procesy ARMA , które odtwarzają różne właściwości statystyczne, takie jak struktura autokorelacji zbioru danych pomiarowych. Otrzymane dane zastępcze można następnie wykorzystać na przykład do testowania nieliniowej struktury danych empirycznych, patrz testowanie danych zastępczych .
Dane zastępcze lub analogiczne mogą odnosić się do danych wykorzystywanych w celu uzupełnienia dostępnych danych, z których zbudowany jest model matematyczny . Zgodnie z tą definicją mogą być generowane (tj. dane syntetyczne ) lub przekształcane z innego źródła.
Używa
Dane zastępcze są wykorzystywane w warunkach środowiskowych i laboratoryjnych, gdy dane badawcze z jednego źródła są wykorzystywane do szacowania cech innego źródła. Na przykład był używany do modelowania trendów populacji gatunków zwierząt. Można go również wykorzystać do modelowania różnorodności biologicznej, ponieważ trudno byłoby zebrać rzeczywiste dane dotyczące wszystkich gatunków na danym obszarze.
Dane zastępcze mogą być wykorzystywane w prognozowaniu. Dane z podobnych serii można łączyć, aby poprawić dokładność prognoz. Wykorzystanie danych zastępczych może umożliwić modelowi uwzględnienie wzorców niewidocznych w danych historycznych.
Innym zastosowaniem danych zastępczych jest testowanie modeli pod kątem nieliniowości. Termin testowanie danych zastępczych odnosi się do algorytmów używanych do analizowania modeli w ten sposób. Testy te zwykle obejmują generowanie danych, podczas gdy dane zastępcze można ogólnie uzyskać lub zebrać na wiele sposobów.
Metody
Jedną z metod danych zastępczych jest znalezienie źródła o podobnych warunkach lub parametrach i wykorzystanie tych danych w modelowaniu. Inną metodą jest skupienie się na wzorcach systemu bazowego i poszukiwanie podobnego wzorca w powiązanych źródłach danych (na przykład wzorce w innych pokrewnych gatunkach lub obszarach środowiskowych).
Zamiast wykorzystywać istniejące dane z oddzielnego źródła, dane zastępcze mogą być generowane za pomocą procesów statystycznych, które mogą obejmować losowe generowanie danych z wykorzystaniem ograniczeń modelu lub systemu.
Zobacz też
Dalsza lektura
- Schreiber, T.; Schmitz, A. (1996). „Ulepszone dane zastępcze do testów nieliniowości”. Fizyczne listy przeglądowe . 77 (4): 635–638. arXiv : chao-dyn/9909041 . Bibcode : 1996PhRvL..77..635S . doi : 10.1103/PhysRevLett.77.635 . PMID 10062864 . S2CID 13193081 .