Prosta głębia

Prosta głębokość w odniesieniu do sześciu czerwonych punktów próbkowania, przy użyciu zmodyfikowanej definicji Burra i in. Duże czarne liczby to głębokości w każdym regionie, a małe niebieskie liczby to głębokości wzdłuż segmentów niebieskich linii.

W solidnych statystykach i geometrii obliczeniowej głębokość symplicalna jest miarą tendencji centralnej określonej przez uproszczenia zawierające dany punkt . W przypadku płaszczyzny euklidesowej zlicza liczbę trójkątów punktów próbkowania, które zawierają dany punkt.

Definicja

Uproszczona głębokość punktu -wymiarowej przestrzeni euklidesowej to liczba -wymiarowych uproszczeń ( wypukłe kadłuby zestawów punktów ), które zawierają To samo pojęcie można uogólnić na dowolny rozkład prawdopodobieństwa w punktach płaszczyzny, a nie tylko na rozkład empiryczny przez zbiór punktów próbkowania, poprzez zdefiniowanie głębokości jako prawdopodobieństwa, że ​​​​losowo wybrana -krotka kadłub, który p . To prawdopodobieństwo można obliczyć na podstawie liczby uproszczeń, które , dzieląc przez gdzie jest punktów próbkowania

Zgodnie ze standardową definicją uproszczonej głębi, uproszczenia, które mają samo, jak uproszczenia z w swoich wnętrzach. Aby uniknąć problematycznego zachowania tej definicji, Burr, Rafalin i Souvaine (2004) zaproponowali zmodyfikowaną definicję uproszczonej głębi, w której uproszczenia z się tylko o połowę mniej. Równoważnie, ich definicja jest średnią liczby otwartych uproszczeń i liczby zamkniętych uproszczeń, które zawierać .

Nieruchomości

Uproszczona głębokość jest odporna na wartości odstające: jeśli zbiór punktów próbkowania jest reprezentowany przez punkt o maksymalnej głębokości, to nawet stała część punktów próbkowania może zostać dowolnie uszkodzona bez znaczącej zmiany położenia reprezentatywnego punktu. Jest również niezmiennikiem przy przekształceniach afinicznych płaszczyzny.

Jednak uproszczona głębokość nie ma innych pożądanych właściwości dla solidnych miar tendencji centralnej. W przypadku rozkładów centralnie symetrycznych niekoniecznie jest tak, że w środku rozkładu znajduje się unikalny punkt o maksymalnej głębokości. I wzdłuż promienia od punktu maksymalnej głębokości niekoniecznie jest tak, że uproszczona głębokość zmniejsza się monotonicznie.

Algorytmy

zestawów na ( ), euklidesowej głębokość dowolnego innego punktu , w optymalne w niektórych modelach obliczeniowych. W trzech wymiarach ten sam problem można rozwiązać w czasie .

Możliwe jest skonstruowanie struktury danych za pomocą sieci ε , które mogą przybliżać uproszczoną głębokość punktu zapytania (biorąc pod uwagę stały zestaw próbek lub zestaw próbek poddawanych wstawianiu punktów) w prawie stałym czasie na zapytanie, w dowolnym wymiarze , z przybliżeniem, którego błąd jest małym ułamkiem całkowitej liczby trójkątów określonych przez próbki. W dwóch wymiarach znany jest dokładniejszy algorytm aproksymacji, dla którego błąd aproksymacji jest niewielką wielokrotnością samej głębokości uproszczonej. Te same metody prowadzą również do algorytmów szybkiej aproksymacji w wyższych wymiarach.

p jest definiowana jako prawdopodobieństwo, że punkt jest zawarty wewnątrz losowej zamkniętej uzyskanej z pary punktów od . Podczas gdy złożoność czasowa większości innych głębokości danych rośnie wykładniczo, sferyczna głębokość rośnie tylko liniowo w wymiarze - prosty algorytm obliczania głębokości sferycznej trwa . przez głębokość sferyczną

TYŁEK.
Afshani, Peyman; Sheehy, Donald R.; Stein, Yannik (2015), Przybliżanie uproszczonej głębi , arXiv : 1512,04856 , Bibcode : 2015arXiv151204856A
ACG.
   Aloupis, Greg; Cortés, Carmen; Gomez, Franciszek; Soss, Michael; Toussaint, Godfried (2002), „Dolne granice obliczania statystycznej głębi”, Computational Statistics & Data Analysis , 40 (2): 223–229, doi : 10.1016 / S0167-9473 (02) 00032-4 , MR 1924007 , S2CID 94060939
pne.
   Bagchi, Amitabha; Chaudhary, Amitabh; Eppstein, David ; Goodrich, Michael T. (2007), „Deterministyczne próbkowanie i liczenie zakresów w strumieniach danych geometrycznych”, ACM Transactions on Algorithms , 3 (2): art. 16, 18, arXiv : cs/0307027 , doi : 10.1145/1240233.1240239 , MR 2335299 , S2CID 123315817
BRS.
Burr, Michael A.; Rafalin, Eynat; Souvaine, Diane L. (2004), „Uproszczona głębia: ulepszona definicja, analiza i wydajność dla przypadku skończonej próby” (PDF) , Proceedings of the 16th Canadian Conference on Computational Geometry, CCCG'04, Concordia University, Montréal, Quebec, Kanada, 9-11 sierpnia 2004 , s. 136-139
BS.
Bremner, Dawid; Shahsavarifar, Rasoul (2017), optymalny algorytm obliczania głębokości sferycznej punktów na płaszczyźnie , arXiv : 1702,07399 , Bibcode : 2017arXiv170207399B
WSPÓŁ.
Cheng, Andrew Y.; Ouyang, Ming (2001), „O algorytmach dla uproszczonej głębi” , Proceedings of the 13th Canadian Conference on Computational Geometry, University of Waterloo, Ontario, Kanada, 13-15 sierpnia 2001, s. 53–56
D.
  Dümbgen, Lutz (1992), „Twierdzenia graniczne dla uproszczonej głębi”, Statistics & Probability Letters , 14 (2): 119–128, doi : 10.1016/0167-7152 (92) 90075-G , MR 1173409
GSW.
  Gil, Józef; Steiger, William; Wigderson, Avi (1992), „Geometric medians”, Discrete Mathematics , 108 (1–3): 37–51, doi : 10.1016/0012-365X (92) 90658-3 , MR 1189827
KM.
L88.
L90.
  Liu, Regina Y. (1990), „O pojęciu głębi danych opartym na losowych uproszczeniach”, Annals of Statistics , 18 (1): 405–414, doi : 10.1214 / aos / 1176347507 , MR 1041400
RR.
  Rousseeuw, Peter J .; Ruts, Ida (1996), „Algorytm AS 307: Dwuwymiarowa głębokość lokalizacji”, Statystyki stosowane , 45 (4): 516, doi : 10,2307/2986073 , JSTOR 2986073
ZS.
   Zuo, Yijun; Serfling, Robert (2000), „Ogólne pojęcia statystycznej funkcji głębi”, Annals of Statistics , 28 (2): 461–482, CiteSeerX 10.1.1.27.7358 , doi : 10.1214/aos/1016218226 , MR 1790005