Centrum k metryczne


W teorii grafów metryczny k -centrum problem jest kombinatorycznym problemem optymalizacyjnym badanym w informatyce teoretycznej . Biorąc pod uwagę n miast o określonych odległościach, chcemy zbudować k magazynów w różnych miastach i zminimalizować maksymalną odległość miasta od magazynu. W teorii grafów oznacza to znalezienie zbioru k wierzchołków , dla których największa odległość dowolnego punktu do jego najbliższego wierzchołka w k -zestaw jest minimalny. Wierzchołki muszą znajdować się w przestrzeni metrycznej , tworząc pełny wykres spełniający nierówność trójkąta .

Definicja formalna


Niech będzie przestrzenią metryczną , w której zbiorem, a jest metryką ZA zestaw jest dostarczany wraz z parametrem . Celem jest znalezienie podzbioru
z tak, że maksymalna odległość punktu w do najbliższego punktu w do jest zminimalizowane. Problem można formalnie zdefiniować w następujący sposób: dla przestrzeni metrycznej ( d ),

  • : zestaw i parametr .
  • : zbiór punktów do
  • Cel: zminimalizować koszt re (v, )

każdy punkt w klastrze znajduje się co najwyżej w odległości .


K-Center Clustering problem można również zdefiniować na kompletnym grafie nieskierowanym G = ( V , E ) w następujący sposób: Dany kompletny graf nieskierowany G = ( V , E ) z odległościami d ( v i , v j ) ∈ N spełnia nierówność trójkąta, znajdź podzbiór C V z | C | = k podczas minimalizacji:

Złożoność obliczeniowa

W pełnym grafie nieskierowanym G = ( V , E ), jeśli posortujemy krawędzie w niemalejącym porządku odległości: d ( e 1 ) ≤ d ( e 2 ) ≤ … ≤ d ( em ) i niech G i = (V, mi ja ), gdzie mi ja = { mi 1 , mi 2 , …, mi ja }. k _ Problem -centrum jest równoważny znalezieniu najmniejszego indeksu i takiego, że G i ma dominujący zbiór rozmiarów co najwyżej k .

Chociaż zbiór dominujący jest NP-zupełny , problem k -centrum pozostaje NP-trudny . Jest to jasne, ponieważ optymalność danego możliwego rozwiązania problemu k -centrum można określić za pomocą redukcji zbioru dominującego tylko wtedy, gdy znamy na pierwszym miejscu rozmiar rozwiązania optymalnego (tj. najmniejszy indeks i taki, że G i ma dominującym zbiorem wielkości co najwyżej k ), co jest właśnie trudnym rdzeniem problemów NP-trudnych . Chociaż Redukcja Turinga może obejść ten problem, wypróbowując wszystkie wartości k .

przybliżenia

Prosty algorytm zachłanny

Prosty algorytm zachłannej aproksymacji , który osiąga współczynnik aproksymacji równy 2, buduje najdalszego pierwszego przejścia w k iteracjach. Ten algorytm po prostu wybiera punkt najbardziej oddalony od bieżącego zestawu centrów w każdej iteracji jako nowe centrum. Można to opisać następująco:

  • Wybierz dowolny punkt do do
  • dla każdego punktu oblicz od do
  • Wybierz punkt o największej odległości od .
  • do zestawu centrów i oznacz ten rozszerzony zestaw centrów jako do . Kontynuuj to, aż znajdziesz k centrów

Czas działania

  • I- iteracja wyboru tego centrum zajmuje
  • Jest k takich iteracji.
  • algorytm _

Dowód współczynnika przybliżenia

Rozwiązanie otrzymane za pomocą prostego algorytmu zachłannego jest przybliżeniem 2 do rozwiązania optymalnego. Ta sekcja koncentruje się na udowodnieniu tego współczynnika przybliżenia.

Biorąc pod uwagę zbiór n punktów należących do przestrzeni metrycznej ( , d) , zachłanny algorytm K -center oblicza zbiór K z k centrów, tak że K jest przybliżeniem 2 do optymalnego skupienia k -center V .

tj.

Twierdzenie to można udowodnić za pomocą dwóch przypadków w następujący sposób,

Przypadek 1: Każdy klaster zawiera dokładnie jeden punkt

  • Rozważmy punkt
  • Niech do będzie centrum, do którego należy w do
  • Niech będzie środkiem , czyli w
  • Podobnie
  • Z nierówności trójkąta:


2 Istnieją i są dla niektórych (Zgodnie z zasadą przegródki, jest to jedyna inna możliwość)

  • Załóżmy, bez utraty ogólności, że później dodany do zbioru centralnego zachłanny algorytm, powiedzmy w tej .
  • Ale ponieważ zachłanny algorytm zawsze wybiera punkt najbardziej oddalony od bieżącego zestawu środków, mamy to i,

Kolejny algorytm aproksymacji 2-czynnikowej

Inny algorytm z tym samym współczynnikiem przybliżenia wykorzystuje fakt, że problem k -Center jest równoważny znalezieniu najmniejszego indeksu i takiego, że G i ma dominujący zbiór wielkości co najwyżej k i oblicza maksymalny niezależny zbiór Gi , patrząc dla najmniejszego indeksu i , który ma maksymalny niezależny zbiór o rozmiarze co najmniej k . Nie jest możliwe znalezienie algorytmu aproksymacji ze współczynnikiem aproksymacji 2 - ε dla dowolnego ε > 0, chyba że P = NP. Ponadto odległości wszystkich krawędzi w G muszą spełniać nierówność trójkąta, jeśli k ma być aproksymowany w dowolnym stałym współczynniku, chyba że P = NP.

Sparametryzowane przybliżenia

Można pokazać, że problem k -Center jest W[2]-trudny do aproksymacji w ramach współczynnika 2 - ε dla dowolnego ε > 0, gdy używamy k jako parametru. Dotyczy to również parametryzacji według wymiaru podwojenia (w rzeczywistości wymiaru metryki Manhattanu ), chyba że P=NP . Biorąc pod uwagę połączony parametr określony przez k i wymiar podwojenia , k -Center jest nadal W[1]-twarde, ale możliwe jest uzyskanie sparametryzowanego schematu aproksymacji . Jest to nawet możliwe dla wariantu z pojemnościami wierzchołków, które określają, ile wierzchołków można przypisać do otwartego środka rozwiązania.

Zobacz też

  1. ^ a b c   Har-peled, Sariel (2011). Algorytmy aproksymacji geometrycznej . Boston, MA, USA: Amerykańskie Towarzystwo Matematyczne. ISBN 0821849115 .
  2. ^   Vazirani, Vijay V. (2003), Algorytmy aproksymacji , Berlin: Springer, s. 47–48, ISBN 3-540-65367-8
  3. ^ Gonzalez, Teofilo F. (1985), „Klastrowanie w celu zminimalizowania maksymalnej odległości między klastrami”, Theoretical Computer Science , tom. 38, Elsevier Science BV, s. 293–306, doi : 10.1016/0304-3975(85)90224-5
  4. ^   Hochbaum Dorit S .; Shmoys, David B. (1986), „Ujednolicone podejście do algorytmów aproksymacji dla problemów wąskich gardeł”, Journal of the ACM , tom. 33, s. 533–550, ISSN 0004-5411
  5. ^   Hochbaum, Dorit S. (1997), Algorytmy aproksymacji dla problemów NP-trudnych , Boston: PWS Publishing Company, s. 346–398, ISBN 0-534-94968-1
  6. ^ Crescenzi, Pierluigi; Kann, Viggo; Halldórsson, Magnus; Karpiński, Marek ; Woeginger, Gerhard (2000), „Minimalne centrum k”, Kompendium problemów optymalizacji NP
  7. ^   Feldmann, Andreas Emil (2019-03-01). „Aproksymacje ze stałymi parametrami dla problemów k-Center na wykresach wymiarów autostrad o niskim poziomie” . Algorytmika . 81 (3): 1031–1052. doi : 10.1007/s00453-018-0455-0 . ISSN 1432-0541 .
  8. ^   Feder, Tomás; Greene, Daniel (1988-01-01). „Optymalne algorytmy dla przybliżonego grupowania” . Materiały z dwudziestego dorocznego sympozjum ACM poświęconego teorii obliczeń . STOK '88. Nowy Jork, NY, USA: Association for Computing Machinery: 434–444. doi : 10.1145/62212.62255 . ISBN 978-0-89791-264-8 .
  9. ^   Feldmann, Andreas Emil; Marks, Daniel (2020-07-01). „Sparametryzowana twardość problemu k-centrum w sieciach transportowych” . Algorytmika . 82 (7): 1989–2005. doi : 10.1007/s00453-020-00683-w . ISSN 1432-0541 .
  10. ^   Feldmann, Andreas Emil; Vu, Tung Anh (2022). Bekos, Michael A.; Kaufmann, Michael (red.). „Uogólnione centrum $$k$$: rozróżnianie podwojenia i wymiaru autostrady” . Graf-teoretyczne koncepcje w informatyce . Cham: Springer International Publishing: 215–229. doi : 10.1007/978-3-031-15914-5_16 . ISBN 978-3-031-15914-5 .

Dalsza lektura