Uczciwe losowe przypisanie
Sprawiedliwe losowe przypisanie (zwane także probabilistycznym dopasowaniem jednostronnym ) jest rodzajem problemu sprawiedliwego podziału .
W problemie przypisania (zwanym także problemem alokacji domów lub jednostronnym dopasowywaniem ) jest m obiektów i muszą one być przydzielone między n agentów, tak aby każdy agent otrzymał co najwyżej jeden obiekt. Przykłady obejmują przydzielanie zadań pracownikom, pokojów współlokatorom, akademików studentom, przedziałów czasowych użytkownikom wspólnej maszyny i tak dalej.
Ogólnie rzecz biorąc, uczciwy przydział może być niemożliwy do osiągnięcia. Na przykład, jeśli Alicja i Batya wolą pokój wschodni od zachodniego, tylko jedno z nich go dostanie, a drugie będzie zazdrosne. W losowego przydziału sprawiedliwość osiąga się za pomocą loterii. Tak więc w powyższym prostym przykładzie Alicja i Batya rzucają uczciwą monetą, a zwycięzca otrzyma wschodni pokój.
Historia
Losowy przydział jest już wspomniany w Biblii : zastosowano loterię, aby przydzielić ziemie Kanaanu między plemiona Izraela (Liczb 26:55).
W Stanach Zjednoczonych loterie służyły do przydzielania terenów publicznych osadnikom (np. Oklahoma w 1901 r.) oraz do przydzielania widm radiowych nadawcom (np. FCC 1981-1993). Loteria jest nadal używana do przyznawania zielonych kart .
Metody
Istnieje kilka sposobów rozszerzenia metody „rzutu monetą” na sytuacje, w których agentów jest więcej niż dwóch i mogą oni mieć różne relacje preferencji względem obiektów:
- Losowy priorytet (RP, inaczej Random Serial Dictatorship lub RSD) to bardzo prosty mechanizm, który wymaga od agentów jedynie uporządkowania poszczególnych przedmiotów. Wybiera losową kolejność priorytetów przedmiotów i pozwala każdemu agentowi po kolei wybrać swój ulubiony pozostały przedmiot.
- Probabilistic Serial (PS) to kolejny mechanizm, który działa tylko z porządkowym rankingiem przedmiotów. Agenci „zjadają” swoje ulubione pozostałe przedmioty ze stałą prędkością, a ułamek, który każdy agent zdołał zjeść, to jego/jej prawdopodobieństwo zdobycia tego przedmiotu.
- Równowaga konkurencyjna wynikająca z równych dochodów (CEEI) to mechanizm rynkowy: każdy przedmiot jest postrzegany jako towar podzielny. Każdy agent otrzymuje równy budżet w walucie fiducjarnej, następnie agenci mogą handlować, aż do osiągnięcia równowagi cenowej . Jest to bardziej złożony mechanizm, który wymaga, aby agenci mieli pełne kardynalne funkcje użyteczności (lub alternatywnie ranking porządkowy w loteriach).
Nieruchomości
Efektywność
Jedną z pożądanych właściwości reguły losowego przydziału jest efektywność Pareto (PE). Istnieją trzy warianty PE:
- Ex-post PE oznacza, że po ustaleniu ostatecznej alokacji żadna inna alokacja nie jest lepsza dla jednego agenta i co najmniej tak dobra dla innych. Wszystkie trzy powyższe zasady (RP, PS i CEEI) są ex post PE.
- Ex-ante PE jest silniejszą właściwością, istotną dla agentów o użyteczności kardynalnej. Oznacza to, że żadna inna loteria nie jest lepsza dla jednego agenta i co najmniej tak dobra dla innych. CEEI jest ex-ante PE, gdy agenci porównują loterie na podstawie ich oczekiwanej użyteczności.
- Możliwy PE (lub sd-PE) jest właściwością pośrednią, odpowiednią dla agentów o użyteczności porządkowej . Oznacza to, że alokacja jest ex-ante PE dla niektórych funkcji wyceny zgodna z porządkowym rankingiem agentów. PS jest możliwe - PE, ale RP nie.
W przypadku PE implikacje są następujące: ex ante → sd(możliwe) → ex post .
Uczciwość
Inną pożądaną właściwością jest brak zazdrości (EF). Ponownie, istnieją trzy warianty EF:
- Ex post EF oznacza, że po ustaleniu ostatecznej alokacji żaden agent nie preferuje alokacji innego agenta. Żadna reguła nie spełnia tej silnej właściwości; w rzeczywistości znalezienie alokacji niepodzielnych obiektów ex post może być niemożliwe.
- Ex-ante EF jest słabszą właściwością, istotną dla agentów o użyteczności kardynalnej. Oznacza to, że żaden agent nie preferuje loterii innego agenta. CEEI to oczekiwane użyteczności ex ante EF wrt.
- Niezbędny EF (lub sd-EF) to właściwość pośrednia, istotna dla agentów o użyteczności porządkowej . Oznacza to, że alokacja jest ex ante EF (patrz poniżej) dla wszystkich funkcji wyceny zgodnych z porządkowym rankingiem agentów. PS jest konieczne-EF, ale RP nie. RP jest słabo ex-ante sd-EF; jest to EF, gdy agenci porównują loterie według dominacji leksykograficznej (ld-EF).
Dla EF kierunek implikacji jest przeciwny do kierunku efektywności: ex-post → sd(niezbędne) → ex-ante .
Prawdomówność
Trzecią pożądaną właściwością jest prawdomówność (zwana także strategią). Ponownie mamy trzy warianty:
- Prawdomówność ex ante, istotna dla agentów z kardynalną użytecznością, oznacza, że żaden agent nie może wygrać lepszej loterii, zgłaszając fałszywe wyceny. Jest to silna właściwość, której nie spełnia żaden nietrywialny mechanizm.
- Możliwa prawdomówność jest słabszą właściwością, istotną dla agentów o użyteczności porządkowej . Oznacza to, że agent nie może uzyskać stochastycznie dominującej loterii, zgłaszając fałszywy ranking. Ta słaba właściwość jest spełniona przez PS, gdy wszystkie rankingi są ścisłe i na osobę przypada co najwyżej jeden obiekt. W tym układzie jest to również zgodne z prawdą z dominacją leksykograficzną ( ld-truthful ). Nie jest usatysfakcjonowany, gdy rankingi są słabe.
- Konieczna prawdomówność jest silniejszą właściwością, istotną dla agentów o użyteczności porządkowej . Oznacza to, że agent zgłaszający fałszywy ranking zawsze otrzymuje loterię zdominowaną stochastycznie. Tę mocną właściwość spełnia RP i można ją zgodnie z prawdą rozszerzyć także na ogólny przypadek, gdy przedmiotów jest więcej niż ludzi.
Poniższa tabela porównuje właściwości różnych reguł (kolumny RP i PS są oparte na ):
#przedmioty ≤ #agenci | #przedmioty > #agenci | |||||
---|---|---|---|---|---|---|
RP | PS | CEEI | RP | PS | CEEI | |
Efektywność: | PE ex post | Możliwy PE | ex-ante PE | NIE | możliwe PE | ex-ante PE |
Uczciwość : | Słaby sd-EF; ld-EF |
Niezbędny EF | EF ex-ante | Słaby sd-EF | sd-EF | EF |
Prawdomówność: | Koniecznie zgodny z prawdą | Możliwe sd-prawdziwe; ld-truthful [ścisłe preferencje]
Brak [słabe preferencje] |
NIE | sd-prawdziwy* | NIE | NIE |
Niemożliwe kombinacje
Niektóre kombinacje powyższych trzech właściwości nie mogą być jednocześnie spełnione przez żaden mechanizm:
- W przypadku agentów o użyteczności kardynalnej Zhou udowadnia, że żaden mechanizm nie spełnia kryteriów wydajności ex ante , prawdziwości ex ante i równego traktowania równych (= agenci o identycznych funkcjach użyteczności powinni uzyskać taką samą użyteczność).
- agentom o ściśle określonych użytecznościach porządkowych, że żaden mechanizm nie spełnia możliwej skuteczności , koniecznej prawdomówności i równego traktowania równych .
- W przypadku agentów o słabej użyteczności porządkowej Katta i Sethuraman dowodzą, że żaden mechanizm nie spełnia możliwej wydajności , możliwej prawdomówności i niezbędnej wolności od zazdrości .
Dekompozycja ułamkowej alokacji
Zarówno zasady PS, jak i CEEI obliczają macierz oczekiwanych przypisań, tj. krańcowe prawdopodobieństwa, z jakimi każdy agent otrzymuje każdy obiekt. Ponieważ jednak ostateczna alokacja musi być dopasowaniem, należy znaleźć rozkład tej macierzy na loterię dopasowań.
W klasycznym układzie, w którym m = n , można to zrobić za pomocą algorytmu Birkhoffa . Może rozłożyć dowolną n -na- n prawdopodobieństw agenta-obiektu na wypukłą kombinację macierzy permutacji O( n2 ) , z których każda reprezentuje dopasowanie . Jednak rozkład nie jest wyjątkowy, a niektóre rozkłady mogą być lepsze niż inne.
Budish, Che, Kojima i Milgrom uogólniają algorytm Birkhoffa na dowolne m i n . Pozwalają również na dodawanie ograniczeń do przypisań, przy maksymalnym zbiorze warunków na zbiorze ograniczeń. Przedstawiają również metodę dekompozycji, która minimalizuje różnice w użyteczności doświadczanej przez agentów między różnymi dopasowaniami.
Demeulemeester, Goossens, Hermans i Leus przedstawiają algorytm dekompozycji w czasie wielomianowym, który maksymalizuje liczbę agentów otrzymujących obiekt w najgorszym przypadku. Ich algorytm gwarantuje, że liczba agentów w najgorszym przypadku równa się oczekiwanej liczbie agentów zaokrąglonej w dół, czyli najlepszej możliwej. Przedstawiają inny algorytm dekompozycji, który maksymalizuje liczbę przypisanych agentów w najgorszym przypadku, gwarantując jednocześnie, że wszystkie dopasowania w dekompozycji będą ex post PE; drugi algorytm może być użyty tylko do przypisań ułamkowych wyprowadzanych przez PS, ale nie do przypisań odpowiadających RP. W przypadku RP możliwe jest jedynie osiągnięcie 1/2-czynnikowego przybliżenia optymalnej najgorszej liczby przypisanych agentów. W przypadku ogólnych przydziałów ułamkowych maksymalizacja najgorszej liczby przydzielonych agentów podlegających PE ex post jest NP-trudna. Przedstawiają również generowania kolumn , które można wykorzystać do optymalizacji innych najgorszych kryteriów.
Porównanie empiryczne
Hosseini, Larson i Cohen porównują RP do PS w różnych ustawieniach. Pokazują, że:
- Kiedy są co najwyżej 2 obiekty i co najwyżej 3 agentów, RP i PS zwracają ten sam przydział.
- Kiedy są co najwyżej 2 obiekty, dla dowolnej liczby agentów, PS jest sd-prawdziwy, a RP jest wolny od zazdrości, aw większości przypadków PS dominuje RP, szczególnie przy 4 lub więcej agentach.
- Gdy istnieją 3 lub więcej obiektów (i 3 lub więcej agentów), RP i PS mogą zwracać różne alokacje i żadna alokacja nie dominuje nad drugą. Załóżmy na przykład, że istnieją trzy obiekty a, b, c i trzej agenci z rankingami preferencji (1) a>c>b, (2) a>b>c, (3) b>a>c. Następnie agentowi (1) zarówno RP, jak i PS dają 1/2 a + 1/2 c; agentowi (2), RP daje 1/2 a + 1/6 b + 1/3 c, podczas gdy PS daje 1/2 a + 1/4 b + 1/4 c, co jest stochastycznie dominujące ; a agentowi (3), RP daje 5/6 b + 1/6 c, podczas gdy PS daje 3/4 b + 1/4 c, co jest zdominowane stochastycznie. Tak więc (1) jest obojętny, (2) ściśle preferuje PS i (3) ściśle preferuje RP.
- Ułamek profili preferencji, dla których PS sd dominuje RP, jest duży, gdy liczba agentów i obiektów jest różna, ale zbliża się do 0, gdy liczby są równe. To samo dotyczy dominacji ld.
- Gdy agenci są neutralni pod względem ryzyka , oczekiwany dobrobyt społeczny PS jest większy niż RP, ale różnica jest znacząca tylko wtedy, gdy n≠m . W przypadku RP frakcja zazdrosnych agentów jest bliska zeru, gdy n ≥ m. PS można manipulować, a zysk z manipulacji wzrasta, gdy m > n .
- Kiedy agenci poszukują ryzyka , oczekiwany dobrobyt społeczny PS jest większy niż RP, a różnica szybko rośnie, gdy n≠m. Natomiast gdy n = m RP w większości przypadków osiąga wyższy dobrobyt społeczny. W przypadku RP frakcja zazdrosnych agentów jest bliska zeru, gdy n ≥ m, ale generuje zazdrość, gdy m>n. Zazdrość o RP maleje, gdy wzrasta skłonność do ryzyka. Zysk z manipulowania PS maleje, gdy agenci są bardziej skłonni do ryzyka.
- Kiedy agenci mają awersję do ryzyka , różnica w dobrobycie społecznym między RP a PS zmniejsza się (choć nadal jest istotna statystycznie). Odsetek agentów zazdrosnych w RP wzrasta, ale zazdrość pozostaje poniżej 0,01, gdy n ≥ m . Manipulowalność PS spada do 1, gdy m / n .
Rozszerzenia
Tao i Cole badają istnienie losowych alokacji PE i EF, gdy użyteczności są nieliniowe (mogą mieć dopełnienia).
Yilmaz bada problem losowego przydziału, w którym agenci mają fundusze.
Zobacz też
- Harmonia czynszów to wariant problemu przypisania, w którym sprawiedliwość osiąga się za pomocą płatności pieniężnych zamiast losowości.
- Sprawiedliwy przydział przedmiotów to ustawienie, w którym agenci mogą otrzymać więcej niż jeden przedmiot.
- Sortowanie - losowy wybór urzędników politycznych.