Uczciwe losowe przypisanie

Sprawiedliwe losowe przypisanie (zwane także probabilistycznym dopasowaniem jednostronnym ) jest rodzajem problemu sprawiedliwego podziału .

W problemie przypisania (zwanym także problemem alokacji domów lub jednostronnym dopasowywaniem ) jest m obiektów i muszą one być przydzielone między n agentów, tak aby każdy agent otrzymał co najwyżej jeden obiekt. Przykłady obejmują przydzielanie zadań pracownikom, pokojów współlokatorom, akademików studentom, przedziałów czasowych użytkownikom wspólnej maszyny i tak dalej.

Ogólnie rzecz biorąc, uczciwy przydział może być niemożliwy do osiągnięcia. Na przykład, jeśli Alicja i Batya wolą pokój wschodni od zachodniego, tylko jedno z nich go dostanie, a drugie będzie zazdrosne. W losowego przydziału sprawiedliwość osiąga się za pomocą loterii. Tak więc w powyższym prostym przykładzie Alicja i Batya rzucają uczciwą monetą, a zwycięzca otrzyma wschodni pokój.

Historia

Losowy przydział jest już wspomniany w Biblii : zastosowano loterię, aby przydzielić ziemie Kanaanu między plemiona Izraela (Liczb 26:55).

W Stanach Zjednoczonych loterie służyły do przydzielania terenów publicznych osadnikom (np. Oklahoma w 1901 r.) oraz do przydzielania widm radiowych nadawcom (np. FCC 1981-1993). Loteria jest nadal używana do przyznawania zielonych kart .

Metody

Istnieje kilka sposobów rozszerzenia metody „rzutu monetą” na sytuacje, w których agentów jest więcej niż dwóch i mogą oni mieć różne relacje preferencji względem obiektów:

Losowy priorytet (RP, inaczej Random Serial Dictatorship lub RSD) to bardzo prosty mechanizm, który wymaga od agentów jedynie uporządkowania poszczególnych przedmiotów. Wybiera losową kolejność priorytetów przedmiotów i pozwala każdemu agentowi po kolei wybrać swój ulubiony pozostały przedmiot.
Probabilistic Serial (PS) to kolejny mechanizm, który działa tylko z porządkowym rankingiem przedmiotów. Agenci „zjadają” swoje ulubione pozostałe przedmioty ze stałą prędkością, a ułamek, który każdy agent zdołał zjeść, to jego/jej prawdopodobieństwo zdobycia tego przedmiotu.
Równowaga konkurencyjna wynikająca z równych dochodów (CEEI) to mechanizm rynkowy: każdy przedmiot jest postrzegany jako towar podzielny. Każdy agent otrzymuje równy budżet w walucie fiducjarnej, następnie agenci mogą handlować, aż do osiągnięcia równowagi cenowej . Jest to bardziej złożony mechanizm, który wymaga, aby agenci mieli pełne kardynalne funkcje użyteczności (lub alternatywnie ranking porządkowy w loteriach).

Nieruchomości

Efektywność

Jedną z pożądanych właściwości reguły losowego przydziału jest efektywność Pareto (PE). Istnieją trzy warianty PE:

Ex-post PE oznacza, że po ustaleniu ostatecznej alokacji żadna inna alokacja nie jest lepsza dla jednego agenta i co najmniej tak dobra dla innych. Wszystkie trzy powyższe zasady (RP, PS i CEEI) są ex post PE.
Ex-ante PE jest silniejszą właściwością, istotną dla agentów o użyteczności kardynalnej. Oznacza to, że żadna inna loteria nie jest lepsza dla jednego agenta i co najmniej tak dobra dla innych. CEEI jest ex-ante PE, gdy agenci porównują loterie na podstawie ich oczekiwanej użyteczności.
Możliwy PE (lub sd-PE) jest właściwością pośrednią, odpowiednią dla agentów o użyteczności porządkowej . Oznacza to, że alokacja jest ex-ante PE dla niektórych funkcji wyceny zgodna z porządkowym rankingiem agentów. PS jest możliwe - PE, ale RP nie.

W przypadku PE implikacje są następujące: ex ante → sd(możliwe) → ex post .

Uczciwość

Inną pożądaną właściwością jest brak zazdrości (EF). Ponownie, istnieją trzy warianty EF:

Ex post EF oznacza, że po ustaleniu ostatecznej alokacji żaden agent nie preferuje alokacji innego agenta. Żadna reguła nie spełnia tej silnej właściwości; w rzeczywistości znalezienie alokacji niepodzielnych obiektów ex post może być niemożliwe.
Ex-ante EF jest słabszą właściwością, istotną dla agentów o użyteczności kardynalnej. Oznacza to, że żaden agent nie preferuje loterii innego agenta. CEEI to oczekiwane użyteczności ex ante EF wrt.
Niezbędny EF (lub sd-EF) to właściwość pośrednia, istotna dla agentów o użyteczności porządkowej . Oznacza to, że alokacja jest ex ante EF (patrz poniżej) dla wszystkich funkcji wyceny zgodnych z porządkowym rankingiem agentów. PS jest konieczne-EF, ale RP nie. RP jest słabo ex-ante sd-EF; jest to EF, gdy agenci porównują loterie według dominacji leksykograficznej (ld-EF).

Dla EF kierunek implikacji jest przeciwny do kierunku efektywności: ex-post → sd(niezbędne) → ex-ante .

Prawdomówność

Trzecią pożądaną właściwością jest prawdomówność (zwana także strategią). Ponownie mamy trzy warianty:

Prawdomówność ex ante, istotna dla agentów z kardynalną użytecznością, oznacza, że żaden agent nie może wygrać lepszej loterii, zgłaszając fałszywe wyceny. Jest to silna właściwość, której nie spełnia żaden nietrywialny mechanizm.

Możliwa prawdomówność jest słabszą właściwością, istotną dla agentów o użyteczności porządkowej . Oznacza to, że agent nie może uzyskać stochastycznie dominującej loterii, zgłaszając fałszywy ranking. Ta słaba właściwość jest spełniona przez PS, gdy wszystkie rankingi są ścisłe i na osobę przypada co najwyżej jeden obiekt. W tym układzie jest to również zgodne z prawdą z dominacją leksykograficzną ( ld-truthful ). Nie jest usatysfakcjonowany, gdy rankingi są słabe.
Konieczna prawdomówność jest silniejszą właściwością, istotną dla agentów o użyteczności porządkowej . Oznacza to, że agent zgłaszający fałszywy ranking zawsze otrzymuje loterię zdominowaną stochastycznie. Tę mocną właściwość spełnia RP i można ją zgodnie z prawdą rozszerzyć także na ogólny przypadek, gdy przedmiotów jest więcej niż ludzi.

Poniższa tabela porównuje właściwości różnych reguł (kolumny RP i PS są oparte na ):


	#przedmioty ≤ #agenci			#przedmioty > #agenci
	RP	PS	CEEI	RP	PS	CEEI
Efektywność:	PE ex post	Możliwy PE	ex-ante PE	NIE	możliwe PE	ex-ante PE
Uczciwość :	Słaby sd-EF; ld-EF	Niezbędny EF	EF ex-ante	Słaby sd-EF	sd-EF	EF
Prawdomówność:	Koniecznie zgodny z prawdą	Możliwe sd-prawdziwe; ld-truthful _{[ścisłe preferencje]} Brak _{[słabe preferencje]}	NIE	sd-prawdziwy*	NIE	NIE

Niemożliwe kombinacje

Niektóre kombinacje powyższych trzech właściwości nie mogą być jednocześnie spełnione przez żaden mechanizm:

W przypadku agentów o użyteczności kardynalnej Zhou udowadnia, że żaden mechanizm nie spełnia kryteriów wydajności ex ante , prawdziwości ex ante i równego traktowania równych (= agenci o identycznych funkcjach użyteczności powinni uzyskać taką samą użyteczność).
agentom o ściśle określonych użytecznościach porządkowych, że żaden mechanizm nie spełnia możliwej skuteczności , koniecznej prawdomówności i równego traktowania równych .
W przypadku agentów o słabej użyteczności porządkowej Katta i Sethuraman dowodzą, że żaden mechanizm nie spełnia możliwej wydajności , możliwej prawdomówności i niezbędnej wolności od zazdrości .

Dekompozycja ułamkowej alokacji

Zarówno zasady PS, jak i CEEI obliczają macierz oczekiwanych przypisań, tj. krańcowe prawdopodobieństwa, z jakimi każdy agent otrzymuje każdy obiekt. Ponieważ jednak ostateczna alokacja musi być dopasowaniem, należy znaleźć rozkład tej macierzy na loterię dopasowań.

W klasycznym układzie, w którym m = n , można to zrobić za pomocą algorytmu Birkhoffa . Może rozłożyć dowolną n -na- n prawdopodobieństw agenta-obiektu na wypukłą kombinację macierzy permutacji O( n2 ) , z których każda reprezentuje dopasowanie ^. Jednak rozkład nie jest wyjątkowy, a niektóre rozkłady mogą być lepsze niż inne.

Budish, Che, Kojima i Milgrom uogólniają algorytm Birkhoffa na dowolne m i n . Pozwalają również na dodawanie ograniczeń do przypisań, przy maksymalnym zbiorze warunków na zbiorze ograniczeń. Przedstawiają również metodę dekompozycji, która minimalizuje różnice w użyteczności doświadczanej przez agentów między różnymi dopasowaniami.

Demeulemeester, Goossens, Hermans i Leus przedstawiają algorytm dekompozycji w czasie wielomianowym, który maksymalizuje liczbę agentów otrzymujących obiekt w najgorszym przypadku. Ich algorytm gwarantuje, że liczba agentów w najgorszym przypadku równa się oczekiwanej liczbie agentów zaokrąglonej w dół, czyli najlepszej możliwej. Przedstawiają inny algorytm dekompozycji, który maksymalizuje liczbę przypisanych agentów w najgorszym przypadku, gwarantując jednocześnie, że wszystkie dopasowania w dekompozycji będą ex post PE; drugi algorytm może być użyty tylko do przypisań ułamkowych wyprowadzanych przez PS, ale nie do przypisań odpowiadających RP. W przypadku RP możliwe jest jedynie osiągnięcie 1/2-czynnikowego przybliżenia optymalnej najgorszej liczby przypisanych agentów. W przypadku ogólnych przydziałów ułamkowych maksymalizacja najgorszej liczby przydzielonych agentów podlegających PE ex post jest NP-trudna. Przedstawiają również generowania kolumn , które można wykorzystać do optymalizacji innych najgorszych kryteriów.

Porównanie empiryczne

Hosseini, Larson i Cohen porównują RP do PS w różnych ustawieniach. Pokazują, że:

Kiedy są co najwyżej 2 obiekty i co najwyżej 3 agentów, RP i PS zwracają ten sam przydział.
Kiedy są co najwyżej 2 obiekty, dla dowolnej liczby agentów, PS jest sd-prawdziwy, a RP jest wolny od zazdrości, aw większości przypadków PS dominuje RP, szczególnie przy 4 lub więcej agentach.
Gdy istnieją 3 lub więcej obiektów (i 3 lub więcej agentów), RP i PS mogą zwracać różne alokacje i żadna alokacja nie dominuje nad drugą. Załóżmy na przykład, że istnieją trzy obiekty a, b, c i trzej agenci z rankingami preferencji (1) a>c>b, (2) a>b>c, (3) b>a>c. Następnie agentowi (1) zarówno RP, jak i PS dają 1/2 a + 1/2 c; agentowi (2), RP daje 1/2 a + 1/6 b + 1/3 c, podczas gdy PS daje 1/2 a + 1/4 b + 1/4 c, co jest stochastycznie dominujące ; a agentowi (3), RP daje 5/6 b + 1/6 c, podczas gdy PS daje 3/4 b + 1/4 c, co jest zdominowane stochastycznie. Tak więc (1) jest obojętny, (2) ściśle preferuje PS i (3) ściśle preferuje RP.
Ułamek profili preferencji, dla których PS sd dominuje RP, jest duży, gdy liczba agentów i obiektów jest różna, ale zbliża się do 0, gdy liczby są równe. To samo dotyczy dominacji ld.
Gdy agenci są neutralni pod względem ryzyka , oczekiwany dobrobyt społeczny PS jest większy niż RP, ale różnica jest znacząca tylko wtedy, gdy n≠m . W przypadku RP frakcja zazdrosnych agentów jest bliska zeru, gdy n ≥ m. PS można manipulować, a zysk z manipulacji wzrasta, gdy m > n .
Kiedy agenci poszukują ryzyka , oczekiwany dobrobyt społeczny PS jest większy niż RP, a różnica szybko rośnie, gdy n≠m. Natomiast gdy n = m RP w większości przypadków osiąga wyższy dobrobyt społeczny. W przypadku RP frakcja zazdrosnych agentów jest bliska zeru, gdy n ≥ m, ale generuje zazdrość, gdy m>n. Zazdrość o RP maleje, gdy wzrasta skłonność do ryzyka. Zysk z manipulowania PS maleje, gdy agenci są bardziej skłonni do ryzyka.
Kiedy agenci mają awersję do ryzyka , różnica w dobrobycie społecznym między RP a PS zmniejsza się (choć nadal jest istotna statystycznie). Odsetek agentów zazdrosnych w RP wzrasta, ale zazdrość pozostaje poniżej 0,01, gdy n ≥ m . Manipulowalność PS spada do 1, gdy m / n .

Rozszerzenia

Tao i Cole badają istnienie losowych alokacji PE i EF, gdy użyteczności są nieliniowe (mogą mieć dopełnienia).

Yilmaz bada problem losowego przydziału, w którym agenci mają fundusze.

Zobacz też

Harmonia czynszów to wariant problemu przypisania, w którym sprawiedliwość osiąga się za pomocą płatności pieniężnych zamiast losowości.
Sprawiedliwy przydział przedmiotów to ustawienie, w którym agenci mogą otrzymać więcej niż jeden przedmiot.
Sortowanie - losowy wybór urzędników politycznych.