Randomizowany eksperyment
W nauce eksperymenty z randomizacją to eksperymenty , które pozwalają na największą wiarygodność i trafność oszacowań statystycznych efektów leczenia. Wnioskowanie oparte na randomizacji jest szczególnie ważne w projektowaniu eksperymentów i doborze ankiet .
Przegląd
W statystycznej teorii projektowania eksperymentów randomizacja obejmuje losowe przydzielanie jednostek eksperymentalnych do grup badawczych . Na przykład, jeśli w eksperymencie porównuje się nowy lek ze standardowym lekiem, pacjentów należy przydzielić albo do nowego leku, albo do standardowej grupy kontrolnej, stosując randomizację.
Randomizowane eksperymenty nie są przypadkowe. Randomizacja zmniejsza błąd systematyczny poprzez wyrównywanie innych czynników, które nie zostały wyraźnie uwzględnione w projekcie eksperymentu (zgodnie z prawem wielkich liczb ). Randomizacja prowadzi również do ignorowania projektów , które są cenne we wnioskowaniu statystycznym opartym na modelach , zwłaszcza bayesowskim lub prawdopodobieństwa -na podstawie. W projektowaniu eksperymentów najprostszym projektem porównywania terapii jest „całkowicie losowy projekt”. Pewne „ograniczenia dotyczące randomizacji” mogą wystąpić w przypadku blokowania i eksperymentów, które mają trudne do zmiany czynniki; dodatkowe ograniczenia randomizacji mogą wystąpić, gdy pełna randomizacja jest niewykonalna lub gdy pożądane jest zmniejszenie wariancji estymatorów wybranych efektów.
Randomizacja leczenia w badaniach klinicznych stwarza problemy natury etycznej. W niektórych przypadkach randomizacja ogranicza opcje terapeutyczne zarówno dla lekarza, jak i pacjenta, dlatego randomizacja wymaga klinicznej równowagi w zakresie leczenia.
Randomizowane kontrolowane eksperymenty online
Witryny internetowe mogą przeprowadzać losowo kontrolowane eksperymenty w celu stworzenia pętli sprzężenia zwrotnego. Kluczowe różnice między eksperymentami offline a eksperymentami online obejmują:
- Rejestrowanie: interakcje użytkownika mogą być rejestrowane niezawodnie.
- Liczba użytkowników: duże witryny, takie jak Amazon, Bing/Microsoft i Google, przeprowadzają eksperymenty, z których każda obejmuje ponad milion użytkowników.
- Liczba jednoczesnych eksperymentów: duże witryny przeprowadzają dziesiątki nakładających się lub równoczesnych eksperymentów.
- Roboty, niezależnie od tego, czy są to roboty indeksujące z ważnych źródeł, czy też złośliwe boty internetowe . [ wymagane wyjaśnienie ]
- Możliwość przyspieszenia eksperymentów z niskich wartości procentowych do wyższych wartości procentowych.
- Szybkość / wydajność ma znaczący wpływ na kluczowe wskaźniki.
- Możliwość wykorzystania okresu przedeksperymentalnego jako testu A/A w celu zmniejszenia wariancji.
Historia
Wydaje się, że w Księdze Daniela Starego Testamentu zasugerowano kontrolowany eksperyment. Król Nabuchodonozor zaproponował, aby niektórzy Izraelici spożywali „dzienną porcję jedzenia i wina ze stołu królewskiego”. Daniel wolał dietę wegetariańską, ale urzędnik martwił się, że król „zobaczy, że wyglądasz gorzej niż inni młodzi mężczyźni w twoim wieku? Król miałby wtedy moją głowę z twojego powodu”. Następnie Daniel zaproponował następujący kontrolowany eksperyment: „Doświadczaj swoich sług przez dziesięć dni. Daj nam tylko jarzyny do jedzenia i wodę do picia. Następnie porównaj nasz wygląd z młodzieńcami, którzy jedzą królewskie potrawy, i traktuj swoje sługi zgodnie z z tym, co widzisz”. (Dan. 1, 12–13).
Randomizowane eksperymenty zostały zinstytucjonalizowane w psychologii i edukacji pod koniec XVIII wieku, po wynalezieniu randomizowanych eksperymentów przez CS Peirce'a . Poza psychologią i edukacją losowe eksperymenty spopularyzował RA Fisher w swojej książce Statistical Methods for Research Workers , która wprowadziła również dodatkowe zasady projektowania eksperymentów.
Interpretacja statystyczna
Model przyczynowy Rubina zapewnia powszechny sposób opisywania losowego eksperymentu. Chociaż model przyczynowy Rubina zapewnia ramy do definiowania parametrów przyczynowych (tj. wpływu randomizowanego leczenia na wynik), analiza eksperymentów może przybierać różne formy. Model zakłada, że istnieją dwa potencjalne wyniki dla każdej jednostki w badaniu: wynik, jeśli jednostka zostanie poddana leczeniu i wynik, jeśli jednostka nie zostanie poddana leczeniu. Różnica między tymi dwoma potencjalnymi wynikami jest znana jako efekt leczenia, czyli przyczynowy wpływ leczenia na wynik. Najczęściej randomizowane eksperymenty są analizowane za pomocą ANOVA , test t-Studenta , analiza regresji lub podobny test statystyczny . Model uwzględnia również potencjalne czynniki zakłócające, które mogą wpływać zarówno na leczenie, jak i na wynik. Kontrolując te zakłócające czynniki, model pomaga zapewnić, że każdy obserwowany efekt leczenia jest naprawdę przyczynowy, a nie tylko wynikiem innych czynników, które są skorelowane zarówno z leczeniem, jak i wynikiem.
Model przyczynowy Rubina jest przydatnym narzędziem do zrozumienia, jak oszacować przyczynowy efekt leczenia, nawet jeśli występują zmienne zakłócające, które mogą wpływać na wynik. Model ten określa, że efektem przyczynowym leczenia jest różnica w wynikach, które zostałyby zaobserwowane dla każdej osoby, gdyby otrzymała leczenie i gdyby nie została poddana leczeniu. W praktyce nie jest możliwe obserwowanie obu potencjalnych wyników dla tej samej osoby, dlatego do oszacowania efektu przyczynowego na podstawie danych z eksperymentu stosuje się metody statystyczne.
Empiryczne dowody na to, że randomizacja ma znaczenie
Empirycznie różnice między badaniami randomizowanymi i nierandomizowanymi oraz między badaniami z randomizacją adekwatnie i nieodpowiednio były trudne do wykrycia.
Zobacz też
- Testy A/B
- Alokacja ukrycia
- Losowe zadanie
- Randomizowany projekt bloku
- Randomizowana kontrolowana próba
- Caliński, Tadeusz & Kageyama, Sanpei (2000). Projekty bloków: podejście do randomizacji, tom I : Analiza . Notatki do wykładów ze statystyki. Tom. 150. Nowy Jork: Springer-Verlag. ISBN 978-0-387-98578-7 .
- Caliński, Tadeusz & Kageyama, Sanpei (2003). Projekty blokowe: podejście do randomizacji, tom II : Projektowanie . Notatki do wykładów ze statystyki. Tom. 170. Nowy Jork: Springer-Verlag. ISBN 978-0-387-95470-7 .
- Hakowanie, Ian (wrzesień 1988). „Telepatia: początki randomizacji w projekcie eksperymentalnym”. Izyda . 79 (3): 427–451. doi : 10.1086/354775 . JSTOR 234674 . MR 1013489 . S2CID 52201011 .
- Hinkelmann, Klaus; Kempthorne, Oscar (2008). Projektowanie i analiza eksperymentów, tom I: Wprowadzenie do projektowania eksperymentów (wyd. Drugie). Wileya. ISBN 978-0-471-72756-9 . MR 2363107 .
- Kempthorne, Oscar (1992). „Eksperymenty interwencyjne, randomizacja i wnioskowanie” . W Malay Ghosh i Pramod K. Pathak (red.). Aktualne problemy wnioskowania statystycznego - eseje na cześć D. Basu . Instytut Statystyki Matematycznej Notatki z wykładów - seria monografii. Hayward, Kalifornia: Instytut Statystyki Matematycznej. s. 13–31. doi : 10.1214/lnms/1215458836 . ISBN 978-0-940600-24-9 . MR 1194407 .