Efekt wsadowy
W biologii molekularnej efekt wsadowy występuje, gdy czynniki niebiologiczne w eksperymencie powodują zmiany w danych uzyskanych w wyniku eksperymentu. Takie efekty mogą prowadzić do błędnych wniosków, gdy ich przyczyny są skorelowane z jednym lub kilkoma wynikami będącymi przedmiotem zainteresowania w eksperymencie. Są one powszechne w wielu typach z sekwencjonowaniem o dużej przepustowości , w tym z wykorzystaniem mikromacierzy , spektrometrów masowych i danych z sekwencjonowania pojedynczych komórek RNA . Najczęściej omawia się je w kontekście badań nad genomiką i wysokowydajnym sekwencjonowaniem, ale istnieją one również w innych dziedzinach nauki.
Definicje
W literaturze zaproponowano wiele definicji terminu „efekt partii”. Lazar i in. (2013) zauważyli: „Dostarczenie pełnej i jednoznacznej definicji tak zwanego efektu wsadowego jest trudnym zadaniem, zwłaszcza że jego pochodzenie i sposób, w jaki przejawia się w danych, nie są całkowicie znane lub nie są rejestrowane”. Koncentrując się na eksperymentach z mikromacierzami, proponują nową definicję opartą na kilku poprzednich: „[T] on efekt partii reprezentuje systematyczne różnice techniczne, gdy próbki są przetwarzane i mierzone w różnych partiach i które nie są związane z żadną zmianą biologiczną zarejestrowaną podczas MAGE [ ekspresja genów mikromacierzy] eksperyment”.
Powoduje
Wiele potencjalnie zmiennych czynników zostało zidentyfikowanych jako potencjalne przyczyny efektów serii, w tym następujące:
- Warunki laboratoryjne
- Wybór partii odczynnika lub serii
- Różnice personalne
- Pora dnia, w której przeprowadzono eksperyment
- Poziomy ozonu atmosferycznego
- Instrumenty użyte do przeprowadzenia eksperymentu
Korekta
Opracowano różne techniki statystyczne w celu skorygowania efektów wsadowych w eksperymentach o dużej przepustowości. Techniki te są przeznaczone do stosowania na etapach projektowania eksperymentu i analizy danych. Historycznie skupiali się głównie na eksperymentach genomicznych i dopiero niedawno zaczęli rozszerzać się na inne dziedziny nauki, takie jak proteomika . Jednym z problemów związanych z takimi technikami jest to, że mogą one w sposób niezamierzony usunąć rzeczywistą zmienność biologiczną. Niektóre techniki stosowane do wykrywania i/lub korygowania efektów wsadowych obejmują:
- W przypadku danych z mikromacierzy zastosowano liniowe modele mieszane , z czynnikami zakłócającymi uwzględnionymi jako losowe punkty przecięcia.
- W 2007 roku Johnson i in. zaproponował empiryczną technikę bayesowską do korygowania efektów wsadowych. Podejście to stanowiło ulepszenie w stosunku do poprzednich metod, ponieważ mogło być skutecznie stosowane w przypadku małych partii.
- wprowadzono pakiet oprogramowania sva . Obejmuje wiele funkcji do dostosowywania efektów wsadowych, w tym wykorzystanie estymacji zmiennych zastępczych , które, jak wykazano wcześniej, poprawiają odtwarzalność i zmniejszają zależność w eksperymentach o dużej przepustowości.
- Haghverdi i in. (2018) zaproponowali technikę zaprojektowaną dla danych seq pojedynczych komórek RNA, opartą na wykrywaniu wzajemnych najbliższych sąsiadów w danych.
- Papiez i in. (2019) zaproponowali programowania dynamicznego do identyfikacji efektów wsadowych o nieznanej wartości w danych o dużej przepustowości.
- Voß i in. (2022) zaproponowali algorytm o nazwie HarmonizR, który umożliwia harmonizację danych w niezależnych zestawach danych proteomicznych z odpowiednią obsługą brakujących wartości.