Działka RA
średniej ilorazowej (RA) jest opartą na liczbach całkowitych wersją wykresu MA do wizualizacji danych zliczania dwóch warunków. Jego charakterystyczny, przypominający strzałkę kształt wywodzi się ze sposobu, w jaki obejmuje on punkty unikalne dla warunków (0, n ) lub ( n , 0) na wykresie za pośrednictwem współczynnika epsilon .
Definicja
Wykres RA , podobnie jak jego kuzyn, wykres MA , jest przeskalowaną i obróconą o (45 stopni) wersją prostego dwuwymiarowego wykresu punktowego a w porównaniu z b , gdzie a i b są równej długości wektorami dodatnich pomiarów. To przeskalowanie i obrót pozwala na lepszą widoczność i podkreślenie ważnych punktów odstających, które różnią się między dwoma warunkami pomiaru. Zasadniczo jest to wykres stosunku logarytmicznego [R] do średniego logarytmicznego [A] każdej pary elementów a i b . Jednak w przeciwieństwie do wykresu MA, ponieważ wykres RA przyjmuje jako dane wejściowe nieujemne liczby całkowite, musi uwzględniać obejścia, aby uwzględnić punkty niewidoczne matematycznie (takie jak punkty, w których jeden lub oba elementy pary mają wartość zero).
Jeśli zmodyfikujemy nasz oryginalny wektor a (lub b ) poprzez:
Gdzie
wtedy R i A można zdefiniować jako:
R , podobnie jak M , jest wykreślone na osi y i reprezentuje logarytm (krotność zmiany) stosunku między a i b . A jest wykreślone na osi x i reprezentuje średnią liczebność dla pary współrzędnych. Wykres RA zapewnia szybki przegląd rozkładu i rozmiaru zbioru danych składającego się z niezerowych zliczeń.
Etymologia
Przedrostek akronimu „RA” jest czasami wymawiany jako jednosylabowe słowo „promień” ze względu na silne podobieństwo fabuły do promienia geometrycznego . Ten charakterystyczny kształt przypominający strzałę wywodzi się z dwóch kluczowych cech: po prawej stronie początku wektora , długiego asymptotycznego ogona, a po lewej (tworząc grot strzałki) dwóch (często gęstych) płatów punktów unikalnych dla warunków.
Obejścia dla widoczności i włączania punktów
Warunek unikalne punkty
Ponieważ duża część par aib zawiera zera w jednym lub obu warunkach, nie można ich wykreślić w skali logarytmicznej. Inne funkcje kreślenia MA sztucznie uwzględniają te unikalne dla warunków punkty na wykresie, rozkładając je pionowo jako „smugę” po lewej stronie lub poziomo jako „dywan ” na samej górze i dole wykresu. Z kolei na wykresie RA unikaty są uwzględniane poprzez dodanie małego współczynnika epsilon (między 0,1 a 0,5), który umieszcza je w bardziej odpowiednim statystycznie miejscu na wykresie.
Przekreślanie
Innym problemem związanym z wykreślaniem tego (lub dowolnego) typu danych zliczania jest przekreślanie , które jest rozwiązywane na wykresie RA przez odsuwanie punktów od siebie, ale nie na tyle, aby połączyć się z innymi współrzędnymi. Rezultatem tej funkcji jest patchworkowy wygląd fabuły, który zanika wraz ze wzrostem A.
Pakiety
caroline CRAN R zawiera jedyną znaną implementację wykresu RA. Jednak pakiet meta-transkryptomiki „manta” R zapewnia opakowanie wokół tej implementacji wykresu RA i jest używany do oceny krotności zmiany w transkrypcji genów (punktów), jednocześnie wizualizując rozkłady taksonomiczne każdego genu jako indywidualne punkty wykresu kołowego.
Przykłady
biblioteka(karolina) a <- rnbinom(n=10000, mu=5, size=2) b <- rnbinom(n=10000, mu=5, size=2) raPlot(a, b)
- ^ Dudoit, S , Yang, YH , Callow, MJ, Prędkość, TP . (2002). Statystyczne metody identyfikacji genów o zróżnicowanej ekspresji w replikowanych eksperymentach z mikromacierzami cDNA. Stan. Grzech. 12:1 111-139
- ^ Schruth, D. & Marchetti, A. (2011). Znormalizowana analiza transkrypcji zbiorowości drobnoustrojów. Wersja pakietu R 0.9.5.