O întrebare pe care este întotdeauna important să o puneți statistici este: „Rezultatul observat se datorează doar întâmplării sau este semnificativ din punct de vedere statistic?“ O clasă de teste de ipoteză, numite teste de permutare, ne permit să testăm această întrebare. Prezentarea generală și etapele unui astfel de test sunt:
- Ne împărțim subiecții într-un grup de control și un grup experimental. Ipoteza nulă este că nu există nicio diferență între aceste două grupuri.
- Aplicați un tratament pe grupul experimental.
- Măsurați răspunsul la tratament
- Luați în considerare fiecare configurație posibilă a grupului experimental și răspunsul observat.
- Calculați o valoare p pe baza răspunsului nostru observat în raport cu toate grupurile experimentale potențiale.
Acesta este un contur al unei permutări. Pentru a descoperi acest contur, vom petrece timp uitându-ne la un exemplu elaborat al unui astfel de test de permutare în detaliu.
Exemplu
Să presupunem că studiem șoareci. În special, ne interesează cât de repede șoarecii termină un labirint pe care nu l-au mai întâlnit până acum. Dorim să oferim dovezi în favoarea unui tratament experimental. Scopul este de a demonstra că șoarecii din grupul de tratament vor rezolva mai repede labirintul decât șoarecii netratați.
Începem cu subiecții noștri: șase șoareci. Pentru comoditate, la șoarecii vor fi menționate literele A, B, C, D, E, F. Trei dintre acești șoareci trebuie selectați la întâmplare pentru tratamentul experimental, iar ceilalți trei sunt puși într-un grup de control în care subiecții primesc un placebo.
Vom alege în mod aleatoriu ordinea în care sunt selectați șoarecii pentru a rula labirintul. Va fi notat timpul petrecut la finalizarea labirintului pentru toți șoarecii și se va calcula o medie a fiecărui grup.
Să presupunem că selecția noastră aleatoare are șoareci A, C și E în grupul experimental, cu ceilalți șoareci din placebo grupul de control. După ce tratamentul a fost implementat, alegem la întâmplare ordinea ca șoarecii să treacă prin labirint.
Timpurile de rulare pentru fiecare dintre șoareci sunt:
- Mouse A rulează cursa în 10 secunde
- Mouse B rulează cursa în 12 secunde
- Mouse C rulează cursa în 9 secunde
- Mouse D rulează cursa în 11 secunde
- Mouse E rulează cursa în 11 secunde
- Mouse F rulează cursa în 13 secunde.
Timpul mediu pentru completarea labirintului pentru șoarecii din grupul experimental este de 10 secunde. Timpul mediu de finalizare a labirintului pentru cei din grupul de control este de 12 secunde.
Am putea pune câteva întrebări. Tratamentul este cu adevărat motivul timpului mediu mai rapid? Sau am fost doar norocoși în selecția noastră de control și a grupului experimental? Poate că tratamentul nu a avut niciun efect și am ales la întâmplare șoarecii mai lentați pentru a primi placebo și șoarecii mai rapide pentru a primi tratamentul. Un test de permutare vă va ajuta să răspundeți la aceste întrebări.
ipoteze
Ipotezele pentru testul nostru de permutare sunt:
- ipoteza nulă este afirmația fără efect. Pentru acest test specific, avem H0: Nu există nicio diferență între grupurile de tratament. Timpul mediu pentru a rula labirintul pentru toți șoarecii fără tratament este același cu timpul mediu pentru toți șoarecii cu tratament.
- Ipoteza alternativă este ceea ce încercăm să stabilim dovezi în favoarea. În acest caz, am avea HA: Timpul mediu pentru toți șoarecii cu tratament va fi mai rapid decât timpul mediu pentru toți șoarecii fără tratament.
permutări
Există șase șoareci și există trei locuri în grupul experimental. Aceasta înseamnă că numărul de grupuri experimentale posibile este dat de numărul de combinații C (6,3) = 6! / (3! 3!) = 20. Persoanele rămase ar face parte din grupul de control. Deci, există 20 de moduri diferite de a alege aleatoriu indivizi în cele două grupuri noastre.
Alocarea A, C și E grupului experimental s-a făcut la întâmplare. Deoarece există 20 de astfel de configurații, cea specifică cu A, C și E în grupul experimental are o probabilitate de 1/20 = 5% să apară.
Trebuie să determinăm toate cele 20 de configurații ale grupului experimental al indivizilor din studiul nostru.
- Grupa experimentală: A B C și grup de control: D E F
- Grup experimental: A B D și grup de control: C E F
- Grup experimental: A B E și grup de control: C D F
- Grup experimental: A B F și grup de control: C D E
- Grupa experimentală: A C D și grup de control: B E F
- Grupa experimentală: A C E și grup de control: B D F
- Grupa experimentală: A C F și grup de control: B D E
- Grupa experimentală: A D E și grup de control: B C F
- Grupa experimentală: A D F și grup de control: B C E
- Grupa experimentală: A E F și grup de control: B C D
- Grupa experimentală: B C D și grup de control: A E F
- Grupa experimentală: B C E și grup de control: A D F
- Grupa experimentală: B C F și grup de control: A D E
- Grupa experimentală: B D E și grup de control: A C F
- Grupa experimentală: B D F și grup de control: A C E
- Grupa experimentală: B E F și grup de control: A C D
- Grupa experimentală: C D E și grup de control: A B F
- Grup experimental: C D F și grup de control: A B E
- Grupa experimentală: C E F și grup de control: A B D
- Grupa experimentală: D E F și grup de control: A B C
Ne uităm apoi la fiecare configurație a grupurilor experimentale și de control. Calculăm media pentru fiecare dintre cele 20 de permutări din enumerarea de mai sus. De exemplu, pentru primul, A, B și C au timpi de 10, 12 și, respectiv, 9. Media acestor trei numere este 10.3333. Tot în această primă permutare, D, E și F au timpi de 11, 11 și, respectiv, 13. Aceasta are o medie de 11.6666.
După calcularea media fiecărui grup, calculăm diferența dintre aceste mijloace. Fiecare dintre următoarele corespunde diferenței dintre grupurile experimentale și cele de control enumerate mai sus.
- Placebo - tratament = 1,333333333 secunde
- Placebo - Tratament = 0 secunde
- Placebo - Tratament = 0 secunde
- Placebo - Tratament = -1.333333333 secunde
- Placebo - Tratament = 2 secunde
- Placebo - Tratament = 2 secunde
- Placebo - tratament = 0,666666667 secunde
- Placebo - tratament = 0,666666667 secunde
- Placebo - Tratament = -0,666666667 secunde
- Placebo - Tratament = -0,666666667 secunde
- Placebo - tratament = 0,666666667 secunde
- Placebo - tratament = 0,666666667 secunde
- Placebo - Tratament = -0,666666667 secunde
- Placebo - Tratament = -0,666666667 secunde
- Placebo - Tratament = -2 secunde
- Placebo - Tratament = -2 secunde
- Placebo - tratament = 1,333333333 secunde
- Placebo - Tratament = 0 secunde
- Placebo - Tratament = 0 secunde
- Placebo - Tratament = -1.333333333 secunde
Valoarea P
Acum clasăm diferențele dintre mijloacele de la fiecare grup pe care le-am remarcat mai sus. De asemenea, tabelăm procentul celor 20 de configurații diferite, care sunt reprezentate de fiecare diferență de mijloace. De exemplu, patru dintre 20 nu au avut nicio diferență între mijloacele grupurilor de control și tratament. Aceasta reprezintă 20% din cele 20 de configurații menționate mai sus.
- -2 pentru 10%
- -1,33 pentru 10%
- -0.667 pentru 20%
- 0 pentru 20%
- 0,667 pentru 20%
- 1,33 pentru 10%
- 2 pentru 10%.
Aici comparăm această listă cu rezultatul observat. Selecția noastră aleatoare de șoareci pentru grupurile de tratament și control a dus la o diferență medie de 2 secunde. De asemenea, vedem că această diferență corespunde cu 10% din toate probele posibile. Rezultatul este că pentru acest studiu avem un Valoarea p de 10%.