Uneori, în statistici, este util să vezi exemple elaborate de probleme. Aceste exemple ne pot ajuta să găsim probleme similare. În acest articol, vom parcurge procesul de realizare a statisticilor inferențiale pentru un rezultat privind două mijloace de populație. Nu numai că vom vedea cum să realizăm un test de ipoteză despre diferența a două mijloace de populație, vom construi și o interval de încredere pentru această diferență. Metodele pe care le folosim sunt uneori numite test de două probe t și interval de încredere de două probe t.
Declarația problemei
Să presupunem că dorim să testăm aptitudinea matematică a copiilor de școală. O întrebare pe care o putem avea este dacă nivelurile de grad mai mari au scoruri medii mai mari.
Un eșantion simplu aleatoriu de 27 de gradatori a treia este dat un test de matematică, răspunsurile lor sunt notate, iar rezultatele au un scor mediu de 75 de puncte cu un deviație standard pentru eșantion de 3 puncte.
Un eșantion simplu aleatoriu de 20 de clase a cincea este dat același test de matematică și răspunsurile lor sunt notate. Scorul mediu pentru elevii de cincilea este de 84 de puncte, cu o probă de abatere standard de 5 puncte.
Având în vedere acest scenariu, ne punem următoarele întrebări:
- Datele din eșantion ne oferă dovezi că scorul mediu de testare a populației tuturor celor cinci clase este mai mare decât scorul mediu de testare a populației tuturor celor treia gradatori?
- Care este un interval de încredere de 95% pentru diferența scorurilor medii ale testelor între populațiile de gradatori a treia și cele de gradul cinci
Condiții și procedură
Trebuie să selectăm ce procedură să folosim. Pentru a face acest lucru, trebuie să ne asigurăm că și să verificăm dacă au fost îndeplinite condițiile pentru această procedură. Ni se cere să comparăm două mijloace de populație. O colecție de metode care pot fi utilizate pentru a face acest lucru sunt cele pentru proceduri t cu două probe.
Pentru a utiliza aceste proceduri t pentru două probe, trebuie să ne asigurăm că următoarele condiții păstrează:
- Avem două probe simple aleatoare din cele două populații de interes.
- Probele noastre aleatorii simple nu constituie mai mult de 5% din populație.
- Cele două probe sunt independente unele de altele și nu există nicio potrivire între subiecți.
- Variabila este distribuită în mod normal.
- Atât media populației, cât și abaterea standard sunt necunoscute pentru ambele populații.
Vedem că majoritatea acestor condiții sunt îndeplinite. Ni s-a spus că avem probe simple aleatorii. Populațiile pe care le studiem sunt mari, deoarece există milioane de studenți în aceste niveluri de clasă.
Condiția pe care nu putem să o asumăm automat este dacă scorurile testului sunt distribuite în mod normal. Deoarece avem o dimensiune a eșantionului suficient de mare, prin robustetea procedurilor noastre t, nu este neapărat nevoie ca variabila să fie distribuită în mod normal.
Deoarece condițiile sunt îndeplinite, efectuăm câteva calcule preliminare.
Eroare standard
Eroarea standard este o estimare a unei abateri standard. Pentru această statistică, adăugăm variația de probă a probelor și apoi luăm rădăcina pătrată. Aceasta oferă formula:
(s1 2 / n1 + s22 / n2)1/2
Folosind valorile de mai sus, vedem că valoarea erorii standard este
(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583
Grade de libertate
Putem folosi aproximarea conservatoare pentru a noastră grade de libertate. Aceasta poate subestima numărul de grade de libertate, dar este mult mai ușor de calculat decât să folosești formula lui Welch. Folosim cea mai mică dintre cele două dimensiuni de eșantion, apoi scăzem una din acest număr.
De exemplu, cea mai mică dintre cele două probe este de 20. Aceasta înseamnă că numărul de grade de libertate este 20 - 1 = 19.
Test de ipoteză
Dorim să testăm ipoteza conform căreia elevii din clasa a cincea au un scor mediu de testare care este mai mare decât scorul mediu al elevilor din clasa a treia. Fie μ1 să fie scorul mediu al populației tuturor claselor a cincea. În mod similar, lăsăm μ2 să fie scorul mediu al populației tuturor gradelor a treia.
Ipotezele sunt următoarele:
- H0: μ1 - μ2 = 0
- HA: μ1 - μ2 > 0
Statistica testului este diferența dintre mijloacele de probă, care este apoi împărțită la eroarea standard. Deoarece folosim deviații standard pentru a estima deviația standard a populației, statisticile de testare de la distribuția t.
Valoarea statisticii testului este (84 - 75) /1.2583. Aceasta este aproximativ 7.15.
Acum determinăm care este valoarea p pentru acest test de ipoteză. Analizăm valoarea statisticii testului și unde aceasta se află pe o distribuție t cu 19 grade de libertate. Pentru această distribuție, avem 4,2 x 10-7 ca valoarea noastră p. (O modalitate de a determina acest lucru este de a utiliza funcția T.DIST.RT în Excel.)
Deoarece avem o valoare p mică, respingem ipoteza nulă. Concluzia este că scorul mediu de testare pentru elevii a cincea este mai mare decât scorul mediu de testare pentru a treia gradatori.
Interval de încredere
Deoarece am stabilit că există o diferență între scorurile medii, acum determinăm un interval de încredere pentru diferența dintre aceste două mijloace. Avem deja mare parte din ceea ce avem nevoie. Intervalul de încredere pentru diferență trebuie să aibă atât o estimare, cât și o marjă de eroare.
Estimarea pentru diferența a două mijloace este simplă de calculat. Pur și simplu găsim diferența mijloacelor de probă. Această diferență a mijloacelor de eșantion estimează diferența de mijloc a populației.
Pentru datele noastre, diferența dintre mijloacele de eșantion este de 84 - 75 = 9.
Marja de eroare este ușor mai dificil de calculat. Pentru aceasta, trebuie să înmulțim statistica corespunzătoare cu eroarea standard. Statistica de care avem nevoie este găsită consultând un tabel sau un software statistic.
Din nou folosind aproximarea conservatoare, avem 19 grade de libertate. Pentru un interval de încredere de 95% vedem că t* = 2.09. Am putea folosi Funcția T.INV în ExceVoi calcula această valoare.
Acum am pus totul laolaltă și vedem că marja noastră de eroare este 2,09 x 1,2583, care este aproximativ 2,63. Intervalul de încredere este de 9 ± 2,63. Intervalul este de la 6,37 până la 11,63 puncte la testul pe care l-au ales elevii a cincea și a treia.