Test de ipoteză pentru compararea a două proporții

În acest articol vom parcurge pașii necesari pentru a efectua o test de ipotezăsau test de semnificație, pentru diferența de două proporții de populație. Acest lucru ne permite să comparăm două proporții necunoscute și să deducem dacă nu sunt egale între ele sau dacă una este mai mare decât alta.

Prezentare generală a testului de ipoteză și fundal

Înainte de a intra în specificul testului nostru de ipoteză, vom analiza cadrul testelor de ipoteză. Într-un test de semnificație încercăm să arătăm că o afirmație privind valoarea unei populații parametru (sau uneori natura populației însăși) este probabil să fie adevărată.

Suntem probe pentru această afirmație efectuând un eșantion statistic. Calculăm o statistică din acest eșantion. Valoarea acestei statistici este ceea ce folosim pentru a determina adevărul enunțului inițial. Acest proces conține incertitudine, cu toate acestea suntem capabili să cuantificăm această incertitudine

Procesul general pentru un test de ipoteză este dat de lista de mai jos:

instagram viewer

Asigurați-vă că sunt îndeplinite condițiile necesare testului nostru.
Indicați în mod clar ipoteze nule și alternative. Ipoteza alternativă poate implica un test pe o singură față sau pe două fețe. De asemenea, ar trebui să stabilim nivelul de semnificație, care va fi notat de litera greacă alfa.
Calculați statistica testului. Tipul de statistică pe care o utilizăm depinde de testul particular pe care îl efectuăm. Calculul se bazează pe eșantionul nostru statistic.
Calculați Valoarea p. Statistica testului poate fi tradusă într-o valoare p. O valoare p este probabilitatea ca singura întâmplare să producă valoarea statisticii noastre de testare sub ipoteza că ipoteza nulă este adevărată. Regula generală este că, cu cât valoarea p este mai mică, cu atât sunt mai mari dovezile împotriva ipotezei nule.
Trage o concluzie. În sfârșit, folosim valoarea alfa care a fost deja selectată ca valoare prag. Regula deciziei este că Dacă valoarea p este mai mică sau egală cu alfa, atunci respingem ipoteza nulă. Altfel, noi nu reușesc să resping ipoteza nulă.

Acum că am văzut cadrul pentru un test de ipoteză, vom vedea specificul unui test de ipoteză pentru diferența de două proporții de populație.

Condițiile

Un test de ipoteză pentru diferența a două proporții de populație impune îndeplinirea următoarelor condiții:

Avem doua probe simple aleatoare din populații mari. Aici „mare” înseamnă că populația este de cel puțin 20 de ori mai mare decât dimensiunea eșantionului. Mărimile eșantionului vor fi notate cu n₁ și n₂.
Indivizii din eșantioanele noastre au fost aleși independent unul de altul. Populațiile în sine trebuie să fie, de asemenea, independente.
Există cel puțin 10 succese și 10 eșecuri în ambele probe.

Atâta timp cât aceste condiții au fost îndeplinite, putem continua cu testul nostru de ipoteză.

Ipotezele nule și alternative

Acum trebuie să luăm în considerare ipotezele pentru testul nostru de semnificație. Ipoteza nulă este afirmația noastră fără niciun efect. În acest tip particular de ipoteză, testul nostru nul este că nu există nicio diferență între cele două proporții ale populației. Putem scrie acest lucru ca H₀: p₁ = p₂.

Ipoteza alternativă este una dintre cele trei posibilități, în funcție de specificul pentru care testăm:

H_A: p₁ este mai mare decât p₂. Acesta este un test pe o singură coadă sau pe o singură față.
H_A: p₁ e mai puțin decât p₂. Acesta este, de asemenea, un test unilateral.
H_A: p₁ nu este egal cu p₂. Acesta este unul cu două cozi sau test pe două fețe

Ca întotdeauna, pentru a fi precaut, ar trebui să folosim ipoteza alternativă pe două fețe dacă nu avem o direcție în minte înainte de a obține proba noastră. Motivul pentru a face acest lucru este că este mai greu să respingi ipoteza nulă cu un test pe două fețe.

Cele trei ipoteze pot fi rescrise precizând cum p₁ - p₂ este legată de valoarea zero. Pentru a fi mai specific, ipoteza nulă ar deveni H₀:p₁ - p₂= 0. Ipotezele alternative alternative ar fi scrise astfel:

H_A: p₁ - p₂> 0 este echivalent cu afirmația "p₁ este mai mare decât p₂."
H_A: p₁ - p₂<0 este echivalent cu afirmația "p₁ e mai puțin decât p₂."
H_A: p₁ - p₂≠ 0 este echivalent cu afirmația "p₁ nu este egal cu p₂."

Această formulare echivalentă ne arată de fapt un pic mai mult din ceea ce se întâmplă în culise. Ceea ce facem în acest test de ipoteză este transformarea celor doi parametri p₁ și p₂în parametrul unic p₁ - p_2. Testăm apoi acest nou parametru față de valoarea zero.

Statistica testului

Formula statisticii testului este dată în imaginea de mai sus. Urmează o explicație a fiecăruia dintre termeni:

Eșantionul din prima populație are dimensiuni n_1.Numărul de succese din acest eșantion (care nu se vede direct în formula de mai sus) este k_1.
Eșantionul din a doua populație are dimensiuni n_2.Numărul de succese din acest eșantion este k_2.
Proporțiile eșantionului sunt p₁-pălărie = k₁ / n₁și p₂-hat = k₂ / n₂ .
Apoi combinăm sau combinăm succesele din ambele probe și obținem: p-hat = (k₁ + k₂) / (n₁+ n₂).

Ca întotdeauna, aveți grijă cu ordinea operațiunilor atunci când calculați. Tot ce se află sub radical trebuie calculat înainte de a lua rădăcina pătrată.

Valoarea P

Următorul pas este să calculăm valoarea p care corespunde statisticii noastre de testare. Utilizăm o distribuție normală standard pentru statisticile noastre și consultăm un tabel de valori sau folosim software statistic.

Detaliile calculului valorii noastre depind de ipoteza alternativă pe care o folosim:

Pentru H_A: p₁ - p₂> 0, calculăm proporția distribuției normale care este mai mare decât Z.
Pentru H_A: p₁ - p₂<0, calculăm proporția distribuției normale care este mai mică de Z.
Pentru H_A: p₁ - p₂≠ 0, calculăm proporția distribuției normale care este mai mare decât |Z|, valoarea absolută a Z. După aceasta, pentru a ține cont de faptul că avem un test pe două cozi, dublăm proporția.

Regula deciziei

Acum luăm o decizie cu privire la respingerea ipotezei nule (și, prin urmare, să acceptăm alternativa) sau să nu respingem ipoteza nulă. Luăm această decizie comparând valoarea noastră p cu nivelul alfa de semnificație.

Dacă valoarea p este mai mică sau egală cu alfa, atunci respingem ipoteza nulă. Aceasta înseamnă că avem un rezultat semnificativ statistic și că vom accepta ipoteza alternativă.
Dacă valoarea p este mai mare decât alfa, atunci nu reușim să respingem ipoteza nulă. Acest lucru nu dovedește că ipoteza nulă este adevărată. În schimb, înseamnă că nu am obținut suficiente dovezi convingătoare pentru a respinge ipoteza nulă.

Notă specială

interval de încredere pentru diferența a două proporții de populație nu pune în comun succesele, în timp ce testul de ipoteză nu. Motivul pentru aceasta este că ipoteza noastră nulă presupune că p₁ - p₂= 0. Intervalul de încredere nu presupune acest lucru. Unii statisticieni nu reunesc succesele acestui test de ipoteză și folosesc în schimb o versiune ușor modificată a statisticii testului de mai sus.