Chi-Square Test de bunătate

chi-pătrat bunătatea testului de potrivire este o variație a testului chi-pătrat mai general. Setarea pentru acest test este o singură variabilă categorică care poate avea mai multe niveluri. Adesea, în această situație, vom avea în minte un model teoretic pentru o variabilă categorică. Prin acest model ne așteptăm ca anumite proporții ale populației să se încadreze în fiecare dintre aceste niveluri. O testare a bunătății de potrivire determină cât de bine se potrivește proporțiile așteptate din modelul nostru teoretic.

Începem cu o variabilă categorică cu n niveluri și lăsați peu să fie proporția populației la nivel eu. Modelul nostru teoretic are valori de qeu pentru fiecare dintre proporții. Enunțarea ipotezelor nule și alternative sunt următoarele:

Pentru un test de bună calitate, avem un model teoretic pentru modul în care datele noastre ar trebui să fie proporționate. Simplificăm aceste proporții cu dimensiunea eșantionului n pentru a obține conturile noastre așteptate.

Statistica chi-pătrat pentru testarea bunătății de testare este determinată prin compararea numărului real și așteptat pentru fiecare nivel al variabilei noastre categorice. Etapele pentru calcularea statisticii chi-pătrate pentru o bună probabilitate de testare sunt următoarele:

instagram viewer

Dacă modelul nostru teoretic se potrivește perfect cu datele observate, atunci numărul preconizat nu va arăta nicio abatere de la numărurile observate ale variabilei noastre. Aceasta va însemna că vom avea o statistică chi-pătrată de zero. În orice altă situație, statistica chi-pătrat va fi un număr pozitiv.

Statistica chi-pătrat pe care am calculat-o corespunde unei anumite locații pe o distribuție chi-pătrată cu numărul corespunzător de grade de libertate. Valoarea p determină probabilitatea obținerii unei statistici de test în această extremă, presupunând că ipoteza nulă este adevărată. Putem utiliza un tabel de valori pentru o distribuție chi-pătrată pentru a determina valoarea p a testului nostru de ipoteză. Dacă avem software-ul statistic disponibil, atunci acesta poate fi utilizat pentru a obține o estimare mai bună a valorii p.

Luăm decizia noastră de a respinge ipoteza nulă pe baza unui nivel de semnificație predeterminat. Dacă valoarea noastră p este mai mică sau egală cu acest nivel de semnificație, atunci respingem ipoteza nulă. Altfel, noi nu reușesc să resping ipoteza nulă.