Exemplu de testare a bunătății

chi-pătrat bunătatea testului de potrivire este util să compari a model teoretic la datele observate. Acest test este un tip al testului chi-pătrat mai general. Ca în orice subiect din matematică sau statistică, poate fi util să lucrați printr-un exemplu pentru a înțelege ce se întâmplă, printr-un exemplu de bun-chi-pătrat de testare potrivită.

Luați în considerare un pachet standard de ciocolată cu lapte M&M. Există șase culori diferite: roșu, portocaliu, galben, verde, albastru și maro. Să presupunem că suntem curioși cu privire la distribuția acestor culori și să ne întrebăm, toate cele șase culori apar în proporție egală? Acesta este tipul de întrebare la care se poate răspunde cu un test de bunătate.

reglaj

Începem prin a observa setarea și de ce este adecvată testarea bunătății. Variabila noastră de culoare este categorică. Există șase niveluri ale acestei variabile, care corespund celor șase culori care sunt posibile. Vom presupune că M&S pe care le socotim va fi un eșantion simplu aleatoriu din populația tuturor M&M.

instagram viewer

Ipoteze nule și alternative

ipoteze nule și alternative pentru bunătatea noastră de testare potrivită reflectă presupunerea pe care o facem despre populație. Deoarece testăm dacă culorile au proporții egale, ipoteza noastră nulă va fi aceea că toate culorile apar în aceeași proporție. Mai formal, dacă p1 este proporția populației de bomboane roșii, p2 este proporția populației de bomboane portocalii și așa mai departe, atunci ipoteza nulă este că p1 = p2 =... = p6 = 1/6.

Ipoteza alternativă este aceea că cel puțin una dintre proporțiile populației nu este egală cu 1/6.

Numărul real și cel așteptat

Numărul real este numărul de bomboane pentru fiecare din cele șase culori. Numărul așteptat se referă la ceea ce ne-am aștepta dacă ipoteza nulă ar fi adevărată. Vom lăsa n să fie dimensiunea eșantionului nostru. Numărul așteptat de bomboane roșii este p1 n sau n/6. De fapt, de exemplu, numărul preconizat de bomboane pentru fiecare din cele șase culori este pur și simplu n ori peu, sau n/6.

Chi-square Statistic pentru bunătatea în formă

Acum vom calcula o statistică chi-pătrată pentru un exemplu specific. Să presupunem că avem un eșantion simplu aleatoriu de 600 de bomboane M&M cu următoarea distribuție:

  • 212 dintre bomboane sunt albastre.
  • 147 dintre bomboane sunt portocalii.
  • 103 dintre bomboane sunt verzi.
  • 50 dintre bomboane sunt roșii.
  • 46 dintre bomboane sunt galbene.
  • 42 dintre bomboane sunt maro.

Dacă ipoteza nulă ar fi adevărată, atunci numărul estimat pentru fiecare din aceste culori ar fi (1/6) x 600 = 100. Acum folosim acest lucru în calculul statisticii chi-pătrat.

Calculăm contribuția la statisticile noastre din fiecare culoare. Fiecare are forma (Actual - Așteptat)2/Expected.:

  • Pentru albastru avem (212 - 100)2/100 = 125.44
  • Pentru portocală avem (147 - 100)2/100 = 22.09
  • Pentru verde avem (103 - 100)2/100 = 0.09
  • Pentru roșu avem (50 - 100)2/100 = 25
  • Pentru galben avem (46 - 100)2/100 = 29.16
  • Pentru maro avem (42 - 100)2/100 = 33.64

Totalizăm apoi toate aceste contribuții și determinăm că statistica noastră de chi-pătrat este 125,44 + 22,09 + 0,09 + 25 +29,16 + 33,64 = 235,42.

Grade de libertate

Numarul grade de libertate pentru un test de bunătate de potrivire este pur și simplu unul mai mic decât numărul de niveluri ale variabilei noastre. De vreme ce erau șase culori, avem 6 - 1 = 5 grade de libertate.

Tabelul Chi-patrat și valoarea P

Statistica chi-pătratului de 235,42 pe care am calculat-o corespunde unei anumite locații pe o distribuție chi-pătrată cu cinci grade de libertate. Acum avem nevoie de Valoarea p, pentru a determina probabilitatea obținerii unei statistici de testare cel puțin la fel de extreme ca 235.42, în timp ce presupunem că ipoteza nulă este adevărată.

Excel pentru Microsoft poate fi utilizat pentru acest calcul. Constatăm că statisticile noastre de testare cu cinci grade de libertate au o valoare p de 7,29 x 10-49. Aceasta este o valoare p extrem de mică.

Regula deciziei

Luăm decizia noastră de a respinge ipoteza nulă pe baza mărimii valorii p. Deoarece avem o valoare p minisculă, respingem ipoteza nulă. Concluzionăm că M&S nu sunt distribuite uniform între cele șase culori diferite. O analiză de urmărire ar putea fi utilizată pentru a determina un interval de încredere pentru proporția populației dintr-o anumită culoare.