Variația populației oferă o indicație despre modul de răspândire a unui set de date. Din păcate, este de obicei imposibil de știut exact care este acest parametru al populației. Pentru a compensa lipsa de cunoștințe, folosim un subiect din statistici inferențiale numit intervale de încredere. Vom vedea un exemplu despre cum se calculează un interval de încredere pentru o variație a populației.
Formula intervalului de încredere
Formula pentru (1 - α) interval de încredere cu privire la variația populației. Este dat de următorul șir de inegalități:
[ (n - 1)s2] / B < σ2 < [ (n - 1)s2] / A.
Aici n este dimensiunea eșantionului, s2 este variația probei. Numarul A este punctul distribuției chi-pătrat cu n -1 grade de libertate la care exact α / 2 din zona de sub curbă se află la stânga A. Într-un mod similar, numărul B este punctul aceleiași distribuții chi-pătrate cu exact α / 2 din zona de sub curbă din dreapta lui B.
Preliminarii
Începem cu un set de date cu 10 valori. Acest set de valori de date a fost obținut printr-un simplu eșantion aleatoriu:
97, 75, 124, 106, 120, 131, 94, 97,96, 102
Unele analize ale datelor exploratorii ar fi necesare pentru a arăta că nu există valori exterioare. Prin construirea unui complot tulpină și frunze vedem că aceste date sunt probabil dintr-o distribuție care este distribuită aproximativ în mod normal. Aceasta înseamnă că putem continua cu găsirea unui interval de încredere de 95% pentru variația populației.
Varianță de probe
Trebuie să estimăm variația populației cu variația probei, notată cu s2. Deci, începem prin calcularea acestei statistici. În esență, facem o medie suma abaterilor pătrate din medie Totuși, mai degrabă decât împărțirea acestei sume pe n o împărțim după n - 1.
Constatăm că media probei este 104,2. Folosind aceasta, avem suma abaterilor pătrate de la media dată de:
(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6
Împărțim această sumă cu 10 - 1 = 9 pentru a obține o variație a mostrei de 277.
Distribuția Chi-Square
Acum apelăm la distribuția noastră de chi-pătrat. Deoarece avem 10 valori de date, avem 9 grade de libertate. Deoarece ne dorim mijlocul de 95% din distribuția noastră, avem nevoie de 2,5% în fiecare din cele două cozi. Consultăm un tabel sau un software chi-pătrat și vedem că valorile tabelului de 2.7004 și 19.023 cuprind 95% din suprafața distribuției. Aceste numere sunt A și B, respectiv.
Avem acum tot ce avem nevoie și suntem pregătiți să ne asamblăm intervalul de încredere. Formula pentru punctul final stânga este [(n - 1)s2] / B. Aceasta înseamnă că obiectivul nostru stâng este:
(9 x 277) / 19.023 = 133
Obiectivul corect este găsit înlocuind B cu A:
(9 x 277) /2.7004 = 923
Deci, suntem 95% încrezători că variația populației se situează între 133 și 923.
Abaterea standard a populației
Desigur, deoarece abaterea standard este rădăcina pătrată a variației, această metodă ar putea fi utilizată pentru a construi un interval de încredere pentru abaterea standard a populației. Tot ce trebuie să facem este să luăm rădăcini pătrate ale obiectivelor. Rezultatul ar fi un interval de încredere de 95% pentru deviație standard.