Exemplu de intervale de încredere pentru variație

click fraud protection

Variația populației oferă o indicație despre modul de răspândire a unui set de date. Din păcate, este de obicei imposibil de știut exact care este acest parametru al populației. Pentru a compensa lipsa de cunoștințe, folosim un subiect din statistici inferențiale numit intervale de încredere. Vom vedea un exemplu despre cum se calculează un interval de încredere pentru o variație a populației.

Formula intervalului de încredere

Formula pentru (1 - α) interval de încredere cu privire la variația populației. Este dat de următorul șir de inegalități:

[ (n - 1)s2] / B < σ2 < [ (n - 1)s2] / A.

Aici n este dimensiunea eșantionului, s2 este variația probei. Numarul A este punctul distribuției chi-pătrat cu n -1 grade de libertate la care exact α / 2 din zona de sub curbă se află la stânga A. Într-un mod similar, numărul B este punctul aceleiași distribuții chi-pătrate cu exact α / 2 din zona de sub curbă din dreapta lui B.

Preliminarii

Începem cu un set de date cu 10 valori. Acest set de valori de date a fost obținut printr-un simplu eșantion aleatoriu:

instagram viewer

97, 75, 124, 106, 120, 131, 94, 97,96, 102

Unele analize ale datelor exploratorii ar fi necesare pentru a arăta că nu există valori exterioare. Prin construirea unui complot tulpină și frunze vedem că aceste date sunt probabil dintr-o distribuție care este distribuită aproximativ în mod normal. Aceasta înseamnă că putem continua cu găsirea unui interval de încredere de 95% pentru variația populației.

Varianță de probe

Trebuie să estimăm variația populației cu variația probei, notată cu s2. Deci, începem prin calcularea acestei statistici. În esență, facem o medie suma abaterilor pătrate din medie Totuși, mai degrabă decât împărțirea acestei sume pe n o împărțim după n - 1.

Constatăm că media probei este 104,2. Folosind aceasta, avem suma abaterilor pătrate de la media dată de:

(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6

Împărțim această sumă cu 10 - 1 = 9 pentru a obține o variație a mostrei de 277.

Distribuția Chi-Square

Acum apelăm la distribuția noastră de chi-pătrat. Deoarece avem 10 valori de date, avem 9 grade de libertate. Deoarece ne dorim mijlocul de 95% din distribuția noastră, avem nevoie de 2,5% în fiecare din cele două cozi. Consultăm un tabel sau un software chi-pătrat și vedem că valorile tabelului de 2.7004 și 19.023 cuprind 95% din suprafața distribuției. Aceste numere sunt A și B, respectiv.

Avem acum tot ce avem nevoie și suntem pregătiți să ne asamblăm intervalul de încredere. Formula pentru punctul final stânga este [(n - 1)s2] / B. Aceasta înseamnă că obiectivul nostru stâng este:

(9 x 277) / 19.023 = 133

Obiectivul corect este găsit înlocuind B cu A:

(9 x 277) /2.7004 = 923

Deci, suntem 95% încrezători că variația populației se situează între 133 și 923.

Abaterea standard a populației

Desigur, deoarece abaterea standard este rădăcina pătrată a variației, această metodă ar putea fi utilizată pentru a construi un interval de încredere pentru abaterea standard a populației. Tot ce trebuie să facem este să luăm rădăcini pătrate ale obiectivelor. Rezultatul ar fi un interval de încredere de 95% pentru deviație standard.

instagram story viewer