Cum să estimați abaterile standard (SD)

click fraud protection

Abaterea standard și intervalul reprezintă ambele măsuri ale răspândirea unui set de date. Fiecare număr ne spune în felul său cât de distanțate sunt datele, deoarece acestea sunt atât o măsură a variației. Deși nu există o relație explicită între intervalul și abaterea standard, este un regula degetului mare care pot fi utile pentru a raporta aceste două statistici. Această relație este uneori numită regula intervalului pentru abaterea standard.

Regula intervalului ne spune că abaterea standard a unui eșantion este aproximativ egală cu o pătrime din intervalul de date. Cu alte cuvintes = (Maxim - Minim) / 4. Aceasta este o formulă foarte simplă de utilizat și ar trebui să fie utilizată doar ca o foarte aspră estimarea abaterii standard.

Un exemplu

Pentru a vedea un exemplu despre modul în care funcționează regula intervalului, vom analiza următorul exemplu. Să presupunem că începem cu valorile datelor din 12, 12, 14, 15, 16, 18, 18, 20, 20, 25. Aceste valori au un Rău din 17 și o abatere standard de aproximativ 4.1. Dacă, în schimb, calculăm prima dată intervalul de date ca 25 - 12 = 13 și apoi divizăm acest număr cu patru, estimăm abaterea standard la 13/4 = 3,25. Acest număr este relativ apropiat de adevărata abatere standard și bun pentru o estimare brută.

instagram viewer

De ce funcționează?

Poate părea că regula intervalului este puțin ciudată. De ce funcționează? Nu vi se pare complet arbitrar să împărțiți doar intervalul cu patru? De ce nu ne-am împărți la un număr diferit? În spatele scenei se întâmplă o justificare matematică.

Reamintiți-vă proprietățile curba clopotului și probabilitățile de la a distribuție normală standard. O caracteristică are legătură cu cantitatea de date care se încadrează într-un anumit număr de abateri standard:

  • Aproximativ 68% din date se află într-o abatere standard (mai mare sau mai mică) de la medie.
  • Aproximativ 95% din date se află în două abateri standard (mai mari sau mai mici) de la medie.
  • Aproximativ 99% se află în trei abateri standard (mai mari sau mai mici) de la medie.

Numărul pe care îl vom folosi are legătură cu 95%. Putem spune că 95% de la două abateri standard sub medie la două abateri standard peste medie, avem 95% din datele noastre. Astfel, aproape toată distribuția noastră normală s-ar întinde pe un segment de linie care este în total de patru abateri standard.

Nu toate datele sunt în mod normal distribuite și în formă de curbă. Însă majoritatea datelor sunt suficient de bine comportate încât îndepărtarea a două abateri standard față de medie surprinde aproape toate datele. Estimăm și spunem că patru abateri standard au aproximativ dimensiunea intervalului, astfel încât intervalul divizat la patru este o aproximare aproximativă a abaterii standard.

Utilizări pentru regulă

Regula intervalului este utilă într-o serie de setări. În primul rând, este o estimare foarte rapidă a abaterii standard. Abaterea standard necesită să găsim mai întâi media, apoi să scădem această medie din fiecare punct de date, pătrat diferențele, adăugați acestea, împărțiți cu unu mai puțin decât numărul de puncte de date, apoi (în sfârșit) luați pătratul rădăcină. Pe de altă parte, regula intervalului necesită doar o scădere și o divizare.

Alte locuri în care regula intervalului este utilă este atunci când avem informații incomplete. Formule precum cea pentru a determina mărimea eșantionului necesită trei informații: cea dorită marja de eroare, nivel de încredere și abaterea standard a populației pe care o investigăm. De multe ori este imposibil de știut ce este populația deviație standard este. Cu regula intervalului, putem estima această statistică și apoi să știm cât de mare ar trebui să facem proba noastră.

instagram story viewer