Multe probleme de inferență statistică necesită să găsim numărul de grade de libertate. Numărul de grade de libertate selectează unul singur distribuția probabilităților dintre infinit de mulți. Acest pas este un detaliu adesea neglijat, dar crucial atât în calcululintervale de încredere și lucrările din teste de ipoteză.
Nu există o singură formulă generală pentru numărul de grade de libertate. Cu toate acestea, există formule specifice utilizate pentru fiecare tip de procedură în statisticile inferențiale. Cu alte cuvinte, setarea în care lucrăm va determina numărul de grade de libertate. Ceea ce urmează este o listă parțială a unora dintre cele mai frecvente proceduri de inferență, împreună cu numărul de grade de libertate care sunt utilizate în fiecare situație.
Distribuție normală standard
Proceduri care implică distribuție normală standard sunt listate pentru completare și pentru a elimina unele concepții greșite. Aceste proceduri nu necesită să găsim numărul de grade de libertate. Motivul pentru aceasta este că există o distribuție normală unică. Aceste tipuri de proceduri cuprind cele care implică o populație, atunci când este deja cunoscută abaterea standard a populației, precum și procedurile privind proporțiile populației.
Un exemplu de proceduri T
Uneori, practica statistică ne impune să folosim distribuția t a Studentului. Pentru aceste proceduri, cum ar fi cele care se ocupă de o populație cu o deviație standard a populației necunoscute, numărul de grade de libertate este cu unul mai mic decât dimensiunea eșantionului. Astfel, dacă dimensiunea eșantionului este n, atunci sunt n - 1 grade de libertate.
T Proceduri cu date în pereche
De multe ori are sens tratați datele ca fiind în pereche. Împerecherea se realizează de obicei datorită unei conexiuni între prima și a doua valoare din perechea noastră. De multe ori ne-am împerechea înainte și după măsurători. Eșantionul nostru de date în pereche nu este independent; cu toate acestea, diferența dintre fiecare pereche este independentă. Astfel, dacă eșantionul are un total de n perechi de puncte de date (pentru un total de 2n valori) atunci există n - 1 grade de libertate.
T Proceduri pentru două populații independente
Pentru aceste tipuri de probleme, încă folosim un distribuție t. De această dată există un eșantion de la fiecare din populațiile noastre. Deși este de preferat ca aceste două probe să fie de aceeași dimensiune, acest lucru nu este necesar pentru procedurile noastre statistice. Astfel putem avea două mostre de mărime n1 și n2. Există două modalități de a determina numărul de grade de libertate. Metoda mai precisă este utilizarea formulei lui Welch, o formulă greoaie din punct de vedere calculativ care implică dimensiunile eșantionului și abaterile standard ale eșantionului. O altă abordare, denumită aproximare conservatoare, poate fi utilizată pentru a estima rapid gradele de libertate. Acesta este pur și simplu cel mai mic dintre cele două numere n1 - 1 și n2 - 1.
Chi-Square pentru Independență
O singură utilizare a test de chi-pătrat este de a vedea dacă două variabile categorice, fiecare cu mai multe niveluri, prezintă independență. Informațiile despre aceste variabile sunt înregistrate în a masă cu două sensuri cu r rânduri și c coloane. Numărul de grade de libertate este produsul (r - 1)(c - 1).
Chi-Square Goodness of Fit
Bunătatea chi-pătrată de potrivire începe cu o singură variabilă categorică cu un total de n niveluri. Testăm ipoteza că această variabilă se potrivește cu un model prestabilit. Numărul de grade de libertate este unul mai mic decât numărul de niveluri. Cu alte cuvinte, există n - 1 grade de libertate.
Un factor ANOVA
Un factor analiza variatiei (ANOVA) ne permite să facem comparații între mai multe grupuri, eliminând necesitatea testelor de ipoteze multiple în perechi. Întrucât testul necesită să măsurăm atât variația dintre mai multe grupuri, cât și variația în cadrul fiecărui grup, ajungem la două grade de libertate. F-statistic, care este utilizat pentru un factor ANOVA, este o fracțiune. Numerotatorul și numitorul au fiecare grade de libertate. Lăsa c să fie numărul de grupuri și n este numărul total de valori ale datelor. Numărul de grade de libertate pentru numărător este unul mai mic decât numărul de grupuri sau c - 1. Numărul de grade de libertate pentru numitor este numărul total de valori ale datelor, minus numărul de grupuri sau n - c.
Este clar să vedem că trebuie să fim foarte atenți pentru a ști cu ce procedură de inferență lucrăm. Această cunoaștere ne va informa despre numărul corect de grade de libertate de utilizare.