Ce este robustețea statisticilor?

În statistici, termenul robust sau robustete se referă la rezistența unui model statistic, teste și proceduri în conformitate cu condițiile specifice ale analizei statistice pe care un studiu speră să le realizeze. Dat fiind faptul că aceste condiții ale unui studiu sunt îndeplinite, modelele pot fi verificate ca fiind adevărate prin utilizarea unor dovezi matematice.

Multe modele se bazează pe situații ideale care nu există atunci când lucrează cu date din lumea reală și, ca urmare, modelul poate oferi rezultate corecte chiar dacă condițiile nu sunt îndeplinite exact.

Prin urmare, statistici puternice sunt orice statistici care dau performanțe bune atunci când datele sunt extrase dintr-o gamă largă de distribuții de probabilitate care sunt în mare parte neafectate de valorile exterioare sau mici depărtări de la ipotezele modelului într-un anume set de date. Cu alte cuvinte, o statistică robustă este rezistentă la erorile rezultate.

O modalitate de a observa o procedură statistică robustă obișnuită, trebuie să nu privim mai departe de procedurile t, care folosesc teste de ipoteză pentru a determina cele mai precise predicții statistice.

instagram viewer

Respectarea procedurilor T

Pentru un exemplu de robustete, vom lua în considerare T-proceduri, care includ interval de încredere pentru o medie a populației cu deviație standard a populației necunoscute, precum și teste de ipoteză despre media populației.

Utilizarea T-procedurile presupun următoarele:

Setul de date cu care lucrăm este un eșantion simplu aleatoriu al populației.
În mod normal, populația din care am prelevat probele este distribuită.

În practică cu exemple din viața reală, statisticienii au rareori o populație care este distribuită în mod normal, astfel încât, în schimb, întrebarea devine „Cât de puternici sunt T-proceduri?“

În general, starea că avem un eșantion simplu aleatoriu este mai importantă decât condiția pe care am prelevat-o de la o populație distribuită normal; motivul pentru aceasta este că teorema limită centrală asigură o distribuție de eșantionare care este aproximativ normal - cu cât este mai mare dimensiunea eșantionului nostru, cu atât este mai aproape de a fi distribuirea eșantionului a probei normal.

Cum funcționează procedurile T ca statistici robuste

Atât de robustă pentru T-proceduri balamale privind mărimea eșantionului și distribuția eșantionului nostru. Acestea includ:

Dacă dimensiunea eșantioanelor este mare, ceea ce înseamnă că avem 40 sau mai multe observații, atunci T-procedurile pot fi utilizate chiar și cu distribuții care sunt înclinate.
Dacă dimensiunea eșantionului este între 15 și 40, atunci putem folosi T-proceduri pentru orice distribuție în formă, cu excepția cazului în care există valori superioare sau un grad ridicat de înclinare.
Dacă dimensiunea eșantionului este mai mică de 15, atunci putem folosi T- proceduri pentru date care nu au valori superioare, un vârf unic și sunt aproape simetrice.

În cele mai multe cazuri, robustetea a fost stabilită prin lucrări tehnice în statisticile matematice și, din fericire, nu trebuie neapărat să facem aceste calcule matematice avansate pentru a putea corecta folosește-le; trebuie doar să înțelegem care sunt orientările generale pentru robustetea metodei noastre statistice specifice.

Procedurile T funcționează ca statistici solide, deoarece obișnuiesc să obțină performanțe bune pentru aceste modele prin factorizarea dimensiunii eșantionului în baza aplicării procedurii.