Intervalele de încredere: 4 greșeli comune

Intervalele de încredere sunt o parte cheie a statisticilor inferențiale. Putem folosi unele probabilități și informații de la a distribuția probabilităților pentru a estima un parametru de populație cu utilizarea unui eșantion. Declarația unui interval de încredere se face în așa fel încât să fie ușor înțeles greșit. Vom analiza interpretarea corectă a intervalelor de încredere și vom cerceta patru greșeli care sunt făcute cu privire la acest domeniu de statistică.

Ce este un interval de încredere?

Un interval de încredere poate fi exprimat fie ca o gamă de valori, fie în următoarea formă:

Estimarea ± Marja de eroare

Un interval de încredere este de obicei declarat cu un nivel de încredere.Niveluri comune de încredere sunt 90%, 95% și 99%.

Vom analiza un exemplu în care dorim să folosim un eșantion mediu pentru a deduce media unei populații. Să presupunem că acest lucru are ca rezultat un interval de încredere între 25 și 30. Dacă spunem că suntem 95% încrezători că populația necunoscută

instagram viewer
Rău este conținut în acest interval, atunci spunem cu adevărat că am găsit intervalul folosind o metodă care reușește să dea rezultate corecte 95% din timp. Pe termen lung, metoda noastră nu va reuși 5% din timp. Cu alte cuvinte, nu vom reuși să surprindem adevărata populație înseamnă doar una din 20 de ori.

Greșeala nr. 1

Vom analiza acum o serie de greșeli diferite care pot fi făcute atunci când abordăm intervale de încredere. O declarație incorectă care se face adesea despre un interval de încredere la un nivel de încredere de 95% este că există 95% șanse ca intervalul de încredere să conțină media reală a populației.

Motivul pentru care aceasta este o greșeală este de fapt destul de subtil. Ideea cheie referitoare la un interval de încredere este aceea că probabilitatea utilizată intră în imagine metoda folosită, în determinarea intervalului de încredere este aceea că se referă la metoda care este folosit.

Greșeala nr. 2

O a doua greșeală este interpretarea unui interval de încredere de 95%, spunând că 95% din toate valorile datelor din populație se încadrează în acest interval. Din nou, 95% vorbește despre metoda testului.

Pentru a vedea de ce afirmația de mai sus este incorectă, am putea considera o populație normală cu o deviație standard de 1 și o medie de 5. Un eșantion care a avut două puncte de date, fiecare cu valori de 6 are o probă medie de 6. Un interval de încredere de 95% pentru media populației ar fi de 4,6 până la 7,4. Acest lucru nu se suprapune în mod clar cu 95% distributie normaladeci nu va conține 95% din populație.

Greșeala nr. 3

O a treia greșeală este să spunem că un interval de încredere de 95% implică faptul că 95% din toate mijloacele de probă posibile se încadrează în intervalul. Reconsiderați exemplul din ultima secțiune. Orice eșantion de dimensiunea a doua care a fost format doar din valori mai mici de 4,6 ar avea o medie care a fost mai mică de 4,6. Astfel, aceste mijloace de eșantion ar fi în afara acestui interval de încredere particular. Probele care se potrivesc cu această descriere reprezintă mai mult de 5% din suma totală. Deci este o greșeală să spunem că acest interval de încredere captează 95% din toate mijloacele de probă.

Greșeala nr. 4

O a patra greșeală în tratarea intervalelor de încredere este de a crede că acestea sunt singura sursă de eroare. Deși există o marjă de eroare asociată cu un interval de încredere, există și alte locuri în care erorile se pot strecura într-o analiză statistică. Câteva exemple de aceste tipuri de erori ar putea fi dintr-o proiectare incorectă a experimentului, o prejudecată în eșantionare sau o incapacitate de a obține date dintr-un anumit subset de populație.

instagram story viewer