Gama de seturi de date statistice

În statistică și matematică, intervalul este diferența dintre valorile maxime și minime ale unui set de date și servește ca una dintre cele două caracteristici importante ale unui set de date. Formula pentru un interval este valoarea maximă minus valoarea minimă din setul de date, care oferă statisticienilor o mai bună înțelegere a cât de variată este setul de date.

Două caracteristici importante ale unui set de date includ centrul datelor și răspândirea datelor, iar centrul poate fimăsurate în mai multe moduri: cele mai populare dintre acestea sunt media, median, modul și interval mediu, dar într-o manieră similară, există diferite moduri de a calcula modul în care este extins setul de date și cea mai ușoară și crudă măsură de răspândire se numește gama.

Calculul intervalului este foarte simplu. Tot ce trebuie să facem este să găsim diferența dintre cea mai mare valoare a datelor din setul nostru și cea mai mică valoare a datelor. Afirmată succint avem următoarea formulă: Interval = Valoarea maximă - Valoarea minimă. De exemplu, setul de date 4,6,10, 15, 18 are un maxim de 18, un minim de 4 și un interval de

instagram viewer
18-4 = 14.

Intervalul este o măsurare foarte brută a răspândirii datelor, deoarece este extrem de sensibil la valori superioare și, în consecință, există anumite limitări la utilitatea unui adevărat interval de set de date statisticienilor, deoarece o valoare unică de date poate afecta foarte mult valoarea gamă.

De exemplu, luați în considerare setul de date 1, 2, 3, 4, 6, 7, 7, 8. Valoarea maximă este 8, minimul 1 și intervalul 7. Apoi, luați în considerare același set de date, numai cu valoarea 100 inclusă. Gama devine acum 100-1 = 99 în care adăugarea unui singur punct suplimentar de date a afectat considerabil valoarea intervalului. Abaterea standard este o altă măsură a răspândirii care este mai puțin sensibilă la valori superioare, dar dezavantajul este că calculul abaterii standard este mult mai complicat.

De asemenea, gama nu ne spune nimic despre caracteristicile interne ale setului nostru de date. De exemplu, avem în vedere setul de date 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10 unde intervalul pentru acest set de date este 10-1 = 9. Dacă apoi comparăm acest lucru cu setul de date de 1, 1, 1, 2, 9, 9, 9, 10. Aici intervalul este, din nou, nouă, totuși, pentru acest al doilea set și spre deosebire de primul set, datele sunt grupate în jurul valorilor minime și maxime. Alte statistici, cum ar fi primul și al treilea quartile, ar trebui să fie utilizate pentru a detecta o parte din această structură internă.

Gama este o modalitate bună de a înțelege foarte bine cum sunt numerele răspândite în setul de date, deoarece este ușor de făcut calculați deoarece necesită doar o operație aritmetică de bază, dar există și alte câteva aplicații ale gamei unui set de date în statistici.

Intervalul poate fi folosit și pentru a estima o altă măsură a răspândirii, abaterea standard. În loc să parcurgem o formulă destul de complicată pentru a găsi abaterea standard, putem folosi în schimb ceea ce se numește regula intervalului. Intervalul este fundamental în acest calcul.

Intervalul apare și în a grafic cu căsuțe, sau un complot de cutii și biciuri. Valorile maxime și minime sunt ambele grefate la sfârșitul bâțâielor graficului și lungimea totală a băuturilor și a casetei este egală cu intervalul.