Clasele de histograme: informații și exemple

click fraud protection

În realitate nu există nicio regulă pentru câte clase ar trebui să fie. Există câteva lucruri de luat în considerare cu privire la numărul de clase. Dacă ar exista o singură clasă, toate datele ar intra în această clasă. Histograma noastră ar fi pur și simplu un singur dreptunghi cu înălțimea dată de numărul de elemente din setul nostru de date. Acest lucru nu ar fi foarte util sau histogramă utilă.

La cealaltă extremă, am putea avea o multitudine de clase. Aceasta ar rezulta într-o multitudine de bare, care nu ar fi probabil foarte înalte. Ar fi foarte dificil să se stabilească orice caracteristici distincte de date prin utilizarea acestui tip de histogramă.

Pentru a ne feri de aceste două extreme, trebuie să utilizăm o regulă mare pentru a determina numărul de clase pentru o histogramă. Când avem un set de date relativ redus, de obicei folosim doar aproximativ cinci clase. Dacă setul de date este relativ mare, atunci folosim în jur de 20 de clase.

Din nou, să subliniem că aceasta este o regulă generală, nu un principiu statistic absolut. Pot exista motive întemeiate pentru a avea un număr diferit de clase pentru date. Vom vedea un exemplu în acest sens mai jos.

instagram viewer

Înainte de a lua în considerare câteva exemple, vom vedea cum să stabilim care sunt clasele de fapt. Începem acest proces găsind gamă a datelor noastre. Cu alte cuvinte, scăzem cea mai mică valoare a datelor din cea mai mare valoare a datelor.

Când setul de date este relativ mic, împărțim intervalul la cinci. Quocientul este lățimea claselor pentru histograma noastră. Probabil va trebui să facem o rotunjire în acest proces, ceea ce înseamnă că numărul total de clase nu poate ajunge la cinci.

Când setul de date este relativ mare, împărțim intervalul cu 20. La fel ca înainte, această problemă de diviziune ne oferă lățimea claselor pentru histograma noastră. De asemenea, așa cum am văzut anterior, rotunjirea noastră poate duce la ceva mai mult sau puțin mai puțin de 20 de clase.

În oricare dintre cazurile mari sau mici setate de date, facem ca prima clasă să înceapă cu un punct puțin mai mic decât cea mai mică valoare a datelor. Trebuie să facem acest lucru în așa fel încât prima valoare a datelor să se încadreze în prima clasă. Alte clase ulterioare sunt determinate de lățimea stabilită atunci când am împărțit intervalul. Știm că ne aflăm la ultima clasă atunci când cea mai mare valoare a datelor este conținută de această clasă.

Pentru un exemplu, vom determina o lățime de clasă adecvată și clase pentru setul de date: 1.1, 1.9, 2.3, 3.0, 3.2, 4.1, 4.2, 4.4, 5.5, 5.5, 5.6, 5.7, 5.9, 6.2, 7.1, 7.9, 8.3, 9.0, 9.2, 11.1, 11.2, 14.4, 15.5, 15.5, 16.7, 18.9, 19.2.

Vedem că în setul nostru există 27 de puncte de date. Acesta este un set relativ mic și astfel vom împărți intervalul cu cinci. Intervalul este 19,2 - 1,1 = 18,1. Împărțim 18,1 / 5 = 3,62. Aceasta înseamnă că o lățime de clasă de 4 ar fi adecvată. Cea mai mică valoare a datelor este 1,1, așa că începem prima clasă la un punct mai mic decât aceasta. Întrucât datele noastre constau în numere pozitive, ar avea sens să facem prima clasă de la 0 la 4.

Pentru un exemplu în acest sens, să presupunem că există un test cu alegere multiplă cu 35 de întrebări, iar 1000 de elevi de la un liceu iau testul. Dorim să formăm o histogramă care să indice numărul de studenți care au obținut anumite scoruri la test. Vedem că 35/5 = 7 și că 35/20 = 1,75. În ciuda regulii noastre mari, care ne oferă opțiunile de clase cu lățimea 2 sau 7 pe care să le utilizăm pentru histograma noastră, poate fi mai bine să avem clase de lățime 1. Aceste clase ar corespunde fiecărei întrebări la care un student a răspuns corect la test. Primul dintre acestea ar fi centrat la 0 și ultimul ar fi centrat pe 35.

instagram story viewer