Boxplot-urile își iau numele din ceea ce seamănă. Ele sunt uneori denumite loturi de tip box și whisker. Aceste tipuri de grafice sunt utilizate pentru a afișa intervalul, median, și quartile. Când sunt completate, o casetă conține primul și al treilea quartile. Băieții se extind de la casetă la valorile minime și maxime ale datelor.
Următoarele pagini vor arăta cum se poate face un boxplot pentru un set de date cu minim 20, primul quartile 25, mediana 32, al treilea quartile 35 și maximum 43.
Desenați cinci linii verticale deasupra liniei numerice, una pentru fiecare dintre valorile minimului, primul quartile, median, al treilea quartile și maxim. De obicei, liniile pentru minim și maxim sunt mai scurte decât liniile pentru quartile și mediană.
Pentru datele noastre, minimul este 20, primul quartile este 25, mediana 32, al treilea quartile 35 și maxim 43. Liniile corespunzătoare acestor valori sunt trasate mai sus.
În continuare, desenăm o casetă și folosim câteva dintre rânduri pentru a ne ghida. Primul quartile este partea din stânga a cutiei noastre. Al treilea quartile este partea dreaptă a cutiei noastre. Mediana cade oriunde în interiorul cutiei.
Prin definiția primelor și a treia quartile, jumătate din toate valorile datelor sunt conținute în casetă.
Acum vedem cum o casetă și un grafic bătător obțin a doua parte a numelui. Băieții sunt trași pentru a demonstra gama de date. Desenați o linie orizontală de la linie pentru minim în partea stângă a casetei din primul quartile. Acesta este unul dintre bătaia noastră. Desenați o a doua linie orizontală din partea dreaptă a casetei din al treilea quartile până la linia reprezentând maximul datelor. Acesta este cel de-al doilea bătaie al nostru.
Graficul pentru cutie și bici, sau boxplot, este acum complet. La prima vedere, putem determina intervalul de valori ale datelor și gradul în care este completat totul. Următorul pas arată cum putem compara și contrasta două boxplots.
Graficele casetelor și șoimelor afișează rezumatul cu cinci numere al unui set de date. Prin urmare, două seturi de date diferite pot fi comparate examinând împreună box-urile. Deasupra unui al doilea boxplot a fost desenat deasupra celui pe care l-am construit.
Există câteva caracteristici care merită menționate. Prima este că mediile ambelor seturi de date sunt identice. Linia verticală din ambele casete este la același loc pe linia numerică. Al doilea lucru de remarcat cu privire la cele două grafice cu casetă și bici este că trama de sus nu este la fel de răspândită în partea de jos. Cutia de sus este mai mică, iar biciurile nu se extind atât de departe.
Trasarea a două box-uri peste aceeași linie numerică presupune că datele din spatele fiecăruia merită să fie comparate. Nu ar avea niciun sens să comparați o cutie de înălțimi de graderi a treia cu greutăți de câini la un adăpost local. Deși ambele conțin date la raport nivelul de măsurare, nu există niciun motiv pentru a compara datele.
Pe de altă parte, ar avea un sens să comparăm box-urile cu înălțimile gradatorilor al treilea, dacă un lot a reprezentat datele de la băieții dintr-o școală, iar celălalt complot a reprezentat datele de la fetele din scoala.