În statistici, există mulți termeni care au distincții subtile între ei. Un exemplu în acest sens este diferența dintre frecvența și frecvența relativă. Deși există multe utilizări pentru frecvențele relative, există în special una care implică o histogramă de frecvență relativă. Acesta este un tip de grafic care are conexiuni cu alte subiecte din statistici și statistici matematice.
Definiție
Histogramele sunt grafice statistice care arată grafice de bare. Totuși, în mod obișnuit, termenul histogramă este rezervat cantitativ variabile. Axa orizontală a unei histograme este o linie numerică care conține clase sau pubele de lungime uniformă. Aceste coșuri sunt intervale ale unei linii numerice unde datele pot cădea și pot consta dintr-un singur număr (de obicei pentru distinct seturi de date care sunt relativ mici) sau o serie de valori (pentru seturi de date discrete și mai mari continuu date).
De exemplu, ne-ar putea interesa să avem în vedere distribuirea punctajelor pe un test de 50 de puncte pentru o clasă de studenți. Un mod posibil de a construi pubele ar fi să ai o coșul diferit pentru fiecare 10 puncte.
Axa verticală a unei histograme reprezintă numărul sau frecvența pe care o valoare de date are loc în fiecare dintre coșuri. Cu cât este mai mare bara, cu atât mai multe valori ale datelor se încadrează în acest interval de valori ale binelor. Pentru a reveni la exemplul nostru, dacă suntem cinci studenți care au marcat mai mult de 40 de puncte la test, atunci bara corespunzătoare 40 - 50 bin va avea cinci unități înălțime.
Comparația histogramelor de frecvență
O histogramă de frecvență relativă este o modificare minoră a unei histograme de frecvență tipică. În loc să folosim o axă verticală pentru numărul de valori care intră într-o coșul dat, folosim această axă pentru a reprezenta proporția globală a valorilor de date care intră în această coș. Deoarece 100% = 1, toate barele trebuie să aibă o înălțime de la 0 la 1. Mai mult, înălțimea tuturor barelor din histograma noastră de frecvență relativă trebuie să se ridice la 1.
Astfel, în exemplul de alergare la care ne-am uitat, să presupunem că sunt 25 de studenți în clasa noastră și cinci au obținut peste 40 de puncte. În loc să construim o bară de înălțime cinci pentru această coș, am avea o bară de înălțime 5/25 = 0,2.
Comparând o histogramă cu o histogramă cu frecvență relativă, fiecare cu aceleași pubele, vom observa ceva. Forma generală a histogramelor va fi identică. O histogramă de frecvență relativă nu accentuează numărul total al fiecărei coșuri. În schimb, acest tip de grafic se concentrează asupra modului în care numărul de date din coș se referă la celelalte pubele. Modul în care arată această relație este procentual din numărul total de valori ale datelor.
Funcții de masă de probabilitate
Ne putem întreba care este punctul în definirea unei histograme cu frecvență relativă. O aplicație cheie se referă la variabile aleatoare discrete, în care coșurile noastre au lățimea unu și sunt centrate pe fiecare număr întreg neegativ. În acest caz, putem defini o funcție în bucată cu valori corespunzătoare înălțimilor verticale ale barelor din histograma noastră de frecvență relativă.
Acest tip de funcții se numește funcție de masă de probabilitate. Motivul pentru construirea funcției în acest fel este că curba definită de funcție are o legătură directă cu probabilitate. Zona de sub curbă de la valori A la b este probabilitatea ca variabila aleatoare să aibă o valoare de la A la b.
Conexiunea dintre probabilitatea și aria de sub curbă este una care apare în mod repetat în statisticile matematice. Utilizarea unei funcții de masă de probabilitate pentru modelarea unei histograme de frecvență relativă este o altă conexiune.