Înainte de a continua, este important să înțelegem despre ce vorbim atunci când ne referim la o relație empirică și să contrastăm cu studiile teoretice. Unele rezultate din statistici și alte domenii de cunoștințe pot fi obținute din unele afirmații anterioare într-o manieră teoretică. Începem cu ceea ce știm, apoi folosim logica, matematica și motiv dedus și vezi unde ne duce asta. Rezultatul este o consecință directă a altor fapte cunoscute.
Contrast cu teoretic este modul empiric de dobândire a cunoștințelor. În loc să ne gândim la principii deja stabilite, putem observa lumea din jurul nostru. Din aceste observații, putem formula apoi o explicație a ceea ce am văzut. O mare parte din știință se face în acest mod. Experimentele ne oferă date empirice. Scopul devine apoi formularea unei explicații care să se potrivească tuturor datelor.
În statistici, există o relație între media, mediul și modul care este bazat empiric. Observațiile a nenumărate seturi de date au arătat că, de cele mai multe ori, diferența dintre medie și modul este de trei ori mai mare decât diferența dintre medie și mediană. Această relație sub formă de ecuație este:
Pentru a vedea relația de mai sus cu datele din lumea reală, să aruncăm o privire asupra populațiilor statelor americane din 2010. În milioane, populațiile au fost: California - 36,4, Texas - 23,5, New York - 19,3, Florida - 18,1, Illinois - 12,8, Pennsylvania - 12,4, Ohio - 11,5, Michigan - 10,1, Georgia - 9,4, Carolina de Nord - 8,9, New Jersey - 8,7, Virginia - 7,6, Massachusetts - 6,4, Washington - 6,4, Indiana - 6,3, Arizona - 6,2, Tennessee - 6,0, Missouri - 5.8, Maryland - 5.6, Wisconsin - 5.6, Minnesota - 5.2, Colorado - 4.8, Alabama - 4.6, Carolina de Sud - 4.3, Louisiana - 4.3, Kentucky - 4.2, Oregon - 3.7, Oklahoma - 3.6, Connecticut - 3.5, Iowa - 3.0, Mississippi - 2.9, Arkansas - 2.8, Kansas - 2.8, Utah - 2.6, Nevada - 2.5, New Mexico - 2.0, Virginia de Vest - 1.8, Nebraska - 1.8, Idaho - 1.5, Maine - 1.3, New Hampshire - 1.3, Hawaii - 1.3, Rhode Island - 1.1, Montana - .9, Delaware - .9, Dakota de Sud - .8, Alaska - .7, Dakota de Nord - .6, Vermont -. 6, Wyoming - .5
De exemplu, dacă știm că avem o medie de 10, un mod de 4, care este mediana setului nostru de date? Deoarece medie - mod = 3 (medie - mediană), putem spune că 10 - 4 = 3 (10 - median). Prin oarecare algebră, vedem că 2 = (10 - median), și deci mediana datelor noastre este 8.
După cum s-a văzut mai sus, cele de mai sus nu reprezintă o relație exactă. În schimb, este o regulă bună, similară cu cea a regula intervalului, care stabilește o legătură aproximativă între deviație standard și gamă. Este posibil ca media, modul și modul să nu se încadreze exact în relația empirică de mai sus, dar există șanse mari ca acesta să fie rezonabil apropiat.