Câmpul statisticii este împărțit în două diviziuni majore: descriptive și inferențiale. Fiecare dintre aceste segmente este important, oferind tehnici diferite care îndeplinesc obiective diferite. Statisticile descriptive descriu ceea ce se întâmplă în a populație sau set de date. Statisticile inferențiale, prin contrast, permit oamenilor de știință să ia concluzii dintr-un grup de probe și să le generalizeze într-o populație mai mare. Cele două tipuri de statistici prezintă unele diferențe importante.
Statisticile descriptive
Statisticile descriptive sunt tipul de statistici care răspund probabil în mintea majorității oamenilor atunci când aud cuvântul „statistici”. În această ramură a statisticilor, scopul este de a descrie. Măsurile numerice sunt utilizate pentru a spune despre caracteristicile unui set de date. Există o serie de elemente care aparțin acestei porțiuni de statistici, cum ar fi:
- in mediesau o măsură a centrului unui set de date, constând din media, mediana, modul sau interval mediu
- Răspândirea unui set de date, care poate fi măsurat cu gamă sau deviație standard
- Descrierea generală a datelor, cum ar fi rezumat de cinci numere
- Măsurători cum ar fi asimetria și aplatizării
- Explorarea relațiilor și corelație între datele împerecheate
- Prezentarea rezultatelor statistice în grafic formă
Aceste măsuri sunt importante și utile, deoarece permit oamenilor de știință să vadă tiparele dintre date și astfel să înțeleagă aceste date. Statisticile descriptive pot fi utilizate doar pentru a descrie populația sau setul de date studiate: Rezultatele nu pot fi generalizate la niciun alt grup sau populație.
Tipuri de statistici descriptive
Există două tipuri de statistici descriptive pe care le folosesc oamenii de știință socială:
Măsuri de tendință centrală surprinde tendințele generale în cadrul datelor și sunt calculate și exprimate ca medie, medie și mod. O medie spune oamenilor de știință media matematică a tuturor unui set de date, cum ar fi vârsta medie la prima căsătorie; mediana reprezintă mijlocul distribuției datelor, la fel ca vârsta care se află la mijlocul intervalului de vârstă la care oamenii se căsătoresc pentru prima dată; și, modul ar putea fi cea mai comună vârstă la care oamenii se căsătoresc pentru prima dată.
Măsurile de răspândire descriu modul în care datele sunt distribuite și se raportează între ele, inclusiv:
- Intervalul, întregul interval de valori prezent într-un set de date
- Distribuția frecvenței, care definește de câte ori apare o anumită valoare într-un set de date
- Quartile, subgrupuri formate în cadrul unui set de date atunci când toate valorile sunt împărțite în patru părți egale pe întreaga gamă
- Media abaterii absolute, media cât de mult se abate fiecare valoare de la medie
- variație, care ilustrează cât de mult există o răspândire în date
- Abatere standard, care ilustrează răspândirea datelor în raport cu media
Măsurile de răspândire sunt adesea reprezentate vizual în tabele, grafice cu plăcintă și bare și histograme pentru a ajuta la înțelegerea tendințelor din date.
Statistici deduse
Statisticile inferențiale sunt produse prin calcule matematice complexe care permit oamenilor de știință să deducă tendințele unei populații mai mari pe baza unui studiu al unui eșantion prelevat din acesta. Oamenii de știință folosesc statistici inferențiale pentru a examina relațiile dintre variabilele dintr-un eșantion apoi faceți generalizări sau predicții despre modul în care se vor raporta acele variabile la o dimensiune mai mare populație.
De obicei, este imposibil de examinat individual fiecare membru al populației. Deci, oamenii de știință aleg un subset reprezentativ al populației, numit eșantion statistic și, din această analiză, sunt capabili să spună ceva despre populația din care a provenit eșantionul. Există două diviziuni majore ale statisticilor inferențiale:
- Un interval de încredere oferă o serie de valori pentru un parametru necunoscut al populației prin măsurarea unui eșantion statistic. Aceasta este exprimată în termeni de intervale și gradul de încredere că parametrul se află în interval.
- Teste de semnificație sau testarea ipotezelor unde oamenii de știință formulează o afirmație despre populație prin analizarea unui eșantion statistic. Prin proiectare, există o anumită incertitudine în acest proces. Aceasta poate fi exprimată în termeni de semnificație.
Tehnicile pe care oamenii de știință socială le utilizează pentru a examina relațiile dintre variabile și, astfel, pentru a crea statistici inferențiale, includ analize de regresie liniară, analize de regresie logistică, ANOVA, analize de corelație, Modelarea ecuației structuraleși analiza supraviețuirii. Atunci când efectuează cercetări folosind statistici inferențiale, oamenii de știință efectuează un test de importanță pentru a determina dacă își pot generaliza rezultatele pentru o populație mai mare. Testele comune de semnificație includ chi-pătrat și t-test. Acestea spun oamenilor de știință probabilitatea ca rezultatele analizei acestora să fie reprezentative pentru populație în ansamblu.
Descriptiv vs. Statistici deduse
Deși statisticile descriptive sunt utile în învățarea unor lucruri precum răspândirea și centrul datelor, nimic din statisticile descriptive nu poate fi folosit pentru a face generalizări. În statisticile descriptive, măsurători precum media și abaterea standard sunt menționate ca numere exacte.
Chiar dacă statisticile inferențiale folosesc unele calcule similare - cum ar fi media și abaterea standard - accentul este diferit pentru statisticile inferențiale. Statisticile inerente încep cu un eșantion și apoi se generalizează la o populație. Aceste informații despre o populație nu sunt menționate ca număr. În schimb, oamenii de știință exprimă acești parametri ca o serie de numere potențiale, împreună cu un grad de încredere.