Curba clopotului și definiția normală a distribuției

Termenul curba clopotului este folosit pentru a descrie conceptul matematic numit distribuție normală, uneori denumit distribuție gaussiană. "Curba clopotului" se referă la forma clopotului care este creată atunci când este trasată o linie folosind punctele de date pentru un element care îndeplinește criteriile de distribuție normală.

Într-o curbă de clopot, centrul conține cel mai mare număr de valori și, prin urmare, este cel mai înalt punct de pe arcul liniei. Acest punct se referă la Rău, dar în termeni simpli, este cel mai mare număr de apariții ale unui element (în termeni statistici, modul).

Distributie normala

Lucrul important de remarcat despre a distributie normala este că curba este concentrată în centru și scade pe ambele părți. Acest lucru este semnificativ prin faptul că datele au o tendință mai mică de a produce valori neobișnuit de extreme, numite valori outliers, în comparație cu alte distribuții. De asemenea, curba clopotului semnifică faptul că datele sunt simetrice. Acest lucru înseamnă că puteți crea așteptări rezonabile cu privire la posibilitatea ca un rezultat să se încadreze în termen de se situează în stânga sau în dreapta centrului, după ce ați măsurat abaterea conținută în date. Aceasta se măsoară în termeni de

instagram viewer
abateri standard.

Un grafic al curbei de clopot depinde de doi factori: media și abaterea standard. Media identifică poziția centrului, iar abaterea standard determină înălțimea și lățimea clopoței. De exemplu, o abatere standard mare creează un clopot scurt și lat, în timp ce o mică abatere standard creează o curbă înaltă și îngustă.

Probabilitatea curbei Bell și abaterea standard

Pentru a înțelege factorii de probabilitate ai unei distribuții normale, trebuie să înțelegeți următoarele reguli:

  1. Suprafața totală sub curbă este egală cu 1 (100%)
  2. Aproximativ 68% din suprafața de sub curbă se încadrează într-o abatere standard.
  3. Aproximativ 95% din suprafața de sub curbă se încadrează în două abateri standard.
  4. Aproximativ 99,7% din suprafața de sub curbă se încadrează în trei abateri standard.

Elementele 2, 3 și 4 de mai sus sunt uneori denumite regula empirică sau regula 68-95-99.7. După ce determinați că datele sunt distribuite în mod normal (clopot curbat) și calculați media și deviație standard, puteți determina probabilitate că un singur punct de date se va încadra într-o gamă dată de posibilități.

Exemplu de curbă de clopoțel

Un bun exemplu de curbă de clopot sau de distribuție normală este sul de două zaruri. Distribuția este centrată în jurul numărului șapte și probabilitatea scade pe măsură ce te îndepărtezi de centru.

Iată procentul de șanse al diferitelor rezultate atunci când arunci două zaruri.

  • Două: (1/36) 2.78%
  • Trei: (2/36) 5.56%
  • Patru: (3/36) 8.33%
  • Cinci: (4/36) 11.11%
  • Şase: (5/36) 13.89%
  • Șapte: (6/36) 16,67% = rezultatul cel mai probabil
  • Opt: (5/36) 13.89%
  • Nouă: (4/36) 11.11%
  • Zece: (3/36) 8.33%
  • Unsprezece: (2/36) 5.56%
  • Doisprezece: (1/36) 2.78%

Distribuțiile normale au multe proprietăți convenabile, deci în multe cazuri, în special în fizică și astronomie, se consideră că variațiile aleatorii cu distribuții necunoscute sunt normale pentru a permite calcularea probabilității. Deși aceasta poate fi o presupunere periculoasă, este adesea o bună aproximare datorită unui rezultat surprinzător cunoscut sub numele de teorema limitei centrale.

Această teoremă afirmă că media oricărui set de variante cu o distribuție care are o medie finită și o variație tinde să apară într-o distribuție normală. Multe atribute obișnuite, cum ar fi scorurile de testare sau înălțimea, urmează distribuții aproximativ normale, cu puțini membri la capetele înalte și joase și multe la mijloc.

Când nu ar trebui să folosiți curba Bell

Există anumite tipuri de date care nu respectă un model normal de distribuție. Aceste seturi de date nu ar trebui să fie obligate să încerce să se încadreze într-o curbă de clopot. Un exemplu clasic ar fi clasele studenților, care au adesea două moduri. Alte tipuri de date care nu respectă curba includ veniturile, creșterea populației și eșecurile mecanice.