Inegalitatea din Chebyshev în probabilitate

Inegalitatea lui Chebyshev spune că cel puțin 1-1 /K2 datele dintr-un eșantion trebuie să se încadreze K abateri standard de la medie (aici K este orice pozitiv numar real mai mare decât unul).

Orice set de date care este distribuit în mod normal sau sub forma unui curba clopotului, are mai multe caracteristici. Una dintre ele se ocupă de răspândirea datelor în raport cu numărul de abateri standard de la medie. Într-o distribuție normală, știm că 68% din date reprezintă o abatere standard de la medie, 95% sunt două abateri standard de la medie și aproximativ 99% se încadrează în trei abateri standard față de medie.

Dar dacă setul de date nu este distribuit sub forma unei curbe de clopot, atunci o cantitate diferită ar putea fi într-o abatere standard. Inegalitatea lui Chebyshev oferă o modalitate de a ști ce fracțiune de date se încadrează K abateri standard de la media pentru orice set de date

Fapte despre inegalitate

Putem afirma, de asemenea, inegalitatea de mai sus, înlocuind sintagma „date dintr-un eșantion” cu

instagram viewer
distribuția probabilităților. Acest lucru se datorează faptului că inegalitatea lui Chebyshev este rezultatul probabilității, care poate fi apoi aplicat statisticilor.

Este important de menționat că această inegalitate este un rezultat care a fost dovedit matematic. Nu este ca relație empirică între medie și mod, sau regula degetului mare care conectează intervalul și abaterea standard.

Ilustrația inegalității

Pentru a ilustra inegalitatea, îl vom analiza pentru câteva valori K:

  • Pentru K = 2 avem 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Deci, inegalitatea lui Chebyshev spune că cel puțin 75% din valorile de date ale oricărei distribuții trebuie să se încadreze în două abateri standard ale mediei.
  • Pentru K = 3 avem 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Deci, inegalitatea lui Chebyshev spune că cel puțin 89% din valorile de date ale oricărei distribuții trebuie să se încadreze în trei abateri standard ale mediei.
  • Pentru K = 4 avem 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93.75%. Așadar, inegalitatea lui Chebyshev spune că cel puțin 93,75% din valorile de date ale oricărei distribuții trebuie să se încadreze în două abateri standard ale mediei.

Exemplu

Să presupunem că am prelevat greutățile câinilor din adăpostul local pentru animale și am constatat că eșantionul nostru are o medie de 20 de kilograme cu o abatere standard de 3 kilograme. Prin utilizarea inegalității lui Chebyshev, știm că cel puțin 75% din câinii pe care i-am făcut probă au greutăți care reprezintă două abateri standard de la medie. De două ori deviația standard ne oferă 2 x 3 = 6. Reduceți și adăugați acest lucru din media de 20. Acest lucru ne spune că 75% dintre câini au greutate de la 14 kilograme la 26 de kilograme.

Utilizarea inegalității

Dacă știm mai multe despre distribuția cu care lucrăm, atunci de obicei putem garanta că mai multe date sunt un anumit număr de abateri standard față de medie. De exemplu, dacă știm că avem o distribuție normală, atunci 95% din date reprezintă două abateri standard de la medie. Inegalitatea lui Chebyshev spune că în această situație știm asta macar 75% din date reprezintă două abateri standard de la medie. După cum putem vedea în acest caz, ar putea fi mult mai mult decât acest 75%.

Valoarea inegalității este că ne oferă un scenariu „în caz mai rău” în care singurele lucruri pe care le cunoaștem despre datele noastre de eșantion (sau distribuția probabilităților) sunt media și deviație standard. Când nu știm altceva despre datele noastre, inegalitatea lui Chebyshev oferă o informație suplimentară asupra modului de răspândire a setului de date.

Istoria inegalității

Inegalitatea poartă numele matematicianului rus Pafnuty Chebyshev, care a afirmat pentru prima dată inegalitatea fără dovezi în 1874. Zece ani mai târziu, inegalitatea a fost dovedită de Markov în doctoratul său. disertație. Datorită variațiilor în modul de a reprezenta alfabetul rus în engleză, Chebyshev este, de asemenea, scris ca Tchebysheff.

instagram story viewer