O introducere în gama Interquartile

Gama interquartile (IQR) este diferența dintre primul quartile și al treilea quartile. Formula pentru aceasta este:

IQR = Q3 - Î1

Există multe măsurători ale variabilității unui set de date. Amandoua gamă și deviație standard spune-ne cât de răspândite sunt datele noastre. Problema cu aceste statistici descriptive este că sunt destul de sensibile la valori superioare. Măsurarea răspândirii unui set de date care este mai rezistent la prezența valorilor exterioare este intervalul interquartil.

Definiția Interquartile Range

După cum s-a văzut mai sus, intervalul interquartile este construit pe baza calculării altor statistici. Înainte de a determina intervalul interquartile, trebuie să cunoaștem mai întâi valorile primului quartile și al treilea quartile. (Desigur, primul și al treilea quartile depind de valoarea mediană).

După ce am determinat valorile primelor și celei de-a treia quartile, intervalul interquartil este foarte ușor de calculat. Tot ce trebuie să facem este să scădem primul quartile din al treilea quartile. Acest lucru explică utilizarea termenului interval interquartile pentru această statistică.

instagram viewer

Exemplu

Pentru a vedea un exemplu de calcul al unui interval interquartil, vom lua în considerare setul de date: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9. rezumat de cinci numere pentru acest set de date este:

  • Minim 2
  • Primul quartile de 3,5
  • Mediană de 6
  • Al treilea quartile din 8
  • Maxim 9

Astfel, vedem că intervalul interquartile este 8 - 3,5 = 4,5.

Semnificația intervalului Interquartile

Intervalul ne oferă o măsurare a modului de răspândire a întregului set de date. Gama interquartile, care ne spune cât de departe este distanța primul și al treilea quartile sunt, indică cât de răspândită este mijlocul de 50% din setul nostru de date.

Rezistență la valori superioare

Avantajul principal al utilizării intervalului interquartile, mai degrabă decât a intervalului pentru măsurarea răspândirii unui set de date este faptul că intervalul interquartile nu este sensibil la valori exterioare. Pentru a vedea acest lucru, vom analiza un exemplu.

Din setul de date de mai sus avem un interval inter-filial de 3,5, un interval de 9 - 2 = 7 și o abatere standard de 2,34. Dacă înlocuim cea mai mare valoare de 9 cu o valoare extremă peste 100, atunci abaterea standard devine 27,37 și intervalul 98. Chiar dacă avem schimbări destul de drastice ale acestor valori, primul și al treilea quartile nu sunt afectate și astfel intervalul interquartil nu se schimbă.

Utilizarea gamei Interquartile

Pe lângă faptul că este o măsură mai puțin sensibilă a răspândirii unui set de date, intervalul interquartil are o altă utilizare importantă. Datorită rezistenței sale la valori superioare, intervalul interquartile este util în identificarea când o valoare este mai mare.

regula intervalului interquartil este ceea ce ne informează dacă avem o intervenție ușoară sau puternică. Pentru a căuta un aspect mai vechi, trebuie să privim sub primul quartil sau deasupra celui de-al treilea quartile. Cât de departe ar trebui să mergem depinde de valoarea intervalului interquartile.