Regula intervalului interquartil este utilă în detectarea prezenței valorilor exterioare. Aberante sunt valori individuale care nu se încadrează în modelul general al unui set de date. Această definiție este oarecum vagă și subiectivă, de aceea este util să existe o regulă de aplicat atunci când determinarea dacă un punct de date este într-adevăr un anormal - aici este regula intervalului interquartil intră.
Orice set de date poate fi descris de către acesta rezumat cu cinci numere. Aceste cinci numere, care vă oferă informațiile de care aveți nevoie pentru a găsi modele și valori, constau în (în ordine crescătoare):
Aceste cinci numere spun unei persoane mai multe despre datele sale decât ar putea privi numerele dintr-o dată, sau cel puțin să le facă mai ușoare. De exemplu, gamă, care este minimul scăzut din maxim, este un indicator al modului de răspândire a datelor într-un set (notă: intervalul este extrem de mare sensibil la valori superioare - dacă o valoare anterioară este, de asemenea, minimă sau maximă, intervalul nu va fi o reprezentare exactă a lățimii unei date a stabilit).
Altfel ar fi dificil de extrapolat. Similar cu intervalul, dar mai puțin sensibil la valori superioare este gama interquartile. gama interquartile este calculat în același mod cu intervalul. Tot ce faceți pentru a afla este să scădeți primul quartile din al treilea quartile:
Gama interquartile arată modul în care datele sunt răspândite despre mediană. Este mai puțin sensibil decât intervalul la valori superioare și, prin urmare, poate fi mai util.
Deși de multe ori nu este afectat prea mult de acestea, gama interquartile poate fi folosită pentru a detecta valorile exterioare. Aceasta se face folosind acești pași:
Amintiți-vă că regula interquartile este doar o regulă generală, care în general este valabilă, dar care nu se aplică tuturor cazurilor. În general, ar trebui să-ți urmărești întotdeauna analiza anterioară, studiind elementele rezultate pentru a vedea dacă au sens. Orice potențial obținut anterior prin metoda interquartile ar trebui examinat în contextul întregului set de date.
Consultați regula intervalului intermediar la lucru cu un exemplu. Să presupunem că aveți următorul set de date: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. Rezumatul celor cinci numere pentru acest set de date este minim = 1, primul quartile = 4, mediana = 7, al treilea quartile = 10 și maxim = 17. S-ar putea să priviți datele și să spuneți automat că 17 este o valoare anterioară, dar ce spune regula intervalului intermediar?
Înmulțiți acum răspunsul cu 1,5 pentru a obține 1,5 x 6 = 9. Nouă mai puțin decât primul quartile este 4 - 9 = -5. Nicio date nu este mai mică decât aceasta. Nouă mai mult decât al treilea quartile este 10 + 9 = 19. Nicio date nu este mai mare decât aceasta. În pofida valorii maxime fiind cu cinci mai mult decât cel mai apropiat punct de date, regula intervalului interquartile arată că probabil nu ar trebui considerată o valoare mai mare pentru acest set de date.