Datele asociate în statistici, denumite adesea perechi ordonate, se referă la două variabile la indivizii unei populații care sunt legate între ele pentru a determina corelația dintre ele. Pentru ca un set de date să fie considerat date în pereche, ambele valori ale acestor date trebuie să fie atașate sau legate între ele și nu trebuie luate în considerare separat.
Ideea de date în pereche este contrastată cu asocierea obișnuită a unui număr la fiecare punct de date ca în altul date cantitative stabilește că fiecare punct de date individual este asociat cu două numere, oferind un grafic care permite statisticienilor să observe relația dintre aceste variabile într-o populație.
Această metodă de date în pereche este folosită atunci când un studiu speră să compare două variabile la indivizii din populație pentru a trage un fel de concluzie despre corelația observată. La respectarea acestor puncte de date, ordinea împerecherii este importantă, deoarece primul număr este o măsură a unui lucru, în timp ce al doilea este o măsură a cu totul altceva.
Exemplu de date în pereche
Pentru a vedea un exemplu de date în pereche, să presupunem că un profesor numără numărul de sarcini pentru fiecare acasă activat pentru o anumită unitate și apoi împerechează acest număr cu procentul fiecărui elev la testul unității. Perechile sunt următoarele:
- O persoană care a finalizat 10 misiuni a câștigat 95% la testul său. (10, 95%)
- O persoană care a finalizat 5 misiuni a câștigat 80% la testul său. (5, 80%)
- O persoană care a finalizat 9 misiuni a câștigat 85% la testul său. (9, 85%)
- O persoană care a finalizat 2 misiuni a câștigat 50% la testul său. (2, 50%)
- O persoană care a finalizat 5 misiuni a câștigat 60% la testul său. (5, 60%)
- O persoană care a finalizat 3 misiuni a câștigat 70% la testul său. (3, 70%)
În fiecare din aceste seturi de date în pereche, putem vedea că numărul de misiuni vine întotdeauna pe primul loc pereche comandată în timp ce procentul câștigat la test vine pe locul doi, așa cum se vede în prima instanță din (10, 95%).
În timp ce o analiză statistică a acestor date ar putea fi, de asemenea, utilizată pentru a calcula numărul mediu de sarcinile de temă finalizate sau scorul mediu de testare, pot exista alte întrebări datele. În acest caz, profesorul vrea să știe dacă există vreo legătură între numărul de sarcini pentru teme s-a transformat și a făcut performanța la test, iar profesorul ar trebui să păstreze datele împerecheate pentru a răspunde la acest lucru întrebare.
Analiza datelor în pereche
tehnici statistice de corelație și regresie sunt utilizate pentru a analiza datele în pereche în care coeficient de corelație cuantifică cât de strâns sunt datele de-a lungul unei linii drepte și măsoară puterea relației liniare.
Pe de altă parte, regresia este folosită pentru mai multe aplicații, inclusiv pentru a determina care linie se potrivește cel mai bine pentru setul nostru de date. La rândul său, această linie poate fi folosită pentru a estima sau prezice y valori pentru valori ale X care nu făceau parte din setul nostru original de date.
Există un tip special de grafic, care este potrivit în special pentru datele în pereche numite scatterplot. In acest tip de grafic, o axă de coordonate reprezintă o cantitate de date împerecheate, în timp ce cealaltă axă de coordonate reprezintă cealaltă cantitate de date împerecheate.
O diagramă de dispersie pentru datele de mai sus ar avea ca axa X să indice numărul de sarcini transformate în timp ce axa y ar indica scorurile la testul unității.