Componentele principale și analiza factorilor

Analiza componentelor principale (PCA) și analiza factorilor (FA) sunt tehnici statistice utilizate pentru reducerea datelor sau detectarea structurii. Aceste două metode sunt aplicate unui singur set de variabile atunci când cercetătorul este interesat descoperind care variabile din set formează subseturi coerente care sunt relativ independente de una o alta. Variabilele care sunt corelate între ele, dar sunt în mare măsură independente de alte seturi de variabile, sunt combinate în factori. Acești factori vă permit să condensați numărul de variabile din analiza dvs. prin combinarea mai multor variabile într-un singur factor.

Obiectivele specifice ale PCA sau FA sunt rezumarea tiparelor corelații dintre variabilele observate, pentru a reduce un număr mare de variabile observate la un număr mai mic de factori, pentru a oferi o ecuația de regresie pentru un proces de bază utilizând variabile observate sau pentru a testa o teorie despre natura proceselor de bază.

Exemplu

Spune, de exemplu, un cercetător este interesat să studieze caracteristicile studenților absolvenți. Cercetătorul examinează un eșantion mare de studenți absolvenți cu privire la caracteristicile personalității, cum ar fi motivație, capacitate intelectuală, istoric scolastic, istoric familial, sănătate, caracteristici fizice, etc. Fiecare dintre aceste zone este măsurată cu mai multe variabile. Variabilele sunt apoi introduse în analiză individual și sunt studiate corelațiile dintre ele. Analiza dezvăluie tipare de corelație între variabilele despre care se crede că reflectă procesele de bază care afectează comportamentele studenților absolvenți. De exemplu, mai multe variabile din măsurile de capacitate intelectuală se combină cu unele variabile din măsurile istorice scolastice pentru a forma un factor de măsurare a inteligenței. În mod similar, variabilele din măsurile de personalitate se pot combina cu unele variabile din motivație și scolastică istoria masoara formarea unui factor care masoara gradul in care un student prefera sa lucreze independent - o independenta factor.

instagram viewer

Pașii analizei componentelor principale și analiza factorilor

Etapele în analiza componentelor principale și analiza factorilor includ:

  • Selectați și măsurați un set de variabile.
  • Pregătiți matricea de corelație pentru a realiza fie PCA, fie FA.
  • Extrageți un set de factori din matricea de corelație.
  • Determinați numărul de factori.
  • Dacă este necesar, rotiți factorii pentru a crește interpretabilitatea.
  • Interpretați rezultatele.
  • Verificați structura factorilor prin stabilirea validității constructive a factorilor.

Diferența dintre analiza componentelor principale și analiza factorilor

Analiza componentelor principale și analiza factorilor sunt similare, deoarece ambele proceduri sunt utilizate pentru a simplifica structura unui set de variabile. Cu toate acestea, analizele diferă în mai multe moduri importante:

  • În PCA, componentele sunt calculate ca combinații liniare ale variabilelor originale. În FA, variabilele originale sunt definite ca combinații liniare ale factorilor.
  • În PCA, obiectivul este să reprezinte o mare parte din total variație în variabile posibil. Obiectivul din FA este să explice covarianțele sau corelațiile dintre variabile.
  • PCA este utilizat pentru a reduce datele într-un număr mai mic de componente. FA este utilizat pentru a înțelege ce constă la baza datelor.

Probleme cu analiza componentelor principale și analiza factorilor

O problemă cu PCA și FA este că nu există nicio variabilă de criterii pentru a testa soluția. În alte tehnici statistice, cum ar fi analiza funcțiilor discriminante, regresia logistică, analiza profilului și multivariate analiza variatiei, soluția este apreciată de cât de bine prezice apartenența la grup. În PCA și FA, nu există un criteriu extern, cum ar fi apartenența la grup pentru a testa soluția.

A doua problemă a PCA și FA este că, după extragere, există un număr infinit de rotații disponibile, toate reprezentând aceeași cantitate de varianță în datele originale, dar cu factorul ușor definit diferit. Alegerea finală este lăsată cercetătorului pe baza evaluării interpretării și a utilității sale științifice. Cercetătorii diferă adesea în opinia care este cea mai bună alegere.

O a treia problemă este că FA este frecvent utilizat pentru a „salva” cercetările prost concepute. Dacă nicio altă procedură statistică nu este adecvată sau aplicabilă, datele pot fi cel puțin analizate cu factor. Acest lucru lasă multora să creadă că diferitele forme de FA sunt asociate cu cercetarea sloppy.