Hovedkomponenter og faktoranalyse

Analyse af hovedkomponenter (PCA) og faktoranalyse (FA) er statistiske teknikker, der bruges til datareduktion eller strukturdetektion. Disse to metoder anvendes til et enkelt sæt af variabler, når forskeren er interesseret i opdage, hvilke variabler i det sæt, der danner sammenhængende undergrupper, der er relativt uafhængige af en en anden. Variabler, der er korreleret med hinanden, men som stort set er uafhængige af andre sæt af variabler, kombineres til faktorer. Disse faktorer giver dig mulighed for at kondensere antallet af variabler i din analyse ved at kombinere flere variabler til en faktor.

De specifikke mål for PCA eller FA er at opsummere mønstre af korrelationer blandt observerede variabler for at reducere et stort antal observerede variabler til et mindre antal faktorer for at tilvejebringe en regressionsligning for en underliggende proces ved hjælp af observerede variabler eller for at teste en teori om arten af ​​de underliggende processer.

Eksempel

Sig f.eks. At en forsker er interesseret i at studere karakteristikaen for kandidatstuderende. Forskeren undersøger et stort udvalg af kandidatstuderende om personlighedskarakteristika som f.eks motivation, intellektuel evne, skolastisk historie, familiehistorie, sundhed, fysiske egenskaber, etc. Hvert af disse områder måles med flere variabler. Variablerne indtastes derefter individuelt i analysen, og sammenhænge blandt dem undersøges. Analysen afslører korrelationsmønstre mellem de variabler, der menes at afspejle de underliggende processer, der påvirker de studerendes adfærd. For eksempel kombinerer flere variabler fra målingerne af den intellektuelle evne med nogle variabler fra de skolastiske mål for at danne en faktor, der måler intelligens. Tilsvarende kan variabler fra personlighedsmålingerne kombineres med nogle variabler fra motivation og skolastisk historie måler at danne en faktor, der måler den grad, som en studerende foretrækker at arbejde selvstændigt - en uafhængighed faktor.

instagram viewer

Trin til analyse af hovedkomponenter og faktoranalyse

Trin i analyse af hovedkomponenter og faktoranalyse inkluderer:

  • Vælg og mål et sæt af variabler.
  • Forbered korrelationsmatrixen til at udføre enten PCA eller FA.
  • Ekstraher et sæt faktorer fra korrelationsmatrixen.
  • Bestem antallet af faktorer.
  • Rotér om nødvendigt faktorerne for at øge tolkbarheden.
  • Fortolke resultaterne.
  • Kontroller faktorstrukturen ved at fastlægge faktorernes konstruktionsgyldighed.

Forskel mellem analyse af hovedkomponenter og faktoranalyse

Analyse af hovedkomponenter og faktoranalyse ligner, fordi begge procedurer bruges til at forenkle strukturen i et sæt af variabler. Analyserne adskiller sig imidlertid på flere vigtige måder:

  • I PCA beregnes komponenterne som lineære kombinationer af de originale variabler. I FA defineres de originale variabler som lineære kombinationer af faktorer.
  • I PCA er målet at udgøre så meget af det samlede beløb varians i variablerne som muligt. Målet i FA er at forklare covariancer eller sammenhænge mellem variablerne.
  • PCA bruges til at reducere dataene til et mindre antal komponenter. FA bruges til at forstå, hvilke konstruktioner, der ligger til grund for dataene.

Problemer med analyse af hovedkomponenter og faktoranalyse

Et problem med PCA og FA er, at der ikke er nogen kriterievariabel, som løsningen skal testes imod. I andre statistiske teknikker såsom diskriminerende funktionsanalyse, logistisk regression, profilanalyse og multivariat variansanalyse, vurderes løsningen ud fra, hvor godt den forudsiger gruppemedlemskab. I PCA og FA er der ikke et eksternt kriterium, såsom gruppemedlemskab, som løsningen skal testes imod.

Det andet problem med PCA og FA er, at der efter ekstraktion er et uendeligt antal tilgængelige rotationer, alle tegner sig for den samme mængde af varians i de originale data, men med den definerede faktor lidt forskellige. Det endelige valg overlades til forskeren på baggrund af deres vurdering af dens fortolkningsevne og videnskabelige anvendelighed. Forskere er ofte uenige om, hvilket valg der er bedst.

Et tredje problem er, at FA ofte bruges til at ”redde” dårlig undfanget forskning. Hvis ingen anden statistisk procedure er passende eller anvendelig, kan data i det mindste faktoranalyses. Dette overlader mange til at tro, at de forskellige former for FA er forbundet med sjusket forskning.