En introduktion til Akaikes informationskriterium (AIC)

click fraud protection

Det Akaike informationskriterium (ofte benævnt blot som AIC) er en kriterium til valg af indlejrede statistiske eller økonometriske modeller. AIC er i det væsentlige et estimeret mål for kvaliteten af ​​hver af de tilgængelige økonometriske modeller da de forholder sig til hinanden for et bestemt datasæt, hvilket gør det til en ideel metode til valg af modeller.

Brug af AIC til valg af statistisk og økonometrisk model

Akaike informationskriterium (AIC) blev udviklet med et fundament i informationsteori. Informationsteori er en gren af ​​anvendt matematik vedrørende kvantificering (processen med at tælle og måle) af information. Ved at bruge AIC til at forsøge at måle den relative kvalitet af økonometriske modeller for et givet datasæt, giver AIC forskeren et skøn over de oplysninger, der ville gå tabt, hvis en bestemt model blev anvendt til at vise den proces, der producerede data. Som sådan arbejder AIC'en på at afveje afvejningerne mellem kompleksiteten af ​​en given model og dens godhed af pasform

instagram viewer
, som er det statistiske udtryk til at beskrive, hvor godt modellen "passer" til data eller observationssæt.

Hvad AIC ikke vil gøre

På grund af hvad Akaike Information Criterion (AIC) kan gøre med et sæt statistiske og økonometriske modeller og et givet datasæt, er det et nyttigt værktøj til valg af modeller. Men selv som et modeludvælgelsesværktøj har AIC sine begrænsninger. F.eks. Kan AIC kun levere en relativ test af modelkvalitet. Det vil sige, at AIC ikke og ikke kan give en test af en model, der resulterer i information om kvaliteten af ​​modellen i en absolut forstand. Så hvis hver af de testede statistiske modeller er lige så utilfredsstillende eller uegnet til dataene, ville AIC ikke give nogen indikation fra begyndelsen.

AIC i økonometriske vilkår

AIC er et tal, der er knyttet til hver model:

AIC = ln (sm2) + 2m / T

Hvor m er antallet af parametre i modellen, og sm2 (i et AR (m) -eksempel) er den estimerede restvarians: sm2 = (summen af ​​kvadratet residualer til model m) / T. Det er den gennemsnitlige firkantede rest for model m.

Kriteriet kan minimeres i forhold til valg af m at danne en afvejning mellem modelens pasform (hvilket sænker summen af ​​kvadratet) residualer) og modellens kompleksitet, som måles ved m. Således kan en AR (m) -model versus en AR (m + 1) sammenlignes med dette kriterium for en given batch af data.

En ækvivalent formulering er denne: AIC = T ln (RSS) + 2K, hvor K er antallet af regressorer, T antallet af observationer, og RSS den resterende sum af kvadrater; minimere over K for at vælge K

Som sådan forudsat et sæt af økonometri modeller, den foretrukne model med hensyn til relativ kvalitet vil være modellen med den minimale AIC-værdi.

instagram story viewer