De fleste økonomiafdelinger kræver anden- eller tredjeårs studerende at gennemføre et økonometrik-projekt og skrive en artikel om deres fund. Flere år senere kan jeg huske, hvor stressende mit projekt var, så jeg har besluttet at skrive vejledningen til økonometriske semesteropgaver, som jeg ville ønske jeg havde, da jeg var studerende. Jeg håber, at dette vil forhindre dig i at tilbringe mange lange nætter foran en computer.
Til dette økonometrik-projekt vil jeg beregne den marginale forbrugsbenyttelse i USA. (Hvis du er mere interesseret i at gøre et enklere, univariat økonometrik-projekt, se venligst "Sådan gør du et smertefrit økonometrik-projekt") Den marginale tilbøjelighed til at forbruge defineres som hvor meget en agent bruger, når han får en ekstra dollar fra en ekstra dollars personlige disponible indkomst. Min teori er, at forbrugere holder et bestemt beløb til side til investering og nødsituation og bruger resten af deres disponible indkomst på forbrugsvarer. Derfor er min nullhypotese, at MPC = 1.
Jeg er også interesseret i at se, hvordan ændringer i prime rate påvirker forbrugsvaner. Mange tror, at når renten stiger, sparer folk mere og bruger mindre. Hvis dette er sandt, må vi forvente, at der er en negativ sammenhæng mellem rentesatser som prime-rente og forbrug. Min teori er imidlertid, at der ikke er nogen forbindelse mellem de to, så alt andet er lige, vi bør ikke se nogen ændring i niveauet for tilbøjeligheden til at forbruge, når primærrenten ændres.
For at teste mine hypoteser, er jeg nødt til at oprette en økonometrisk model. Først definerer vi vores variabler:
Yt er de nominelle personlige forbrugsudgifter (PCE) i USA.
x2t er den nominelle disponible indkomst efter skat i USA. x3t er den primære sats i U.S.
Vores model er så:
Yt = b1 + b2X2t + b3X3t
Hvor b 1, b 2og b 3 er de parametre, vi vil estimere via lineær regression. Disse parametre repræsenterer følgende:
- b1 er størrelsen af PCE-niveauet, når den nominelle disponible indkomst efter skat (X2t) og hovedrenten (X3t) er begge nul. Vi har ikke en teori om, hvad den "sande" værdi af denne parameter skal være, da den ikke rummer meget interesse for os.
- b2 repræsenterer det beløb, PCE stiger, når den nominelle disponible indkomst efter skat i USA stiger med en dollar. Bemærk, at dette er definitionen af den marginale tilbøjelighed til at forbruge (MPC), så b2 er simpelthen MPC. Vores teori er, at MPC = 1, så vores nulhypotese for denne parameter er b2 = 1.
- b3 repræsenterer det beløb, PCE stiger, når primærrenten stiger med en hel procent (sige fra 4% til 5% eller fra 8% til 9%). Vores teori er, at ændringer i prime rate ikke har indflydelse på forbrugsvaner, så vores nulhypotese for denne parameter er b2 = 0.
Så vi vil sammenligne resultaterne af vores model:
Yt = b1 + b2X2t + b3X3t
til det hypotetiske forhold:
Yt = b1 + 1 * X2t + 0 * X3t
hvor b 1 er en værdi, der ikke særlig interesserer os. For at kunne estimere vores parametre har vi brug for data. Excel-regnearket "Personligt forbrugsudgifter" indeholder kvartalsvise amerikanske data fra 1. kvartal 1959 til 3. kvartal 2003. Alle data kommer fra FRED II - St. Louis Federal Reserve. Det er det første sted, du skal gå for amerikanske økonomiske data. Når du har downloadet dataene, skal du åbne Excel og indlæse filen kaldet "aboutpce" (fuldt navn "aboutpce.xls") i det uanset bibliotek, du gemte den i. Fortsæt derefter til næste side.
Vær sikker på at fortsætte til side 2 af "Sådan gør du et smertefrit multivariat økonometrik-projekt"
Vi har åbnet datafilen, vi kan begynde at se efter, hvad vi har brug for. Først skal vi finde vores Y-variabel. Husk, at Yt er de nominelle personlige forbrugsudgifter (PCE). Ved hurtig scanning af vores data ser vi, at vores PCE-data er i kolonne C, mærket "PCE (Y)". Ved at se på kolonne A og B ser vi, at vores PCE-data løber fra 1. kvartal 1959 til sidste kvartal 2003 i celler C24-C180. Du skal skrive disse fakta ned, da du har brug for dem senere.
Nu skal vi finde vores X-variabler. I vores model har vi kun to X-variabler, som er X2t, disponibel personlig indkomst (DPI) og X3t, den primære rente. Vi ser, at DPI er i søjlen mærket DPI (X2), som er i søjle D, i celler D2-D180, og hovedhastigheden er i søjlen mærket Prime Rate (X3), som er i søjle E, i celler E2-E180. Vi har identificeret de data, vi har brug for. Vi kan nu beregne regressionskoefficienterne ved hjælp af Excel. Hvis du ikke er begrænset til at bruge et bestemt program til din regressionsanalyse, vil jeg anbefale at bruge Excel. Excel mangler mange af de funktioner, en masse af de mere sofistikerede økonometrikpakker bruger, men til at udføre en enkel lineær regression er det et nyttigt værktøj. Det er meget mere sandsynligt, at du bruger Excel, når du går ind i den "virkelige verden", end du bruger en økonometrisk pakke, så det at være dygtig i Excel er en nyttig færdighed at have.
Vores Yt data findes i celler E2-E180 og vores Xt data (X2t og X3t samlet) findes i cellerne D2-E180. Når vi udfører en lineær regression, har vi brug for enhver Yt at have nøjagtigt et tilknyttet X2t og en tilknyttet X3t og så videre. I dette tilfælde har vi det samme antal Yt, X2tog X3t poster, så vi er gode til at gå. Nu hvor vi har fundet de data, vi har brug for, kan vi beregne vores regressionskoefficienter (vores b1, b2og b3). Før du fortsætter, skal du gemme dit arbejde under et andet filnavn (jeg valgte myproj.xls), så hvis vi skal starte forfra, har vi vores originale data.
Nu, hvor du har downloadet dataene og åbnet Excel, kan vi gå videre til det næste afsnit. I det næste afsnit beregner vi vores regressionskoefficienter.
Sørg for at fortsætte til side 3 af "Sådan gør du et smertefrit multivariat økonometrik-projekt"
Nu på dataanalysen. Gå til Værktøj menu øverst på skærmen. Find derefter Dataanalyse i Værktøj menu. Hvis Dataanalyse er ikke der, så bliver du nødt til at installere det. Se disse instruktioner for at installere dataanalyseværktøjspakken. Du kan ikke foretage regressionsanalyse uden dataanalyseværktøjspakken installeret.
Når du har valgt Dataanalyse fra Værktøj menu kan du se en menu med valgmuligheder som "Covariance" og "F-Test To-prøve til varians". I den menu vælges Regression. Elementerne er i alfabetisk rækkefølge, så de skal ikke være for svære at finde. Når du først er der, ser du en formular, der ser sådan ud. Nu skal vi udfylde denne formular. (Dataene på baggrund af dette skærmbillede afviger fra dine data)
Det første felt, vi skal udfylde, er Indtast Y-område. Dette er vores PCE i celler C2-C180. Du kan vælge disse celler ved at skrive "$ C $ 2: $ C $ 180" i den lille hvide boks ved siden af Indtast Y-område eller ved at klikke på ikonet ved siden af det hvide felt og derefter vælge disse celler med din mus.
Det andet felt, vi skal udfylde, er Input X Range. Her vil vi indtaste begge af vores X-variabler, DPI og Prime Rate. Vores DPI-data findes i celler D2-D180, og vores primærhastighedsdata er i celler E2-E180, så vi har brug for dataene fra rektanglet til celler D2-E180. Du kan vælge disse celler ved at skrive "$ D $ 2: $ E $ 180" i den lille hvide boks ved siden af Input X Range eller ved at klikke på ikonet ved siden af det hvide felt og derefter vælge disse celler med din mus.
Til sidst skal vi navngive den side, som vores regressionsresultater fortsætter med. Sørg for, at du har det Nyt regnearklag valgt, og i det hvide felt ved siden af skriver det et navn som "Regression". Når det er afsluttet, skal du klikke på Okay.
Du skal nu se en fane i bunden af din skærm, der kaldes Regression (eller hvad du end kaldte det) og nogle regressionsresultater. Nu har du alle de resultater, du har brug for til analyse, inklusive R Square, koefficienter, standardfejl osv.
Vi var på udkig efter at estimere vores afskærmningskoefficient b1 og vores X-koefficienter b2, b3. Vores afskærmningskoefficient b1 er placeret i den navngivne række Intercept og i den navngivne kolonne koefficienter. Sørg for at notere disse tal ned, inklusive antallet af observationer, (eller udskriv dem), da du har brug for dem til analyse.
Vores afskærmningskoefficient b1 er placeret i den navngivne række Intercept og i den navngivne kolonne koefficienter. Vores første hældningskoefficient b2 er placeret i den navngivne række X-variabel 1 og i den navngivne kolonne koefficienter. Vores anden hældningskoefficient b3 er placeret i den navngivne række X Variabel 2 og i den navngivne kolonne koefficienter Den endelige tabel, der genereres af din regression, skal svare til den, der er givet i bunden af denne artikel.
Nu har du de regressionsresultater, du har brug for, skal du analysere dem til dit semesteropgave. Vi vil se, hvordan vi gør det i næste uges artikel. Hvis du har et spørgsmål, du gerne vil have besvaret, så brug feedbackformularen.
Regressionsresultater
Observationer
koefficienter
Standard fejl
t Stat
P-værdi
Lavere 95%
Øvre 95%
Intercept
X-variabel 1
X Variabel 2
-13.71941.4186-9.67080.0000-16.5192-10.9197