Hvad er restpersoner?

Lineær regression er et statistisk værktøj, der bestemmer, hvor godt en lige linje passer til et sæt parrede data. Den lige linje, der bedst passer til disse data, kaldes den mindst kvadratiske regressionslinje. Denne linje kan bruges på flere måder. En af disse anvendelser er at estimere værdien af ​​en responsvariabel for en given værdi af en forklarende variabel. Relateret til denne idé er en rest.

(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)

At beregne det resterende på punkterne x = 5, vi trækker den forudsagte værdi fra vores observerede værdi. Siden y koordinat for vores datapunkt var 9, dette giver en rest på 9 - 10 = -1.

Der er flere anvendelser til restprodukter. En brug er at hjælpe os med at bestemme, om vi har et datasæt, der har en samlet lineær tendens, eller om vi skal overveje en anden model. Årsagen til dette er, at rester er med til at forstærke ethvert ikke-lineært mønster i vores data. Hvad der kan være vanskeligt at se ved at se på en spredningsdiagram, kan lettere observeres ved at undersøge resterne og et tilsvarende rest plot.

instagram viewer

En anden grund til at overveje rester er at kontrollere, at betingelserne for inferens for lineær regression er opfyldt. Efter verifikation af en lineær tendens (ved at kontrollere resterne), kontrollerer vi også fordelingen af ​​resterne. For at være i stand til at udføre regression inferens, ønsker vi, at resterne omkring vores regressionslinie skal være omtrent normalt fordelt. EN histogram eller stemplot af resterne hjælper med at verificere, at denne betingelse er opfyldt.

instagram story viewer