Deze pagina bevat een afbeelding die niet weergegeven kan worden omdat er geen recente versie van de Flash Plugin aanwezig is. Installeer de Macromedia Flash Player om de afbeelding te kunnen bekijken.
Laten we de variantie van de residuen, S d 2 , nu eens vergelijken met de gewone variantie in Y, S y 2 , voor dezelfde meetpunten. Deze variantie in Y is de (gemiddelde) som van de gekwadrateerde afstanden van de Y-waarden tot Y¯. Dit is een mondvol maar, laat zich mooi weergeven in de grafiek.
We bekijken nu dezelfde meetpunten maar nu niet ten opzichte van de regressielijn, maar ten opzichte van de lijn Y=Y¯. De variantie S y 2 kun je zien als de som van de kwadraten van de lengtes van de verticale lijnen (gedeeld door n). Dit lijkt precies op de variantie van de residuen S d 2 : deze werd alleen berekend door de afstand tot aan de regressielijn te gebruiken.
Welke variantie is de grootste?
Nee. S d 2 en S y 2 kunnen hoogstens aan elkaar gelijk zijn (als er geen samenhang is tussen X en Y). We nemen aan dat er wèl samenhang is en dat de regressielijn eruit ziet zoals in de eerste figuur. De regressielijn (de eerste figuur) is dan de best passende lijn. Deze is juist zó gekozen, dat de variantie (afstanden) van de residuen geminimaliseerd is.
Dit is in het algemeen niet juist. Alleen als er geen enkele samenhang tussen de X en Y-waarden is dan zijn deze varianties gelijk. We nemen hier aan dat er wèl samenhang is en dat de regressielijn eruit ziet zoals in de eerste figuur.
Natuurlijk. Immers de regressielijn (de eerste figuur) is de best passende lijn. Deze is juist zó gekozen, dat de variantie (afstanden) van de residuen geminimaliseerd is.