Bij het berekenen van de richtingscoëfficiënt van de regressielijn hebben we gezien dat de richtingscoëfficiënt b afhankelijk is van de correlatiecoëfficiënt: b=rS yS x. Er wordt nu wat dieper op die relatie tussen regressie en correlatie ingegaan.
De kleinste kwadratenmethode voor de bepaling van de best passende lijn berust op het minimaliseren van de som van de kwadraten van de residuen, ∑d i 2 . Daarbij geldt ook voor de best passende lijn dat de gemiddelde afwijking, d¯, nul is. Als we deze som delen door het aantal meetpunten, en we betrekken d¯ (=0) in de formule, dan krijgen we een vorm die we al een aantal malen hebben gezien:
∑(d i−d¯) 2 n=d i 2 n.
Welke vorm heeft de formule ∑(d i−d¯) 2 n, oftewel d i 2 n (d¯=0 )?
Nee, de vorm van een standaardafwijking bestaat in het algemeen uit de wortel uit een gemiddelde som van kwadraten: ∑d i 2 n.
Nee, de standaardfout heeft dezelfde vorm als een standaardafwijking. De standaard afwijking is de wortel uit de expressie ∑d i 2 n.
Inderdaad. We noteren deze expressie dan ook net als de andere notaties die we voor varianties kennen: S d 2 =∑d i 2 n. Dit is de variantie van de residuen.