Regressieanalyse (49/57)

Lessen
Dr.Stat
Regressieanalyse

Bij het berekenen van de richtingscoëfficiënt van de regressielijn hebben we gezien dat de richtingscoëfficiënt $b$ afhankelijk is van de correlatiecoëfficiënt: $b = r \frac{S_{y}}{S_{x}}$ . Er wordt nu wat dieper op die relatie tussen regressie en correlatie ingegaan.

De kleinste kwadratenmethode voor de bepaling van de best passende lijn berust op het minimaliseren van de som van de kwadraten van de residuen, $\sum d_{i}^{2}$ . Daarbij geldt ook voor de best passende lijn dat de gemiddelde afwijking, $\bar{d}$ , nul is. Als we deze som delen door het aantal meetpunten, en we betrekken $\bar{d}$ (=0) in de formule, dan krijgen we een vorm die we al een aantal malen hebben gezien: $\frac{\sum (d_{i} - \bar{d})^{2}}{n} = \frac{d_{i}^{2}}{n} .$

Welke vorm heeft de formule $\frac{\sum (d_{i} - \bar{d})^{2}}{n}$ , oftewel $\frac{d_{i}^{2}}{n}$ ( $\bar{d} = 0)$ ?

Nee, de vorm van een standaardafwijking bestaat in het algemeen uit de wortel uit een gemiddelde som van kwadraten: $\sqrt{\frac{\sum d_{i}^{2}}{n}}$ .

Nee, de standaardfout heeft dezelfde vorm als een standaardafwijking. De standaard afwijking is de wortel uit de expressie $\frac{\sum d_{i}^{2}}{n}$ .

Inderdaad. We noteren deze expressie dan ook net als de andere notaties die we voor varianties kennen: $S_{d}^{2} = \frac{\sum d_{i}^{2}}{n}$ . Dit is de variantie van de residuen.

Open tabellen

→ Volgende

Dr.Stat