Deze pagina bevat een afbeelding die niet weergegeven kan worden omdat er geen recente versie van de Flash Plugin aanwezig is. Installeer de Macromedia Flash Player om de afbeelding te kunnen bekijken.
Tot nu toe hebben we steeds gesproken over de ‘best passende’ lijn door een puntenwolk. We gaan dat begrip ‘best passend’ nu eens wat nader bekijken.
We zullen in plaats van de concrete variabelen ‘leeftijd’ en’ lengte’ nu de formele variabelen X en Y gebruiken. Een puntenwolk bestaat dus uit paren (X i,Y i): de X- en Y-waarde voor meting nr. i.
In de puntenwolk is het twaalfde punt aangegeven: (X 12 =75 ,Y 12 =50 ). Ter verhoging van de duidelijkheid zullen we in onze voorbeelden maar met een beperkt aantal punten werken.
Hieronder staan 3 redenen waarom het eigenlijk niet zinnig zou zijn om regressie over slechts een paar punten te doen. Welke is niet correct?
Nee, dit alternatief is juist correct: als je wilt weten of een kind een abnormale lengte heeft, moet je eerst weten wat normaal is, en daarvoor heb je veel metingen nodig.
Nee, dit alternatief is correct. Om op grond van een regressielijn een voorspelling te kunnen doen, moet het aantal punten in ieder geval groot genoeg zijn.
Inderdaad, dit alternatief is incorrect. De nauwkeurigheid van de meetpunten wordt niet bepaald door het aantal, maar door de nauwkeurigheid van het meetinstrument. Je moet dus goed onthouden dat we hier alleen voor het rekengemak met zo weinig punten in de puntenwolk werken; in het algemeen zijn er veel meetpunten nodig om een regressielijn zinvol te berekenen.