Deze pagina bevat een afbeelding die niet weergegeven kan worden omdat er geen recente versie van de Flash Plugin aanwezig is. Installeer de Macromedia Flash Player om de afbeelding te kunnen bekijken.
Stel dat je van 7 studenten te weten bent gekomen hoeveel ze per maand aan reiskosten besteden. Het ligt dan voor de hand om over die 7 studenten het gemiddelde te berekenen. In dit geval is dat: (0 + 61 + 156 + 72 + 0 + 78 + 123) / 7 = 70. We zouden nu kunnen zeggen: in de steekproef is het gemiddelde 70, dus zal dat in de hele populatie ook wel ongeveer zo zijn. We schatten dus het populatiegemiddelde. De vraag is nu: hoe goed is die schatting?
Een eerste factor die bepaalt hoe goed het populatiegemiddelde geschat kan worden met het steekproefgemiddelde is de grootte van de steekproef. Er zijn nu gegevens van 7 studenten. Maar de steekproef had ook groter of kleiner kunnen zijn. Hoe groter de steekproef, des te nauwkeuriger is de schatting. In een grotere steekproef is het gemiddelde namelijk wat minder gevoelig voor de net wat hoog of laag uitgevallen reiskosten van een enkeling.
Naast de steekproefgrootte is er een tweede factor die bepaalt hoe goed het populatiegemiddelde geschat kan worden met het steekproefgemiddelde. De steekproef moet representatief zijn voor de populatie. Dat wil zeggen dat de steekproef een goede afspiegeling van de populatie moet zijn, en er geen systematische vertekening mag optreden…
Systematische vertekening zou bijvoorbeeld optreden indien je als steekproef 7 studenten op een spoorwegstation vraagt hoeveel ze per maand aan reiskosten kwijt zijn. Het is namelijk erg waarschijnlijk dat er ook studenten zijn die zich per bus, auto, motor, fiets, of te voet verplaatsen. Zij betalen misschien bedragen van een hele andere orde van grootte dan de treinreizende studenten. De 7 treinreizende studenten zijn dan niet representatief voor de populatie.