| |
 |
|
Steekproeven. |
©
h.hofstede (h.hofstede@hogeland.nl) |
|
| |
|
|
|
Als je uitspraken
over de werkelijkheid wilt doen, dan zul je moeten onderzoeken hoe die
werkelijkheid er uitziet.
Om absoluut zeker van je zaak te zijn zou je natuurlijk gewoon alles
moeten onderzoeken, maar in praktijk is dat vaak niet haalbaar.
Stel bijvoorbeeld dat je "Maurice" heet en graag wilt weten hoeveel
mensen in Nederland op de VVD zullen gaan stemmen. Dan kun je moeilijk
heel Nederland gaan enquêteren. Dat zou iets teveel werk zijn. |
 |
| Je zult je tevreden
moeten stellen met een kleine selectie die je kunt onderzoeken en dan
moet je maar hopen dat de eigenschappen van die selectie (wel of niet
VVD) een beetje kloppen met heel Nederland. |
|

Eerst maar wat termen. |
Een tweede reden kan natuurlijk
ook zijn dat het te duur zou zijn om de hele populatie te bekijken.
Bijvoorbeeld als je van de bevolking van een klein dorpje wilt weten
hoeveel mensen drager van een bepaalde ziekte zijn zou het best eens te
duur kunnen zijn om alle mensen aan een medisch onderzoek te
onderwerpen. En een derde reden zou kunnen zijn dat je onderzoek
destructief is. Dat betekent dat de elementen uit je
steekproef verloren gaan. Als je bijvoorbeeld per se wilt weten hoeveel
jaarringen de bomen in een bos gemiddeld hebben kun je moeilijk het hele
bos omzagen....
|
|
Populatie |
= |
alles wat je zou
kunnen onderzoeken.
In het voorbeeld van Maurice is de populatie niet heel
Nederland, maar alleen de mensen in Nederland die mogen stemmen. |
|
Steekproef |
= |
het deel van de
populatie dat je werkelijk gaat onderzoeken. |
|
Aselect |
= |
Een steekproef is
aselect als elk element van de populatie een even grote kans heeft om in
de steekproef te komen. |
|
Representatief |
= |
Een steekproef is
representatief als de onderzochte eigenschappen kloppen met de hele
populatie.
Maar ja, dat weet je natuurlijk nooit zeker; je weet
immers nog niet hoe die eigenschappen in de populatie verdeeld zijn. Als
je dat wél zou weten is de steekproef nogal overbodig.... |
| |
|
|
|
|
|
Voorbeelden van fouten. |
| |
|
|
|
Hier zie je een paar
voorbeelden van steekproeven waarbij fouten gemaakt zijn. Ofwel
steekproeven die niet representatief zijn.
Flauw voorbeeld 1.
In een enquête wordt de vraag gesteld: "Vult U graag enquêtes in?"
Ik zal je niet beledigen door uit te leggen waarom dat een nogal domme
vraag is......
Je kunt bijna net zo goed mensen een enquête per E-mail sturen en vragen
"Heeft U een computer...?"
Flauw voorbeeld 2.
Een leerling van de middelbare school wil voor zijn profielwerkstuk
onderzoeken hoeveel er gerookt wordt door medeleerlingen. Hij gaat
daarom aan het begin van de pauze buiten staan en vraagt aan de eerste
10 leerlingen die naar buiten komen of ze roken of niet.
Ik hoop dat je het logisch vindt dat het aantal rokers in de steekproef
veel groter is dan in de populatie....
Subtiel voorbeeld 3.
Een busmaatschappij wil graag weten hoe vol de bussen zitten. Men laat
daarom een student op een busstation rondlopen en aan zoveel mogelijk
mensen vragen: "Met hoeveel mensen zat U in de bus?"
Zie je dat het aantal mensen in een bus op deze manier veel te groot
wordt?
Stel bijvoorbeeld dat er 25 ritten zijn, met bezetting
1,2,3,4,...,24,25.
Dan is de gemiddelde bezetting natuurlijk gelijk aan
13
mensen per bus.
Maar wat zeggen de passagiers die we ondervragen? Als de enquête perfect
is, en we ondervragen ALLE mensen, dan krijgen we deze antwoorden: |
| |
|
|
|
|
1 zegt 1
2 zeggen 2
3 zeggen 3
4 zeggen 4
...
...
...
25 zeggen 25 |
|
| |
|
|
|
| Het gemiddelde van al
deze getallen is:
(1 • 1 + 2 • 2 + 3 • 3 + ....) / (1 + 2 + ... + 25)
= 17.
FOUT DUS!!!
Het zit hem er natuurlijk in, dat er veel meer mensen zeggen dat de
bussen vol zijn, omdat er nou eenmaal meer mensen in een volle bus
zitten!
Gewoon voorbeeld 4.
Bij elke steekproef is ook de zogenaamde
non-respons van groot belang. Dat is het aantal gevraagde
mensen dat de steekproef niet invult. Dat wel of niet invullen kan
behoorlijk afhankelijk zijn van wat mensen vinden. Als je bijvoorbeeld
een onderzoek houdt over de klanttevredenheid van de mensen dan is de
kans groot dat vooral ontevreden klanten de enquête invullen. |
| |
|
|
|
|
 |
| |
|
|
|
Steekproefproportie en
populatieproportie.
Stel dat je een steekproef hebt gehouden onder een aantal HAVO-4 leerlingen
en je hebt bijvoorbeeld gevraagd of zij roken of niet.
Dan komt daar een bepaald percentage uit van rokers.
Als je zo'n percentage weergeeft als cijfers achter de komma, dan heet
dat een proportie.
|
proportie = percentage als kommagetal |
Bijvoorbeeld:
een percentage van 24% is een proportie van 0,24
een percentage van 0,8% is een proportie van 0,008
een percentage van 134% is een proportie 1,34
De steekproefproportie van
een bepaalde eigenschap (zoals roken) bereken je dus door: |
| |
|
|
|
|
|
| |
|
|
|
| Als je steekproef
representatief was (en dat hoop je natuurlijk) dan zal jouw gevonden
steekproefproportie dicht in de buurt liggen van de werkelijke (maar
onbekende) populatieproportie: |
| |
|
|
|
|
|
| |
|
|
|
| Nou is die
populatieproportie een puur theoretisch getal, dat je als onderzoeker
nooit kent. Immers als je dat wel zou kennen zou je helemaal geen
steekproef hoeven te doen. Dûh! |
| |
|
|
|
Gelaagde
Steekproef.
Soms is een bepaalde eigenschap in de populatie zó belangrijk dat je
zeker wilt weten dat de aantallen in je steekproef daarvoor zeker
kloppen met de werkelijkheid.
Als je weet hoe die eigenschap in de populatie is verdeeld kun je daar
makkelijk rekening mee houden. Als je dat doet dan heet dat een
gelaagde steekproef (ook wel een gestratificeerde
steekproef).
Stel bijvoorbeeld dat je weet dat in de populatie 34% uit vrouwen
bestaat en 66% uit mannen.
Als je dan een steekproef van 80 mensen wilt houden reken je vooraf uit
hoeveel 35% en 65% daarvan is. Dat is natuurlijk 0,34
• 80 = 27,2 ≈
27 vrouwen en 0,66 • 80 = 52,8 ≈
53 mannen.
Je neemt dan dus 27 vrouwen en 53 mannen in je steekproef.
Dan is in ieder geval de verhouding man-vrouw alvast representatief.
Natuurlijk moet je daarna wel aselect gaan kiezen welke mannen en
vrouwen je in je steekproef neemt. |
| |
|
|
|
|
|
OPGAVEN. |
| |
|
|
|
|
| 1. |
Op het Noorder College wil men weten hoe het met
de vrijetijdsbesteding van de leerlingen gesteld is. In de
volgende tabel zie je de leerlingenaantallen. |
| |
|
|
|
|
| |
|
|
jongens |
meisjes |
|
onderbouw
bovenbouw |
560
750 |
640
470 |
|
| |
|
|
|
|
| |
Men besluit tot een gelaagde steekproef van 40
leerlingen, zowel wat geslacht betreft als wat
onderbouw/bovenbouw betreft. Hoe moet deze steekproef worden
samengesteld? |
| |
|
|
|
|
| 2. |
Welke fouten zijn volgens jou
gemaakt bij het opstellen van de volgende steekproeven? |
| |
|
|
|
|
| |
a. |
De manager van Albert Hein wil graag
weten hoe lang de rijen voor de kassa gemiddeld zijn. Hij houdt
daarom een enquête bij de uitgang en vraagt alle klanten hoe
lang ze in de rij stonden. |
| |
|
|
|
|
| |
b. |
Bij een onderzoek naar overgewicht
bij kleuters wordt van alle kindertjes in een speeltuin het
gewicht en de lengte gemeten. |
| |
|
|
|
|
| |
c. |
Om de mate van inburgering te meten
stuurt de gemeente alle buitenlandse gezinnen in de stad een
schriftelijke enquête. |
| |
|
|
|
|
| |
d. |
Pathé heeft een complex van 10
filmzalen. Bij de uitgang van het complex vraagt men alle bezoekers om een
enquête in te vullen waarin men een rapportcijfer aan de
bezochte film mag geven. |
| |
|
|
|
|
| |
e. |
Om de tevredenheid van ouders over
de school te onderzoeken krijgen een aantal willekeurig gekozen
leerlingen een vragenlijst voor hun ouders mee naar huis. |
| |
|
|
|
|
| 3. |
Toen men in de vorige eeuw veel
interesse kreeg voor de gemiddelde temperatuur op aarde, werden
er zo'n 6000 meetstations, verspreid over de aarde, in stand
gehouden om metingen te leveren.
Maar begin deze eeuw zijn meer en meer stations afgebroken,
gewoon omdat het te duur werd die stations te onderhouden. In
2010 waren er nog maar 1500 meetstations over.De duurste
stations heeft men het eerst afgebroken en die stonden
natuurlijk vooral in onherbergzame gebieden.
Leg uit dat dit voor een deel een verklaring zou kunnen zijn
voor de opwarming van de aarde die na 2000 is gemeten. |
| |
|
|
|
|
| 4. |
De
schoolleiding van een grote middelbare school wil graag een
beeld krijgen over hoe vaak de nieuwe brugklassers 's avonds
alleen thuis zijn.
Op de gemeenschappelijke ouderavond van alle brugklassen van de
school vraagt men daarom de ouders een formulier in te vullen.
Eén van de vragen daarbij is hoeveel avonden in een week beide
ouders weg van huis zijn (of als er één ouder is, hoe vaak die
dan weg van huis is).
Van de 128 ingevulde formulieren bleken dat de brugklassers in
34 gevallen meer dan 2 avonden in de week alleen thuis waren.
In werkelijkheid zijn 62 van de in totaal 184 brugklassers meer
dan 2 avonden in de week alleen thuis. |
| |
|
|
|
|
| |
a. |
Bereken de
populatieproportie en de steekproefproportie en leg daarmee uit
of je te maken hebt met een representatieve steekproef. |
| |
|
|
|
|
| |
b. |
Waarom kun
je uit de opzet van het onderzoek al wel verwachten dat de
steekproef niet representatief zal zijn? |
| |
|
|
|
|
|
|
|
|
©
h.hofstede (h.hofstede@hogeland.nl) |