© h.hofstede (h.hofstede@hogeland.nl)

Van Steekproef naar Populatie.
       
Ik moet eerlijk zeggen, die vorige les (van populatie naar steekproef), daar heb je niet zo heel veel aan, want je kent meestal tóch de gegevens van de populatie niet. Als dat wel zo zou zijn, waarom zou je dan nog een "onderzoek" willen doen?

Deze les wordt nuttiger.

We gaan bekijken in hoeverre resultaten van een steekproef iets zeggen over de populatie. De andere kant op dus. En dat is nou juist het doel van de meeste onderzoeken.
Laat één ding vooraf volkomen duidelijk zijn, misschien wel HET principe van deze les:
       

We kunnen nooit met volledige zekerheid iets beweren!

       
Stel dat je in een (verantwoord) onderzoek hebt gevonden dat 60% van je populatie een rijbewijs heeft, en 40% niet. Dan lijkt het een redelijke veronderstelling om te zeggen dat van de hele populatie ook ongeveer 60% een rijbewijs zal hebben. Hoe groter je steekproef was, des te zekerder mag je dat stellen.
Maar je weet het nooit helemaal zeker!  (behalve in het flauwe geval dat je de hele populatie als steekproef had, maar dan zijn we eigenlijk niet met statistiek bezig)

Laten we bijvoorbeeld eens aannemen dat je een steekproef van 100 had, waarin er dus 60 een rijbewijs hadden en 40 niet.
Aan de hand daarvan wil je nu graag de bewering doen  "60% van deze populatie heeft een rijbewijs".

Maar hoe zeker is dat?

Overschrijdingskans.

Laten we eens aannemen dat in werkelijkheid een proportie P van de populatie een rijbewijs heeft.
Je vermoedt dat P ≈ 0,60. Maar als dat niet zo is, en P is bijvoorbeeld 0.55, ook dan zou jouw steekproef best 60 of zelfs nog meer van de 100 kunnen hebben opgeleverd. Dat is natuurlijk wel een afwijking van de verwachte 55, maar niet al te veel.  Geef toe:  ook al is P = 0,55 dan zou het wel héél toevallig zijn als in jouw steekproef ook precies 55 van de 100 mensen een rijbewijs hadden!  (die kans is maar  binompfd(100, 0.55, 55) = 0,08).
Kortom:  een afwijking zal erg vaak voorkomen, maar niet een al te grote afwijking.
Daarom gebruiken we vanaf nu het begrip  "overschrijdingskans":
       
overschrijdingskans = kans op een minstens even grote afwijking
       
We kunnen de kans op die overschrijdingskans in ons geval natuurlijk makkelijk uitrekenen:  
1 - binomcdf(100, 0.55, 59) = 0,1831 dus de overschrijdingskans is  2 • 0,1831 = 0,3662 (want alles vanaf 60 en alles onder 50 heeft een afwijking van 5 vanaf het midden).
Dus bij een populatieproportie van 0,55 zul je in zo'n 37% van de gevallen een meting in je steekproef krijgen die evenveel of nog meer van de "verwachte" 55 afligt als onze 60 dat doet.

Betrouwbaarheidsinterval.

Hieronder zie je een aantal mogelijkheden voor de populatieproportie, variërend van 0,50 tot 0,70.  Elke keer is aangegeven waar onze meting van 60 ligt, en ook hoe groot de kans is op een meting met een minstens even grote afwijking als de onze (dat zijn die rode oppervlaktes).

Voor de oplettende lezer:
Eigenlijk hadden het hieronder geen vloeiende klokvormen moeten zijn, maar allemaal staafjes van de binomiale verdeling, maar ik was te lui om elke keer 100 staafjes te gaan tekenen....)
       

       
Je ziet dat ook bij populatieproporties die niet gelijk is aan 0,60 het best mogelijk is om een meting van 60 van de 100 te krijgen. Maar je ziet ook dat zulke metingen steeds onwaarschijnlijker worden (die overschrijdingskansen worden vanaf de middelste P = 0,60 naar boven en naar beneden steeds kleiner). Die P-waarden verder van 0,60 af zijn dus niet onmogelijk, maar worden wel steeds onwaarschijnlijker, immers bij die P-waarden is de kans dat we een 

Omdat we nooit 100% zekerheid zullen hebben  (HET principe van deze les) spreken we gewoon af, welke overschrijdingskans we nog acceptabel vinden.  Dus in feite kiezen we in bovenstaande figuren welke rode oppervlakte nog mag.
Stel dat we kiezen 20%, dan zijn de P-waarden die horen bij de groene kruizen nog acceptabel (in de figuur P van  0,54  tm 0,66).  Daar is die rode oppervlakte namelijk meer dan 20%  Maar de P-waarden bij de rode kruizen is niet meer acceptabel, want bij die P-waarden is onze meting van 60 veel te onwaarschijnlijk  (kans minder dan 20%).

Dat groene-vinkjes-gedeelte noemen we het betrouwbaarheidsinterval
       

Het 95%-betrouwbaarheidsinterval, 
bestaat uit de P-waarden
waarvoor de overschrijdingskans van onze meting
groter is dan 5%.

       
Voorbeeld.
In een onderzoek onder 1200 middelbare scholieren zeggen 90 van hen wel eens te blowen. Welk 95%-betrouwbaarheidsinterval voor de hele populatie hoort daarbij?
  Bij deze vraag horen beide plaatjes hiernaast (eigenlijk staafjes in plaats van een vloeiende klokvorm). Het gaat erom hoe groot de blauwe populatieproporties P maximaal en minimaal mogen zijn zodat de overschrijdingskans bij onze meting van 90 minimaal 5% is.

bovenste plaatje:
binomcdf(1200, X, 90) = 0,025  geeft  X = P = 0,091
onderste plaatje: 
binomcdf(1200, X, 89) = 0,972 geeft  X = P = 0,061

Het betrouwbaarheidsinterval is   [0.061, 0.091]
Conclusie van dit onderzoek:

       
Hier zie je nog een keer wat er nou precies aan de hand is:
       

       
Van alle vooraf mogelijke populatieverdelingen van de bovenste rij hebben die blauwen de eigenschap dat vanaf onze meting (van 7,5%)  de oppervlakte erbuiten minstens 0,025 is. Ofwel:  de middens van die blauwe verdelingen liggen "dicht genoeg" bij onze steekproefmeting 0,075.
De mogelijke steekproefproporties (middens) P van al die blauwe verdelingen vormen ons betrouwbaarheidsinterval.
       
Normale verdeling.

Dit hele verhaal was aan de hand van een voorbeeld met de binomiale verdeling. Uit luiheid had ik die als normale verdeling getekend. Maar natuurlijk kan je experiment ook de meting van een bepaald gemiddelde met bijbehorende standaarddeviatie zijn  (in plaats van het "aantal successen" zoals hierboven). Je kunt natuurlijk best iets meten wat daadwerkelijk normaal verdeeld is.
In dat geval geldt precies hetzelfde verhaal als hierboven, en zijn de figuren "echte""normale verdelingen. Dus gaan de berekeningen ook met de normale verdeling (normalcdf) in plaats van de binomiale.  We spreken dan meestal van populatie gemiddelde (μ) in plaats van populatieproportie (P).

Voorbeeld.
  Een antropoloog meet de lengtes van een steekproef van 100 vrouwen uit een zekere populatie en vindt een gemiddelde van 179 cm met een standaarddeviatie van 18 cm.
Voor een gemiddelde van 100 vrouwen geldt een normale verdeling met  σ = 18/√100 = 1,8
Als onder de 179 nog 2,5% ligt geldt  normalcdf(0, 179, X, 1.8) = 0,025  en dat geeft  X = μ = 182,5
Als boven de 179 nog 2,5% ligt geldt  normalcdf(179, ∞ , X, 1.8) = 0,025  en dat geeft  X = μ =  175,5
Het 95%-betrouwbaarheidsinterval voor μ is dus ongeveer   [175.5,  182.5].
       
Hoe zit dat nou met die "betrouwbaarheid"?

Stel dat jij onderzoeker bent en je hebt op bovenstaande manier zo'n 95%-betrouwbaarheidsinterval berekend. Dan hoop je natuurlijk maar dat het werkelijke (nog onbekende) gemiddelde van de populatie inderdaad in jouw interval ligt, want dan had je gelijk. Maar als het werkelijke gemiddelde buiten jouw interval ligt, dan ligt jou meting dus automatisch "verder dan die 5% grens" vanaf dat midden, want zo had je dat interval immers opgesteld. Maar de kans daarop is (bij dat werkelijke gemiddelde) kleiner dan 5%.  Kortom:  de kans dat het werkelijke gemiddelde buiten jouw interval ligt is hoogstens 5%. Vandaar het woord "betrouwbaarheid". Ofwel:  in hoogstens 5% van de gevallen zal het werkelijke gemiddelde van de populatie toch buiten het betrouwbaarheidsinterval liggen.
       
  OPGAVEN
       
1. Als je de grootte van een steekproef laat toenemen, zal de grootte van het 95%-betrouwbaarheidsinterval dan afnemen of toenemen?  Leg uit!
     

 afnemen

2. De reactietijd van 180 gamers is getest en daaruit bleek een gemiddelde van 0,78 sec met een standaarddeviatie van  0,15 sec.
Geef het 95%-betrouwbaarheidsinterval dat uit dit onderzoek volgt.
     

 [0.756, 0.804]

3. Een onderzoek onder  300 Vlamingen leverde op dat 76% van hen tegen de komst van nog meer asielzoekers was.
Geef een 95%-betrouwbaarheidsinterval voor het werkelijk percentage Vlamingen dat tegen de komst van nog meer asielzoekers was.
     

 [70.8, 80.7]

4. Na het centraal examen wiskunde levert een steekproef van het CITO onder 88 deelnemers op, dat hun gemiddelde een 6,4 is met een standaarddeviatie van  0,7.
Geef in drie decimalen nauwkeurig een 95%-betrouwbaarheidsinterval voor het werkelijk gemiddelde in heel Nederland.
     

 [6.254,6.546]

5. Examenopgave Havo, Wiskunde A, 2018.

Sinds de jaren tachtig meet het Trimbos-instituut regelmatig via een enquête het gebruik van alcohol, drugs en tabak in aselecte, representatieve steekproeven onder alle leerlingen van het voortgezet onderwijs. Ook werd de leerlingen in de enquête gevraagd naar hun leeftijd (in jaren), hun geslacht (jongen, meisje), en hun schoolniveau (vmbo, havo, vwo).

Aan de enquête van 2015 deden 6714 leerlingen mee in de leeftijd van 12 tot en met 16 jaar. In deze groep is onder andere gekeken naar de lifetime-prevalentie van roken. Hieronder staat wat dit begrip betekent:

       
 

lifetime-prevalentie van roken = het percentage van de leerlingen dat
rookt of ooit gerookt heeft in zijn of haar leven.

       
 
lifetime-prevalentie van roken
steekproefomvang 6714
percentage dat rookt of ooit gerookt heeft 1544
lifetime-prevalentie 23%
       
 

In de tabel zie je dat van de leerlingen in de steekproef 23%, bijna een kwart, rookt of ooit gerookt heeft.

Bereken het 95%-betrouwbaarheidsinterval voor de lifetime-prevalentie van roken.

     

 [22 , 24]

6. Examenopgave Havo, Wiskunde A, 2016.

Patiënten die voor een behandeling enige tijd in een ziekenhuis worden opgenomen, lopen tijdens dit verblijf het risico een infectie te krijgen. Zo’n infectie wordt een zorginfectie genoemd. Een deel van de zorginfecties ontstaat na een operatie.

In de periode 2007 tot en met 2012 is een steekproef gehouden onder een deel van de Nederlandse ziekenhuizen. Enkele resultaten hiervan zijn in de tabel te zien.

       
 
  aantal
patiënten 95299
patiënten die een zorginfectie hebben opgelopen 4694
geopereerde patiënten 32664
geopereerde patiënten die een zorginfectie hebben opgelopen 1286
       
  We nemen aan dat de patiënten in deze ziekenhuizen representatief zijn voor alle patiënten die in een Nederlands ziekenhuis worden opgenomen.
Dan kunnen we op basis van de gegevens in de tabel schatten hoeveel procent van alle in Nederland geopereerde patiënten in de genoemde periode een zorginfectie opliep.

Bereken het 95%-betrouwbaarheidsinterval van dit percentage. Rond de getallen in je eindantwoord af op één decimaal.
     

 [3,7% ; 4,2%]

7.

Examenopgave Havo, Wiskunde A, 2016.

Voor het onderzoek 'Sociale samenhang' in 2013 werden gegevens verzameld onder de Nederlandse bevolking. Er deden 7400 aselect getrokken personen aan dit onderzoek mee. Van de deelnemers gaven 4292 personen aan vertrouwen te hebben in de medemens.

Op basis van deze gegevens worden de volgende twee uitspraken gedaan over het percentage Nederlanders dat (in 2013) vertrouwen had in de medemens:

  1. Het is meer dan 95% zeker dat het percentage Nederlanders dat vertrouwen had in de medemens,
in het interval [56,6 ; 59,4] ligt.
  2. Het is minder dan 95% zeker dat het percentage Nederlanders dat vertrouwen had in de medemens,
in het interval [56,6 ; 59,4] ligt.
       
  Eén van deze twee uitspraken is juist.
Welke uitspraak is juist? Licht je antwoord met een berekening toe.
       
     

© h.hofstede (h.hofstede@hogeland.nl)