© h.hofstede (h.hofstede@hogeland.nl)

Betrouwbaarheidsinterval voor een proportie.
       
De vorige les hebben we gezien hoe je uit een meting die je in een steekproef hebt gedaan conclusies kunt trekken die voor de hele populatie gelden.
Dat leverde bij een gemeten gemiddelde in de steekproef een 95%-betrouwbaarheidsinterval voor de hele populatie op. Dat waren twee grenzen waarvan je met 95% zekerheid kunt zeggen dat het werkelijke gemiddelde daartussen zal liggen.

Een proportie in plaats van een grootte.

In plaats van dat je als onderzoeker ergens de gemiddelde grootte van hebt gemeten kan het natuurlijk ook zo zijn dat je een percentage hebt gemeten.
Dan wil je uiteraard graag weten welke conclusies je dan kunt trekken over dat percentage voor de hele populatie.
Het zal je niet verbazen dat je ook daarvoor een 95%-betrouwbaarheidsinterval kunt opstellen.

Je zou bijvoorbeeld kunnen meten hoeveel procent van de eerstejaarsstudenten na een jaar nog thuis woont.

Stel dat je een enquête onder 200 eerstejaars studenten houdt waarvan er 70 nog thuis blijken te wonen.
Dat is 35%.
Dus zou je willen beweren:  "Van de eerstejaarsstudenten woont 35% nog thuis".
Maar ja.... Hoe betrouwbaar is die 35%.......?
Precies dezelfde vraag als in de vorige les:  Hoe kun je een steekproefmeting van 35% vertalen naar een populatiebewering?

Ook hiervoor is een formule voor het 95%-betrouwbaarheidsinterval opgesteld (die je op de formulekaart kunt vinden) en dat is de volgende:
       

       
Bedenk goed dat hierin p de proportie is (en niet het percentage) dus dat betekent dat je een percentage eerst door 100 moet delen voordat je deze formule kunt gebruiken. Verder is n de steekproefgrootte
       
 is een proportie
       
Bij de 35% studenten uit het voorbeeld zou gelden: 
Dus dat geeft een interval  [0.302 ; 0.398]  ofwel tussen  30,2% en  39,8%

Terugrekenen naar een steekproefgrootte.

Het kan ook andersom:   als je het 95%-betrouwbaarheidsinterval weet, dan kun je dat terugrekenen naar het steekproefgemiddelde en de steekproefgrootte.

Voorbeeld.
Stel dat het 95%-betrouwbaarheidsinterval van een proportie gelijk is aan   [0.461; 0.601]
Da n was het midden van de metingen gelijk aan  (0,601 + 0,461)/2  = 0,531
En de breedte van het interval is  0,601 - 0.461 = 0,14,  dus vanaf het midden is dat naar beide kanten 0,07
Dat betekent dat moet gelden:

Voer in de GR in:
Y1 = 2 * √(0,531*(1 - 0,531)/X)
Y2 = 0,07
CALC  en dan intersect geeft  X = n = 203
De steekproefgrootte was dus 203 en de steekproef leverde een proportie van 0,531 op  (53,1%)
       
 
       
                                       
       
  OPGAVEN.
       
1. Een onderzoek onder  300 Vlamingen leverde op dat 76% van hen tegen de komst van nog meer asielzoekers was.
Geef een 95%-betrouwbaarheidsinterval voor het werkelijk percentage Vlamingen dat tegen de komst van nog meer asielzoekers was.
       
2. Examenopgave Havo, Wiskunde A, 2018.

Sinds de jaren tachtig meet het Trimbos-instituut regelmatig via een enquête het gebruik van alcohol, drugs en tabak in aselecte, representatieve steekproeven onder alle leerlingen van het voortgezet onderwijs. Ook werd de leerlingen in de enquête gevraagd naar hun leeftijd (in jaren), hun geslacht (jongen, meisje), en hun schoolniveau (vmbo, havo, vwo).

Aan de enquête van 2015 deden 6714 leerlingen mee in de leeftijd van 12 tot en met 16 jaar. In deze groep is onder andere gekeken naar de lifetime-prevalentie van roken. Hieronder staat wat dit begrip betekent:

       
 

lifetime-prevalentie van roken = het percentage van de leerlingen dat
rookt of ooit gerookt heeft in zijn of haar leven.

       
 
lifetime-prevalentie van roken
steekproefomvang 6714
aantal dat rookt of ooit gerookt heeft 1544
lifetime-prevalentie 23%
       
  In de tabel zie je dat van de leerlingen in de steekproef 23%, bijna een kwart, rookt of ooit gerookt heeft.

Bereken het 95%-betrouwbaarheidsinterval voor de lifetime-prevalentie van roken.
       
3. Examenopgave Havo, Wiskunde A, 2016.

Patiënten die voor een behandeling enige tijd in een ziekenhuis worden opgenomen, lopen tijdens dit verblijf het risico een infectie te krijgen. Zo’n infectie wordt een zorginfectie genoemd. Een deel van de zorginfecties ontstaat na een operatie.

In de periode 2007 tot en met 2012 is een steekproef gehouden onder een deel van de Nederlandse ziekenhuizen. Enkele resultaten hiervan zijn in de tabel te zien.

       
 
  aantal
patiënten 95299
patiënten die een zorginfectie hebben opgelopen 4694
geopereerde patiënten 32664
geopereerde patiënten die een zorginfectie hebben opgelopen 1286
       
  We nemen aan dat de patiënten in deze ziekenhuizen representatief zijn voor alle patiënten die in een Nederlands ziekenhuis worden opgenomen.
Dan kunnen we op basis van de gegevens in de tabel schatten hoeveel procent van alle in Nederland geopereerde patiënten in de genoemde periode een zorginfectie opliep.

Bereken het 95%-betrouwbaarheidsinterval van dit percentage. Rond de getallen in je eindantwoord af op één decimaal.
       
4. Een onderzoek onder een aantal Vlamingen leverde op dat 76% van hen tegen de komst van nog meer asielzoekers was.
Het 95%-betrouwbaarheidsinterval voor het werkelijk percentage was gelijk aan  [74.8 ; 77.2]
Bereken hoeveel Vlamingen aan het onderzoek meededen.
       
 
       

© h.hofstede (h.hofstede@hogeland.nl)