© h.hofstede (h.hofstede@hogeland.nl)

Twee gemeten eigenschappen vergelijken

Stel dat we de jongens en de meisjes van een HAVO-5 klas vragen of ze op een sportvereniging zitten of niet. Dan zou dat best eens de volgende tabel kunnen geven:
       
  jongens meisjes
wel lid 9 5
geen lid 6 10
       
Als je dan iets wilt zeggen is het misschien handig (omdat er niet evenveel meisjes als jongens zijn) om het te hebben over de percentages die van beide groepen lid zijn van een sportvereniging.
Voor de jongens geeft dat  9/16 ē 100% = 56%  en voor de meisjes  5/10 ē 100% = 50%
Je ziet dat er iets meer jongens lid zijn dan meisjes.

Je zou het zelfs nog kunnen hebben over het percentageverschil, en dat zou in dit geval 56% - 50% = 6% zijn.

Odds-Ratio.

De odds-ratio is een andere manier om het verschil tussen beide groepen weer te geven, en dat gebeurt door beide percentages op elkaar te delen.

In dit geval zou dat geven  56/50 = 1,12  of  50/56 = 0,89.  Meestal wordt gekozen voor de grootste van beiden, dus in dit geval 1,12. (overigens kiest men er in de geneeskunde vaak voor om de zieke groep in de eerste kolom te zetten, en de gezonde in de tweede en ook het slechte resultaat in de eerste rij te zetten en het goede in de tweede).
De Odds-Ratio is natuurlijk een beetje een raar getal, want je neemt eigenlijk de verhouding van procenten, dus in weze verhoudingen van verhoudingen. De Odds-Ratio komt van de vroegere wedkantoren waar je bijvoorbeeld bij het ene kantoor een weddenschap 1 : 4 kon afsluiten en bij het andere 1 : 5, dus dan was de verhouding tussen die weddenschappen 5/4 = 1,25.  De ene leverde 1,25 keer zoveel op als de andere.

Je ziet vast wel dat je die odds-ratio ook direct uit bovenstaande kruistabel kunt aflezen (zonder die procenten tussendoor):

       

       
Daar rechts staan beide kruisproducten uit de tabel op elkaar gedeeld. Als je een Odds-Ratio meer dan 1 wilt hebben, dan moet je wel het grootste kruisproduct bovenaan zetten.
       
Een nadeel van de OR is, dat hij tussen 1 en oneindig groot kan variŽren. Dat is nogal een groot gebied. Daarom wordt ook wel "Soete's maat van samenhang" gebruikt, die er zů uit ziet:   S = 1 - √(1/OR).  Dat geeft tenminste altijd een getal tussen 0 en 1. In ons voorbeeld  S = 1 - √(1/1,12) = 0,055.

Phi-coŽfficiŽnt.

       
Met dezelfde tabel hierboven kun je ook de zogenaamde phi-coŽfficiŽnt (meestal aangegeven met j) berekenen.
Dat gaat zo:
       

       
(Voor wie dat kennen:  de phi-coŽfficiŽnt is eigenlijk net zoiets als de correlatiecoŽfficiŽnt, maar dan bij maar twee metingen)
(En voor nog verdere experts:  nj2 = c2: de chi-kwadraat waarde)


De phi-coŽfficiŽnt is eigenlijk een soort van maat voor hoeveel verband er is tussen twee gegevens.
In ons voorbeeldgeval van de jongens en meisjes die wel of niet lid van een sportvereniging waren, vinden we:

       
Om een beetje gevoel voor de grootte te krijgen; we spreken meestal af voor de waarde van j:
       

       
In ons sportvoorbeeld hierboven zouden we dus spreken van een middelmatig verschil (0,27).

De j  wordt groter positief als de waarden in de kruistabel vooral van linksonder naar rechtsboven groot zijn.
De j wordt sterker negatief als de waarden in de kruistabel vooral van rechtsboven naar linksonder groot zijn.
Dat doet de teller allemaal. De noemer zorgt er alleen maar voor dat het altijd een getal tussen 0 en 1 wordt.
       
       
       
  OPGAVEN
       
1. In de medische wereld maakt men vaak een volgende tabel als er een test is gedaan naar een bepaalde ziekte:
       
 
  ziekte aanwezig ziekte afwezig
test zegt ziek a b
test zegt niet ziek c d
       
  Bij een positief testresultaat is de kans dat de ziekte nu aanwezig is, OR keer zo groot als bij een negatief testresultaat.
Toon dat aan.
       
2. Leg uit waarom "Soete's maat van samenhang" altijd een getal tussen 0 en 1 oplevert.
       
3. Examenopgave Havo, Wiskunde A, 2018
       
 

Sinds de jaren tachtig meet het Trimbos-instituut regelmatig via een enquÍte het gebruik van alcohol, drugs en tabak in aselecte, representatieve steekproeven onder alle leerlingen van het voortgezet onderwijs. Ook werd de leerlingen in de enquÍte gevraagd naar hun leeftijd (in jaren), hun geslacht (jongen, meisje), en hun schoolniveau (vmbo, havo, vwo.

Aan de enquÍte van 2015 deden 6714 leerlingen mee in de leeftijd van 12 tot en met 16 jaar. In deze groep is onder andere gekeken naar de lifetime-prevalentie van roken. Hieronder staat wat dit begrip betekent:

       
 

lifetime-prevalentie van roken = het percentage van de leerlingen dat
rookt of ooit gerookt heeft in zijn of haar leven.

       
  In de volgende tabel zijn de 6714 leerlingen uitgesplitst naar schoolniveau.
       
 
lifetime-prevalentie van roken
  aantal leerlingen aantal dat rookt of
ooit gerookt heeft
lifetime-prevalentie
vmbo 3265 873 27%
havo 1805 410 23%
vwo 1644 261 16%
totaal 6714 1544 23%
       
  Bepaal of het verschil in lifetime-prevalentie van roken tussen havoleerlingen en vwo-leerlingen groot, middelmatig of gering is.
       
4. Examenopgave Havo, Wiskunde A, 2016.

PatiŽnten die voor een behandeling enige tijd in een ziekenhuis worden opgenomen, lopen tijdens dit verblijf het risico een infectie te krijgen. Zoín infectie wordt een zorginfectie genoemd. Een deel van de zorginfecties ontstaat na een operatie.

In de periode 2007 tot en met 2012 is een steekproef gehouden onder een deel van de Nederlandse ziekenhuizen. Enkele resultaten hiervan zijn in de tabel te zien.

       
 
  aantal
patiŽnten 95299
patiŽnten die een zorginfectie hebben opgelopen 4694
geopereerde patiŽnten 32664
geopereerde patiŽnten die een zorginfectie hebben opgelopen 1286
       
  Vul de kruistabel hieronder in en bepaal daarmee, en met behulp van een vuistregel op het formuleblad, of het genoemde verschil groot, middelmatig of gering is.
       
 

 

geopereerd

wel niet totaal
zorginfectie
opgelopen
wel      
niet      
totaal      
       
5. Examenopgave Havo, Wiskunde A, 2021-I.
       
  In deze opgave kijken we naar een aspect van de uitgaven van scholieren. Dit aspect betreft de vraag hoe vaak scholieren spijt hebben na het doen van een aankoop. Van 1200 aselect gekozen respondenten (600 jongens en 600 meisjes) is bekend hoe vaak zij spijt hebben na het doen van een aankoop. De resultaten zijn weergegeven in een relatieve frequentietabel, zie de volgende tabel.
       
 
Spijt na het doen van een aankoop
  jongens meisjes totaal
nooit/zelden 16% 8% 12%
meestal niet 65% 61% 63%
meestal wel 19% 29% 24%
vaak/altijd 0% 2% 1%
       
  Onderzoek met behulp van het formuleblad of het verschil tussen jongens en meisjes in hoe vaak zij spijt hebben na het doen van een aankoop gering, middelmatig of groot is.
       
6. Examenopgave Havo, Wiskunde A, 2021-II.

De respondenten aan een onderzoek gaven aan of zij wel of geen sociale overlast ervaren. Denk hierbij bijvoorbeeld aan overlast door dronken mensen op straat, drugsgebruik of rondhangende jongeren. De resultaten zijn in de volgende tabel in vijf groepen uitgesplitst naar de mate van stedelijkheid van de woonplaats van de respondenten.
       
 

mate van
stedelijkheid

aantal
respondenten
aantal dat sociale
overlast ervaart
zeer sterk 25222 4590
sterk 27581 3751
matig 19219 1768
weinig 19496 1267
niet 19482 1052
       
  We bekijken nu de groep respondenten van wie de woonplaats zeer sterk stedelijk is en de groep respondenten van wie de woonplaats niet stedelijk is.
Tussen deze twee groepen is er verschil in het wel of niet ervaren van sociale overlast.
Bereken met behulp van het formuleblad of dit verschil groot, middelmatig of gering is.
       
7. Examenopgave HAVO Wiskunde A, 2022-III
       
  De heer Uil heeft een schatting gemaakt van het aantal volwassenen dat in 1706 kon schrijven. Daartoe heeft hij verzoekschriften bekeken die in die tijd bij de Zeeuwse en Staats-Vlaamse overheden ingediend zijn. De indieners ervan ondertekenden die met een handtekening of met een merk, bijvoorbeeld een kruisje of een zelfbedacht teken. Wie een handtekening zette kon waarschijnlijk schrijven. Wie een merk zette, kon waarschijnlijk niet schrijven. In de tabel is te zien hoeveel handtekeningen en hoeveel merken er gezet zijn.
       
 
periode mannen vrouwen totaal
handtekening merk handtekening merk
1609 - 1650 265 102 - - 367
1651 - 1700 556 85 4 2 647
1701 - 1750 530 80 103 83 796
1751 - 1800 1735 181 255 68 2239
       
  Je kunt uit de gegevens afleiden dat er verschil is tussen mannen en vrouwen wat betreft het gebruik van een handtekening of een merk.

Bepaal met behulp van het formuleblad of dit verschil in de periode 1701 Ė 1750 gering, middelmatig of groot is.
       
     

© h.hofstede (h.hofstede@hogeland.nl)