© h.hofstede (h.hofstede@hogeland.nl)

Twee gemeten eigenschappen vergelijken

Stel dat we de jongens en de meisjes van een HAVO-5 klas vragen of ze op een sportvereniging zitten of niet. Dan zou dat best eens de volgende tabel kunnen geven:
       
  jongens meisjes
wel lid 9 5
geen lid 6 10
       
Als je dan iets wilt zeggen is het misschien handig (omdat er niet evenveel meisjes als jongens zijn) om het te hebben over de percentages die van beide groepen lid zijn van een sportvereniging.
Voor de jongens geeft dat  9/16 ē 100% = 56%  en voor de meisjes  5/10 ē 100% = 50%
Je ziet dat er iets meer jongens lid zijn dan meisjes.

Je zou het zelfs nog kunnen hebben over het percentageverschil, en dat zou in dit geval 56% - 50% = 6% zijn.

Odds-Ratio.

De odds-ratio is een andere manier om het verschil tussen beide groepen weer te geven, en dat gebeurt door beide percentages op elkaar te delen.

In dit geval zou dat geven  56/50 = 1,12  of  50/56 = 0,89.  Meestal wordt gekozen voor de grootste van beiden, dus in dit geval 1,12. (overigens kiest men er in de geneeskunde vaak voor om de zieke groep in de eerste kolom te zetten, en de gezonde in de tweede en ook het slechte resultaat in de eerste rij te zetten en het goede in de tweede).
De Odds-Ratio is natuurlijk een beetje een raar getal, want je neemt eigenlijk de verhouding van procenten, dus in weze verhoudingen van verhoudingen. De Odds-Ratio komt van de vroegere wedkantoren waar je bijvoorbeeld bij het ene kantoor een weddenschap 1 : 4 kon afsluiten en bij het andere 1 : 5, dus dan was de verhouding tussen die weddenschappen 5/4 = 1,25.  De ene leverde 1,25 keer zoveel op als de andere.

Je ziet vast wel dat je die odds-ratio ook direct uit bovenstaande kruistabel kunt aflezen (zonder die procenten tussendoor):

       

       
Daar rechts staan beide kruisproducten uit de tabel op elkaar gedeeld. Als je een Odds-Ratio meer dan 1 wilt hebben, dan moet je wel het grootste kruisproduct bovenaan zetten.
       
Een nadeel van de OR is, dat hij tussen 1 en oneindig groot kan variŽren. Dat is nogal een groot gebied. Daarom wordt ook wel "Soete's maat van samenhang" gebruikt, die er zů uit ziet:   S = 1 - √(1/OR).  Dat geeft tenminste altijd een getal tussen 0 en 1. In ons voorbeeld  S = 1 - √(1/1,12) = 0,055.

Phi-coŽfficiŽnt.

       
Met dezelfde tabel hierboven kun je ook de zogenaamde phi-coŽfficiŽnt (meestal aangegeven met j) berekenen.
Dat gaat zo:
       

       
(Voor wie dat kennen:  de phi-coŽfficiŽnt is eigenlijk net zoiets als de correlatiecoŽfficiŽnt, maar dan bij maar twee metingen)
(En voor nog verdere experts:  nj2 = c2: de chi-kwadraat waarde)


De phi-coŽfficiŽnt is eigenlijk een soort van maat voor hoeveel verband er is tussen twee gegevens.
In ons voorbeeldgeval van de jongens en meisjes die wel of niet lid van een sportvereniging waren, vinden we:

       
Om een beetje gevoel voor de grootte te krijgen; we spreken meestal af voor de waarde van j:
       

       
In ons sportvoorbeeld hierboven zouden we dus spreken van een middelmatig verschil (0,27).

De j  wordt groter positief als de waarden in de kruistabel vooral van linksonder naar rechtsboven groot zijn.
De j wordt sterker negatief als de waarden in de kruistabel vooral van rechtsboven naar linksonder groot zijn.
Dat doet de teller allemaal. De noemer zorgt er alleen maar voor dat het altijd een getal tussen 0 en 1 wordt.
       
       
       
  OPGAVEN
       
1. In de medische wereld maakt men vaak een volgende tabel als er een test is gedaan naar een bepaalde ziekte:
       
 
  ziekte aanwezig ziekte afwezig
test zegt ziek a b
test zegt niet ziek c d
       
  Bij een positief testresultaat is de kans dat de ziekte nu aanwezig is, OR keer zo groot als bij een negatief testresultaat.
Toon dat aan.
       
2. Leg uit waarom "Soete's maat van samenhang" altijd een getal tussen 0 en 1 oplevert.
       
3. Examenopgave Havo, Wiskunde A, 2018
       
 

Sinds de jaren tachtig meet het Trimbos-instituut regelmatig via een enquÍte het gebruik van alcohol, drugs en tabak in aselecte, representatieve steekproeven onder alle leerlingen van het voortgezet onderwijs. Ook werd de leerlingen in de enquÍte gevraagd naar hun leeftijd (in jaren), hun geslacht (jongen, meisje), en hun schoolniveau (vmbo, havo, vwo.

Aan de enquÍte van 2015 deden 6714 leerlingen mee in de leeftijd van 12 tot en met 16 jaar. In deze groep is onder andere gekeken naar de lifetime-prevalentie van roken. Hieronder staat wat dit begrip betekent:

       
 

lifetime-prevalentie van roken = het percentage van de leerlingen dat
rookt of ooit gerookt heeft in zijn of haar leven.

       
  In de volgende tabel zijn de 6714 leerlingen uitgesplitst naar schoolniveau.
       
 
lifetime-prevalentie van roken
  aantal leerlingen aantal dat rookt of
ooit gerookt heeft
lifetime-prevalentie
vmbo 3265 873 27%
havo 1805 410 23%
vwo 1644 261 16%
totaal 6714 1544 23%
       
  Bepaal of het verschil in lifetime-prevalentie van roken tussen havoleerlingen en vwo-leerlingen groot, middelmatig of gering is.
       
4. Examenopgave Havo, Wiskunde A, 2016.

PatiŽnten die voor een behandeling enige tijd in een ziekenhuis worden opgenomen, lopen tijdens dit verblijf het risico een infectie te krijgen. Zoín infectie wordt een zorginfectie genoemd. Een deel van de zorginfecties ontstaat na een operatie.

In de periode 2007 tot en met 2012 is een steekproef gehouden onder een deel van de Nederlandse ziekenhuizen. Enkele resultaten hiervan zijn in de tabel te zien.

       
 
  aantal
patiŽnten 95299
patiŽnten die een zorginfectie hebben opgelopen 4694
geopereerde patiŽnten 32664
geopereerde patiŽnten die een zorginfectie hebben opgelopen 1286
       
  Vul de kruistabel hieronder in en bepaal daarmee, en met behulp van een vuistregel op het formuleblad, of het genoemde verschil groot, middelmatig of gering is.
       
 

 

geopereerd

wel niet totaal
zorginfectie
opgelopen
wel      
niet      
totaal      
       
       
     

© h.hofstede (h.hofstede@hogeland.nl)