h.hofstede (h.hofstede@hogeland.nl)

De Effectgrootte.

Je zou natuurlijk lekker lui kunnen zijn en gewoon om te kijken of er verschil tussen twee frequentieverdelingen is het gemiddelde van beiden kunnen berekenen en die vergelijken.
Maar wanneer noem je zo'n gemiddelde dan groot, en wanneer klein?
Of twee gemiddelden veel of weinig van elkaar verschillen hangt ook nogal veel af van hoe ver de metingen uit elkaar liggen,

Hieronder bespreken twee gevallen waarbij het gemiddelde beide keren 8 van elkaar verschilt. Toch vinden we in het ene geval dat verschil van 8 groot en in het andere geval klein.

Voorbeeld.

Neem twee vrienden die beiden een trekvakantie hebben gehouden, en met elkaar vergelijken hoeveel afstand ze per dag aflegden. Stel dat ze beiden hun gemiddelde afgelegde afstand per dag uitrekenen en komen op een verschil van 8 km per dag. Vinden we dat dan veel of niet?
Nou, dat hangt er volgens mij nogal vanaf hoe groot die afstanden nou werkelijk waren. Als de vrienden beiden een wandelvakantie hielden zouden hun afstanden z kunnen zijn:
       
vriend A 8 6 5 10 9 8 8 4 7 11
vriend B 13 18 19 18 10 20 14 14 11 19
       
Vriend A legde gemiddeld 7,6 km af en vriend B  15,6 km dus inderdaad een verschil van 8 km. Maar je ziet dat vriend B veel meer aflegde. Zelfs elke dag meer en behoorlijk ook! De grootste afstand van A is de kleinste van B!!!
Maar als de vrienden met de auto erop uit trokken zouden dit hun afstanden kunnen zijn:
       
vriend A 135 176 288 120 89 156 203 152 103 195
vriend B 146 198 203 135 120 98 139 245 187 226
       
Vriend A legde nu gemiddeld 161,7 km af en vriend B 169,7 km. Weer een verschil van 8 km. Maar als je deze tabel bekijkt is er helemaal niet zoveel verschil tussen de getallen. Dat komt natuurlijk omdat de getallen veel groter zijn, dus die 8 verschil maakt niet zoveel uit.
De twee verdelingen zien er globaal zo uit:
       

       

       
Het verschil tussen de gemiddeldes van in beide gevallen gelijk (de afstand tussen de stippellijnen). Toch zijn de rode verdelingen behoorlijk overlappend, en de blauwen liggen helemaal naast elkaar. Dat komt natuurlijk omdat die roden veel breder zijn.
Omdat de standaarddeviatie een maat is voor de spreiding in de getallen en dus meestal ook voor de breedte van de verdleing, is het misschien een idee om het gevonden verschil te delen door de gemiddelde standaarddeviatie. Dat geeft een soort "relatief verschil". Dat noemen de we "Effectgrootte E"
       

       
(daarbij zorgen we dat er een positief getal uitkomt door μA groter dan μB te kiezen).
De beide gevallen van de vrienden hierboven zouden dan het volgende opleveren:
       
de loopvrienden:
μA = 7,6  en  σA = 2,06
μB = 15,6 en  σB = 3,44
 

       
de autovrienden:
μA = 161,7  en  σA = 55,03
μB = 169,7 en  σB = 46,23
 

       
Zoals je ziet in het tweede geval inderdaad een veel kleinere effectgrootte dan in het eerste geval.

Of het verschil gering, middelmatig of groot genoemd wordt zie je daarna als volgt:
       

       
  OPGAVEN.
       
1. Examenopgave Havo, Wiskunde A,  2018.
       
 

Bij een bloedonderzoek worden het hemoglobinegehalte en de hoeveelheid rode bloedcellen gemeten. In de uitslag van het onderzoek staan van beide de gemeten waarden. Om deze uitslag te kunnen beoordelen, worden de gemeten waarden vergeleken met de bijbehorende referentiewaarden. Dit zijn de waarden zoals ze gevonden worden bij 95% van de gezonde mensen. In deze opgave bekijken we de referentiewaarden van volwassenen.

Het hemoglobinegehalte wordt uitgedrukt in millimol per liter (mmol/L) (een mol is een eenheid voor het aantal deeltjes) en de hoeveelheid rode bloedcellen in biljoenen per liter (1 biljoen = 1012). We gaan ervan uit dat het hemoglobinegehalte en de hoeveelheid rode bloedcellen van gezonde mannen normaal verdeeld zijn. Dit geldt ook voor het hemoglobinegehalte en de hoeveelheid rode bloedcellen van gezonde vrouwen.

In de tabel staan de referentiewaarden van het hemoglobinegehalte en van de hoeveelheid rode bloedcellen. Deze referentiewaarden liggen symmetrisch om het gemiddelde. Zo kun je in de tabel bijvoorbeeld aflezen dat 95% van de gezonde mannen een hemoglobinegehalte heeft tussen 8,6 mmol/L en 11,0 mmol/L.

       
 
  geslacht

referentiewaarden

hemoglobine man 8,6 - 11,0
  vrouw 7,6 - 10,0
rode bloedcellen man 4,4 - 5,8
  vrouw 4,0 - 5,3
       
  a. Bereken de standaardafwijking van de hoeveelheid rode bloedcellen van gezonde vrouwen. Geef je antwoord in biljoenen per liter en rond af op n decimaal.
     

0,325

  De standaardafwijking van het hemoglobinegehalte van zowel gezonde mannen als gezonde vrouwen is 0,6 mmol/L.
       
  b. Bereken met behulp van het formuleblad of het verschil tussen het hemoglobinegehalte van gezonde mannen en gezonde vrouwen gering, middelmatig of groot is.
       
2. Examenopgave Havo. Wiskunde A, 2018.
       
  Een lunchrestaurants probeert zijn klanten bewust te maken van de hoeveelheid kcal die ze bestellen. Dit restaurant presenteert daarom de calorie-informatie duidelijk zichtbaar bij het bestelpunt. Onderzoekers hebben aan de klanten van dit restaurant gevraagd of deze informatie effect had op hun bestelling. Die informatie hebben zij per klant gekoppeld aan zijn of haar kassabonnetje. De resultaten staan in de volgende tabel.
       
 
  aantal
kassabonnetjes
aantal kcal percentage
dat meer
dan 1000
kcal
bestelt
gemiddelde standaardafwijking
calorie-
informatie
wel
gelezen
568 713 301 17,5
calorie-
informatie
niet
gelezen
1237 766 584 23,0
       
  Op grond van de resultaten in deze tabel bespreken de onderzoekers de volgende stelling: Er bestaat een groot verschil in het aantal kcal per bestelling tussen klanten die de calorie-informatie wel hebben gelezen en klanten die de calorie-informatie niet hebben gelezen.

Onderzoek of deze stelling door de gegevens in deze tabel wordt ondersteund.
       
3. Examenopgave Havo, Wiskunde A, 2017
       
 

In een bedrijf wordt er gewerkt in drie ploegendiensten.
Tijdens elke dienst komen er storingen voor. Het productieproces wordt dan een aantal minuten stilgelegd totdat de storing verholpen is. Telkens wordt bijgehouden hoe lang de storing duurt. Na afloop van de dienst wordt de totale tijd van alle storingen genoteerd. Deze tijd noemt men de uitvaltijd. De directie wil dat de uitvaltijd zo klein mogelijk is.

Om te onderzoeken hoe groot de uitvaltijd is, heeft men van 16 werkweken van elk van de drie verschillende ploegendiensten de gemiddelde uitvaltijd en de standaardafwijking berekend. Zie de volgende tabel.

       
 
uitvaltijd per dag- of nachtdienst in minuten
  gemiddelde standaardafwijking
dagdienst A 36,75 1,10
dagdienst B 37,29 1,04
nachtdienst 29,39 1,53
       
 

Men vermoedt dat de lagere uitvaltijden tijdens de nachtdiensten te maken hebben met het feit dat de energietoevoer gedurende de nacht constanter is dan overdag. Daarom wordt de energietoevoer overdag verbeterd.

Na verloop van tijd blijkt dat de gemiddelde uitvaltijd van de A-diensten en B-diensten gelijk geworden is aan de gemiddelde uitvaltijd van de nachtdiensten. De standaardafwijkingen van de A-diensten en B-diensten zijn niet veranderd.

Bereken voor dagdienst B of het verschil in uitvaltijd tussen de oude en de nieuwe situatie groot, middelmatig of gering is.

       
5. Examenopgave Havo, Wiskunde A, 2016

Jaarlijks wordt voor een onderzoek aan een groot aantal personen gevraagd hun lengte te schatten. We noemen deze lengte de geschatte lengte. Daarnaast wordt de lengte nauwkeurig door een onderzoeker gemeten. We noemen deze lengte de werkelijke lengte.
De geschatte lengte en de werkelijke lengte worden vervolgens met elkaar vergeleken. Het blijkt dat mensen in het algemeen hun lengte te hoog schatten.

In het onderzoek van een bepaald jaar schatten de vrouwen hun lengte gemiddeld 0,9 cm hoger dan hun werkelijke lengte. De standaardafwijking van de werkelijke lengte was 6,0 cm. De standaardafwijking van de geschatte lengte was 6,2 cm.

Bepaal of het verschil tussen de werkelijke lengte en de geschatte lengte gering, middelmatig of groot is.

       
       

h.hofstede (h.hofstede@hogeland.nl)