h.hofstede (h.hofstede@hogeland.nl)

Soorten verdelingen
       
We hebben al eerder gezien dat je een serie waarnemingen of metingen kunt noteren in een frequentietabel en dat je er bijvoorbeeld een histogram van kunt maken.
Zo'n tabel of histogram noemen we in het algemeen een verdeling.

Hieronder zie je een paar soorten verdelingen (ze worden meestal als histogrammen getekend):
       

       
Een paar eigenschappen:
  Bedenk dat de frequenties op de y-as staan en de gemeten waarden op de x-as.
  "Rechtsscheef" en "Linksscheef" heten naar de kant waar ze de "staart" hebben zitten.
  Bij relatieve frequenties is de totale oppervlakte 100%
  De totale breedte heet ook wel de spreidingsbreedte.
  De modus is de x-plaats van de top (bij meer toppen is er geen modus)
  De kwartielafstand is de horizontale breedte van de middelste 75% van het histogram.
 

Mediaan en Gemiddelde.

De mediaan en het gemiddelde zijn iets lastiger uit zo'n verdeling af te lezen.
Ik zal het voordoen met de tabel en het histogram hieronder.
 


1. Mediaan.

De mediaan is gewoon het middelste getal van al je metingen. Omdat in een histogram elke waarneming als een blokje is aangegeven is het gewoon het middelste blokje van al die blokjes. Die blokjes zie je hieronder links.
Dat betekent dat de mediaan het getal op de x-as is, waarvoor geldt dat de oppervlaktes onder het histogram aan beide kanten precies gelijk zijn. Dat zie je in de rechterfiguur hieronder. De oranje oppervlakte is gelijk aan de groene oppervlakte.
De mediaan is 2 (bij de rode pijl)

       

       
2.  Gemiddelde.

Voor het gemiddelde tellen niet alleen het aantal blokjes mee, maar ook hoe ver ze op de x-as naar rechts liggen. De blokjes naar rechts tellen zwaarder mee, want dat stellen grotere getallen voor.
Om de plaats van het gemiddelde te vinden moet je je voorstellen alsof je het histogram op een plankje hebt staan dat je moet balanceren. Ongeveer zoiets:
       

       
Die pijl bij het gemiddelde is de plaats waarop het histogram "in evenwicht" is.

Je ziet dat bij een rechtsscheve verdeling het gemiddelde verder naar rechts ligt dan de mediaan.  Dat komt omdat die kleine blokjes aan de rechterkant zwaarder meetellen omdat ze grotere getallen voorstellen.
Je snapt dat bij een symmetrische verdeling het gemiddelde gelijk zal zijn aan de mediaan.
       
Uitschieters.
       
 
 

 

   
 
 
       
       
 
       
                                       
       
  OPGAVEN.
       
       
       
       

h.hofstede (h.hofstede@hogeland.nl)