© h.hofstede (h.hofstede@hogeland.nl)

Spreidingsbreedte en Kwartielafstand.
       
In een eerde les hebben we van een frequentieverdeling de centrummaten bekeken. Dat waren drie getallen  (modus. mediaan en gemiddelde) die aangaven waar het midden van de verdeling ligt.

Maar het midden van een verdeling zegt natuurlijk lang niet alles. Kijk naar de histogrammen hieronder. Die hebben allemaal hetzelfde aantal metingen en dezelfde mediaan en gemiddelde. (Degenen waar de modus bestaat hebben ook nog eens dezelfde modus).Toch zijn ze nogal verschillend, vind je niet?
       

       
Waar zit hem nou dat verschil in?
Het "midden" van deze verdelingen zit wel steeds op dezelfde plaats, maar de spreiding eromheen is nogal verschillend. De eerste drie hebben nog wel ongeveer dezelfde "vorm", maar de breedte is enorm verschillend. De vierde heeft een heel andere vorm.
Er zijn verschillende manieren om de spreiding van een verdeling in een getal uit te drukken.
       
1.  De spreidingsbreedte.
       
De spreidingsbreedte is de allereenvoudigste. Het is gewoon de breedte van het histogram, ofwel de grootste meting min de kleinste.
Een voordeel is dat het zo'n makkelijk te berekenen getal is. Een groot nadeel is echter, dat deze breedte nogal gevoelig is voor één kleine afwijking. Neem het histogram in de volgende twee figuren:
       

       
Doordat er in die rechterfiguur één metinkje bij is gekomen  (duidelijk een uitschieter) is de spreidingsbreedte nogal spectaculair veel veranderd, terwijl de rest van de figuur toch gelijk is.
       
2. De kwartielafstand.
       
Om dit laatste probleem op te vangen, en zo'n paar kleine getallen aan de rand niet teveel invloed te laten hebben, kunnen we afspreken om de buitenste getallen niet mee te laten tellen.
       
Je zou bijvoorbeeld kunnen afspreken om alleen het middelste deel van de figuur te nemen, bijvoorbeeld de middelste 50% van de metingen.
Verdeel je getallen in vier gelijke delen (dat wil zeggen evenveel metingen in elk deel, dus 25% van je metingen) en neem dan de breedte van de middelste twee stukken.

De grenzen waar 25%, 50% en 75% van je metingen geweest zijn heten de kwartielen Q1, Q2 en Q3. Overigens kennen wij dat tweede kwartiel Q2 ook al onder de naam mediaan (het is immers waar de helft van je metingen geweest is?)

       
Je kunt het eerste kwartiel dus vinden door eerst de mediaan te berekenen.
Die mediaan verdeelt je metingen dan in twee groepen (Als de mediaan één getal is, telt dat niet meer mee, als de mediaan tussen twee getallen in ligt tellen beiden in een groep mee).
Als je nu de mediaan van de eerste groep berekent dan heb je het eerste kwartiel Q1 gevonden.
De mediaan van de tweede groep geeft dan het derde kwartiel Q3.

Voorbeeld.
Neem deze frequentietabel:
meting 4 5 6 7 8 9 10 11 12 13 14
frequentie 3 5 8 9 18 20 15 8 6 6 3
       
Daar staan 101 metingen (tel de frequenties maar op), dus de middelste is nr. 51
De mediaan is nr. 51 en dat is meting van Q2 = 9
Er zijn nu twee groepen van 50 en de middelste van zo'n groep ligt tussen nummers 25 en 26 in die groep
De mediaan van de eerste groep is nr. 25-26   dat is tussen 7 en 8 dus  Q1 is 7,5
De mediaan van de tweede groep is nr. 25-26 gerekend vanaf  de mediaan nr. 51, dus dat is nr. 76-77.
Dat is beiden een meting van 10, dus Q3 = 10
       
Als maat voor de spreiding nemen we nu de middelste helft, dus dat is de afstand tussen Q1 en Q3. Zie de figuur hiernaast.

Dat noemen de kwartielafstand  (of ook wel de interkwartielafstand)

In ons rekenvoorbeeld zou de kwartielafstand gelijk zijn aan 10 - 7,5 = 2,5

Het gebruiken van de kwartielafstand als maat voor de breedte van de figuur  heeft als voordeel dat een paar losse metingen aan de rand deze spreiding niet beïnvloeden. Maar het heeft uiteraard als nadeel dat de "vorm" en grootte van de buitenste helft helemaal niet worden meegeteld.

       
De kwartielafstand bij een cumulatief frequentiepolygoon.
 
Als je een cumulatief frequentiepolygoon hebt dan kun je daar in één keer de kwartielafstand uit aflezen, vooral als de frequenties (op de y-as) in procenten zijn gegeven.

Omdat de kwartielen alle metingen in vier kwarten verdelen weet je immers direct:

Q1 vind je bij 25% van de metingen.
Q2 vind je bij 50% van de metingen.
Q3 vind je bij 75% van de metingen.

Kik maar bij het cumulatieve frequentiepolygoon hiernaast hoe je razendsnel die kwartielen en de kwartielafstand kunt aflezen.

       

spreidingsbreedte = grootste - kleinste
kwartielafstand = Q3 - Q1

       
 
       
                                       
       
  OPGAVEN.
       
1. Hiernaast staat een cumulatief frequentiepolygoon van de leeftijden van alle leden van een golfvereniging.

Bepaal met dit polygoon de kwartielafstand, de mediaan en de modus van deze metingen.

       
2. Examenopgave HAVO wiskunde A, 2022-II

Wanneer er een melding bij de ambulance-meldkamer binnenkomt, moet men de mate van urgentie van de melding vaststellen en zorgen voor de inzet van een ambulance: een ambulancerit. De mate van urgentie kan zijn:
  - Hoge urgentie: de benodigde zorg is spoedeisend en er is sprake van direct levensgevaar voor de patiënt. We noemen dit een A1-rit.
  - Lage urgentie: de benodigde zorg is spoedeisend, maar er is geen direct levensgevaar voor de patiënt. We noemen dit een A2-rit.
  - Geen urgentie: de benodigde zorg is niet spoedeisend. We noemen dit een B-rit.
       
  In de rest van de opgave kijken we alleen naar A1-ritten en A2-ritten. Omdat er bij A1-ritten sprake is van direct levensgevaar voor de patiënt, zijn de responstijden van deze ritten over het algemeen korter dan de responstijden van de A2-ritten.

In de figuur staan de relatieve cumulatieve frequentiepolygonen van de responstijden van de A1-ritten en die van de responstijden van de A2-ritten in 2014. In de figuur is niet aangegeven welke polygoon bij de A1-ritten hoort en welke bij de A2-ritten.
       
 
       
  Bepaal met behulp van de figuur de interkwartielafstand van de responstijd van de A1-ritten. Geef hierbij aan welke polygoon je gebruikt hebt en licht je keuze toe.
       
3. Een uitschieter is een meetwaarde die erg ver onder of boven de rest van de meetwaarden ligt.
Men neemt in de statistiek meestal als vuistregel dat een meetwaarde die meer dan 1,5 keer de kwartielafstand boven Q3 of onder Q1 ligt, als uitschieter wordt beschouwd.

Een onderzoeker heeft de volgende meetwaarden gevonden:

12 - 32 - 34 - 38 - 40 - 41 - 45 - 51 - 52 - 54 - 55 - 55 - 58 - 62 - 65 - 70 - 94

Onderzoek of de meetwaarden 12 en 94 volgens de vuistregel hierboven uitschieters zijn.
   
       

© h.hofstede (h.hofstede@hogeland.nl)