© h.hofstede (h.hofstede@hogeland.nl)

Frequentietabellen en Centrummaten
       
Zo, dus jij wilt graag iets meer weten over de lengte van de Nederlandse mannen in 1950 en in 1970?
Nou vooruit, dan, hier zijn de gegevens van twee steekproeven uit die jaren:
       
Nederlandse mannen, 1950
(lengte in cm).
                   
177 173 176 169 181 184 178 171 176 171
174 178 182 169 178 175 170 170 173 165
180 175 179 177 179 180 176 174 173 176
170 177 173 176 183 170 172 182 182 173
178 174 171 169 176 180 174 176 178 173
179 180 179 177 175 182 182 174 178 177
170 179 176 180 181 175 181 184 177 172
186 170 183 183 177 179 176 188 176 173
172 174 174 173 170 186 184 176 175 173
179 172 176 178 171 178 173 181 171 173
176 175 182 172 181 183 176 177 177 178
178 177 176 182 174 174 180 171 181 171
179 176 175 179 183 172 174 177 170 179
177 180 172 175 172 173 176 175 179 174
174 174 174 182 177 173 176 176 179 185
171 177 177 176 174 174 181 177 177 172
175 175 174 178 174 175 179 174 170 175
169 178 175 180 173 182 173 173 178 179
173 176 180 178 176 177 173 170 180 177
175 175 168 185 181 175 168 175 167 175
169 174 180 180 180 178 175 172 180 178

Nederlandse mannen, 1970 
(lengte in cm).

                   
185 173 176 171 179 176 182 186 177 180
173 179 173 176 179 179 188 180 185 170
179 175 182 185 177 186 175 179 184 183
180 175 178 179 176 176 182 184 171 180
174 184 170 186 181 171 182 181 178 182
178 173 181 177 182 182 180 171 189 182
179 180 186 182 184 179 176 188 175 186
171 179 180 185 176 179 186 176 171 179
182 177 177 182 178 184 189 167 187 185
183 176 179 181 181 177 178 178 185 185
177 176 179 181 167 181 174 189 180 177
166 180 176 177 169 183 180 179 171 181
191 180 174 175 170 180 184 178 185 177
183 188 178 179 184 187 183 183 182 176
173 179 188 176 175 183 172 180 190 169
174 179 171 183 178 175 173 175 180 173
180 181 183 176 179 178 180 183 189 181
182 175 185 171 180 177 177 188 184 177
178 177 176 179 171 181 173 170 180 176
180 186 183 174 186 181 176 181 173 185
177 181 172 179 191 175 180 179 170 176
179 175 181 179 179 175 181 181 180 186
178 187 179 181 182 182 185 178 180 181
172 177 173 181 186 174 176 179 179 179
179 171 183 181 178 173 172 173 185 180
177 178 179 182 177 176 184 184 183 175

 

Veel plezier ermee!
En.... weet je al iets meer?
       
Gegevensverwerking.

Dit hoofdstuk zullen we behandelen hoe je nou uit zo'n enorme brij van gegevens iets kunt zien. We zullen ons vooral bezighouden met manieren om grote hoeveelheden getallen in beeld te brengen en er berekeningen aan te maken.

De allereerste en ook simpelste manier is natuurlijk om bij bovenstaande tabellen te gaan tellen hoe vaak elke lengte voorkomt. Maak een tabel met in de eerste kolom de gemeten lengtes. Loop nu alle lengtes langs, en zet steeds een streepje in de tabel bij de lengte die je tegenkomt  ("turven" heet dat, als je elk vijfde streepje schuin legt).
       

       
Die getallen aan de rechterkant geven aan hoe vaak een bepaalde waarde voorkomt, en zo'n getal heet een frequentie.
       

frequentie  =  hoe vaak iets voorkomt

       
Als je de frequentie in een tabel zet, dan heet dat (dûh) een frequentietabel. Het wordt ook wel een frequentieverdeling genoemd, immers je kunt zien hoe de aantallen verdeeld zijn.
Hier is de frequentietabel voor 1950:
       
lengte 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188
frequentie 1 0 1 2 5 10 8 10 18 20 20 22 19 16 14 14 8 9 5 3 2 2 0 1
       
Soms zijn de makers van een opgave nogal flauw en noemen ze om je in de war te brengen beiden "aantal". In zo'n geval moet je je gewoon afvragen:  "Wat is hier geteld, en hoe vaak kwam het voor?"
Twee voorbeelden daarvan

Voorbeeld 1.
Een klas vindt het leuk om bij te houden hoeveel wiskundige fouten een wiskundeleraar in een les maakt.
Dat geeft dan de volgende frequentietabel:
       
aantal lessen 12 10 9 6 2 1
aantal fouten 2 3 5 8 11 14
       
In deze tabel staan twee keer aantallen.  Wat is nou de frequentie en wat is de meting???

Bedenk je steeds goed wat er gebeurd is.  Die 12 lessen en 2 fouten betekent eigenlijk:  "Er zijn 12 lessen geweest waarin de leraar 2 fouten maakte". Dus de 12 is een getal dat aangeeft hoe vaak het getal 2 is voorgekomen.  Omdat de frequentie altijd is hoe vaak iets is voorgekomen is de 12 de frequentie, en 2 de meetwaarde.
Je kunt het ook zó zien:  in dit experiment was de klas aan het opletten of er een fout werd gemaakt. Het maken van een fout was daarom een meting.
       
Voorbeeld 2.

De volgende tabel geeft het aantal doelpunten in de wedstrijden van de eredivisie en de eerste divisie in een bepaald weekeinde.
       
aantal doelpunten 0 1 2 3 4 5 6 7
aantal wedstrijden 10 6 6 3 2 0 0 1
       
Het aantal doelpunten is gemeten en is dus de meetwaarde.
Het aantal wedstrijden was hoe vaak dat aantal doelpunten voorkwam en is dus de frequentie.
Je kunt het ook zó zien:  men heeft zitten tellen hoeveel doelpunten er werden gemaakt. Dat is dus de meetwaarde.
       
Berekeningen met frequentietabellen.
 
Vaak zijn we geïnteresseerd in waar het "midden" van al de waargenomen getallen ongeveer ligt. Immers, dan kunnen we misschien iets zeggen over verschillen tussen groepen metingen.

Er zijn drie getallen die iets zeggen over het midden van zo'n frequentietabel. Dat zijn de modus, de mediaan en het gemiddelde en samen heten ze wel de centrummaten.
       

Centrummaten:   Modus, Mediaan, Gemiddelde.

       
1.  De Modus.
       
De modus is de makkelijkste van de drie. Het is namelijk het getal met de grootste frequentie, ofwel het getal dat het vaakst voorkomt.
In de tabel voor 1950 hierboven zou gelden:  Modus = 176  want het getal 176 komt het vaakst voor (namelijk 22 keer)
       
Modus  =  vaakst voorkomende getal
       
Als er een gedeelde eerste plaats is, dan heb je geen modus.
       
2.  De Mediaan.
       
Om de mediaan te vinden zet je alle metingen op volgorde van klein naar groot (zoals in de tabel al is gebeurd) en dan is de mediaan het middelste van al die getallen.
Om te weten wat de middelste is zul je eerst moeten weten hoeveel getallen hier nou eigenlijk staan.
Daarvoor moet je al die frequenties optellen:
Aantal getallen = 1 + 0 + 1 + 2 + 5 + 10 + ..... = 210

Welk getal is de middelste van 210?.....
Wat zeg je?....    
nr. 105?.....
Weet je het zeker?.....
Echt waar?......
Oh ja; zet dan eens 6 mensen naast elkaar op een rijtje, wat is dan de middelste?
Precies:  dat is niet nummer3!!!!
De midden van de rij zit tussen nr. 3 en nr. 4 in, want vanaf daar staan er aan beide kanten drie mensen.
Het midden van 210 mensen zit op dezelfde manier tussen nr. 105 en nr. 106 in.
Voor wie van formules houdt:

       
In dit geval komt er dus uit:   (210 + 1)/2 = 105,5 en dat betekent dat de mediaan tussen nr 105 en nr 106 zit.
Om de mediaan van deze tabel te vinden gaan we dus gewoon vanaf het begin tellen tot we bij de nrs. 105 en 106 zijn.
1 + 0 + 1 + 2 + 5 + 10 + 8 + 10 + 18 + 20 + 20 + 22 = 117 en dan zijn we  er voorbij.
De mediaan zit dus ergens in de groep van 22, dus de mediaan is 176

Als de mediaan toevallig tussen twee verschillende getallen invalt, dan nemen we het gemiddelde van die twee getallen.
       
3. Het gemiddelde.
       
Het uitrekenen van het gemiddelde hoef je meestal aan middelbare scholieren niet uit te leggen. Vooral tegen rapporttijd zijn ze continu bezig uit te rekenen wat hun gemiddeldes zijn en wat ze nog moeten halen om een voldoende te krijgen.
Als iemand bijvoorbeeld op zes proefwerken drie keer een 5 heeft gehaald en twee keer een 6 en één keer een zeven dan is het gemiddelde:  (3 × 5 + 2 × 6 + 1 × 7)/6  = 5,67
Je vermenigvuldigt steeds de getallen met hun frequentie, en op het eind deel je door het totaal aantal (alle frequentie samen).

Nou, dat gaat met zo'n frequentietabel precies zo:
Gemiddelde = (1 × 165 + 0 × 166 + 1 × 167 + 2 × 168 + ....)/(210) = 176,13
       
Voor- en Nadelen van deze drie centrummaten.
       
Elk van de drie centrummaten heeft zijn eigen voor- en nadelen.
 
Het gemiddelde heeft het voordeel dat alle meetwaarden gebruikt worden, en ook de grootte ervan. Een nadeel van het gemiddelde is dat het nogal gevoelig is voor uitschieters.

Stel dat wij in een straat wonen met 76 adressen en dat het gemiddelde inkomen van die gezinnen gelijk is aan  €42000 bruto per jaar. Maar stel verder dat opeens Bill Gates bij ons in de straat komt wonen, met een inkomen van 10,7 miljard euro. Dan wordt het gemiddelde van onze straat ineens ongeveer 140 miljoen euro (reken dat zelf maar na). En dat terwijl toch iedereen verder evenveel is blijven verdienen. Al die inkomens van die andere 76 mensen doen er niet toe; als ze allemaal  niets zouden verdienen was nog steeds het gemiddelde inkomen 139 miljoen.

Je ziet dat één zo'n vreemde uitschieter het gemiddelde veel te veel beïnvloedt. Sterker nog; bij metingen is zo'n vreemde uitschieter vaak een meetfout geweest......

De mediaan is veel minder gevoelig voor zulke uitschieters. Ga maar na dat die nauwelijks zou veranderen als Bill Gates bij ons in de straat komt wonen.
       
De modus heeft als voordeel dat hij bij alle variabelen te gebruiken is. Ook als het geen getallen zijn wat er gemeten is. Als je bijvoorbeeld van een grote groep jongeren hebt gekeken welke sport zij beoefenen dan is er meestal wel een modus (de sport die het vaakst beoefend wordt) maar nooit een gemiddelde (er zijn geen getallen) en geen mediaan (er is dus geen middelste meting).
Voordeel van de modus is verder dat hij snel te bepalen is.
Nadeel is dat de modus er niet altijd is (als meerdere metingen het vaakst voorkomen).
       
De mediaan heeft als nadeel dat alleen de grootte van de middelste waarneming telt, en dat het helemaal onbelangrijk is hoe de metingen daaromheen verdeeld zijn. Voordeel van de mediaan is dat hij ongevoelig is voor uitschieters.
       
Ben je nogal lui en vond je dit veel te veel werk?
       
Nou, dan heb ik goed nieuws voor je!
Het kan namelijk ook allemaal met de GR.

Eerst moet je de tabel invoeren in je GR. Dat is nog wel even een werkje, maar daarna ben je zo ongeveer klaar. Dat invoeren gaat als volgt:
       
Kies het menu  STAT  en dan  1:  Edit.
Als je dat indrukt krijg je een scherm als hiernaast.
Daar staan een aantal verticale lijsten L1, L2,..., L6 waar je getallen kunt invoeren.

 

• Als de lijsten niet leeg zijn kun je ze leeg maken door met de cursor op de naam (L1, L2, ...) van de lijst te gaan staan en dan op CLEAR te drukken.

•  Als er lijsten ontbreken of als ze andere namen hebben kun je, als je dat vervelend vindt, de boel resetten via  STAT  -  5: SetUpEditor ENTER
 
       
Goed, nu kun je je frequentietabel invoeren. Misschien is het handig om jezelf aan te wennen de meetgegevens altijd in L1 te zetten en de frequenties in L2.
       
Als je tabel er in zit,  dan toets je  STAT - CALC - 1:Var Stats  en dan krijg je het scherm hiernaast.

Zet bij List nu L1  (via  2nd  -  L1 )
Zet bij FreqList  nu L2  ( (via  2nd  -  L2 )
Druk op Calculate  (ENTER)

  

   
Dan krijg je een heel lijstje in beeld.
(dat onderste deel krijg je door omlaag te scrollen met het pijltje onderin).

Ik heb de belangrijkste drie hiernaast omcirkeld.

Zoals je ziet heb je in één keer gevonden

het gemiddelde x̅  is  176.1285714
het totaal aantal  n  is  210
de mediaan:  Med  is 176

       
 
       
                                       
       
  OPGAVEN.
       
1. Hieronder staat het aantal ogen dat met een dobbelsteen is gegooid.
Bepaal van deze frequentieverdeling de modus, de mediaan en het gemiddelde.
       
 
aantal ogen 1 2 3 4 5 6
frequentie 12 16 10  8 19 13
       
2. Van iemand die griep heeft verdwijnen de verschijnselen (koorts, rillingen, keelpijn, spierpijn) zo ongeveer na 2 tot 7 dagen. Voor een aantal grieppatiënten is bijgehouden hoe lang de koorts duurde.
       
 
aantal dagen 2 3 4 5 6 of meer
aantal patiënten (%) 15 43 22 12 8
       
  a. Stel dat de laatste groep 6,5 zou zijn in plaats van 6 of meer.
Bereken in dat geval de modus, de mediaan en het gemiddelde.
       
  b. Welk van de drie berekende getallen uit de vorige vraag zou veranderen als er in plaats van "6 of meer" ook 6, 7, 8 enz zou hebben gestaan?
       
  c. Welk getal moet er in plaats van "6 of meer"  staan als het werkelijke gemiddelde gelijk blijkt te zijn aan 3,75?
       
3. Een leraar heeft bijgehouden hoeveel onvoldoendes er in een jaar op zijn proefwerken door de klas werden gehaald. Dat gaf deze tabel:
       
 
aantal proefwerken 4 2 4 5 5 6 10 6
aantal onvoldoendes 3 4 5 6 7 8 9 10
       
  a. Bereken de modus, de mediaan en het gemiddelde.
       
  De man heeft ook het aantal voldoendes per klas van diezelfde proefwerken bijgehouden.
Dat gaf deze tabel:
       
 
aantal proefwerken 2 6 11 7 8 4 4
aantal voldoendes 19 21 22 23 24 25 26
       
  b. Wat kun je zeggen over de grootte van de klassen van de leraar?
       
  c. Hoeveel procent van alle proefwerken die in dit jaar door deze leraar zijn gegeven was onvoldoende?
       
4. Examenvraagstuk HAVO wiskunde A, 2007.

Uit onderzoek is gebleken dat leerlingen in de eerste klas van het voortgezet onderwijs gemiddeld ruim 8 uur per week aan huiswerk besteden. De meeste tijd besteden zij aan de vakken wiskunde, Engels en Nederlands. Daarnaast besteden meisjes meer tijd aan huiswerk dan jongens. De tijd in uren die leerlingen per week aan hun huiswerk besteden, noemen we de huiswerktijd.
In de volgende figuur zijn de resultaten van het onderzoek weergegeven.

       
 

       
  In deze figuur kun je bijvoorbeeld zien dat ongeveer 27 procent van de jongens minstens 6 uur maar minder dan 8 uur per week aan huiswerk besteedt.
       
  a. Hoeveel procent van de meisjes besteedt 8 uur of meer per week aan het huiswerk? Licht je antwoord toe.
       
  De gemiddelde huiswerktijd van de leerlingen in de eerste klas is ruim 8 uur. Meisjes blijken gemiddeld meer dan 8 uur aan hun huiswerk te besteden. Met behulp van de klassenmiddens kun je het gemiddelde voor de jongens schatten.
       
  b. Toon met behulp van een berekening met de klassenmiddens aan dat de gemiddelde huiswerktijd van de jongens minder dan 8 uur is.
       
 
       

© h.hofstede (h.hofstede@hogeland.nl)