Meerdere metingen.

© h.hofstede (h.hofstede@hogeland.nl)

   
Voor een gezonde visstand is het nodig dat er tenminste 5 mg zuurstof per liter water aanwezig is.
Stel je voor dat ik mij zorgen maak over de waterkwaliteit van de sloten in Groningen.
Het natuurbeheer van Groningen beweert dat er gemiddeld 5,2 mg zuurstof per liter water aanwezig is (met een standaarddeviatie van 1,3), maar ik denk dat dat minder is.
Dan kan ik besluiten dat te gaan controleren. Gewoon nameten dus. Het is natuurlijk niet erg wetenschappelijk om dan maar in één sloot ergens één watermonster te nemen en naar aanleiding van de éne meting conclusies te gaan trekken.

Het lijkt veel logischer om een groot aantal monsters uit verschillende sloten te halen, en naar aanleiding van het gemiddelde zuurstofgehalte in die monsters mijn vermoeden te toetsen.

Hoe verandert daardoor het toetsmodel?

Bij het nemen van één monster zou het model er zó uitzien:
   
H0μ = 5,2 met σ = 1,3
H1
μ < 5,2
   
Wat wordt er anders aan dit model als ik niet één meting doe, maar bijvoorbeeld het gemiddelde van 40 metingen neem?
Je moet je afvragen: 

Wat zegt H0 over het gemiddelde van 40 metingen?

 
Ofwel:  als iets normaal verdeeld is met  (μ = 5,2 met σ = 1,3) hoe is het dan met het gemiddelde van 40 metingen?
Nou, dat hebben we al gehad toen we bespraken hoe het gemiddelde en de standaarddeviatie veranderen als je van dingen het gemiddelde neemt of dingen bij elkaar optelt. Dat stond in deze les, en de conclusie daar was:
   
n dingen optellen:
μsom = nμ1  en  σsom= σ√n

gemiddelde van n dingen nemen:
μgem = μ  en  σgem = σ/n
   
Voor dit model zou dat de nieuwe H0 geven:   μ = 5,2  en  σ = 1,3/40 0,206
Als we een significantieniveau van 0.05 nemen, en ik zou als gemiddelde zuurstofgehalte van 40 sloten 4,7 mg/liter gemeten hebben, dan is de overschrijdingskans daarbij:  normalcdf(0, 4.7, 5.2, 0.206) = 0,008 en dat is veel kleiner dan 0,05 dus mag ik concluderen dat die 5,2 mg/l die men beweert niet klopt.

Merk nog op dat als ik bij één meting 4,7 zou vinden, de overschrijdingskans gelijk was aan
normalcdf(0, 4.7, 5.2, 1.3) = 0,35. Dat is lang niet genoeg om H0 te mogen verwerpen.
Ik hoop dat je dat logisch vindt: aan de hand van 40 metingen is het uiteraard eerder toegestaan iets te beweren dan aan de hand van één meting. Dat van die 40 is natuurlijk veel betrouwbaarder.

conclusie:

   

Als niet één meting is gedaan:

H0 aanpassen!!!

(Verder blijft alles hetzelfde)

   
praktische opmerking.
In veel praktische gevallen is wel een gemiddelde bekend, maar geen standaarddeviatie. Vaak wordt dan een schatting van de standaarddeviatie gedaan door te berekenen wat de standaarddeviatie van de steekproef is. Die is echter wel wat groter dan de "echte" standaarddeviatie van de hele populatie (binnen een klein aantal metingen zit nou eenmaal meer willekeurige fluctuatie dan binnen een erg groot aantal). De verdeling is dan niet meer normaal, maar heet een t-verdeling.
 
 
  OPGAVEN
 
1. De spijbeltijd per leerling loopt op een middelbare school nogal uit de hand. Op een bepaald moment is dat zelfs 3,4 uur per leerling per week (met een standaarddeviatie van 0,8 uur).
Men besloot tot een strenger controlebeleid en strafbeleid over te gaan.
Na een korte aanloopperiode bleek bij een test van 30 leerlingen de gemiddelde spijbeltijd gelijk te zijn aan 2,9 uur.
Mag men hieruit concluderen (neem α = 0,05) dat de gemiddelde spijbeltijd per leerling per week inderdaad korter is geworden?
   
2. De levensduur van spaarlampen hoort normaal verdeeld te zijn met een gemiddelde van 5000 uur en een standaarddeviatie van 600 uur.
Een steekproef van 300 lampen van een bepaalde fabrikant blijkt echter een gemiddelde levensduur van  4950 uur.
Mag men daaruit concluderen dat de fabrikant inferieure spaarlampen levert? Neem een significantieniveau van 10%.
   
3. De firma BonFire verkoopt houtskool in verpakkingen van 5 kilogram met een standaarddeviatie van 0,2 kg.
Een kritisch koper meet dat het gemiddelde gewicht van een groot aantal zakken gelijk is aan 4930 gram.
Hij laat wiskundig zien dat hij aan de hand van deze meting mag concluderen dat de firma BonFire minder dan 5 kg in de zakken stopt (met een significantieniveau van 5%)

Hoeveel zakken heeft de kritische koper minstens gewogen?

 

23

4. De supermarkt ALDI beweert dat alle caissières net zolang getraind worden totdat ze een gemiddelde afhandelingtijd aan de kassa van 2 minuten per klant bereiken (met een standaarddeviatie van 0,5 minuut).

Ik geloof daar niets van, want laatst was ik bij de ALDI en toen waren er 5 mensen voor me in de rij, maar moest ik maar liefst 12 minuten wachten voordat ik aan de beurt was.
Mag ik naar aanleiding hiervan inderdaad concluderen dat dat gemiddelde van 2 minuten per klant in werkelijkheid hoger is? (neem een significantieniveau van 5%).
       
5. Een pompoenenkweker kan een grote voorraad van 2000 pompoenen verkopen aan een veiling. Hij krijgt van de veiling een bedrag per pompoen dat afhankelijk is van het gewicht van de pompoen. Hoe zwaarder, des te meer geld.
De veiling deelt aangeleverde pompoenen in drie categorieën in, en betaalt daarvoor het volgende:
       
 
gewicht 0 - 2 kg 2 - 4 kg meer dan 4 kg
opbrengst €0,20 €0,30 €0,45
     
  De kweker beweert dat het gewicht van zijn pompoenen normaal verdeeld is met een gemiddelde van 2,8 kg en een standaarddeviatie van 0,5 kg.  De veilinginkoper vertrouwt de zaak niet en neemt een steekproef van 10 pompoenen uit de voorraad. Die wegen gemiddeld slechts 2,5 kg. Hij concludeert dat de pompoenen minder wegen.
 
       
  a. Toon aan dat de veilinginkoper dat inderdaad bij een significantieniveau van 5% mag concluderen.
       
  De veilinginkoper stelt daarom voor de kweker te betalen voor een voorraad met een gemiddelde van 2,5 kg en een standaarddeviatie van 0,5 kg.
Maar de kweker beweert nu dat hij zich vergist heeft: het gemiddelde was inderdaad wél 2,8 kg maar de standaarddeviatie was 0,58 kg.
       
  b. Toon aan dat de inkoper die bewering aan de hand van zijn meting niet mag verwerpen.
       
  c. Bereken hoeveel geld de kweker in beide gevallen voor zijn voorraad krijgt. Rond af op hele euro's
     

556/569

6. Een tablet Aspirine-C van de firma Bayer bevat 400 mg acetylsalicylzuur (acetosal) en 240 mg ascorbinezuur (vitamine C) per tablet. Tenminste dat staat erop.
Die eerste stof is de werkzame stof die pijnverlichting geeft. Het blijkt dat de werkelijke hoeveelheid acetylsalicylzuur in een tablet normaal verdeeld is met een gemiddelde van 400 mg en een standaarddeviatie van 12 mg.

Als de hoeveelheid in een tablet minder dan 380 mg wordt, dan werkt het niet goed meer.
       
  a. Hoe groot is de kans dat een willekeurig gekozen tablet niet goed werkt?
     

0,0478

  Uiteraard wordt regelmatig gecontroleerd of de gemiddelde hoeveelheid acetylsalicylzuur in een tablet wel 400 mg is.
Een steekproef van 100 tabletten leverde een gemiddelde hoeveelheid acetylsalicylzuur op van 397,5 mg.
       
  b. Mag hieruit met een significantieniveau van 5% worden geconcludeerd dat het gemiddelde inderdaad minder is dan 400 mg?
       
7. Ik wil graag een enorme houten vloer van maar liefst  90m2  in de was gaan zetten.
Ik kies voor het product Osmo Waxolie, dat wordt verkocht in blikken waar op staat vermeld dat je met de inhoud van zo'n blik 16 m2 kunt behandelen. De standaarddeviatie daarvan is 2 m2 .
Ik besluit daarom om 6 blikken te kopen, maar wat blijkt: ik heb nét niet voldoende!!
Mag ik (met significantieniveau 5%) concluderen dat die beloofde 16 m2 op het blik lager is?
     

nee (0,092)

       
8. Bij de help-desk van een internetprovider  worden de bellers geholpen, waarbij de gemiddelde gesprekstijd gelijk is aan  6 minuten met een standaarddeviatie van 50 seconden. Het blijkt dat dat te lang is, want er ontstaan te grote rijen wachtenden. Men kan natuurlijk meer medewerkers aannemen zodat meer lijnen tegelijk open zijn, maar men wil eerst proberen of het niet mogelijk is de huidige medewerkers efficiënter te laten werken.
Daarom stuurt men iedereen op een cursus "helpdeskefficiëntie".
Na afloop blijkt de gemiddelde gesprekstijd van 40 gesprekken gelijk te zijn aan  5 minuten en 45 seconden.
     
  a. Mag men daaruit met 95% significantieniveau concluderen dat de cursus heeft geholpen?
     

JA: 0,029

  b. Bij welke aantallen gesprekken in de steekproef zou men bij een gemiddelde van 5 minuten en 45 seconden  NIET mogen concluderen dat de gemiddelde gesprekstijd is afgenomen?
     

  ≤ 30 

       
9. De mentor van klas 3A beweert dat leerlingen tegenwoordig veel te veel tijd met computerspelletjes doorbrengen. Volgens hem is voor derdeklassers van tegenwoordig de gemiddelde computertijd per dag normaal verdeeld met een gemiddelde van 200 minuten en een standaarddeviatie van 30 minuten.
Een enquête onder 14 van zijn leerlingen leverde de volgende computertijden op (in minuten):
       
 
180 230 50 300 160 160 100 80 230 200 190 250 400 90
       
  Is er bij significantieniveau van 10% aanleiding om zijn bewering in twijfel te trekken?
     

  nee:0,054 

       
10. Door de aanvoer van zware metalen via kunstmest en dierlijke mest vindt nagenoeg in alle landbouwgebieden ophoping van zware metalen in de bodem plaats. Een normale hoeveelheid zink in onze bodem is bijvoorbeeld  40 μmol/gram droge bodem, met een standaarddeviatie van 6 μmol/gram.
Een ambtenaar van de milieudienst neemt bij een boerderij een aantal bodemmonsters en meet daarin het zinkgehalte. Hij vindt de volgende waarden:
       
 
42 50 35 38 34 49 46 37 40 51
       
  Mag hij uit deze metingen concluderen dat het zinkgehalte in deze bodem hoger is dan 40 μmol/gram?  Neem een significantieniveau van 5%.
     

  nee:0,1231 

       
 
       

© h.hofstede (h.hofstede@hogeland.nl)