mediaan toetsen


	© h.hofstede (h.hofstede@hogeland.nl)

De mediaan toetsen.

In de les over de tekentoets zag je hoe je van het vergelijken van twee rijen getallen via een slimme truc een bewering
H₀: p = ¹/₂ kon maken, en dus een p-toets.

Precies hetzelfde kan, als iemand iets over de mediaan (weet je nog: de middelste) van een serie getallen beweert.
Immers als iemand bijvoorbeeld zegt dat de mediaan van een serie getallen gelijk is aan 450, dan beweert hij dat er evenveel getallen onder de 450 zullen liggen als erboven. Dus dan is de kans dat een willekeurig getal onder de mediaan ligt 0,5 (we nemen, net als bij de tekentoets, aan dat precies de mediaan niet voorkomt).

Dan kunnen we er weer een p-toets van maken, met H₀: p = ¹/₂

Wat H₁ is, hangt weer af van wat je succes noemt, en wat meneer H₁ beweert.
Stel bijvoorbeeld dat je succes noemt een meting onder de mediaan.

• Als H₁ is "de mediaan is groter dan 450" dan is dat de bewering p < ¹/₂, immers als de mediaan groter is dan 450, dan ligt meer dan de helft van de getallen onder de 450, dus is de kans op een getal onder 450 (succes) groter dan ¹/₂
• Als H₁ is "de mediaan is kleiner dan 450" dan is dat volgens een zelfde redenering de bewering p > ¹/₂,
• Als H₁ is "de mediaan is ongelijk aan 450" dan is dat de bewering p ≠ ¹/₂ en krijg je een tweezijdige toets.

Vraag je dus steeds duidelijk af:

Wat noem ik succes?
Wat zegt H₁dan?

Andere Grenzen.

Hetzelfde principe kun je ook gebruiken bij andere grenzen.
Een voorbeeld zal wel duidelijk maken hoe het werkt, hoop ik.

Stel dat bij een z-toets geldt H₀: μ = 250 en σ = 35 en H₁: μ < 250
Als meetgegevens hebben helaas alleen maar dat er 200 metingen zijn geweest waarvan er 69 een waarde onder de 230 gaven, en 131 een waarde erboven.
Omdat je die metingen verder niet kent, kun je geen z-toets uitvoeren.
Maar je kunt er wel een p-toets van maken, kijk maar;
Als H₀ klopt, dan is de kans dat een meting onder de 230 komt gelijk aan normalcdf(-∞, 230, 250, 35) = 0,2839
Als H₁ klopt, dan ligt het gemiddelde lager, en zullen er méér metingen onder de 230 vallen.

Dat geeft de volgende p-toets:

H₀:   p = 0,2839
H₁:   p > 0,2839
meting: 69 successen van de 200 metingen
stel bijv.   α = 0,05

De overschrijdingskans is dan P(X ≥ 69) = 1 - binomcdf(200, 0.2839, 68) = 0,0348
Met α = 0,05 zou je daarom op grond van deze gegevens H₀ moeten verwerpen.


OPGAVEN

1.	Ik beweer dat de mediaan van de inkomens in Nederland gelijk is aan €20000. Mijn vrouw beweert dat dat hoger is. We vragen aan 80 willekeurig gekozen mensen hoe groot hun inkomen is, en daarvan blijken er 32 meer dan €20000 te verdienen, en 48 minder. Wie van ons krijgt gelijk met een significantieniveau van 5%?


2.	Ik beweer dat de gemiddelde computertijd per dag van middelbare scholieren normaal verdeeld is met een gemiddelde van 3 uur en een standaarddeviatie van 0,8 uur. Mijn vrouw beweert dat dat gemiddelde hoger is. We weten van 120 middelbare scholieren dat er 7 meer dan 4 uur per dag computeren Wie van ons krijgt gelijk met een significantieniveau van 5%?

3.	Een socioloog beweert dat het aantal uren slaap van bejaarde mensen normaal verdeeld is met een gemiddelde van 7 uur per dag en een standaardafwijking van 0,8 uur. Als dat klopt, dan zou dus de kans dat een bejaarde meer dan 7 uur slaapt gelijk zijn aan 50%.

	a.	Leg uit waarom dat zo is

	Als dat gemiddelde van 7 uur niet klopt, dan is de kans dat een bejaarde meer dan 7 uur slaapt dus ongelijk aan 0,5.

	b.	Bij een onderzoek onder 300 mensen blijken 168 mensen meer dan 7 uur te slapen. Mag je daaruit concluderen dat de 7 uur niet klopt? Neem α = 0,05