h.hofstede (h.hofstede@hogeland.nl)

Fouten van de eerste en van de tweede soort.
       
Tot nu toe hadden we het bij het aannemen of verwerpen van H0 steeds over de kans op een foute conclusie. Maar dat was steeds alleen maar de kans dat H0 ten onrechte werd verworpen. Die vergeleken we met α.

Maar eigenlijk zijn er natuurlijk bij elke toets VIER mogelijkheden:
 
 

beslissing

H0 wordt
aangenomen
H0 wordt
verworpen
werkelijkheid H0 is waar GOED FOUT
H0 is niet waar FOUT GOED

       
Twee van de vier opties geven zoals je ziet een foute conclusie, de andere twee een kloppende conclusie.
Tot nu toe hebben we het alleen maar gehad over die bovenste twee, met kansen α (significantieniveau) en 1 - α  (betrouwbaarheidsniveau).
       
 

beslissing

H0 wordt
aangenomen
H0 wordt
verworpen
werkelijkheid H0 is waar (1 - α) α
H0 is niet waar    
       
Die rode fout om H0 te verwerpen terwijl H0 WAAR is, heet een "fout van de eerste soort", en die gaven we aan met α.
Dat andere rode vakje heet een "fout van de tweede soort". Dat is dus de fout dat H0 ten onrechte wordt aangenomen. Die geven we vanaf nu aan met β.

Die onderste rij, daar kwamen we niet aan toe, vooral omdat H1 niet een bewering deed als  μ = .... of  p = ....
En H1 zei altijd iets veel vagers als  μ > ...   of  p < ... of zoiets
En tja, als je niet weet welke kansverdeling H1 nou precies beweert, dan kun je ook niet de kans uitrekenen dat H1 ten onrechte verworpen wordt. Je hebt immers geen klokvorm om aan te rekenen. 't Was meer uit armoede dus dat we het nooit over die fout van de tweede soort hebben gehad.

Tijd om dat te veranderen.......

Laten we eens een geval nemen waarin H1 wl een precieze bewering doet.

Het voorbeeld van de valse dobbelstenen.
       
Bij een zuivere dobbelsteen is de kans om 6 te gooien gelijk aan 1/6. Dat weet iedereen. Stel nu dat er valse dobbelstenen in omloop zijn waarbij de kans op een 6 gelijk is aan 1/4.
Jij hebt een dobbelsteen voor je neus liggen en wilt bepalen of het zo'n valse is of een zuivere.
Je gooit 120 keer en vindt 24 zessen.
Wat is je conclusie?
Wat is de kans op een foute conclusie?

Laten we eerst vaststellen dat H0 en H1 hier twee precieze beweringen zijn:
H0:  P(6) = 1/6   (het is een zuivere dobbelsteen)
H1:  P(6) = 1/4   (het is een valse dobbelsteen)

Van de 120 keer gooien verwacht H0 dus 20 zessen en H1 verwacht 30 zessen.
Daar horen deze twee plaatjes bij:
       

       
Als je besluit H0 te verwerpen geeft de bovenste rode oppervlakte de fout die je dan eventueel maakt (fout van de eerste soort), namelijk dat H0 wel waar is, maar je meting toch minstens 24 opleverde.
Als je besluit H1 te verwerpen dan geeft de onderste rode oppervlakte de fout die je dan eventueel maakt (fout van de tweede soort) namelijk de kans dat H1 waar is, maar je meting toch hoogstens 24 opleverde.

Dat geeft  dus  α = 1 - binomcdf(120, 1/6, 23) = 0,1935   en  β = binomcdf(120, 1/4, 24) = 0,0391

Die tweede fout is kleiner dan die eerste, dus  H1 maar verwerpen dus?

Was het leven maar zo simpel...
Was het leven maar gewoon wiskunde....!

Helaas komen er meestal allerlei andere zaken bij kijken. Bijvoorbeeld:  het maken van beide fouten is vaak niet even rampzalig. Neem een  geval waarin een jury moet beslissen om iemand te veroordelen of vrij te spreken aan de hand van het aanwezige bewijsmateriaal. Als je neemt H0 = hij is onschuldig (of zij natuurlijk: sorry dames!)  en H1  = hij is schuldig,  dan betekent een fout van de eerste soort dat je een onschuldig iemand veroordeelt,  en een fout van de tweede soort betekent dat je een schuldig iemand vrijspreekt.
Meestal vindt men in de rechtspraak de eerste fout veel zwaarder wegen dan de tweede ("guilt must be proved beyond all reasonable doubt").
Als je wiskundig maar inziet dat er geen manier is om beide fouten (α en β) tegelijk te verkleinen. Als je α kleiner wilt maken moet je in bovenstaand voorbeeld de grenswaarde G van H0 aannemen/verwerpen naar links verschuiven, maar dan wordt automatisch β groter. En andersom.

De enige manier om α n β tegelijk te verkleinen is meer experimenten te doen! Immers als n groter wordt dan worden beide verdelingen smaller (meer rondom hun midden geconcentreerd) en dus α n β kleiner!
       

h.hofstede (h.hofstede@hogeland.nl)