© h.hofstede (h.hofstede@hogeland.nl)

t - toets.
       
  William Gosset was een Engelse statisticus die bovendien hoofdbrouwer van Guinness was. Hij publiceerde onder het pseudoniem "Student".  De door hem ontwikkelde t-toets heet daarom ook wel de "student-t-toets".

Een andere onderzoeker bij Guinness had net een stuk gepubliceerd waarin geheimen van de Guinness Brouwerij werden onthuld.  Om dat in de toekomst te voorkomen stond de leiding van Guinness de werknemers alleen nog maar toe te publiceren onder de voorwaarde dat zij  geen melding maakten van  a)  Bier,  b)  Guinness  en c)  Hun eigen naam. 
Gosset koos zijn pseudoniem uit een oud notitieboek waarin hij als student metingen deed door tellingen van gistcellen te verrichten.
       
Overigens hangt er bij Guinness aan de muur van hun "Storehouse"  nog wel steeds een plakkaat ter ere van Gosset!!

In deze les kun je vinden wat een t-verdeling nou eigenlijk is.

Het komt er eigenlijk op neer, dat je een z-toets alleen kunt gebruiken als je weet wat de standaarddeviatie van de hele populatie is.  En dat weet je eigenlijk bijna nooit!
Je kunt dan natuurlijk de benadering maken dat de standaarddeviatie van de gehele populatie wel gelijk zal zijn aan de standaarddeviatie van jouw steekproef.

Maar dat is niet zo!
     
In principe gaat een t-toets hetzelfde als een z-toets.
Maar in de les over de t-verdeling kun je lezen dat de   z = (X - μ)/σ  van de standaardnormale verdeling verandert in  t = (X - μ)/s  waarbij die s de standaarddeviatie van je steekproef is. Die s hangt wel af van de steekproefgrootte n, dus dat betekent dat je voor elke steekproefgrootte n een andere verdeling voor  krijgt.

Dat geeft tabellen voor de t-waarden die bij allerlei n aangeven waar de oppervlakte  10%, 5%, 1% enz. is. Die heb je immers nodig om de betrouwbaarheidsintervallen te berekenen.
Hier zijn ze:
     
 

kans

n 0,25 0,10 0,05 0,025 0,010 0,005 0,001
2
3
4
5
1,000
0,816
0,765
0,741
3,078
1,886
1,638
1,533
6,314
2,920
2,353
2,132
12,706
4,303
3,182
2,776
31,821
6,965
4,541
3,747
63,675
9,925
5,841
4,604
318,31
22,326
10,213
7,173
6
7
8
9
10
0,727
0,718
0,711
0,706
0,703
1,476
1,440
1,415
1,397
1,383
2,015
1,943
1,895
1,860
1,833
2,571
2,447
2,365
2,306
2,262
3,365
3,143
2,998
2,896
2,821
4,032
3,707
3,499
3,355
3,250
5,893
5,208
4,785
4,501
4,297
11
12
13
14
15
0,700
0,697
0,695
0,694
0,602
1,372
1,363
1,356
1,350
1,345
1,812
1,796
1,782
1,771
1,761
2,228
2,201
2,179
2,160
2,145
2,764
2,718
2,681
2,650
2,624
3,169
3,106
3,055
3,012
2,977
4,144
4,025
3,930
3,852
3,787
16
17
18
19
20
0,691
0,690
0,689
0,688
0,688
1,341
1,337
1,333
1,330
1,328
1,753
1,746
1,740
1,734
1,729
2,131
2,120
2,110
2,101
2,093
2,602
2,583
2,567
2,552
2,539
2,947
2,921
2,898
2,878
2,861
3,733
3,686
3,646
3,610
3,579
21
22
23
24
25
0,687
0,686
0,686
0,685
0,685
1,325
1,323
1,321
1,319
1,318
1,725
1,721
1,717
1,714
1,711
2,086
2,080
2,074
2,069
2,064
2,528
2,518
2,508
2,500
2,492
2,845
2,831
2,819
2,807
2,797
3,552
3,527
3,505
3,485
3,467
26
27
28
29
30
0,684
0,684
0,684
0,683
0,683
1,316
1,315
1,314
1,313
1,311
1,708
1,706
1,703
1,701
1,699
2,060
2,056
2,052
2,048
2,045
2,485
2,479
2,473
2,467
2,462
2,787
2,779
2,771
2,763
2,756
3,450
3,435
3,421
3,408
3,467
40
60
120
0,681
0,679
0,677
1,303
1,296
1,289
1,684
1,671
1,658
2,021
2,000
1,980
2,423
2,390
2,358
2,704
2,660
2,617
3,307
3,232
3,160
0,674 1,282 1,645 1,960 2,326 2,576 3,090
     
(N.B.  n is het aantal meetwaarden. Het aantal vrijheidsgraden (d.f.) is één minder).
     
Tijd voor een voorbeeld.

Een fabrikant beweert dat er gemiddeld  980 gram boontjes in zijn diepvriesverpakking zit.
Een steekproef van 25 verpakkingen levert echter een gemiddelde van  978 gram met als standaarddeviatie (van de steekproef) van
σ = 2,8 gram.
Kun je concluderen dat er te weinig in de verpakking zit?  Neem α = 0,05.

oplossing.
H0
μ = 980
H1
μ < 980  (éénzijdig).
toetsingsgrootheid  t = (978 - 980)/(2,8/
25) = -3,57
De t-tabel met n = 25 geeft bij oppervlakten 0,05 (éénzijdige toets) de waarde  -1,711
Onze meting van -3,57 is kleiner dan -1,711 dus H0 wordt verworpen.

(merk nog even op, dat als we de steekproefdeviatie als de hele populatiedeviatie zouden nemen, we bij de bijbehorende z-toets een overschrijdingskans van  normalcdf(-∞, 978, 980, 2,8/√25) = 0,00018 zouden vinden).

Met de GR kan het ook!

Bovenstaande tabel zit ook in je GR.

DISTR - tcdf

lower = 0
upper = t-waarde
df = vrijheidsgraden
PASTE
ENTER

Dat geeft als resultaat hoe ver je vanaf 0,50 zit in de tabel.
Bijvoorbeeld  tcdf(0, 2.447, 6)  geeft  0,475  dus dat is een kans van  0,5 - 0,475 = 0,025 precies zoals in de t-tabel hierboven staat (df = 6, dus n = 7).

Andersom kun je de t-waarde bij bijvoorbeeld  n = 12 en kans 0,01 vinden door:
Y1 = tcdf(0, X, 11)
Y2 = 0.49
INTERSECT geeft  dan t = 2,718  precies zoals in de tabel.

     
     

© h.hofstede (h.hofstede@hogeland.nl)