© h.hofstede (h.hofstede@hogeland.nl)

       
Formules voor de standaarddeviatie.

Laten we al onze metingen nummeren en ze   x1, x2, x3, .... enz.  noemen.
Verder geven we het gemiddelde aan met  xG  en het totaal aantal metingen met n.
Tot slot hoop ik dat je de notatie  Σ  voor de som van een aantal getallen kent. Als dat niet zo is moet je eerst deze les lezen.
Goed, dan hoop ik dat je het volgende met me eens bent:
       

       
MEE EENS?
Als je dat niet met me eens bent kun je nu beter met deze les stoppen, of alsnog die les over de somnotatie eerst bestuderen....
Goed, voor wie er nog over zijn gaan we nu een formule voor de standaarddeviatie maken.

We berekenden de standaarddeviatie in een aantal stappen die we nu gaan samenvatten in een formule.
       
Bereken het gemiddelde xG    
Bereken de afstand van elke meting tot het gemiddelde:  die afstand is  xi - xG  (We maken ons even niet druk over het feit of dat positief of negatief is, waarom niet; dat zie je zo wel).
Neem die afstanden in het kwadraat:  dat geeft   (xi - xG)2   (Je ziet dat plus/min teken er inderdaad niet toe doet)
Tel al die kwadratische afwijkingen bij elkaar op:
Deel door het totaal aantal metingen:
Neem daar tenslotte weer de wortel van:  
       
En daar heb je al een formule voor de standaarddeviatie:
       
       
Een andere variant.

Sommige slechte boeken werken deze formule nog verder uit. Die schrijven dan :
Daar staan nu drie termen waarvan je de tweede en derde kunt vereenvoudigen.
De tweede term:  de som van alle xi  is gelijk aan  nxG. (dat is nou eenmaal een eigenschap van het gemiddelde)
De derde term:  onder die som staat een constante, dus daar staat n keer hetzelfde, dus dat is gewoon n xG2
Samen geeft dat dan:
Voor de standaarddeviatie moet daar eerst nog weer een factor 1/n voor en dan de wortel nemen, dus dat geeft:
Die eerste term onder dat wortelteken is gelijk aan het gemiddelde van alle  x2 (immers je telt ze op en deelt door het aantal). Daarom kun je de formule nóg eenvoudiger zó opschrijven:
 

 
"(gemiddelde van alle kwadraten) - (kwadraat van het gemiddelde)"
Klinkt lekker simpel toch?

En toch is deze formule meestal minder goed. Dat zit hem in het volgende.
Kijk, als je de standaarddeviatie met een computer/rekenmachine uitrekent dan doet het er niet toe welke formule je gebruikt. Je doet het toch immers niet zelf.
Maar als je de standaarddeviatie met de hand uitrekent, dan is die tweede formule nogal gevoelig voor afrondingen. Vooral een afronding van het gemiddelde (dat zul je meestal eerst uitrekenen) beïnvloedt de zaak nogal.

Stel dat je een klein foutje f in het gemiddelde hebt gemaakt en dus in plaats van xG de waarde  xG + f gebruikt.

Dan geeft de oorspronkelijke formule voor de standaarddeviatie
Bij de laatste stap is gebruikt dat de som van alle  xi - xG samen NUL is  (dat is nou eenmaal een eigenschap van het gemiddelde).
Waar verschijnt de fout f ?  Alleen in de term met nf 2
De fout in de standaarddeviatie ten gevolge van ons foutje f in het gemiddelde is dus  nf 2
       
De "mooiere" tweede formule geeft:
Waar komt hier de f tevoorschijn?
In de term  2xGf  en die hoeft zeker niet nul te zijn.  Als het gemiddelde groot is kan dit een erg grote fout opleveren.
De fout in de standaarddeviatie ten gevolge van ons foutje f in het gemiddelde is dus   2xGf +  nf 2
       
Klein voorbeeldje.

Stel dat we de drie metingen  x1 = 84 en x2 = 86  en x3 = 87 hebben en daar de standaarddeviatie van willen berekenen.
Het gemiddelde is dan 852/3 maar stel dat we dat per ongeluk afronden naar  85,667

methode 1.
geeft voor de kwadraten van de verschillen dan  (84 - 85,677)2 en (86 - 85,677)2 en (87 - 85,667)2
opgeteld geeft dat 4,666667 en gemiddeld is dat 1,555555667
dat geeft voor de standaarddeviatie  √( 1,555566667) = 1,24722....

methode 2.
(xG)2 = 85,6672 = 7338,834889
(x2)  is  achtereenvolgens  842 en 862 en 872  en het gemiddelde daarvan is 7340,333333
Het verschil is 7340,333333 - 7338,834889 = 1,498444
Neem daar weer de wortel van en je hebt σ = 1,224109....
Dat scheelt nogal!

De werkelijke s was overigens 1,247219.... 
       

© h.hofstede (h.hofstede@hogeland.nl)