h.hofstede (h.hofstede@hogeland.nl)

       
Dingen met elkaar vermenigvuldigen.
       
Daarmee bedoel ik natuurlijk het volgende:
Je hebt een rij getallen {x1, x2, ..., xn}  met gemiddelde xG en standaarddeviatie σx
Je hebt ook een rij getallen  {y1, y2, ..., yn}  met gemiddelde yG en standaarddeviatie  σy

Als je die twee rijen getallen met elkaar vermenigvuldigt dan krijg je de rij  {x1y1, x2y2, ..., xnyn}
Wat is het gemiddelde en wat is de standaarddeviatie van deze laatste rij getallen?
       
Het gemiddelde.

Het gemiddelde is vrij eenvoudig te vinden, als je je het volgende maar realiseert:
Dat is zo als x en y onafhankelijk van elkaar zijn, en dat zagen we als in deze les.
Haakjes wegwerken:
splitsen in losse sommen:
Als je alles door n deelt vind je nu het gemiddelde van xy:
Een aardig simpel resultaat:

       
De standaarddeviatie.
       
Voor de standaarddeviatie gaan we de formule  (xi - xG)(yi - yG) =  xiyi - xGyi - xiyG + xGyG  anders schrijven:
xiyi = (xi - xG)(yi - yG) + xGyi + xiyG - xGyG
xiyi = (xi - xG)(yi - yG) + xGyi - xGyG  + xiyG - xGyG + xGyG
xiyi = (xi - xG)(yi - yG) + xG(yi - yG)  + yG(xi  - xG) + xGyG

En nou maken we de aanname dat de standaarddeviatie veel kleiner is dan het gemiddelde.
Dat betekent dat die eerste term aan de rechterkant veel kleiner is dan beide anderen, want xi - xG  en  yi - yzijn de afstand tot het midden, en zijn dus veel kleiner dan xG en yG

Als je die eerste term verwaarloost, dan blijft over:    xiyi = xG(yi - yG)  + yG(xi  - xG) + xGyG
Dat betekent dat   xiyi - xGyG  = xG(yi - yG)  + yG(xi  - xG)
Zet nu overal een somteken voor en ook nog 1/n en dan heb je de variantie  σ2 gevonden:

Als x en y onafhankelijk zijn dan is dat middelste stuk weer nul (volgens dezelfde redenering die we ook al bij het berekenen van het gemiddelde bovenaan deze les gebruikten).
Dan blijft over:

       
Dit alles onder twee voorwaarden:
  x en y zijn onafhankelijk van elkaar
  de standaarddeviaties van x en y zijn veel kleiner dan hun gemiddelden.
       
Rekenvoorbeeldje:

Neem voor x de serie getallen  (40, 42, 41)  en voor y de serie getallen  (92, 92, 98)
Dan is xy de serie getallen  (3680, 3864, 4018)
invoeren in de GR geeft  gemiddelde 3854 en  standaarddeviatie is 138

x apart invoeren geeft gemiddelde 41 en standaarddeviatie 0,82
y apart invoeren geeft gemiddelde  94 en standaarddeviatie 2,83

onze formules voorspellen:
gemiddelde   xGyG = 31 94 = 3854
standaarddeviatie  σ2 = (41)2 2,832 +  (94)2 0,822 = 19404  dus  σ = 139

Zoals je ziet klopt dat gemiddelde precies (moet ook want daar zat geen benadering in) en klopt die standaarddeviatie redelijk goed. Wijkt een beetje af natuurlijk vanwege beide rode voorwaarden hierboven. Met zo weinig getallen zal vooral aan de eerste voorwaarde meestal niet voldaan worden.... 
       

h.hofstede (h.hofstede@hogeland.nl)