h.hofstede (h.hofstede@hogeland.nl)

       
1.
x 1 3 3 5 7
y 5 6 4 4 3
  De gemiddelden zijn  xG = 3,8  en  yG = 4,4  en dat geeft de volgende tabel:
       
 
x 1 3 3 5 7    
y 5 6 4 4 3   Σ
Δx -2,8 -0,8 -0,8 1,2 3,2   -
Δy 0,6 1,6 -0,4 -0,4 -1,4   -
ΔxΔy -1,68 -1,28 0,32 -0,48 -4,48   -7,6
(Δx)2 7,84 0,64 0,64 1,44 10,24   20,8
       
  Dan is a = -7,6/20,8  ≈ -0,365  en  b = 4,4 + 0,365  3,8 ≈ 5,788
De regressielijn heeft vergelijking  y = -0,365x + 5,788
       
2. Jolanda:  
 
x 2 3 4 5 6 8
yberekend 6,6 5,9 5,2 4,5 3,8 2,4
yafgelezen 7 5 6 5 3 2
di -0,4 0,9 -0,8 -0,5 0,8 0,4
di2 0,16 0,81 0,64 0,25 0,64 0,16
  De som van de laatste rij is 2,66
       
  Gerben:  
 
x 2 3 4 5 6 8
yberekend 6 5,5 5 4,5 4 3
yafgelezen 7 5 6 5 3 2
di -1 0,5 -1 -0,5 1 1
di2 1 0,25 1 0,25 1 1
  De som van de laatste rij is 4,50

Jolanda heeft dus de beste lijn getekend.
       
2 b. L1 = 2, 3, 4, 5, 6, 8
L2 = 7, 5, 6, 5, 3, 2
calc - linreg(ax + b) (L1, L2)
Geeft  regressielijn y = -0,8x + 8,4
list  resid sto L3
L4 = L3^2
list math sum(L4)  geeft  som 2,4
       
3. Als een puntenwolk symmetrisch is tov een verticale lijn (dat is dan uiteraard de lijn  x = xG), dan betekent dat, dat als het punt (xG - Δ, y)  een punt van de wolk is, dat ook het punt  (xG + Δ, y)  en punt is.
Voor de covariantie geeft dat de twee termen   Δ (y - yG) en  -Δ (y - yG)  en die zijn elkaars tegengestelde, dus samen nul.
Maar dat geldt voor alle punten van de wolk. Dus is de covariantie nul, dus is de helling van de regressielijn nul, dus is de regressielijn horizontaal.

Voor symmetrie in een horizontale lijn geeft een zelfde redenering met de punten (x, yG - Δ) en (x, yG + Δ) weer dat de covariantie nul is. 
       
4.
  Die laatste term daar stond n keer een constante, dus die som kan weg.
Maar zo'n som van  xi of yi dat is gewoon  n het gemiddelde (termen 2 en 3). Dat geeft:
 
  Voor σxy moeten we nog delen door n  en dat geeft precies de gevraagde formule.
   
5. a. x in L1, y in L2.
stat calc linreg(ax + b) (L1, L2)  geeft  de regressielijn  y = 0,309x + 3,051
       
  b. list resid sto L3 zet de residuen in L3
Het grootste residu vind je bij x = 11 en is gelijk aan  di = -3,448  dus  di2 = 11,89
Als je die weglaat uit L1 en L2 en opnieuw de regressielijn berekent krijg je  y = 0,640x + 1,855

De totale di2 -som verandert niet met di2  van dat punt omdat de vergelijking van de regressielijn verandert (en dus alle residuen ook)
       
6. De puntenwolk zal uit twee evenwijdige lijnen bestaan (met de regressielijn daar precies midden tussen in), zodat alle verticale afstanden naar de regressielijn gelijk zijn.
       

h.hofstede (h.hofstede@hogeland.nl)