In het casino

© h.hofstede (h.hofstede@hogeland.nl)

 
Stel je gaat naar het casino, maar je hebt al zoveel afschrikwekkende verhalen over enorme verliezen op zo'n avond gehoord dat je besluit hoogstens 10 euro te verspelen. Dan stop je gegarandeerd!
Verder hoor je ook vaak verhalen van mensen die eerst winnen en daardoor zσ in de stemming komen dat ze door blijven spelen tot ze toch weer alles kwijt zijn. Daarom besluit je om als je 20 euro hebt, altijd te stoppen.

Bij het spel dat je speelt is de kans q op 1 euro winst en 1 - q op 1 euro verlies. Je speelt bijvoorbeeld de hele avond aan de roulettetafel op rood of zwart (dan is q = 18/37 en  1 - q = 19/37  immers de 0 is groen, tenminste bij Europees roulette)
Hoe groot is dan de kans dat dit een "geslaagde" avond gaat worden?

Noem P(n) = kans om blut te raken als je op een gegeven moment  n euro hebt (dus P(0) = 1 en P(20) = 0)

Hiernaast zie je stukje kansboom.

Vanaf die eerste knoop links geldt dus  kans P(n) om blut te raken.
Maar vanaf die twee knopen rechts gelden de kansen  P(n + 1) en P(n - 1) om blut te raken.


Kortom:

P(n) = q • P(n + 1) + (1 - q) • P(n - 1)

En zie: daar hebben we een mooi exemplaar van een  "homogene-tweede-orde-lineaire-recursievergelijking".

Stel dat een oplossing is  P(n) = λn  
Invullen in de vergelijking:   λn = q • λn+1 + (1 - q) • λn - 1
Delen door  λn - 1 :    λ = qλ2  + (1 - q)
⇒   λ2 - 1/q • λ  + (1 - q)/q  = 0
⇒  (λ - 1) • (λ - (1 - q)/q )  = 0
⇒  λ = 1   ∨   λ = (1 - q)/q

De algemene oplossing is dus: 

De A en B volgen uit de twee grensvoorwaarden.

P(0) = 1 geeft direct A + B = 1
P(20) = 0  geeft  0 = A + B • ((1 - q)/q)20  

Daaruit kun je vrij makkelijk A en B oplossen, en die twee invullen in de vergelijking voor P(n)
Dat geeft als uiteindelijke oplossing:

De kans dat je je streefbedrag dus wιl haalt is  (1 - deze formule).

In ons voorbeeld-geval was q = 18/37 en in het begin is n = 10 en als je dat invult, dan vind je dat de kans dat je blut raakt vσσr je 20 euro hebt ongeveer gelijk is aan 0,63.  Kortom met deze speeltactiek zullen we in 63% van onze avonden blut gaan en in 37% met een bedrag van 20 euro naar huis gaan. In de volgende grafieken staat alles nog eens samengevat voor verschillende beginbedragen. En als je doel niet 20 euro is maar D euro dan geeft dat uiteraard dezelfde formule met alle 20's vervangen door D.

De volledigheid gebiedt mij te zeggen dat deze methode voor p = q = 0,5 geen oplossing geeft omdat beide oplossingen  voor λ dan hetzelfde zijn!  Beiden geven  λ = 1 en als enige oplossing  P(n) = A
Gelukkig is in dat geval een tweede oplossing  P(n) = n.
Dat geeft als algemene oplossing  P(n) = A + Bn
De randvoorwaarden  P(0) = 1  en  P(D) = 0  geven dan   A = 1 en  B = -1/D
De oplossing is dan   P(n) = 1 - n/D

samengevat:
 

Stel dat je  n euro hebt en je stopt tot je blut bent of  D euro hebt.
Stel dat de kans op succes elke keer q is.

Dan geldt:

 
Pblut(n) =  1 -  n/D      als    q = 1/2
Hoe vaak zullen we gemiddeld spelen?
       
Een best interessante vraag, want hier staat eigenlijk  "Hoeveel plezier heb je van je geld"?
Nou, als je het aantal beurten dat je bij een bedrag n nog gemiddeld zult spelen B(n) noemt, dan geldt volgens precies zo'n zelfde stukje kansboom als hierboven:
       

B(n) =  q • B(n + 1) + (1 - q) • B(n - 1) + 1

       
Die  "+1"  komt van het feit dat je ιιn stapje verder in de kansboom ook ιιn beurt extra hebt gespeeld. Maar die zorgt er helaas wιl voor dat deze tweede-orde-lineaire-recursievergelijking inhomogeen is!

De homogene oplossingen zijn gewoon precies hetzelfde als die voor P(n) hierboven.

Maar we moeten dus nog een extra particuliere oplossing vinden. Op jacht dus maar....
   
  B(n) =  q • B(n + 1) + (1 - q) • B(n - 1) + 1   eerst alles delen door q.
1/q • B(n) = B(n + 1) + (1 - q)/q • B(n - 1) + 1/q        (bedenk dat  1 - q)/q α  en dat dus  1/q = α  + 1))
(α + 1) • B(n) = B(n + 1) + α • B(n  - 1) + (α + 1)
B(n + 1) = (α + 1) • B(n)  - α • B(n - 1) - (α + 1)     .....(1)
 
Er gebeurt nu gelukkig iets moois als je de verschilrij  D(n) = B(n) - B(n - 1) berekent:
Δ(n + 1) = B(n + 1) - B(n)   en nu vervangen we B(n + 1) door de uitdrukking (1) hierboven:
Δ(n + 1) = (α + 1) • B(n) - α • B(n - 1) - (α + 1) - B(n)
Δ(n + 1) = α • (B(n) - B(n - 1))  -  (α + 1)
Δ(n + 1) = α • Δ(n) - (α + 1)

En dit is geen tweede-orde vergelijking meer! Het is een "gewone" eerste orde lineaire differentievergelijking.
Daar weten we sinds deze les  gelukkig wel raad mee.
Daar hebben we ontdekt:

Toegepast op onze vergelijking  (a = α  en  b = - (α + 1))  geeft dat:

En nou nog weer terug naar de oplossing voor B:
B(n) = B(0) + Δ(1) + Δ(2) + Δ(3) + ... + Δ(n)
B(n) = 0 +  ΣΔi

Die eerste som is de som van een meetkundige rij en die tweede som is gewoon een constante. Dus dat geeft:

Wat staat hier nou eigenlijk?
Die Δ0  en α zijn eigenlijk gewoon constanten. Het gaat om de stukjes met n erin. 
Weet je wat, ik noem even alle constanten C. Uit luiheid allemaal dezelfde C waarmee ik bedoel  "dit is ιιn of andere constante". Dat noteert gewoon wat makkelijker.
Dan staat er:   B(n)C • C • 1/C • (αn - 1)  + C • n
Maar dat is gewoon de vorm:   B(n) = Cαn  + C + C • n
Toch maar weer netter noteren met verschillende C's:     B(n) = C1 + n • (α + 1)(α - 1)  + C2 • αn   
Dat is dus de particuliere oplossing.
Maar de oplossing van de homogene vergelijking was  B(n) =  C + C • αn  
Dus als je die samenneemt levert dat als algemene oplossing  (met weer nieuwe C's):
       

B(n) = C1 + n •  (α + 1)(α - 1)  + C2 • αn     

       
Die twee C's worden bepaald door de beginvoorwaarden  B(0) = 0  en  B(D) = 0  immers in die twee gevallen stop je met spelen.
Invullen geeft   C1 + C2 = 0  en    C1 + D •  (α + 1)(α - 1)  + C2 • α= 0
Dus  C2 = -C1  en dan geeft de tweede vergelijking   C1 • (αD  - 1) = D • (α + 1)/(α - 1)

Die kun je beiden weer invullen in de B-vergelijking, en dan een beetje herrangschikken leidt tot dit prachtige resultaat:
       

       
Bijvoorbeeld in ons geval met D = 20  geeft dat de volgende plaatjes  (voor verschillende q = 1/(1 + α)):
       

       
Die zwarte figuur voor q = 0,5 is de parabool   B = (D/2)2 - (n - D/2)2  met  in dit geval D = 20
       
       

© h.hofstede (h.hofstede@hogeland.nl)