De Poissonverdeling.

© h.hofstede (h.hofstede@hogeland.nl)

       
De Poissonverdeling is eigenlijk een waardeloze verdeling!

Zo. Dat is een mooi didactisch verantwoord begin van een les......

Maar ja, het is nou eenmaal niet anders. Bij een Poissonverdeling zijn er gewoon niet zoveel dingen bekend.
Je gebruikt een Poissonverdeling in het volgende geval:
 

"Dingen" gebeuren
met een bekend gemiddelde,
en onafhankelijk van elkaar.

 
Kijk, bij een binomiale verdeling weet je veel meer: je weet om hoeveel experimenten het gaat (n) en wat de kans per keer is (p) en dan kun je de kans op k successen berekenen.
Het gemiddelde weet je bij de binomiale verdeling natuurlijk ook:  dat is  n · p.
De Poissonverdeling is eigenlijk een uitgeklede binomiale verdeling. Je kunt hem er zelfs uit afleiden. Dat gaat zó:
       
Afleiding van de Poissonverdeling.
       
Voor de binomiale verdeling geldt:

       
Noem nu  m = N · p  = gemiddeld aantal successen.  Dan is p =  m/N  en die kun je in  bovenstaande formule vervangen:
       
Verwissel nu de k! uit de eerste factor met de Nk  uit de tweede:
Het wordt interessant als je N naar oneindig laat gaan. Die hele eerste breuk gaat dan naar 1 omdat alleen die N-getallen van belang zijn. Dat -1 en -2 en -3 en ...-k + 1 doet er niet toe (is te verwaarlozen) als N oneindig groot wordt. Dus staan er in de teller k N-waarden en in de noemer ook. Dat wordt samen dus 1, en dat geeft:
Maar ook die laatste term wordt 1. Omdat N naar oneindig gaat gaat dat tussen haakjes naar 1. En omdat k een eindig getal is, staat daar eigenlijk 1-k = 1. Dus we zijn nu bij:
Je kunt bij dit laatste stuk niet precies zo'n redenering toepassen omdat, als N naar oneindig gaat, ook de macht naar oneindig gaat. Kijk, als je hebt ab , en a gaat naar 1, dan zal dat voor constante b wel op den duur ook naar 1 gaan. Maar als b tegelijkertijd naar oneindig gaat, wat dan? Oftewel: hoeveel is (bijna 1)(bijna oneindig) ?    

Dat is niet zomaar te zeggen, maar gelukkig kun je in deze les ontdekken dat er in dit geval e-m uitkomt. Dus:
En daar is al de formule van de Poissonverdeling.
Hier zie je er een aantal voor verschillende waarden van m  (die m wordt in artikelen over de Poissonverdeling trouwens om één of andere reden meestal λ genoemd. Ik blijf eigenwijs m gebruiken om mij eraan te herinneren dat het een gemiddelde is).
       

       
Waarschuwing:  deze krommen zijn continu getekend, maar gelden natuurlijk eigenlijk alleen voor gehele waarden van k (= aantal successen). Je mag dus alleen de snijpunten met de verticale roosterlijnen bekijken.....

Wat betekent dat "N wordt heel groot" nou precies?

Dat zal ik met een voorbeeldje illustreren, want dat is denk ik het duidelijkst.
Stel dat we bekijken hoeveel kasten een antiekhandelaar per week verkoopt.  Stel dat hij een week 6 dagen van 6 uur werkt, en dat hij weet dat hij gemiddeld per week 4 kasten verkoopt.

Laten we het aantal kasten dat hij per dag verkoopt binomiaal bekijken. Ik verdeel de week dus in 6 gelijke stukken van een dag, en beschouw elke dag als een experiment. Dan is n = 6 en omdat het gemiddeld aantal kasten per week 4 is, is  6 • p = 4  dus  p = 2/3
De kans dat hij 2 kasten verkoopt in zes dagen is dan   binompdf(6, 2/3, 2) = 0,0823

Laten we nu het aantal kasten dat hij per uur verkoopt binomiaal bekijken. Ik verdeel een week dan in 36 gelijke stukken van een uur en beschouw elk uur als een experiment. Dan is n = 36 en dan is  36 • p = 4 dus  p = 4/36
De kans dat hij dan 2 kasten verkoopt bij deze 36 experimenten is  binompdf(36, 4/36, 2) = 0,1418

Laten we nu het aantal kasten dat hij per kwartier verkoopt binomiaal bekijken. Ik verdeel een week dan in 144 gelijke stukken van een kwartier. Dan is n = 144  en dan is  144 • p = 4 dus  p4/144
De kans dat hij dan 2 kasten verkoopt bij deze 144 experimenten is binomdf(144, 4/144, 2) = 0,1455

Laten we nu het aantal kasten dat hij per minuut verkoopt binomiaal bekijken. Ik verdeel een week dan in 2160 gelijke stukken van een minuut en beschouw elke minuut als een experiment. Dan is n = 2160  en dan is  210• p = 4 dus p = 4/2160.
De kans dat hij dan 2 kasten verkoopt bij deze 2160 experimenten is binompdf (2160,  4/2160, 2) = 0,1465

En zo kan ik steeds kleinere tijdseenheden nemen.

De kansen die er uitkomen lopen naar de kans die de Poissonverdeling berekent.
Dat is met k = 2 en m = 4 gelijk aan   42/2! • e-4 = 0,146525111...
Het voordeel is dat je bij dit bovenstaande verhaal nergens n of p nodig hebt voor de berekening van deze uiteindelijke kans. Alleen n • p is voldoende......
       
Waar kun je 'm voor gebruiken?
       
Er moeten wel een paar voorwaarden zijn om de Poissonverdeling te mogen gebruiken. Op de eerste plaats moet het gaan om discrete gebeurtenissen ("successen" net als bij de binomiale verdeling).
Verder moet het ook mogelijk zijn om hele kleine tijdsintervallen te nemen. Je moet n heel groot kunnen laten worden (en dus p heel klein zodat n • p  constant blijft).
Als het verkopen van een kast in het voorbeeld hierboven bijvoorbeeld een uur zou kosten, dan kun je moeilijk gaan onderverdelen in minuten, want in 2 opvolgende minuten kun je dan nooit beide een kast verkopen. Verschillende minuten in de buurt van elkaar zijn dan niet onafhankelijke experimenten meer, en dat is wel nodig voor de binomiale verdeling.  

Voorbeeld 1.
Je hebt een radioactief materiaal waarvan je weet dat er gemiddeld 3 kernen per minuut vervallen. Hoe groot is dan de kans dat er 6 kernen in een minuut vervallen?
oplossingm = 3 (per minuut), dus de Poissonverdeling geeft  P(6) = 36/6! • e-3 = 0,0504

Voorbeeld 2.
Op een autoweg komen er gemiddeld 10 auto's per minuut langs. Hoe groot is de kans dat er in een minuut  15 auto's langskomen?
oplossing:  m = 10 (per minuut), dus de Poissonverdeling geeft  P(15) = 1015/15! •  e-10 = 0,0347

N.B.  Wat in de tijd geldt, kan ook in de ruimte gelden natuurlijk, kijk maar:

Voorbeeld 3.
Een automobilist weet dat hij langs een bepaalde snelweg gemiddeld 4 dode dieren zal zien per 5 kilometer
Hoe groot is de kans dat hij op één kilometer 2 dieren zal zien?
oplossing:  m4/5 = 0,8 (per km),  dus de Poissonverdeling geeft  P(2) = 0,82 /2!  e-0,8 = 0,1437

       
       
  OPGAVEN
       
1. Ik krijg per dag gemiddeld (dat heb ik lange tijd bijgehouden) 8 telefoontjes.
Hoeveel dagen per jaar zal ik dan naar verwachting precies 12 telefoontjes krijgen?
     

17 á 18

2. In een bepaald gebied zijn gemiddeld 5 blikseminslagen per jaar.
Bereken de kans dat er in een jaar minder dan 3 blikseminslagen zijn.
     

0,1246

3. Een student Nederlands is er trots op dat hij vrij goed zonder spelfouten kan schrijven. Hij blijkt gemiddeld slechts 1 spelfout per 8 bladzijden tekst te maken.
Hoe groot is dan de kans dat een bladzijde precies 1 spelfout bevat?
     

0,1103

4. Een Nederlands echtpaar heeft nog gemiddeld slechts 8 keer per jaar seks met elkaar.
Hoe groot is de kans dat ze deze maand precies 2 keer seks met elkaar zullen hebben?
     

0,1141

5. De volgende tabel geeft het aantal hartinfarcten dat per maand in een bejaardentehuis plaatsvindt:
       
 
aantal infarcten aantal keer
0
1
2
3
4
5
6
>6
4
11
13
10
7
3
2
0
       
  Onderzoek of dit aantal infarcten een Poissonverdeling volgt.
       
       
De Poissonverdeling met de TI-83.
       
Net als we al bij de normale verdeling en bij de binomiale verdeling gewend waren is er een functie voor de Poissonverdeling. Die vind je bij 2ND - DISTR - poissonpdf(
Je berekent de kans door in te toetsen: 

poissonpdf(m, k)

       
Zo kun je het antwoord op vraag 4 hierboven bijvoorbeeld direct vinden door  poissonpdf(8/12, 2) = 0,1141

Maar er is ook een cumulatieve functie  2ND - DISTR - poissoncdf(m, k)
Die geeft weer de kans op het aantal successen kleiner of gelijk aan k.
Denk erom dat de Poissonverdeling een discrete verdeling is (aantal successen) Dus moet je uitkijken welke waarde je voor k neemt bij vragen als "minstens" e.d.  Hetzelfde als bij de binomiale verdeling.
       
       
6. De klantenbalie van een bouwmarkt is 8 uur per dag open (van 9:00 tot 17:00) en er komen gemiddeld  per dag 25 mensen bij de balie.
Hoe groot is de kans dat er op een dag na  15:00  nog meer dan 8 mensen langskomen?
     

0,1796

7. In een kartonnagefabriek treden regelmatig storingen op omdat het karton vastloopt in de machine. De bedrijfsleider heeft bijgehouden dat er gemiddeld 3 storingen per uur optreden.
Hoe groot is dan de kans dat er over een hele dag (8 uur) minder dan 15 storingen optreden?
     

0,0198

8. a. Een leraar van een middelbare school geeft gemiddeld per week 3 leerlingen strafwerk.
Hoe groot is de kans dat hij in een maand dan minstens 10 leerlingen strafwerk geeft?
     

0,7576

  b. Een collega berekent dat de kans dat zij minstens 12 keer in een maand strafwerk geeft gelijk is aan 
Hoeveel leerlingen geeft zij dan gemiddeld per week strafwerk?
     

2,5

9. In Noord-Oost Groningen vinden de laatste jaren regelmatig aardbevingen plaats ten gevolge van de aardgaswinning.
Het gemiddelde aantal aardbevingen is 2 per maand.
Hoe goot is de kans dat er binnen één week dan meer dan 1 aardbeving plaatsvindt?
     

0,0902

       
De Standaarddeviatie.
       
Als je de Poissonverdeling als grensgeval van de binomiale verdeling afleidt, dan kun je de standaarddeviatie van de Poissonverdeling natuurlijk vast ook wel van de standaardafwijking van de binomiale verdeling afleiden.

Voor de binomiale verdeling gold  σ = √(n • p • (1 - p))
De Poissonverdeling  nam m = n • p constant en liet n steeds groter worden, en p steeds kleiner. Dus p gaat naar nul, en n naar oneindig (np = m constant).  Maar als p naar nul gaat, dan gaat (1 - p)  naar 1.
Dan staat er  σ = √(n • p • 1) = m
       

σ = m

       
     

© h.hofstede (h.hofstede@hogeland.nl)