In aanvulling op wat arno hierboven geschreven heeft heb je hierbij nog wat info over de wet van Benford en je specifieke vragen hierover:
Ik heb hier en daar wat gelezen over de wet van Benford. Een simpel toepasbare wet, dat wel, maar een verklaring voor het fenomeen vind ik nergens. Ik neem dus maar aan dat het een kwestie van "niet dieper over nadenken, het is gewoon zo".
Nee, altijd blijven nadenken!!!
Of is er iemand die vanuit de literatuur een verklaring kent?
Zie ook
http://users.fulladsl.be/spb10695/wetvanbenforda4.pdf pagina 4 punt 4: het gaat om getallen die een meetkundige rij vormen, dus waarbij elk volgende getal een vaste factor groter (of kleiner) is dan het huidige.
Bijvoorbeeld:
-biologie: groei van algen: begin met 100 algen, elke week verdubbeling:
week0=100, week1=2x100=200, week2=2x200=400, week3=2x400=800, week4=2x800=1600, etc
-economie: koers aandelen: begin met 1000 euro, met elk jaar 10% winst (theoretisch althans):
jaa0=1000, jaar1=1.1x1000=1100, jaar2=1.1x1100=1210, jaar3=1.1x1210=1331, etc
-natuurkunde: radioactief verval: begin met 100mg, elke eeuw 20% minder:
eeuw0=100, eeuw1=0.8x100=80, eeuw2=0.8*80=64, eeuw3=0.8*64=51.2, etc
Als je kijkt naar grote verzamelingen van dergelijke getallen, valt op dat ze een logaritmische verdeling hebben, waarbij de kansen op het eerste cijfer wordt gegeven door de formule van arno hierboven.
Deze (kans)verhoudingen zie je ook terug op een rekenliniaal (zie bijvoorbeeld het plaatje op
http://en.wikipedia.org/wiki/Slide_rule: de afstand tussen 1 en 2, dus de kans dat een getal met 1 begint, is precies even groot als de afstand tussen 2 en 4, dus de kans dat een getal met 2 of 3 begint). Vergelijk dit met je formule P(d)=log(1+1/d): P(1)=P(2)+P(3).
Voor andere getallenverzamelingen geldt dit niet.
Neem bijvoorbeeld de verzameling resultaten van de volgende loterijtrekkingen: stop 9 lootjes genummerd van 1 t/m 9 in een hoge hoed en voer 100 trekkingen uit met terugleggen. De kans dat je een 1 trekt is dan precies even groot als de kans dat je een 9 trekt (namelijk 1/9=0.11111...) terwijl als de wet van Benford hier ook zou gelden de kans op een 1 veel groter (namelijk log(2)=0.3010...) zou zijn.
Dan mijn eigenlijke vraag: De wet heeft betrekking over de eerste cijfers van een verzameling afwijkende getallen, maar waarom zou de wet niet ook opgaan voor de laatste cijfers van een verzameling afwijkende getallen. Immers, als ik de getallen cijfermatig omkeer (dat het laatste cijfer dus het eerste cijfer wordt), dan krijg ik toch weer een nieuwe verzameling afwijkende getallen?
Brutaler nog, waarom zou de wet niet gelden voor bijvoorbeeld elk 3e cijfer van een verzameling afwijkende getallen?
In een logaritmische verdeling kan je ook kijken hoe groot de kans is dat het 2e of 3e of nog hogere cijfer een bepaalde waarde heeft. Let op dat deze cijfers ook nul kunnen zijn, i.t.t. het eerste cijfer (waarom?).
Bijvoorbeeld voor het 2e cijfer: neem alle getallen van 10 tot 100, die bestaan allemaal uit 2 cijfers met daarna een rest achter de komma.
De kans dat het 2e cijfer bijvoorbeeld een 5 is, is:
de kans dat het getal ligt tussen 15 en 16 = log(16)-log(15) = log(1+1/15) = 0.028...
plus
de kans dat het getal ligt tussen 25 en 26 = log(26)-log(25) = log(1+1/25) = 0.017...
plus
...
plus
de kans dat het getal ligt tussen 95 en 96 = log(96)-log(95) = log(1+1/95) = 0.004...
=
0.096677
Als je dit doet voor alle 2e cijfers van 0 t/m 9 vind je:
Code: Selecteer alles
c2 P(c2)
0 0.119679
1 0.113890
2 0.108821
3 0.104330
4 0.100308
5 0.096677
6 0.093375
7 0.090352
8 0.087570
9 0.084997
Merk op dat de verschillen hier een stuk minder groot zijn als bij het eerste cijfer.
Voor de 3e cijfers vind je de volgende kansverdeling:
Code: Selecteer alles
c3 P(c3)
0 0.101784
1 0.101376
2 0.100972
3 0.100573
4 0.100178
5 0.099788
6 0.099401
7 0.099019
8 0.098641
9 0.098267
Je ziet: nog kleinere verschillen.
Je kan dit ook uitrekenen voor het 4e, 5e, 6e, en elk ander cijfer, maar het effect zal uiteindelijk verwaarloosbaar zijn.