Vraagje over de wet van Benford

Integraalrekening, afgeleiden, rijen, convergentie & divergentie van reeksen, meervoudige integratie.
Plaats reactie
Wim54
Nieuw lid
Nieuw lid
Berichten: 2
Lid geworden op: 12 sep 2009, 12:10

Vraagje over de wet van Benford

Bericht door Wim54 » 12 sep 2009, 12:34

Ik heb hier en daar wat gelezen over de wet van Benford. Een simpel toepasbare wet, dat wel, maar een verklaring voor het fenomeen vind ik nergens. Ik neem dus maar aan dat het een kwestie van "niet dieper over nadenken, het is gewoon zo". Of is er iemand die vanuit de literatuur een verklaring kent?

Dan mijn eigenlijke vraag:

De wet heeft betrekking over de eerste cijfers van een verzameling afwijkende getallen, maar waarom zou de wet niet ook opgaan voor de laatste cijfers van een verzameling afwijkende getallen.

Immers, als ik de getallen cijfermatig omkeer (dat het laatste cijfer dus het eerste cijfer wordt), dan krijg ik toch weer een nieuwe verzameling afwijkende getallen?

Brutaler nog, waarom zou de wet niet gelden voor bijvoorbeeld elk 3e cijfer van een verzameling afwijkende getallen?

Daar lees ik dus nergens iets over.

Wie kan hier iets zinnigs over vertellen?

arno
Vergevorderde
Vergevorderde
Berichten: 1923
Lid geworden op: 25 dec 2008, 16:28
Locatie: Beek en Donk, Noord-Brabant

Re: Vraagje over de wet van Benford

Bericht door arno » 12 sep 2009, 15:29

Zie in dat verband de formule die vermeld wordt in http://www.inzichten.nl/wetenschap/weten_50.htm
"Mathematics is a gigantic intellectual construction, very difficult, if not impossible, to view in its entirety." Armand Borel

Wim54
Nieuw lid
Nieuw lid
Berichten: 2
Lid geworden op: 12 sep 2009, 12:10

Re: Vraagje over de wet van Benford

Bericht door Wim54 » 12 sep 2009, 21:01

Bedankt voor je antwoord; als je bedoeld de formule (1+1/d), die ken ik al. Deze geeft bij invulling van d voor de getallen 1 t/m 9 de kans dat hij in een dergelijke reeks voorkomt.

Maar ik begrijp eerlijk gezegd niet wat jouw verwijzing naar deze formule met mijn eerdere vraag van doen heeft, maar ik ben een reletieve beginneling, dus.....

arno
Vergevorderde
Vergevorderde
Berichten: 1923
Lid geworden op: 25 dec 2008, 16:28
Locatie: Beek en Donk, Noord-Brabant

Re: Vraagje over de wet van Benford

Bericht door arno » 13 sep 2009, 10:53

De wet van Benford doet alleen een uitspraak over de kans dat het eerste getal in zo'n rij voorkomt, en niets over de andere getallen in de rij. De kans is overigens niet 1+1/d, maar log(1+1/d). Door voor d steeds grotere waarden te nemen zie je dat de kans dat het getal d als eerste in de rij voorkomt steeds kleiner wordt.
"Mathematics is a gigantic intellectual construction, very difficult, if not impossible, to view in its entirety." Armand Borel

arie
Moderator
Moderator
Berichten: 3911
Lid geworden op: 09 mei 2008, 09:19

Re: Vraagje over de wet van Benford

Bericht door arie » 14 sep 2009, 11:15

In aanvulling op wat arno hierboven geschreven heeft heb je hierbij nog wat info over de wet van Benford en je specifieke vragen hierover:

Ik heb hier en daar wat gelezen over de wet van Benford. Een simpel toepasbare wet, dat wel, maar een verklaring voor het fenomeen vind ik nergens. Ik neem dus maar aan dat het een kwestie van "niet dieper over nadenken, het is gewoon zo".
Nee, altijd blijven nadenken!!! ;-)

Of is er iemand die vanuit de literatuur een verklaring kent?
Zie ook http://users.fulladsl.be/spb10695/wetvanbenforda4.pdf pagina 4 punt 4: het gaat om getallen die een meetkundige rij vormen, dus waarbij elk volgende getal een vaste factor groter (of kleiner) is dan het huidige.

Bijvoorbeeld:
-biologie: groei van algen: begin met 100 algen, elke week verdubbeling:
week0=100, week1=2x100=200, week2=2x200=400, week3=2x400=800, week4=2x800=1600, etc
-economie: koers aandelen: begin met 1000 euro, met elk jaar 10% winst (theoretisch althans):
jaa0=1000, jaar1=1.1x1000=1100, jaar2=1.1x1100=1210, jaar3=1.1x1210=1331, etc
-natuurkunde: radioactief verval: begin met 100mg, elke eeuw 20% minder:
eeuw0=100, eeuw1=0.8x100=80, eeuw2=0.8*80=64, eeuw3=0.8*64=51.2, etc

Als je kijkt naar grote verzamelingen van dergelijke getallen, valt op dat ze een logaritmische verdeling hebben, waarbij de kansen op het eerste cijfer wordt gegeven door de formule van arno hierboven.
Deze (kans)verhoudingen zie je ook terug op een rekenliniaal (zie bijvoorbeeld het plaatje op http://en.wikipedia.org/wiki/Slide_rule: de afstand tussen 1 en 2, dus de kans dat een getal met 1 begint, is precies even groot als de afstand tussen 2 en 4, dus de kans dat een getal met 2 of 3 begint). Vergelijk dit met je formule P(d)=log(1+1/d): P(1)=P(2)+P(3).

Voor andere getallenverzamelingen geldt dit niet.
Neem bijvoorbeeld de verzameling resultaten van de volgende loterijtrekkingen: stop 9 lootjes genummerd van 1 t/m 9 in een hoge hoed en voer 100 trekkingen uit met terugleggen. De kans dat je een 1 trekt is dan precies even groot als de kans dat je een 9 trekt (namelijk 1/9=0.11111...) terwijl als de wet van Benford hier ook zou gelden de kans op een 1 veel groter (namelijk log(2)=0.3010...) zou zijn.

Dan mijn eigenlijke vraag: De wet heeft betrekking over de eerste cijfers van een verzameling afwijkende getallen, maar waarom zou de wet niet ook opgaan voor de laatste cijfers van een verzameling afwijkende getallen. Immers, als ik de getallen cijfermatig omkeer (dat het laatste cijfer dus het eerste cijfer wordt), dan krijg ik toch weer een nieuwe verzameling afwijkende getallen?
Brutaler nog, waarom zou de wet niet gelden voor bijvoorbeeld elk 3e cijfer van een verzameling afwijkende getallen?


In een logaritmische verdeling kan je ook kijken hoe groot de kans is dat het 2e of 3e of nog hogere cijfer een bepaalde waarde heeft. Let op dat deze cijfers ook nul kunnen zijn, i.t.t. het eerste cijfer (waarom?).
Bijvoorbeeld voor het 2e cijfer: neem alle getallen van 10 tot 100, die bestaan allemaal uit 2 cijfers met daarna een rest achter de komma.
De kans dat het 2e cijfer bijvoorbeeld een 5 is, is:
de kans dat het getal ligt tussen 15 en 16 = log(16)-log(15) = log(1+1/15) = 0.028...
plus
de kans dat het getal ligt tussen 25 en 26 = log(26)-log(25) = log(1+1/25) = 0.017...
plus
...
plus
de kans dat het getal ligt tussen 95 en 96 = log(96)-log(95) = log(1+1/95) = 0.004...
=
0.096677

Als je dit doet voor alle 2e cijfers van 0 t/m 9 vind je:

Code: Selecteer alles

c2	P(c2)
0	0.119679
1	0.113890
2	0.108821
3	0.104330
4	0.100308
5	0.096677
6	0.093375
7	0.090352
8	0.087570
9	0.084997
Merk op dat de verschillen hier een stuk minder groot zijn als bij het eerste cijfer.

Voor de 3e cijfers vind je de volgende kansverdeling:

Code: Selecteer alles

c3	P(c3)
0	0.101784
1	0.101376
2	0.100972
3	0.100573
4	0.100178
5	0.099788
6	0.099401
7	0.099019
8	0.098641
9	0.098267
Je ziet: nog kleinere verschillen.

Je kan dit ook uitrekenen voor het 4e, 5e, 6e, en elk ander cijfer, maar het effect zal uiteindelijk verwaarloosbaar zijn.

ronmak
Nieuw lid
Nieuw lid
Berichten: 2
Lid geworden op: 15 okt 2015, 16:14

Re: Vraagje over de wet van Benford

Bericht door ronmak » 15 okt 2015, 19:32

hi hoe reken je de percentages uit de tweede getalvoor de wet van benford in de tabel de eerste
lukt me wel met de formule ,maar de tweede en volgende niet
bedankt ron

arie
Moderator
Moderator
Berichten: 3911
Lid geworden op: 09 mei 2008, 09:19

Re: Vraagje over de wet van Benford

Bericht door arie » 16 okt 2015, 20:22

De formule voor de kans dat x tussen getallen a en b uit interval [1, 10> ligt vind je hier:
https://nl.wikipedia.org/wiki/Wet_van_B ... _verdeling



Voorbeeld:
De kans dat een getal x met 5 begint = de kans dat x tussen 5 en 6 ligt (meer precies 5 <= x < 6) is volgens de wet van Benford




Getallen waarvan het tweede cijfer een gegeven waarde c2 heeft liggen niet meer aaneengesloten op het interval [1, 10>, maar op een aantal kleinere deelintervallen daarvan.

Voorbeeld:
Voor c2 = 5 kan x liggen in de intervallen
van 1.5 tot 1.6,
of
van 2.5 tot 2.6,
of
van 3.5 tot 3.6,
of
van 4.5 tot 4.6,
of
...
of
van 9.5 tot 9.6

Voor elk van die 9 intervallen kan je via bovenstaande formule de kans berekenen dat x in dat interval

ligt, voorbeeld:



Dit doe je ook voor de andere deelintervallen hierboven, de kans dat het tweede cijfer een 5 is is dan de

som van deze 9 kansen:



ofwel:




Voor alle mogelijke waarden van c2 (0 t/m 9) vind je de kansen in de eerste tabel in mijn vorige post.


Voor c3 moet je nog meer kansen optellen, bijvoorbeeld:




Kom je hiermee verder?

Plaats reactie