Wet van Benford




Inleiding
Neem eens een aantal getallen. Veel getallen. Dat kunnen statische gegevens zijn als bevolkingsaantallen, geldbedragen of lengten van rivieren. Het kunnen echter ook de eerste 1000 priemgetallen zijn. Kijk nu eens goed naar die getallen. Niet naar de hele getallen, maar alleen naar het begincijfer. Valt je iets op? Als we eventuele nullen buiten beschouwing laten, is het eerste cijfer een van de getallen 1,2,3, 4, 5, 6, 7, 8 of 9. Hoe vaak komt het nu voor dat een getal met 1 begint? Je denkt misschien: net zo vaak als met een 9. Dat is niet zo. De frequentie verloopt volgens een 'logaritmische wet': de 1 komt bij 30% van de getallen voor, de 2 bij 17%, de 3 nog maar bij 12% en de 9 ten slotte bij een schamele 4,5%.
Deze first-digit-law is vernoemd naar de Amerikaanse
natuurkundige Frank Benford (1 883 - 1 948),
die hem in 1938 formuleerde. Het fenomeen was
echter eerder al, in 1881, de Amerikaanse sterrenkundige
Simon Newcomb opgevallen. Benford had
ontdekt dat logaritmetabellen, die toentertijd bij
het rekenen werden gebruikt, op de eerste bladzijden
sterk beduimeld waren. Zijn verklaring daarvoor
was dat getallen die met een 1 beginnen en
daarom aan het begin van logaritmetabellen staan,
vaker voorkomen dan getallen die met een ander
cijfer beginnen.
De verdeling van begincijfers heeft nog een andere
opmerkelijke eigenschap. Laten we eens naar
de balans van een grote onderneming kijken. Dan
blijkt dat de getallen die in die balans voorkomen
volgens de wet van Benford zijn verdeeld. En merkwaardig
genoeg maakt het geen verschil of de balans
in euro's, dollars of yens is opgesteld. Dit
wordt schaalinvariantie genoemd.
De wet van Benford gaat vanzelfsprekend alleen
op bij reële gegevens, niet bij verzonnen getallen of
iets dergelijks. Daarom kan deze wet worden gebruikt
om vervalste gegevens op te sporen, bijvoorbeeld
vervalste balansen. Wanneer er namelijk op
de een of andere manier met getallen gerommeld
is, dan is het vaak zo dat de wet van Benford niet
opgaat. En dat is logisch: wanneer ik getallen zou
vervalsen, dan zou ik ervoor zorgen dat ze 'statistisch' verdeeld
zijn. Dat betekent dat alle cijfers,
van de 1 tot en met de 9, even vaak als begincijfer
zouden voorkomen. Helemaal fout! In reële gegevens
begint niet slechts 11%, maar 30% van alle
getallen met een 1!
Video's
Word ook lid!
Brugklas.net
Vmbobasis.nl
Vmbokader.nl
Mavo3.nl
Mavo4.nl
Havo1.nl
Havo2.nl
Havo3.nl
Vwo1.nl
Vwo2.nl
Vwo3.nl
Wiskunde-a.nl (4/5/6)
Wiskunde-b.nl (4/5/6)
Wiskunde-c.nl (4/5/6)
Wiskunde-d.nl (4/5/6)
Wiskundeles.nl
Wiskunde.help
Wiskunde.LIVE (later meer)
Wiskunde examentraining (2025)