Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Loi de Benford

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 10

Splendeurs et miseres

de la loi de Benford
1 La loi de Benford
Maintes demarches scientifiques sapparentent a des enquetes. Voici un exemple, remontant
au XVIIeme siecle. Crime dans un jardin anglais : une pomme est tombee sur la tete dun
honnete citoyen. Qui la commis, pourquoi, comment ? Lenqueteur etait brillant, et la
resolution de laffaire a prouve que celle-ci ne manquait pas de gravite, mais la question
du mobile est restee ouverte, et a conduit lenqueteur a cet aveu dechec : hypotheses
non fingo, dont Jean-Marc Levy-Leblond disait quil constituait une conclusion un peu
hautaine a de nombreuses annees passees a rechercher les raisons profondes - justement -
de cette loi de la nature. Le sujet etudie ici commence par un mystere aussi, beaucoup
plus humain en apparence, auquel les arbres ne sont dailleurs pas etrangers, eux qui sont
nos principaux fournisseurs de papier (mais peut-etre pas les pommiers, neanmoins).
En 1881, lastronome et mathematicien Simon NEWCOMB publia un court article intitule
Note on the Frequency of Use of the different Digits in natural Number
(American Journal of Mathematics 4, 1881, pp. 39-40). Il avait observe que les premieres
pages des tables de logarithmes etaient plus usees que les autres, et conclu que ces pages
servaient davantage parce que les nombres rencontres par les utilisateurs commencaient
plus souvent par 1 ou 2 que par les autres chiffres. Il proposait dans cet article la loi
1
P (X = i) = log(1 + )
i
pour la frequence dapparition du chiffre i (i = 1, . . . , 9) comme premier chiffre significatif
dun nombre - nous ne dirons pas nombre au hasard.
ln x
La notation log represente ici (et dans toute la suite) le logarithme decimal : log x =
ln 10
Cet article passa totalement inapercu. Cest seulement en 1938 que la publication par le
physicien Frank BENFORD dun article intitule The law of anomalous numbers
(Proceedings of the American Philosophical Society, 78, 1938, pp. 551-572) confera une
reelle notoriete a cette loi. Il y aboutissait, de maniere empirique mais aussi par le calcul,
aux memes conclusions statistiques que Newcomb et cest son nom que lon donna a cette
distribution.
2 La question des fondements : intra ou extra-mathematique ?
Nous avons evoque a propos de Newton la question des hypotheses et de notre capacite a
decrire, voire anticiper des phenomenes naturels dans un formalisme mathematique precis,
en loccurrence chiffre - contrairement par exemple a une approche plus metaphorique
comme celle de la theorie des catastrophes.
Une fois etabli un tel formalisme, il y a plusieurs attitudes possibles. On peut tout simple-
ment decider de ne pas trop sattarder sur la question des causes et developper la theorie, en
confrontant lorsque cest possible ses previsions aux resultats experimentaux. En quelque
sorte, on remplace le pourquoi par le comment, et on verifie si notre comprehension du
comment se conforme a la realite. Une telle demarche fonctionne remarquablement bien en
astronomie par exemple. Il arrive de temps en temps quune revolution experimentale en-
trane une adaptation plus ou moins profonde du formalisme - la theorie de la relativite par
exemple - mais la demarche epistemologique nen est pas pour autant vraiment modifiee.
Nous allons decrire ici dans un premier temps ce qui nous semble relever dune autre
demarche, probablement bien naturelle pour un probleme dapparence si paradoxale, qui
est precisement la recherche dune raison per se pour la predominance de ce 1 initial.
Cette discussion est notamment inspiree par larticle de Ralph A. RAIMI The first
digit problem (Amer. Math. Monthly, 83, n 7, 1976, pp. 521-538).
2.1 Pourquoi le probleme nadmet pas de solution simple et naturelle
Bien quil nexiste pas de probabilite uniforme sur N, on saccorde generalement a con-
siderer quun entier choisi au hasard a une chance sur deux detre pair. Le hasard en
question est bien ressenti comme celui, uniforme, qui donne une meme chance a tous les
nombres - bien que ceci soit impossible, la chance en question etant alors forcement nulle.
La raison qui nous fait accepter cette apparente contradiction - et sa conclusion chiffree
- est que lensemble P des nombres pairs possede dans N une densite egale a 1/2 au sens
suivant :
Card (P {0, . . . , n} 1
lim =
n Card ({0, . . . , n} 2
Cette limite existe si on remplace P par les entiers dont lecriture decimale se termine par
nimporte quel chiffre fixe a lavance (elle vaut alors 1/10), mais aussi pour les entiers
superieurs ou egaux a 10 dont lavant-dernier chiffre est fixe a lavance, ceux superieurs a
100 dont lantepenultieme chiffre est fixe a lavance (elle vaut encore 1/10), etc.
Nest-il pas alors tentant de penser quil en est de meme pour les entiers dont le premier
chiffre est donne a lavance ?
Une analogie rapide, mais aussi le biais dequiprobabilite mis en evidence par les psycho-
logues, et qui fait par exemple lobjet dun article de Marie-Paule Lecoutre : Cognitive
models and problem spaces in hh purely ii random situations (Educational Studies
in Mathematics, 23, 1992, pp. 557-568) conduisent assez naturellement a le penser. Mais
une analyse rapide montre que, contrairement au cas ou lon prescrivait les derniers chiffres,
lensemble des nombres entiers dont le premier chiffre est 1 (que nous designerons par N1 )
nadmet pas de densite, et donc pas de probabilite naturelle.
Pour verifier ceci, nous allons examiner deux situations extremes.
Considerons les nombres de 0 a 10n 1. Il y en a 10n . Ils peuvent avoir 1, 2, . . . , n chiffres
et a part le premier qui ne peut valoir 0 il y a dix possibilites pour chaque chiffre. Il y a
donc :
Exactement 1 nombre a un chiffre commencant par 1 (1 lui-meme).
Exactement 10 nombres a deux chiffres commencant par 1 (de 10 a 19).

Exactement 10n1 nombres a n chiffres commencant par 1 (de 10n1 : 1 suivi de n 1
zeros, a 2 10n1 1 : 1 suivi de n 1 neuf).
Il y a donc au total 1 + 10 + + 10n1 nombres commencant par 1 entre 0 et 10n 1 et
Card (N1 {0, . . . , 10n 1}
 
1 1 1
n
= 1 n '
Card ({0, . . . , 10 1} 9 10 9
Considerons maintenant les nombres de 0 a 2 10n 1. Il y a tous ceux rencontres ci-
dessus et une nouvelle suite de 10n nombres qui commencent tous par 1 (ce sont en fait
les premiers auxquels on a rajoute 1 comme premier chiffre). On a cette fois :
Card (N1 {0, . . . , 2 10n 1}
 
5 1 5
n
= 1 n+1 '
Card ({0, . . . , 2 10 1} 9 10 9
Puis, quand on considere les nombres de 2 10n a 10n+1 1, plus aucun ne commence par
1 et la densite partielle redescend jusqua environ 1/9 comme nous lavons vu ci-dessus.
Ceci montre que largument equiprobabiliste naturel ne conduit a aucune conclusion pour
lensemble N1 .
Il faut noter cependant que levolution de la densite partielle de N2 , N3 , . . . , N9 nest pas
la meme : les valeurs entre lesquelles oscillent ces densites partielles sont differentes (pour
1 10
Nk denviron a ) et les maximas et minimas sont atteints en des positions
9k 9(k + 1)
differentes. Si la globalite des courbes a un sens, elle nous suggere deja cette rupture
duniformite pour le premier chiffre significatif.
Il est a noter que les valeurs du type n = 10m sont celles pour lesquelles les densites
partielles  
Card (Nk {0, . . . , n 1} 1 1
= 1
Card ({0, . . . , n 1} 9 m
sont les memes pour toutes les valeurs de k.
2.2 La demarche de Benford : une moyennisation de lois uniformes
Fixons un nombre reel positif x. Ce qui precede suggere que si x suit une loi uniforme sur
lintervalle ]0, b], la repartition du premier chiffre significatif de x, que nous noterons x1 ,
depend de b. Nous allons preciser ceci et montrer comment Benford, par une procedure de
moyenne, en a deduit sa loi.
Notons dabord que nous pouvons ecrire x sous la forme m(x) 10n ou m(x) [1, 10[ et
n Z. Le nombre m(x) sappelle la mantisse de x (et cest ce genre de quantites que lon
utilisait quand on calculait avec des tables de logarithmes). Dire que x1 = 1, cest dire
que m(x) [1, 2[ (de maniere generale, x1 est la partie entiere de m(x)).
Supposons que x suit une loi uniforme sur [0, b[ ou 1 6 b < 10 et notons Pb (k) la probabilite
pour que x1 = k sous cette hypothese. Dire que x1 = k, cest dire que X appartient a la
reunion
      
k k+1 k k+1 k k+1 
, , , [k, k + 1[ [0, b[ .
103 103 102 102 10 10

A part le dernier, ces intervalles ont une longueur independante de b et k, et la somme de


ces longueurs vaut 1/9. Le dernier est vide si b 6 k, a pour longueur b k si k 6 b 6 k + 1
et 1 si b > k. On a donc

1
si b [1, k],





9b
1 bk

Pb (k) = + si b [k, k + 1],

9b b
1 1


+ si k + 1 6 b 6 10.



9b b
Supposons maintenant que le parametre b soit lui-meme une variable aleatoire de densite
f sur [1, 10]. La quantite Pb calculee ci-dessus devient alors une probabilite conditionnelle
et on obtient Z 10
P (x1 = k) = Pb (k)f (b) db,
1
suivant une formule qui est lanalogue continu de la formule des probabilites totales.
On voit que la valeur de cette probabilite depend du choix de la densite f du parametre b.
Le choix de Benford a ete de prendre f (b) = C/b (le nombre C = ln(10) est une constante
de normalisation pour obtenir une densite de probabilite). Un calcul ou les simplifications
semblent tenir du miracle conduit alors a
 
ln(k + 1) ln(k) 1
P (x1 = k) = = log10 1 +
ln(10) k
Il est a noter que le choix de lintervalle [1, 10[ pour le parametre b nest pas crucial et
on obtient les memes resultats si on le remplace par nimporte quel intervalle du type
Im = [10m , 10m+1 [, ce qui suggere que la limitation imposee a b nen est pas vraiment une.
Si cette loi semble decrire remarquablement bien une grande partie des donnees accumulees
par Benford (pas toutes les series neanmoins), il faut reconnatre quil y a un arbitraire
certain dans le choix fait, qui ressemble plutot a un bel exercice qua une description dune
quelconque realite, et lon peut par exemple se demander ce qui se produit si on modifie la
fonction f . En la choisissant constante, on obtient par exemple la loi de Stigler (elle aussi
independante du choix de lintervalle Im ), dont on a pu observer quelle rendait parfois
mieux compte de certaines donnees boursieres par exemple. Dans son article First Sig-
nificant Digit Patterns from Mixtures of Uniform Distributions, (The American
Statistician, Vol. 58, No. 1 (Feb., 2004), pp. 64-71), Ricardo J. RODRIGUEZ indique que
le choix systematique de la conformite a la loi de Benford comme hypothese nulle dans les
tests dinfluence humaine sur des series de donnees peut de ce fait conduire a des erreurs
dinterpretation.
Remarque Si on choisit des densites du type b 7 C /b , les probabilites P (x1 = k)
tendent vers 1/9 lorsque tend vers , ce qui sexplique car de telles densites concentrent
les parametres b a lune des extremites de lintervalle Im , et la loi du premier chiffre est
presque uniforme sur lintervalle [0, b[ quand b est voisin dune puissance de 10.
2.3 Une autre procedure de sommabilite : les moyennes de Cesaro successives
Une autre procedure, peut-etre plus simple, consiste a essayer de donner une densite a
lensemble des nombres entiers de premier chiffre k en modifiant le calcul de moyenne.
Cette procedure, qui sapparente aux procedes de resommation permettant de definir la
somme de series divergentes (mais ne modifiant pas celle des series convergentes) nous est
fournie par les moyennes de Cesaro : il est connu que pour une suite (un ) convergente, la
suite (vn ) des moyennes partielles
u1 + + un
vn =
n
converge vers la meme limite, mais la reciproque est fausse. Par exemple, les moyennes de
Cesaro de nimporte quelle suite dont les sommes partielles sont bornees tendent vers 0.
Cette operation de moyennisation lisse donc une partie des irregularites des suites et on
peut se demander si, posant
Card ({m {1, . . . , n}|m1 = k} ,
un (k) =
n
(ou comme ci-dessus, m1 designe le premier chiffre significatif de m), la suite des moyennes
de Cesaro vn (k) ne serait pas convergente.
Ce nest pas le cas mais lorsque lon observe la variation de cette suite, on constate que
1 10
les oscillations decrites plus haut (entre et ) voient leur amplitude diminuer.
9k 9(k + 1)
Ceci suggere diterer le processus et de calculer les moyennes de Cesaro wn des vn , puis xn
des wn , etc.
Dans son article On the probability that a random integer has initial digit a (Amer.
Math. Monthly, 73, 1966, pp. 1056-1061), Betty J. FLEHINGER prouve que cette suite de
moyennes converge effectivement vers la loi de Benford lorsque le nombre diterations tend
vers linfini. La demonstration fait appel a des series generatrices et un peu danalyse com-
plexe, et elle est de nature essentiellement analytique. Ce resultat peut aussi etre prouve
suivant dautres approches, par exemple en construisant une chane de Markov dont la loi
de Benford est lunique probabilite stationnaire, tandis que les moyennes de Cesaro iterees
en sont les lois successives, dont on sait que sous les bonnes hypotheses elles convergent
vers cette loi stationnaire. On trouvera cette demonstration, avec une estimation de la
vitesse de convergence, dans larticle dElise JANVRESSE et Thierry DE LA RUE : From
uniform distributions to Benfords law(Journal of applied probability, 41, n 4, 2004,
pp. 1203-1210).
On peut faire pour cette approche les memes commentaires que pour celle de Benford. Les
mathematiques sont attrayantes, mais rien ne justifie vraiment pourquoi ce formalisme
devrait sappliquer a des nombres issus de la vie reelle.
2.4 Une loi de la nature ?
Une autre caracterisation de la loi de Benford sappuie sur la remarque suivante, dont le
statut epistemologique pourra paratre largement discutable, mais ne lest peut-etre pas
beaucoup plus que lavis souvent enonce selon lequel les mathematiques constituent la
langue naturelle de la physique, au point que certaines theories mathematiques semblent
parfois admises comme la meilleure explication du monde.
Sil existe une loi decrivant le premier chiffre des nombres, cette loi ne doit pas dependre
des observateurs humains, et ceci se traduit par au moins deux proprietes :
Elle ne devrait pas changer si les nombres sont exprimes dans dautres unites, cest
linvariance par changement dechelle.
Elle ne devrait pas changer si les nombres sont exprimes dans un autre systeme de
numeration, cest linvariance par changement de base.
Decidant une fois pour toutes que la nature aime enoncer ses lois par les mathematiques,
nous declarerons que ces proprietes doivent caracteriser une bonne loi du premier chiffre.
Il est remarquable de constater que la premiere est effectivement caracteristique de la loi
de Benford. Quant a la deuxieme, elle lest presque : toute loi invariante par changement
de base est une combinaison convexe de la mesure de Dirac au point 1 (le seul nombre
dont lecriture soit la meme quelle que soit la base) et dune loi a la Benford (avec des
logarithmes exprimes dans la base ou on sinteresse au premier chiffre). Si on ajoute une
propriete de continuite a la loi, la composante atomique en 1 disparat et il reste la partie
benfordienne.
Nous allons dire ici un mot de linvariance par changement dechelle. Nous cherchons une
loi de probabilite sur R+ qui ne soit pas modifiee quand on multiplie les donnees par une
constante non nulle. Cette propriete caracterise la mesure de Haar du groupe multiplicatif
(R+ , ) et il est connu que cette mesure, unique a coefficient multiplicatif non nul pres, vaut
dx/x. On constate alors quil ne sagit pas dune loi de probabilite puisque sa masse totale
est infinie. De fait, si on designe par F la fonction de repartition dune telle hypothetique
mesure de probabilite, elle devrait verifier
a, b > 0, > 0, F (b) F (a) = F (b) F (a).
Comme une fonction de repartition tend vers 1 en + on aurait donc
a > 0, > 0, 1 F (a) = 1 F (a)
et F serait constante, ce qui est impossible car F tend vers 0 en 0.
Ceci veut-il dire que notre probleme na pas de solution ? La reponse est non. Cela in-
dique juste que la solution ne peut pas provenir dune fonction admettant une fonction de
repartition. La raison est que dans le probleme du premier chiffre significatif, les intervalles
ne sont pas des ensembles mesurables. En base 10, les ensembles mesurables naturels sont
de la forme [
Ea,b = [10n a, 10n b[,
nZ

ou a et b sont des reels positifs. Si a = 1, . . . , 9 et b = a + 1, lensemble ci-dessus est


exactement lensemble des reels dont le premier chiffre significatif de lecriture decimale
est a. Designons par T la tribu engendree par ces ensembles. On peut observer que T est
limage reciproque de la tribu borelienne sur R (mais aussi sur nimporte quel intervalle
[10m , 10m+1 [ par lapplication mantisse m. Cela fait apparatre les ensembles T -mesurables
comme satures relativement a la relation dequivalence avoir la meme mantisse, et des
techniques classiquement utilisees pour fabriquer par exemple des topologies-quotients per-
mettent ici, partant dune mesure sur [1, 10[, de fabriquer son image reciproque m1
par m :
T T , (m1 )(T ) = (m(T )).
On verifie, en utilisant la saturation par m des elements de T , cest-a-dire la propriete

T = m1 (m(T )),

que m1 est effectivement une mesure (la saturation sert a prouver que si les Ti sont deux
a deux disjoints, leurs images aussi, prouvant ainsi la -additivite). Il faut noter que lon
peut aussi definir 1 de la meme maniere pour toute application : R+ [10m , 10m+1 [
ne dependant que de m et injective modulo m, cest-a-dire telle que

m(x) = m(y) (x) = (y).

En effet une telle application verifie les memes proprietes de saturation que m. Une telle
application sera dite m-injective.
Considerons alors lapplication logf (f comme fractionnaire) qui a tout nombre reel posi-
tif x associe la partie fractionnaire de son logarithme decimal, cest-a-dire le logarithme
decimal de la mantisse de x. Si [, [ [0, 1[, logf (x) [, [ si et seulement si il existe un
entier n tel que
n + 6 log x < n + .
On verifie facilement que logf est m-injective et que si est une mesure sur [0, 1[, on peut
definir log1
f sur (R+ , T ). Si est une mesure de masse 1, on construit ainsi une mesure
de probabilite.
Dire que la loi de x1 est invariante par changement dechelle, cest dire que pour tout
reel a > 0, pour tout entier k [1, 9],

P (x1 = k) = (Ek,k+1 ) = P ((ax)1 = k) = (Ek/a,(k+1)/a ).

Il est clair que si 1 6 6 6 10, logf (E, ) = [log(), log()[ [0, 1[. Comme modulo
1, la partie fractionnaire dune difference est la difference des parties fractionnaires, on
obtient
logf (E/a,/a ) = [log() logf (a), log() logf (a)[ modulo 1
(le membre de droite est soit un intervalle, soit la reunion de deux intervalles : la situation
apparat plus claire si on se represente [0, 1[ comme le cercle unite et laddition comme une
rotation).
Ainsi, la loi apparat comme limage reciproque par logf dune mesure sur [0, 1[ inva-
riante quand on applique une translation modulo 1 quelconque a lun des intervalles
[log(k), log(k + 1)[. Si le probleme admet comme solution evidente la mesure de Lebesgue
sur [0, 1[, je ne sais pas comment on peut prouver quil en est forcement ainsi en supposant
seulement linvariance par translation pour ces neuf intervalles particuliers (ni meme si
cest vrai). Mais si on demande maintenant que les deux, les trois, . . . premiers chiffres
significatifs soient eux aussi invariants (et pourquoi ny auraient-ils pas droit aussi ? ), les
intervalles obtenus forment une partie dense et lunicite annoncee en resulte.
Par consequent, la seule loi pour laquelle les k premiers chiffres significatifs soient invariants
par translation est limage reciproque de la mesure de Lebesgue ` par logf . On a donc
 
1
P (X1 = k) = `([log(k), log(k + 1)[) = log 1 +
k
et on retrouve la loi de Benford.
Remarque On notera que lapplication x 7 x nest pas mesurable de (R+ , T ) dans
(R, B(R)) et que par exemple lecriture P (X 6 t) = 1/2 (qui aurait defini la mediane t de
lensemble des nombres pouvant apparatre dans les lois de la nature) na aucun sens, ce
qui est rassurant.
Remarque La probabilite pour que les deux premiers chiffres significatifs soient 1 et
2 vaut pour la meme raison log(1, 3) log(1, 2). En additionnant les probabilites pour que
les deux premiers chiffres significatifs soient egaux a k et 2 (pour 1 6 k 6 9), on obtient la
probabilite pour que le deuxieme chiffre significatif soit 2. Numeriquement on obtient
P (x2 = 2) ' 0, 109.
En calculant P (x1 = 1 et x2 = 2)/P (x1 = 1), on obtient environ 0, 115. La probabilite
conditionnelle nest pas egale a la probabilite absolue : les chiffres successifs en partant du
debut ne sont pas independants (alors que dans le modele simple presente au debut, ils le
sont quand on part de la fin).
On peut aussi observer par le calcul que la grande amplitude dans la repartition statistique
du premier chiffre (environ 0, 301 pour 1, environ 0, 046 pour 9) diminue des le deuxieme
chiffre (on decrot toujours, mais entre 0, 12 pour 0 - quon ne pouvait pas avoir comme
premier chiffre mais quon peut avoir comme deuxieme - et 0, 085 pour 9) puis continue a
diminuer pour devenir infime a partir du cinquieme chiffre.
3 Des applications, des questions, des developpements
3.1 Fraudes fiscales, comportements psychologiques de marches
La loi de Benford, si elle a excite une curiosite bien reelle chez beaucoup de mathematiciens,
tant du point de vue de son fondement epistemologique, voire metaphysique, que de celui
dune caracterisation plus technique, plus interne aux mathematiques, ne semble pas avoir
connu beaucoup dapplications jusquaux annees 1980/90. A ce moment, un certain nombre
de scientifiques, partant de lobservation que les suites de nombres ecrites par des humains
ont en general des caracteristiques tres differentes de celles prevues par la loi de Benford, se
sont mis a utiliser cette loi comme fondement de tests statistiques dintervention humaine
sur des donnees.
On peut citer leconomiste Mark Nigrini, qui a suggere dutiliser cette loi pour detecter
deventuelles fraudes dans la comptabilite de certaines entreprises. Lobservation de base
est que les donnees non truquees ont tendance a se conformer a la loi de Benford (un
fait de nature experimentale) et quun trop grand ecart entre les chiffres observes et cette
loi est lindice dune intervention que lon peut probablement associer a une fraude. Ces
methodes ont effectivement connu un certain succes, elles necessitent lobservation non pas
du premier mais de plusieurs des premiers chiffres significatifs, et le modus vivendi chez les
mathematiciens est quil est difficile, meme pour un fraudeur averti, de creer une fausse
comptabilite a la fois credible et obeissant a la loi de Benford (evidemment, il nest pas
difficile decrire un programme simulant les resultats de cette loi de maniere convaincante,
mais il faut encore que les resultats soient economiquement acceptables et interessants
pour le fraudeur).
Dans un domaine analogue sinon voisin, il semble que la loi de Benford soit aussi utilisee
pour examiner la sincerite de donnees medicales, suivant une demarche comparable a celle
indiquee au-dessus.
On peut citer dautres questions, de nature plus psychologique. Lobservation dun trop
grand nombre de 0 et dun trop petit nombre de 9 dans les declarations de benefices
nets dun certain nombre dentreprises a conduit certains chercheurs a imputer ceci a
une tendance, pas forcement malhonnete, a arrondir vers le haut ces annonces lorsque
les sommes sont proches de seuils consideres comme significatifs : apparemment, meme
un oeil averti juge un benefice de 40 020 euros plus impressionnant quun benefice de 39
920 euros. De maniere un peu duale, lobservation dun trop grand nombre de 9 dans
des indices boursiers tels le CAC 40 ou le Dow Jones suggere la difficulte des marches a
franchir (vers le haut) certains seuils de resistance, souvent symboliquement multiples de
1000 - une difficulte ressentie par les investisseurs et confirmee par les statisticiens.
3.2 La loi de Benford doit-elle faire la loi ?
La lecture du paragraphe precedent pourrait conduire a penser que lon a trouve, avec
cette loi de Benford, une merveilleuse machine a distinguer le naturel de lartificiel, le non
truque du truque. A lire certains propos de mathematiciens, on a bien limpression quil en
est ainsi, Warren WEAVER (1963) parlant de propriete inherente a notre systeme
de calcul, Donald KNUTH (1981) conjecturant que cette loi est une approxima-
tion precise dune realite qui pourrait evoluer avec lexpansion de lunivers,
Louis-Vladimir FURLAN (1946) decrivant cette loi comme le reflet dune harmonie
profonde de la nature et du fait que celle-ci aime evoluer par progressions
geometriques (une propriete deja indiquee par Benford comme favorisant le comporte-
ment decrit par sa loi).
Toutes ces affirmations paraissent quelque peu exagerees quand on considere la maigreur
des donnees sur lesquelles repose la loi : une vingtaine de series de donnees, de tailles
disparates, representant environ 20 000 nombres. Lorsquon fait passer un test de 2 au
seuil de 5% a ces series, trois sont remarquablement proches de la loi, huit passent le test
avec des probabilites faibles donc peu convaincantes et neuf pas du tout. Un test fait sur
la globalite des 20 000 donnees suggere la encore un 2 beaucoup trop eleve pour accepter
lhypothese que lensemble des donnees suit la loi. Benford lui-meme na pas pratique ces
tests, et son affirmation selon laquelle lensemble de toutes les donnees se conformait mieux
a la loi que les sous-ensembles particuliers sappuie sur un calcul de moyenne non ponderee
des frequences dans les diverses series (cest-a-dire sans tenir compte des differences entre
les effectifs de ces series).
Lobservation de ces faits a conduit deux mathematiciens, Paul D. SCOTT et Maria FASLI
a se demander si la bonne question, plutot que pourquoi la loi de Benford est-elle
vraie, netait pas simplement la loi de Benford est-elle vraie ? Sinteressant a
de nombreux ensembles de donnees choisis pour avoir de bonnes chances de suivre la loi
(ils mentionnent dans leur etude la difficulte que pose un tel choix, et indiquent que les
criteres de choix de Benford lui-meme ne sont pas bien connus), ils ont etudie 230 series,
couvrant plus dun demi-million de valeurs, avec des effectifs ici aussi tres disparates.
Seules 29 passent le test du 2 au niveau 5% et une majorite echoue largement, avec une
probabilite derreur superieure a 99, 99%. En particulier, toutes les donnees financieres et
climatologiques echouent au test (un fait a rapprocher des applications decrites au-dessus).
Leur conclusion tient en trois points :
Peu de series de donnees reelles se conforment a la loi de Benford.
Nombre dentre elles sen ecartent radicalement.
Neanmoins, parmi celles-ci, dassez nombreuses ont une distribution qualitative analogue,
avec une diminution reguliere de la frequence quand le premier chiffre augmente.
Une etude portant ensuite sur divers types de variables a comportement multiplicatif les
conduit a lobservation quune variable positive log-normale (cest-a-dire dont le loga-
rithme suit une loi gaussienne), unimodale (cest-a-dire dont la densite possede un unique
maximum auquel on demande en outre detre strictement positif) et dont la mediane est
moindre que la moitie de la moyenne a tendance a se conformer raisonnablement a la
loi de Benford, et ils proposent dajouter un test de ce type comme prealable aux etudes de
fraude mentionnees ci-dessus. La conclusion de leur article publie en 2001 reste neanmoins
modeste : ces affirmations sont pour linstant le seul fruit de calculs ou de simulations, et
ne sappuient sur aucune preuve formelle. Cependant, ces resultats ont ete depuis corro-
bores par certains calculs de Nicolas GAUVRIT et Jean-Paul DELAHAYE, qui indiquent
pourquoi on peut sattendre a un comportement benfordien pour ce type de variables.
Les resultats de FASLI et SCOTT proviennent de leur article Benfords Law : An Em-
pirical Investigation and a Novel Explanation (CSM Technical Report 349 , Depart-
ment of Computer Science, University of Essex, 2001). On trouve ceux de DELAHAYE et
GAUVRIT dans plusieurs articles, dont notamment Pourquoi la loi de Benford nest
pas mysterieuse (Mathematiques et sciences humaines, article en ligne publie le 30 juin
2008 et consultable a lURL : http : //msh.revues.org/10363).
3.3 Une generalisation : quelles suites dentiers satisfont la loi de Benford ?
Assez loin de ses considerations, un certain nombre de mathematiciens ont reenonce le
probleme de la loi de Benford dans le cadre suivant : une suite (an ) de nombres non nuls
est dite benfordienne si
 
Card ({i {1, . . . , n}|x1 (ai ) = k}) 1
lim = log 1 + .
n n k
Elle est dite fortement benfordienne si la propriete est vraie pour nimporte quelle com-
binaison de premiers chiffres (en modifiant evidemment comme il se doit la valeur de la
limite).
Nous avons vu plus haut que lensemble N tout entier ne possede pas cette propriete, mais
certaines suites peuvent la posseder. Les observations realisees pour deduire la propriete
de Benford de linvariance par changement dechelle conduisent au critere suivant :
Theoreme - La suite dentiers (an ) est fortement benfordienne si et seulement si la suite
(logf (an )) est equidistribuee.
(Une suite delements de [0, 1] est dite equidistribuee si la proportion de termes de la suite
appartenant a nimporte quel intervalle [a, b] [0, 1] tend vers b a quand le nombre
de termes consideres tend vers linfini.) En utilisant divers criteres dequidistribution, et
notamment celui-ci, du a Hermann Weyl :
Theoreme (Hermann Weyl) - Si (un ) est une suite delements de [0, 1], les proprietes
suivantes sont equivalentes :
(i) La suite (un ) est equidistribuee.
(ii) Pour toute fonction continue (a valeurs reeelles ou complexes) f sur [0, 1] telle que
f (0) = f (1), on a
Z 1 N 1
1 X
f (x) dx = lim f (un ).
0 N N
n=0

(iii) Pour tout entier ` 6= 0,


N
X 1
lim e2i`un = 0.
N
n=0

on a pu montrer quun certain nombre de suites recurrentes sont benfordiennes. Cest le


cas par exemple de la suite de Fibonacci, des suites de type (mn ) ou m est un entier tel
que log(m) soit irrationnel.
Ces enonces ont leurs analogues en base quelconque.
Les proprietes des suites equidistribuees permettent de prouver quune suite ne peut etre
benfordienne que si elle crot suffisamment vite, grace notamment au theoreme suivant :
Theoreme - Si une suite (an ) est fortement benfordienne, lim sup n log(an+1 /an ) = +.
On peut en deduire, en utilisant les estimations fournies par le theoreme des nombres
premiers, que la suite (pn ) des nombres premiers nest pas fortement benfordienne (mais
toute sous-suite (pmn ), ou m est un entier tel que log(m) soit irrationnel, est benfordienne).
On prouve aussi par exemple que la suite (n! ) est fortement benfordienne, ce qui confirme
des conjectures numeriques faites sur un grand nombre de donnees.
Comme reference sur ces resultats, on peut citer par exemple deux articles de Paul JOLIS-
SAINT : Loi de Benford, relations de recurrence et suites equidistribuees (Elem.
Math., 2005, vol.60, pp. 10-18) et Loi de Benford, relations de recurrence et suites
equidistribuees II (Elem. Math., 2009, vol.64, pp. 21-36). La propriete forte de Benford
pour certaines suites est decrite notamment dans larticle The distribution of leading
digits and uniform distribution mod 1 (Annals of Probability, 1977, n 5, pp. 72-81)
de Persi DIACONIS. Enfin, le livre Uniform distribution of sequences (Dover Pub-
lications, NewYork, 2006) de Lauwerens KUIPERS et Harald NIEDERREITER semble
etre une reference frequemment citee sur les suites equidistribuees.

Vous aimerez peut-être aussi