NOMBRES - Curiosités, théorie et usages

 

Accueil                           DicoNombre            Rubriques           Nouveautés      Édition du: 22/10/2016

Orientation générale        DicoMot Math          Atlas                   Références                     M'écrire

Barre de recherche          DicoCulture              Index alphabétique                               

     

CHIFFRES

 

Débutants

Nombres

Fréquence

 

Glossaire

Chiffres

 

 

INDEX

 

Chiffres

Nombre normal

Probabilité

 Loi de Benford

Auto-descriptifs

 

Sommaire de cette page

>>> Approche

>>> Invariance d'échelle

>>> Explications

>>> Bilan

>>> Probabilité des chiffres suivants

>>> Anglais

 

 

 

 

LOI de BENFORD

ou Loi du premier chiffre

ou ex loi des nombres anormaux

 

Curieux! Ce sont toujours les mêmes chiffres qui sont privilégiés.

Anglais: Benford's Law or First digit law or leading digit phenomenon

 

 

 

Approche

 

*    Nous nous intéressons  aux nombres de la vie courante: recensements démographiques, prix au supermarché, cours de la bourse, taux de change, facture de gaz, longueurs des fleuves, poids atomiques, constantes physiques, constantes mathématiques, etc.

 

*    Nous observons le chiffre le plus à gauche des nombres, celui de poids le plus fort dit chiffre le plus significatif.

 

 

Curieusement la probabilité de trouver un des chiffres de 1 à 9, à gauche d'un nombre, n'est pas la même.

 

Pour chacun des neuf chiffres, la probabilité devrait être de 11,11%
 

 

*    En 1881, Simon Newcomb, un mathématicien et astronome, constate que les premières pages des tables de logarithmes sont plus usées que les autres. Il formule une loi qui tomba dans l'oubli.

*    Publication dans l'American Journal of Mathematics.

 

 

 

 

 

 

 

PC est la probabilité que le premier chiffre significatif soit c)

Log = logarithme en base 10

 

Ce qui donne les valeurs illustrées sur ce graphique:

 

En 1938, Frank Benford, un physicien américain, redécouvre une loi du même type.

 

Sur des milliers de données, Benford constate que le chiffre 1, en tant que premier chiffre significatif, est présent dans  30% des cas.

 

Observations sur des milliers de données.

 

 

 

Quel que soit le domaine observé, les fréquences de chaque chiffre restent très voisines.

En multipliant les valeurs, les fréquences sont conservées.

Même en changeant la base de numération, cette propriété revient.

 

La loi s'applique à des mesures (nombres suivis d'une unité de mesure).

 

 

Elle ne s'applique pas aux données purement aléatoires comme le tirage du loto.

 

Elle ne s'applique pas non plus à des données contraintes comme le poids des humains, le quotient intellectuel ou le record du saut à la perche …

 

Un cas spécial d'exception: les prix affichés du type 99 euros pour des raisons marketing.

 

 

 

Invariance d'échelle

 

En 1961, Roger Pinkham propose une explication.

 

 

Si la loi est valable pour des prix exprimés en euros comme en dollars, pour des longueurs exprimées en mètres comme en yards … c'est qu'elle présente une invariance d'échelle.

 

Invariance d'échelle

 

Explication du principe avec l'exemple de la multiplication par 2.

 

Les nombres commençant par 5, 6, 7, 8 et 9 multipliés par 2 produisent un 1. Celui-ci hérite de la somme des probabilités de ces chiffres soit 30,07% et retrouve une probabilité globale de 30%.

Les autres chiffres, après multiplication par 2, retrouvent, eux aussi, une probabilité voisine.

 

Si les nombres sont multipliés par une constante quelconque, la distribution du premier chiffre est conservée.

 

 

 

Explications**

Il faut attendre 1998, pour que Hill en fasse la démonstration complète et satisfaisante.

 

Soit P la loi de distribution de la probabilité de ces chiffres (si elle existe).

 

 

Elle est invariante par changement d'échelle:

 

P(a.x) = f(a).P(x)

En décimal un nombre peut s'exprimer en notation scientifique

Le premier chiffre significatif

C étant le premier chiffre de x.

Trouver un invariant d'échelle pour C

C'est trouver un invariant d'échelle pour x.

Et aussi pour son logarithme.

 

Avec les logarithmes, l'invariance se traduit par la conservation de la valeur en ajoutant une constante.

 

y = log x

log ax = log a + log x = log a + y

 

La seule distribution de probabilités qui reste inchangée lors de l'addition d'une constante et la distribution uniforme (équirépartie).

Sur cette figure, on voit que y est uniformément réparti entre log(1) = 0 et log(10) = 1.

 

Nous sommes toujours en logarithmes décimaux (base 10)

 

La probabilité que C vaille 1 est égale à:

Il s'agit d'un calcul d'intégrale:

Cas général

Et son intégrale, où on retrouve la formulation indiquée en début de page.

 

 

 

 Bilan

Internet donne de nombreux exemples d'expériences sur ce thème. La Loi de Benford étant une loi statistique, plus il y a d'échantillons et plus on se rapproche des valeurs théoriques.

La loi est présente à un point que certains l'utilisent pour détecter des fraudes. Des déclarations avec trop de 5, 6 ou 7 déclenchent une alerte. D'autres applications sont à l'étude.

 

 

La probabilité des chiffres suivants se calcule sur le même principe

 

 

English corner

 

Benford’s law: a quirky law based on the number of times a particular digit occurs in a particular position in numbers.

The law is based on a peculiar observation that certain digits appear more frequently than others in data sets.

For example, in certain data sets, it has been observed that more than 30% of numbers begin with the digit one.

Using the Benford's formula, the probability that the first digit of a number is one is about 30 percent while the probability the first digit is a nine is only 4.6 percent. Table above shows the expected frequencies for all digits 0 through 9 in each of the first four places in any number.


 
quirky: bizarre, excentrique

 

 

 

Suite

*         ChiffresIndex

Voir

*         Dénombrement

*         Probabilités

Cette page

http://villemin.gerard.free.fr/Wwwgvmm/Formes/Benford.htm