---
Quand beaucoup de causes indépendantes de même importance additionnent leurs effets, le résultat suit une loi normale.
Au XVIIIe siècle, Abraham de Moivre chercha à comprendre le comportement à la limite de la loi binomiale.
Pour $X$ suivant une loi binomiale, il étudia $\frac{X-m}{\sigma}$ : loi centrée et réduite.
A partir de la formule de Stirling, dont il est le coauteur, il obtient une expression approchée de $C_n^k$, qui lui permet d'étudier le comportement de la loi binomiale $B\left(n,\frac{1}{2}\right)$ quand $n \rightarrow + \infty$.
Il démontre que, dans ce cas, la loi binomiale centrée réduite tend vers une loi continue de densité $f(t) = \frac{1}{\sqrt{2 \pi}} e^{-t^2/2}$
C'est la première apparition de la loi normale, certainement la plus utilisée en statistique mathématique. Sa densité peut être représentée par une courbe en cloche.
Laplace démontre alors, dans sa théorie analytique des probabilités (1812), que la convergence reste vraie, quelle que soit la probabilité $p$. Pour cette raison, la loi normale est aussi appelée la loi de Laplace.
Le résultat de Laplace indique donc que la moyenne arithmétique de $n$ variables aléatoires de même loi de Bernoulli et indépendantes, une fois centrée et réduite, tend vers la loi normale.
Si l'on retire de l'énoncé la condition que les variables aléatoires soient de Bernoulli, le résultat reste vrai (à quelques restrictions naturelles près).
C'est le contenu du théorème central limite, démontré dans toute sa généralité en 1920 par George Polya.
Un autre théorème va encore plus loin, et permet de s'affranchir (partiellement) de la condition d'identité des lois des variables aléatoires dont on fait la moyenne.
Il suffit que les variables aléatoires aient une variabilité voisine, avec une forte probabilité.
C'est-à-dire que dès qu'une série de causes indépendantes, en grand nombre, dont aucune n'a une influence supérieure aux autres, additionnent leurs effets, le résultat obtenu suit la loi normale.
On comprend donc que la loi normale se retrouve dans des distributions statistiques observées dans de très nombreux contextes.
C'est le cas pour des phénomènes comme le poids d'hommes appartenant à la même classe d'age, ou quand on observe les pièces fabriquées par une machine (les tailles ne sont pas tout à fait égales à la taille théorique, mais s'en éloignent selon une loi normale).
De même, au XIXe siècle, les astronomes remarquent que lorsqu'ils effectuent une série d'observations, leur répartition forme une courbe en cloche. Parmi ces astronomes figure Gauss, qui en a popularisé l'usage, au point que cette loi porte aussi son nom.
Il existe différentes manières d'accéder à la loi normale en python, l'une d'elles étant d'utiliser la fonction randn de la bibliothèque numpy.matlib. Cette dernière donne accès à la loi normale centrée réduite, à savoir de moyenne nulle et d'écart type 1, comme suit :
>>> import numpy.matlib >>> numpy.matlib.randn(2) >>> numpy.matlib.randn(1, 2, 3)
Ci-dessus, on a importé la bibliothèque utile, puis on a tiré deux nombres suivant la loi normale centré réduite, enfin on a tiré une fois une matrice de taille 2x3 remplie de tels nombres. Si l'on souhaite une autre moyenne (resp. un autre écart type), il faut faire une translation (resp. une homothétie) des valeurs. Ainsi,
>>> 2.5*numpy.matlib.randn(5)+3
produira 5 nombres suivant une loi normale de moyenne 3 et d'écart type 2,5.