Jul 03, 2024

Wiki

Python

Aide

edit SideBar

Search

Reconnaissance De Formes


Principe général

Applications de la reconnaissance de formes

La reconnaissance de formes est très utilisée dans différents domaines :

  • Reconnaissance de caractères dans des logiciels d’OCR (Optical Character Recognition).
  • Déchiffrage des codes postaux par La Poste.
  • Détection de nappes de pétrole dans l’océan.
  • Détection de défauts dans les matériaux.

L'idée du réseau

On va réaliser un réseau effectuant la reconnaissance de caractères non manuscrits.

Ce réseau ne comporte qu'une seule couche, avec autant de neurones que de formes à reconnaître.

  • Chaque neurone est donc responsable d’une forme.
  • Chaque neurone est relié en entrée à tous les pixels de la forme présentée.
  • Il donne en sortie la probabilité qu’on lui ait présenté la forme dont il est responsable.

L'apprentissage du réseau

L’apprentissage, issu de la règle du delta, est de type supervisé :

  • Si la forme reconnue est la bonne on renforce l'apprentissage selon l'écart avec la seconde forme reconnue.
  • Si le réseau s'est trompé on renforce les valeurs de la forme qui aurait due être reconnue et on les baisse pour la forme reconnue.

Fonctionnement

Concernant les neurones

Tous les poids sont des réels entre -1 et 1.

Les valeurs des entrées sont simplement l’intensité du pixel en niveaux de gris (de 0 à 255), ramenée à un réel entre 0 et 1.

La fonction d’entrée appliquée et une somme pondérée des entrées.

La fonction de transfert appliquée est une sigmoïde ( $f(x) = \frac{1}{1 + e^{-x}}$ ) qui se charge de ramener la sortie à un réel entre 0 et 1, qui représente la probabilité que ce soit la forme correspondante.

Apprentissage

Chaque neurone doit affecter un poids important aux pixels activés de sa forme

Ce poids sera d’autant plus important que le pixel est discriminant (i.e. il n’est pas activé pour les autres formes).

Il doit encore affecteur un poids beaucoup plus faible aux autres.

Apprentissage : la correction

L'apprentissage est donc constitué de correction et de renforcement.

Correction
Le réseau s’est trompé (la forme de plus grande probabilité n’est pas la bonne).
On modifie les poids proportionnellement à la différence entre les probabilités de la forme trouvée et la forme réelle, en augmentant le poids des entrées activées pour la forme réelle et en le baissant pour la forme trouvée.
Renforcement
Le réseau a trouvé la bonne forme.

On modifie les poids proportionnellement au complémentaire de la différence entre les probabilités de la forme trouvée (et réelle) et de la forme arrivant en seconde position, en augmentant le poids des entrées activées pour la forme trouvée.

Un ajustement soigné (et expérimental) des coefficients de proportionnalité est nécessaire afin d’obtenir de bons résultats.

Travaux pratiques

Programmez cette reconnaissance de formes.

Page Actions

Recent Changes

Group & Page

Back Links