Les réseaux de neurones formels (RNF), ou plus simplement réseaux de neurones (RN), constituent aujourd'hui une technique de traitement de données bien comprise et mâtrisée qui permet à l'ingénieur d'extraire, dans de nombreuses situations, le maximum d'informations pertinentes des données qu'il possède : commande de procédés, prédiction de propriétés, modélisation de fonctions, reconnaissance de formes, etc.
De façon formelle, un RN est une fonction mathématique à laquelle sont associés des variables, un résultat, et des paramètres ajustables (poids). A partir d'un ensemble de données (mesures, résultats de calcul, indices économiques ou financiers, etc.), on peut ajuster un RN en choisissant convenablement ses paramètres.
Lorsque l'ajustement des paramètres a été effectué (apprentissage), le RN peut interpoler entre les données ; il peut ainsi prévoir le résultat de mesures qui n'ont pas encore été faites, expliquer des résultats obtenus dans le passé, etc.
Une fois convenablement ajusté, un RN constitue de fait un modèle statistique non linéaire des données.
Les RN possèdent une propriété fondamentale qui les distingue des techniques classiques de traitement des données : ce sont des approximateurs universels parcimonieux. Cela signifie que pour obtenir un modèle non linéaire de précision de donnée, un RN a besoin de moins de paramètres ajustables que les méthodes de régression classiques (par exemple la régression polynomiale). Or le nombre de données nécessaires pour ajuster le modèle est directement lié au nombre de ses paramètres.
Par conséquent, un RN nécessite moins de données qu'une méthode de régression classique pour élaborer un modèle non linéaire de précision équivalente ; ou encore, un RN permet d'élaborer, à partir d'une même base de données, un modèle non linéaire plus précis. Ainsi de manière générale, dans le contexte de la modélisation non linéaire, un RN permet de tirer un meilleur parti des données dont on dispose.
Les RN présentent de plus trois caractéristiques particulièrement intéressantes. Ils sont :
Les grands domaines d'application des RN découlent naturellement des propriétés énoncées précédemment :
Les RN sont des outils puissants de traitement non linéaire des données qui n'ont pas encore atteint leur plein développement pour des raisons plus psychologiques que techniques, liées notamment aux connotations biologiques du terme et à leur relative nouveauté dans le monde industriel.
Nous avons exposé les propriétés fondamentales des RN qui justifient l'intérêt croissant qui leur est accordé : parcimonieux, adaptatifs, massivement parallèles, capables de généralisation. L'industrie doit pouvoir bénéficier de cette nouvelle avancée technologique.
Neural Networks - a comprehensive
foundation, S. Haykin, Ed. Prentice Hall,
1999.
Neural networks for pattern recognition, C.
M. Bishop, Ed. Oxford University Press,
1995.
Réseaux de neurones et traitement du
signal, J. Hérault et C. Jutten, Ed. Hermès,
1994.
A l'origine conçues pour les tâches de classification ou reconnaissance de formes, les SVM permettent également de traiter les problèmes de régression non linéaire. Nous privilégions ici leur intérêt pour la reconnaissance de formes (i.e. la découverte de caractéristiques communes dans un ensemble de données sans connaissance a priori du domaine). Dans ce contexte, l'acronyme SVM peut être judicieusement traduit par Séparateurs à Vaste Marge.