Le terme « intelligence artificielle » (IA) n'est pas clairement défini. Une définition est impossible simplement parce que le terme « intelligence » est ambigu.
Formé dans les années 1950, il est donc façonné par l'histoire et soumis à de nombreuses influences. Il reflète une vision et une vision globale. L'IA touche à plusieurs disciplines techniques et scientifiques et est souvent utilisée (y compris par nous) comme un terme marketing accrocheur.
Lorsqu'il est question d'IA dans les domaines des technologies de mesure ou du traitement d'images, il s'agit généralement d'apprentissage automatique (AA) ou d'apprentissage profond (AP). Ces termes se complètent comme suit :
Intelligence artificielle (IA) → Apprentissage automatique (ML) → Apprentissage profond (DL)
Bien que l'intelligence artificielle soit souvent présentée comme une tendance, elle est loin d'être un phénomène nouveau. Dès les années 1950, des scientifiques partageaient la conviction que le processus de pensée ne se limitait pas au cerveau humain. Après une période de stagnation des recherches sur le sujet, notamment dans les années 1980, des entreprises technologiques comme Google ont insufflé un nouvel élan à ce domaine dans les années 2000. Aujourd'hui, l'intelligence artificielle fait partie intégrante de notre vie quotidienne.
En traitement d'images, il existe fondamentalement deux manières différentes d'aborder un problème :
Le choix de la meilleure approche dépend de l'application et doit être soigneusement évalué, voire déterminé de manière systématique. Les approches basées sur des règles sont particulièrement adaptées, notamment en métrologie et en traitement d'images, pour la prise de décisions fondées sur des caractéristiques et des règles de mesure claires. Si les règles sont inconnues ou ne peuvent être extraites des images qu'au prix d'efforts considérables, une méthode d'apprentissage automatique peut s'avérer plus appropriée. Les méthodes d'apprentissage automatique sont couramment utilisées en traitement d'images pour les tâches de segmentation complexes, la reconnaissance optique de caractères (OCR/OCV), la détection de formes et d'anomalies, la reconnaissance d'objets et d'images, ainsi que la classification d'images. Dans les applications modernes, les deux approches sont généralement combinées efficacement.
En termes généraux et simplifiés, il existe 3 méthodes d'apprentissage différentes pour l'apprentissage automatique.
Les applications d'IA modernes reposent presque exclusivement sur des réseaux de neurones artificiels profonds (RNA). La particularité de ces réseaux réside dans leur capacité à effectuer des tâches complexes, éliminant ainsi tout besoin d'extraction manuelle de caractéristiques. Un RNA est donc capable de réaliser des tâches complexes de manière autonome.
Les méthodes d'apprentissage profond reposent sur des réseaux de neurones artificiels. Ces réseaux s'inspirent des réseaux neuronaux biologiques, qui font partie du système nerveux.
Les réseaux de neurones artificiels sont structurés en couches. Chaque couche est composée de plusieurs neurones artificiels. Entre une couche d'entrée et une couche de sortie se trouvent plusieurs couches cachées. C'est en raison de ces couches cachées que la structure est qualifiée de « profonde ».
En traitement d'images, les réseaux de neurones convolutifs (CNN) sont les plus couramment utilisés. Inspirés du cortex visuel, ces réseaux sont constitués de multiples cartes de caractéristiques. Ces cartes correspondent aux couches d'un réseau de neurones artificiel et sont générées par convolution. Les opérateurs de convolution produisent différentes caractéristiques, telles que les contours. En traitement d'images, un CNN doit être capable de généraliser les caractéristiques et de les représenter à des niveaux d'abstraction de plus en plus élevés.
Source : LeCun, Yann, et al. « Apprentissage basé sur le gradient appliqué à la reconnaissance de documents. » Actes de l'IEEE 86.11 (1998) : 2278-2324
Source : Lee, Honglak, et al. « Apprentissage non supervisé de représentations hiérarchiques avec des réseaux de croyances profonds convolutionnels. » Communications of the ACM 54.10 (2011) : 95-103.
MV.MINDNET, la plateforme d'apprentissage profond de MABRI.VISION, combine technologie de pointe et solutions pratiques.