Le terme « intelligence artificielle » (IA) n'est pas clairement défini. Une définition est impossible simplement parce que le terme « intelligence » est ambigu.
Formé dans les années 1950, il est donc façonné par l'histoire et soumis à de nombreuses influences. Il reflète une vision et une vision globale. L'IA touche à plusieurs disciplines techniques et scientifiques et est souvent utilisée (y compris par nous) comme un terme marketing accrocheur.
Lorsqu'il est question d'IA dans les domaines des technologies de mesure ou du traitement d'images, il s'agit généralement d'apprentissage automatique (AA) ou d'apprentissage profond (AP). Ces termes se complètent comme suit :
Intelligence artificielle (IA) → Apprentissage automatique (ML) → Apprentissage profond (DL)
Bien que l'intelligence artificielle soit souvent qualifiée de tendance, il ne s'agit en aucun cas d'un phénomène nouveau. Dès les années 1950, les scientifiques partageaient la conviction que le processus de pensée ne se limite pas au cerveau humain. Après l'arrêt des recherches sur le sujet, notamment dans les années 80, des entreprises technologiques comme Google ont donné un nouvel essor au domaine dans les années 2000. Aujourd'hui, l'intelligence artificielle fait partie intégrante de notre vie quotidienne.
En traitement d'image, il existe essentiellement deux manières différentes de traiter un problème :
La meilleure approche dépend de l’application et doit être soigneusement évaluée ou déterminée systématiquement. Les approches basées sur des règles, notamment en technologie de mesure et en traitement d’images, sont bien adaptées pour prendre des décisions basées sur des caractéristiques et des règles de mesure claires. Si les règles ne sont pas connues ou ne peuvent être extraites systématiquement des images qu’au prix d’un grand effort, une méthode d’apprentissage automatique peut s’avérer une meilleure approche. Les méthodes d'apprentissage automatique sont généralement utilisées dans le traitement d'images pour des tâches de segmentation difficiles, dans la reconnaissance de caractères (OCR/OCV), la reconnaissance de formes et d'anomalies, la reconnaissance d'objets et d'images et la classification d'images. Dans les applications modernes, les deux approches sont généralement combinées judicieusement.
En gros, il existe 3 méthodes d'apprentissage différentes pour l'apprentissage automatique.
Les applications modernes de l’IA reposent presque exclusivement sur des réseaux de neurones artificiels profonds (ANN). La particularité des réseaux est qu'ils peuvent également effectuer des tâches complexes et que l'extraction manuelle de fonctionnalités peut être complètement éliminée. Un ANN est donc capable de réaliser de manière autonome des tâches complexes.
Les processus d'apprentissage profond sont basés sur des réseaux de neurones artificiels.
Ces réseaux s'inspirent des réseaux de neurones (biologiques), c'est-à-dire faisant partie d'un système nerveux. Les réseaux de neurones artificiels sont construits en couches. Une couche ou un niveau est constitué de plusieurs neurones artificiels. Il existe plusieurs niveaux cachés entre un niveau d'entrée et un niveau de sortie. La structure tire son nom de réseau neuronal « profond » en raison de ces couches cachées.
Les réseaux de neurones convolutifs (CNN) sont principalement utilisés dans le traitement d'images. Ces réseaux, inspirés du cortex visuel, sont constitués de plusieurs cartes de caractéristiques. Ces cartes de caractéristiques correspondent aux niveaux d'un réseau de neurones artificiels et sont générées par convolution. Les opérateurs de convolution produisent différentes caractéristiques/caractéristiques, telles que des arêtes. En traitement d'images, un CNN devrait être capable de généraliser des caractéristiques et de les représenter à des niveaux d'abstraction toujours plus élevés.
Source: LeCun, Yann et al. "L'apprentissage basé sur le gradient s'appliquait à la reconnaissance des documents." Actes de l'IEE 86.11 (1998): 2278-2324
Source: Lee, Honglak, et al. "L'apprentissage non supervisé des représentations hiérarchiques avec des réseaux de profondeur convolutionnels." Communications de l'ACM 54.10 (2011): 95-103.
MV.MINDNET, la plate-forme d'apprentissage en profondeur de MABRI.VISION, combine les dernières technologies et des solutions orientées vers la pratique.