KOMPETENZEN
KI VISION
Was bedeutet künstliche Intelligenz?
Historischer Verlauf
Obwohl die Künstliche Intelligenz oftmals als Trend bezeichnet wird, ist sie durchaus kein neues Phänomen. Bereits in den 50er Jahren teilten Wissenschaftler die Überzeugung, dass der Prozess des Denkens sich nicht auf das menschliche Gehirn beschränkt. Nachdem die Forschung zu dem Thema besonders in den 80er Jahren stockte, kam durch Technologie Unternehmen wie Google in den 2000er Jahren neuer Aufschwung in den Bereich. Heute ist die Künstliche Intelligenz ein fester Bestandteil unseres Alltags.
Was bedeutet maschinelles Lernen (ML)?
In der Bildverarbeitung gibt es grundsätzlich zwei verschiedene Möglichkeiten ein Problem zu bearbeiten:
Regelbasierte Programmierung
- Manuelles formulieren und programmieren von Regeln nachdem die Ergebnisse berechnet oder definiert werden
Maschinelles Lernen
- Trainieren eines Modells mit Daten
- Eigenständiges Lernen von Mustern aus den Daten
- Klassifizieren oder Schätzen von Ergebnisgrößen
Welcher Ansatz der bessere ist hängt von der Applikation ab und muss sorgfältig abgeschätzt oder systematisch ermittelt werden. Regelbasierte Ansätze sind, insbesondere in der Messtechnik und Bildverarbeitung, gut geeignet um Entscheidungen aufgrund von klaren Messmerkmalen und Regeln zu treffen. Wenn die Regeln nicht bekannt sind oder nur mit hohem Aufwand systematisch aus Bildern extrahiert werden können, kann ein maschinelles Lernverfahren der bessere Ansatz sein. Maschinelle Lernverfahren kommen in der Bildverarbeitung typischerweise für schwierige Segmentierungs-Aufgaben, in der Schrifterkennung (OCR / OCV), Muster- und Anomalieerkennung, Objekt- und Bilderkennung sowie Bildklassifizierung zum Einsatz. In modernen Applikationen werden meist beide Ansätze sinnvoll miteinander kombiniert.
Lernverfahren für das maschinelle Lernen (ML)
Grob und vereinfacht dargestellt gibt es für das maschinelle Lernen 3 verschiedene Lernverfahren.
Deep-Learning vs. Maschinelles Lernen
Moderne KI-Applikationen basieren fast ausschließlich auf tiefen künstlichen neuronalen Netzen (KNN). Das besondere an den Netzwerken ist, dass diese auch komplexe Aufgaben erfüllen können und eine manuelle Merkmalsextraktion vollständig entfallen kann. Ein KNN ist demnach in der Lage, eigenständig komplexe Aufgaben zu erfüllen.
- Deep Learning ist ein Teilgebiet des maschinellen Lernen
- DL-Verfahren basieren auf künstlichen neuronalen Netzen mit mehreren Zwischenschichten
Künstliche neuronale Netze (KNN)
Deep-Learning Verfahren basieren auf künstlichen neuronalen Netzen. Diese Netze sind inspiriert von den (biologischen) neuronalen Netzen, also Teil eines Nervensystems.
Künstliche neuronale Netze sind in Schichten aufgebaut. Eine Schicht bzw. Ebene besteht aus mehreren künstlichen Neuronen. Zwischen einer Eingangs- und Ausgangsebene befinden sich mehrere verdeckte Ebenen. Den Namen „tiefes“ neuronales Netz erhält die Struktur aufgrund dieser verdeckten Ebenen.
Faltende neuronale Netze (Convolutional Neural Network - CNN)
In der Bildverarbeitung werden meistens sogenannte „faltende neuronalen Netze“ (engl. convolutional neuronal network – CNN) verwendet. Diese Netze, inspiriert vom visuellem Cortex, besehen aus mehreren Merkmalskarten. Diese Merkmalskarten entsprechen den Ebenen eines künstlichen neuronalen Netzes und werden durch Faltung (convolution) erzeugt. Durch die Faltungsoperatoren werden unterschiedliche Merkmale/Features, wie z.B. Kanten, hervorgeben. In der Bildverarbeitung sollte ein CNN in der Lage sein Merkmale zu generalisieren und diese in immer höheren Abstraktionsgeraden darzustellen.
Quelle: LeCun, Yann, et al. “Gradient-based learning applied to document recognition.” Proceedings of the IEEE 86.11 (1998): 2278-2324
Quelle: Lee, Honglak, et al. “Unsupervised learning of hierarchical representations with convolutional deep belief networks.” Communications of the ACM 54.10 (2011): 95-103.
MV.MINDNET, die Deep Learning Plattform von MABRI.VISION vereint aktuellste Technologie und praxisorientierte Lösungen.