Termen artificiell intelligens (AI) är inte tydligt definierad. En definition misslyckas helt enkelt för att termen "intelligens" är tvetydig.
Termen "Artificiell intelligens" myntades på 1950-talet och är således historiskt formad och utsatt för många influenser. Termen återspeglar visionen och den "hela bilden". AI berör flera tekniska och vetenskapliga discipliner och används ofta (även av oss) som en catchy marknadsföringsterm.
När AI nämns inom mätteknik eller bildbehandling hänvisar det vanligtvis till maskininlärning (ML) eller djupinlärning (DL). Termerna bygger på varandra enligt följande:
Artificiell intelligens (AI) → Maskininlärning (ML) → Djupinlärning (DL)
Även om artificiell intelligens ofta beskrivs som en trend är det inte på något sätt ett nytt fenomen. Redan på 1950-talet delade forskare övertygelsen att tänkandet inte är begränsat till den mänskliga hjärnan. Efter att forskningen på ämnet stannade av, särskilt på 1980-talet, gav teknikföretag som Google ny fart till området på 2000-talet. Idag är artificiell intelligens en integrerad del av vår vardag.
Inom bildbehandling finns det i princip två olika sätt att åtgärda ett problem:
Vilken metod som är bäst beror på tillämpningen och måste noggrant bedömas eller systematiskt bestämmas. Regelbaserade metoder är väl lämpade, särskilt inom metrologi och bildbehandling, för att fatta beslut baserade på tydliga mätegenskaper och regler. Om reglerna är okända eller bara kan extraheras systematiskt från bilder med avsevärd ansträngning, kan en maskininlärningsmetod vara den bättre metoden. Maskininlärningsmetoder används vanligtvis inom bildbehandling för svåra segmenteringsuppgifter, optisk teckenigenkänning (OCR/OCV), mönster- och anomalidetektering, objekt- och bildigenkänning samt bildklassificering. I moderna tillämpningar kombineras vanligtvis båda metoderna effektivt.
I stora drag och förenklade termer finns det tre olika inlärningsmetoder för maskininlärning.
Moderna AI-applikationer är nästan uteslutande baserade på djupa artificiella neurala nätverk (ANN). Det speciella med dessa nätverk är deras förmåga att utföra komplexa uppgifter, vilket helt eliminerar behovet av manuell funktionsutvinning. Ett ANN kan därför självständigt utföra komplexa uppgifter.
Djupinlärningsmetoder är baserade på artificiella neurala nätverk. Dessa nätverk är inspirerade av (biologiska) neurala nätverk, som är en del av ett nervsystem.
Artificiella neurala nätverk är strukturerade i lager. Ett lager består av flera artificiella neuroner. Mellan ett ingångs- och ett utgångslager finns flera dolda lager. Strukturen har fått sitt namn "djupa" neurala nätverk på grund av dessa dolda lager.
Inom bildbehandling används oftast så kallade "faltningsneurala nätverk" (CNN). Inspirerade av den visuella cortex består dessa nätverk av flera funktionskartor. Dessa funktionskartor motsvarar lagren i ett artificiellt neuralt nätverk och genereras genom faltning. Faltningsoperatorerna producerar olika funktioner, såsom kanter. Inom bildbehandling bör ett CNN kunna generalisera funktioner och representera dem på allt högre abstraktionsnivåer.
Källa: LeCun, Yann, et al. ”Gradientbaserat lärande tillämpat på dokumentigenkänning.” Proceedings of the IEEE 86.11 (1998): 2278-2324
Källa: Lee, Honglak, et al. ”Oövervakad inlärning av hierarkiska representationer med faltningsbaserade djupa trosnätverk.” Communications of the ACM 54.10 (2011): 95-103.
MV.MINDNET, plattformen för djupinlärning från MABRI.VISION, kombinerar toppmodern teknik och praktiska lösningar.