Termen artificiell intelligens (AI) är inte tydligt definierad. En definition misslyckas helt enkelt för att termen "intelligens" är tvetydig.
Termen "Artificiell intelligens" myntades på 1950-talet och är således historiskt formad och utsatt för många influenser. Termen återspeglar visionen och den "hela bilden". AI berör flera tekniska och vetenskapliga discipliner och används ofta (även av oss) som en catchy marknadsföringsterm.
När AI nämns inom mätteknik eller bildbehandling hänvisar det vanligtvis till maskininlärning (ML) eller djupinlärning (DL). Termerna bygger på varandra enligt följande:
Artificiell intelligens (AI) → Maskininlärning (ML) → Djupinlärning (DL)
Även om artificiell intelligens ofta kallas en trend, är det ingalunda ett nytt fenomen. Redan på 1950 -talet delade forskare tron att tankeprocessen inte är begränsad till den mänskliga hjärnan. Efter att forskningen om ämnet avstannat, särskilt på 80 -talet, gav teknikföretag som Google fältet en ny högkonjunktur på 2000 -talet. Idag är artificiell intelligens en integrerad del av vår vardag.
Inom bildbehandling finns det i princip två olika sätt att hantera ett problem:
Vilket tillvägagångssätt som är bättre beror på applikationen och måste noggrant utvärderas eller systematiskt bestämmas. Regelbaserade metoder, särskilt inom mätteknik och bildbehandling, är väl lämpade för att fatta beslut baserade på tydliga mätfunktioner och regler. Om reglerna inte är kända eller bara kan extraheras systematiskt från bilder med stor ansträngning kan en maskininlärningsprocess vara det bättre tillvägagångssättet. Maskininlärningsprocesser används vanligtvis vid bildbehandling för svåra segmenteringsuppgifter, vid teckenigenkänning (OCR / OCV), mönster- och avvikelseigenkänning, objekt- och bildigenkänning och bildklassificering. I moderna tillämpningar kombineras vanligtvis båda metoderna på ett meningsfullt sätt.
Grovt sett finns det tre olika inlärningsmetoder för maskininlärning.
Moderna AI -applikationer bygger nästan uteslutande på djupa artificiella neurala nätverk (ANN). Det speciella med nätverken är att de också kan utföra komplexa uppgifter och manuell extrahering av funktioner kan helt undvikas. Ett ANN kan därför självständigt utföra komplexa uppgifter.
Metoder för djupinlärning är baserade på artificiella neurala nätverk.
Dessa nätverk är inspirerade av de (biologiska) neurala nätverken, det vill säga en del av ett nervsystem. Artificiella neurala nätverk är byggda i lager. Ett lager eller nivå består av flera artificiella neuroner. Det finns flera dolda nivåer mellan en ingångs- och utgångsnivå. Strukturen får namnet "djupa" neurala nätverk på grund av dessa dolda nivåer.
Så kallade "convolutional neural networks" (CNN) används mest vid bildbehandling. Dessa nätverk, inspirerade av den visuella cortex, består av flera funktionskartor. Dessa funktionskartor motsvarar lagren i ett artificiellt neuralt nätverk och genereras av faltning. Konvolutionsoperatorerna producerar olika egenskaper/funktioner, såsom kanter. Inom bildbehandling bör en CNN kunna generalisera funktioner och representera dem i allt högre abstraktionsnivåer.
Källa: Lecun, Yann, et al. "Gradientbaserat lärande tillämpas för dokumentigenkänning." Proceedings of the IEE 86.11 (1998): 2278-2324
Källa: Lee, Honglak, et al. "Oövervakad inlärning av hierarkiska representationer med konvolutionella djupa lokaliserade nätverk." Kommunikation av ACM 54.10 (2011): 95-103.
MV.MINDNET, plattformen för djupinlärning från MABRI.VISION, kombinerar den senaste tekniken och praktikinriktade lösningar.