Computer Vision ist ein Teil­be­reich der künst­li­chen In­tel­li­genz, der es Maschinen er­mög­licht, visuelle In­for­ma­tio­nen zu in­ter­pre­tie­ren. Die Tech­no­lo­gie hilft Computern dabei, Bilder und Videos zu ver­ar­bei­ten und zu „verstehen“. Dadurch lassen sich Prozesse au­to­ma­ti­sie­ren und präziser gestalten.

Was ist Computer Vision?

Computer Vision be­zeich­net ein For­schungs- und An­wen­dungs­feld der künst­li­chen In­tel­li­genz, das sich mit der au­to­ma­ti­schen Aus­wer­tung visueller Daten befasst. Ziel ist es, dass Computer Bilder und Videos nicht nur erfassen, sondern deren Inhalt ana­ly­sie­ren und in­ter­pre­tie­ren können. Dazu zählen das Erkennen von Objekten, Personen oder Mustern ebenso wie das Verstehen von Szenen. Computer Vision kom­bi­niert Methoden aus dem ma­schi­nel­len Lernen, der Bild­ver­ar­bei­tung und der Statistik. Besonders leis­tungs­fä­hig sind Verfahren des Deep Learnings, die mit neu­ro­na­len Netzen arbeiten. Diese Modelle werden mit großen Mengen an Bilddaten trainiert, um visuelle Merkmale zu­ver­läs­sig zu iden­ti­fi­zie­ren. Computer Vision bildet damit die tech­ni­sche Grundlage für viele pra­xis­re­le­van­te An­wen­dun­gen. Ohne diese Tech­no­lo­gie wären autonome Systeme oder in­tel­li­gen­te Bild­ana­ly­sen kaum rea­li­sier­bar.

KI-Lösungen
Mehr Digital-Power dank Künst­li­cher In­tel­li­genz
  • In Sekunden zur Online-Präsenz
  • Mehr Wachstum mit KI-Marketing
  • Zeit und Res­sour­cen sparen

Wie funk­tio­niert Computer Vision?

Computer Vision basiert darauf, visuelle Daten in eine für Maschinen ver­ständ­li­che Form zu über­füh­ren. Zunächst werden hierzu die Bilder oder Vi­deo­da­ten digital erfasst und in einzelne Pixel zerlegt. Diese Pixel enthalten In­for­ma­tio­nen über Farben, Hel­lig­keit und Kontraste. An­schlie­ßend ex­tra­hie­ren KI-Al­go­rith­men relevante Merkmale, also zum Beispiel Kanten, Formen oder Texturen.

Die meisten Systeme nutzen dafür neuronale Netze, ins­be­son­de­re Con­vo­lu­tio­nal Neural Networks (CNNs) kommen zum Einsatz. Diese Netze lernen während des Trainings, welche Bild­merk­ma­le für bestimmte Aufgaben relevant sind. Dafür werden große, meist an­no­tier­te Da­ten­sät­ze verwendet. Das Modell passt seine internen Ge­wich­tun­gen so lange an, bis es Objekte oder Muster zu­ver­läs­sig erkennt. Nach dem Training kann das System dann neue, un­be­kann­te Bilder ana­ly­sie­ren. Je nach Anwendung liefert es Er­geb­nis­se wie Klas­si­fi­ka­tio­nen, Po­si­ti­ons­an­ga­ben oder Wahr­schein­lich­kei­ten.

Die Qualität der Er­geb­nis­se hängt stark von der Da­ten­men­ge, der Da­ten­qua­li­tät und dem gewählten Modell ab. Darüber hinaus spielt die zugrunde liegende In­fra­struk­tur eine wichtige Rolle. Viele Computer-Vision-An­wen­dun­gen werden entweder in der Cloud oder direkt auf so­ge­nann­ten Edge-Geräten aus­ge­führt. Cloud-basierte Systeme bieten hohe Re­chen­leis­tung und eignen sich besonders für das Training komplexer Modelle oder die Analyse großer Da­ten­men­gen. Edge-AI hingegen ver­ar­bei­tet Bilddaten direkt am Ent­ste­hungs­ort, zum Beispiel auf Kameras, Smart­phones oder In­dus­trie­an­la­gen. Das reduziert Latenzen, spart Band­brei­te und erhöht den Da­ten­schutz.

Für welche Aufgaben eignet sich Computer Vision?

Computer Vision eignet sich für Aufgaben, bei denen visuelle In­for­ma­tio­nen au­to­ma­tisch aus­ge­wer­tet oder in­ter­pre­tiert werden sollen. Die Tech­no­lo­gie kann große Mengen an Bild- oder Vi­deo­da­ten in kurzer Zeit ana­ly­sie­ren. Sie arbeitet kon­sis­tent und er­mü­dungs­frei, was sie besonders für re­pe­ti­ti­ve Aufgaben zu einer echten Al­ter­na­ti­ve macht. Außerdem er­mög­licht sie Ent­schei­dun­gen in Echtzeit, wie sie bei si­cher­heits­kri­ti­schen An­wen­dun­gen relevant sind. Computer Vision kann sowohl struk­tu­rier­te als auch un­struk­tu­rier­te visuelle Daten ver­ar­bei­ten.

Typische Aufgaben von Computer Vision sind unter anderem:

  • Ob­jekt­er­ken­nung: Systeme erkennen und klas­si­fi­zie­ren Objekte in Bildern oder Videos, etwa Fahrzeuge, Personen oder Produkte. Zu­sätz­lich kann die Position der Objekte bestimmt werden, bei­spiels­wei­se durch Bounding Boxes.
  • Ge­sichts­er­ken­nung: Computer Vision iden­ti­fi­ziert oder ve­ri­fi­ziert Personen anhand ihrer Ge­sichts­zü­ge. Die Technik wird häufig für Zu­gangs­kon­trol­len oder Au­then­ti­fi­zie­rungs­ver­fah­ren ein­ge­setzt.
  • Bild­klas­si­fi­ka­ti­on: Bilder werden au­to­ma­tisch Ka­te­go­rien zu­ge­ord­net, etwa „defekt“ oder „intakt“. Diese Aufgabe ist besonders in der Qua­li­täts­kon­trol­le relevant.
  • Bild- und Instanz-Seg­men­tie­rung: Dabei werden Pixel maskiert, die zu einem Objekt bzw. einer Ob­jekt­klas­se gehören, z. B. für genaue Form- und Kon­tur­er­ken­nung.
  • Bewegungs- und Er­eig­nis­er­ken­nung: Auch Ver­än­de­run­gen in Vi­deo­streams werden erkannt, zum Beispiel un­ge­wöhn­li­che Be­we­gun­gen. Solche Systeme kommen oft in der Über­wa­chung oder Si­cher­heits­tech­nik zum Einsatz.
  • Tie­fen­schät­zung und 3D-Erkennung: Computer Vision arbeitet zunehmend mit 3D-Daten oder Stereo-Kameras, um Ob­jekt­po­si­tio­nen räumlich exakt zu bestimmen.
  • Tex­terken­nung (OCR): Ge­druck­ter oder hand­schrift­li­cher Text wird mit OCR aus Bildern ex­tra­hiert und in ma­schi­nen­les­ba­ren Text um­ge­wan­delt. Das er­leich­tert die Di­gi­ta­li­sie­rung von Do­ku­men­ten.

Wo kommt Computer Vision zum Einsatz?

Computer Vision wird in vielen Bereichen des Alltags und der Industrie ein­ge­setzt:

  • In der in­dus­tri­el­len Fertigung spielt die Tech­no­lo­gie eine wichtige Rolle, da sie Pro­duk­ti­ons­pro­zes­se überwacht und feh­ler­haf­te Bauteile au­to­ma­tisch erkennt.
  • Auch im me­di­zi­ni­schen Bereich ist Computer Vision fest etabliert: Sie un­ter­stützt Ärztinnen und Ärzte bei der Aus­wer­tung von Röntgen-, CT- oder MRT-Bildern und er­leich­tert so präzise Diagnosen.
  • Ein weiteres zentrales An­wen­dungs­feld sind autonome Fahrzeuge. Diese nutzen Computer Vision, um Fahr­spu­ren, Ver­kehrs­schil­der und andere Ver­kehrs­teil­neh­mer zu erkennen und sich sicher im Stra­ßen­ver­kehr zu bewegen.
  • Auch der Ein­zel­han­del pro­fi­tiert von der Tech­no­lo­gie, etwa durch au­to­ma­ti­sche Wa­ren­ana­ly­sen oder Systeme zur Dieb­stahler­ken­nung.
  • In der Logistik wiederum sorgt Computer Vision für eine ef­fi­zi­en­te Iden­ti­fi­ka­ti­on und Sor­tie­rung von Paketen und Sendungen.
  • Auch die Land­wirt­schaft setzt zunehmend auf visuelle KI, bei­spiels­wei­se zur früh­zei­ti­gen Erkennung von Pflan­zen­krank­hei­ten.
  • Ergänzend dazu verwenden Si­cher­heits­be­hör­den Computer Vision zur Analyse von Vi­deo­ma­te­ri­al in öf­fent­li­chen Räumen.
  • Im privaten Umfeld ist die Tech­no­lo­gie ebenfalls präsent: In Smart­phones er­mög­licht sie Features wie Ge­sichts­er­ken­nung oder au­to­ma­ti­sche Bild­op­ti­mie­rung.
  • Darüber hinaus bildet Computer Vision eine zentrale Grundlage für An­wen­dun­gen in ver­schie­de­nen Bereichen der Extended Reality wie bei­spiels­wei­se AR oder VR.
Zum Hauptmenü