Bei einem Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Network (GAN) handelt es sich um ein modernes Machine-Learning-Modell, das zwei neuronale Netzwerke verwendet, um rea­lis­ti­sche syn­the­ti­sche Daten zu erzeugen. Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Networks sind in der Lage, sowohl Bilder und Texte als auch Musik zu kreieren. Die Bereiche, in denen das Konzept Anwendung findet, reichen von der Bild- und Vi­deo­ge­ne­rie­rung über Kunst und Design bis hin zur Da­ten­aug­men­ta­ti­on.

Was bedeutet Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Network?

Ein Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Network – kurz GAN – ist ein Framework zur Erzeugung syn­the­ti­scher Daten aus dem Bereich Machine Learning, das vor allem für das Training von Netz­wer­ken im Bereich des un­über­wach­ten Lernens Ver­wen­dung findet. Das Lern­mo­dell setzt sich aus zwei künst­li­chen neu­ro­na­len Netz­wer­ken – dem Generator und dem Dis­kri­mi­na­tor – zusammen, die ge­gen­ein­an­der arbeiten:

  • Generator: Die Aufgabe des Ge­ne­ra­tors besteht darin, neue Da­ten­in­stan­zen zu erzeugen, die täuschend echt wirken, also dem ur­sprüng­li­chen Datensatz möglichst ähnlich sind. Das ge­ne­ra­ti­ve Neural Network startet mit einem zu­fäl­li­gen Rauschen und erzielt durch Training kon­ti­nu­ier­li­che Ver­bes­se­run­gen. Dabei lernt der Generator, von einem Vektor aus latenten Variablen auf den spe­zi­fi­schen Er­geb­nis­raum ab­zu­bil­den, also Er­geb­nis­se nach einer be­stimm­ten Ver­tei­lung zu ge­ne­rie­ren. Das letzt­li­che Ziel des ge­ne­ra­ti­ven Netzwerks besteht darin, künst­li­che Daten zu erzeugen, mit denen sich der Dis­kri­mi­na­tor täuschen lässt.
  • Dis­kri­mi­na­tor: Dieses Netzwerk wird mithilfe eines bekannten Da­ten­sat­zes darauf trainiert, echte von syn­the­ti­schen Daten zu un­ter­schei­den, bis es eine an­nehm­ba­re Ge­nau­ig­keit aufweist. An­schlie­ßend bewertet der Dis­kri­mi­na­tor die Au­then­ti­zi­tät der ihm an­ge­zeig­ten Da­ten­sät­ze. Das heißt, er legt für be­reit­ge­stell­te Da­ten­in­stan­zen fest, ob diese sich dem ur­sprüng­li­chen Datensatz zurechnen lassen oder eine Fälschung dar­stel­len.

Das Training der kon­kur­rie­ren­den Netzwerke erfolgt simultan. Der Generator tritt so lange gegen den Dis­kri­mi­na­tor an, bis er Daten erzeugt, die letzterer nicht mehr als Fälschung erkennt. Durch eine Feh­ler­rück­füh­rung (Back­pro­pa­ga­ti­on) werden die Gewichte der beiden Netzwerke in jedem Trai­nings­schritt optimiert. Mit dieser Vor­ge­hens­wei­se ver­bes­sern sich die beiden neu­ro­na­len Netzwerke konstant ge­gen­sei­tig, wodurch sich die erzeugte Ver­tei­lung bei aus­rei­chen­der Trai­nings­zeit an die echte angleicht. Nachdem das Training ab­ge­schlos­sen ist, lässt sich der Generator zur Erzeugung rea­lis­tisch wirkender künst­li­cher Daten nutzen.

Hinweis

Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Networks wurden zunächst aus­schließ­lich als Modell für Un­su­per­vi­sed Learning genutzt, haben sich jedoch mitt­ler­wei­le ebenso für Semi-su­per­vi­sed Learning, Su­per­vi­sed Learning und Rein­force­ment Learning bewährt.

GANs im Vergleich zu anderen Machine-Learning-Modellen

Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Networks (GANs) un­ter­schei­den sich in mehreren Aspekten von anderen Methoden des ma­schi­nel­len Lernens. GANs fungieren als implizite ge­ne­ra­ti­ve Modelle, was bedeutet, dass sie weder eine direkte Plau­si­bi­li­täts­funk­ti­on (Li­keli­hood-Funktion) mo­del­lie­ren noch Mittel zum Auffinden der latenten Variable zur Verfügung stellen. Statt­des­sen erzeugen Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Networks neue Da­ten­in­stan­zen durch den Wett­be­werb zwischen den beiden kon­kur­rie­ren­den Netz­wer­ken.

Im Gegensatz zu anderen Ansätzen – die Daten schritt­wei­se ge­ne­rie­ren – gelingt es GANs, eine voll­stän­di­ge Stich­pro­be in nur einem Durchgang zu erzeugen. Außerdem gibt es in Bezug auf die Art der vom Netzwerk ver­wen­de­ten Funktion keine Re­strik­tio­nen.

KI-Lösungen
Mehr Digital-Power dank Künst­li­cher In­tel­li­genz
  • In Sekunden zur Online-Präsenz
  • Mehr Wachstum mit KI-Marketing
  • Zeit und Res­sour­cen sparen

Der Trai­nings­ab­lauf: Wie funk­tio­nie­ren Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Networks?

Der Trai­nings­pro­zess für Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Networks setzt sich aus mehreren Schritten zusammen. Die nach­fol­gen­de Übersicht ver­an­schau­licht, wie das Training von GANs im Detail abläuft:

  1. In­itia­li­sie­rung: Zunächst werden die zwei neu­ro­na­len Netze – Generator sowie Dis­kri­mi­na­tor – erstellt und mit zu­fäl­li­gen Pa­ra­me­tern in­itia­li­siert.
  2. Erzeugung von Fake-Daten: Der Generator erhält als Eingabe einen Zu­falls­vek­tor, den er nutzt, um syn­the­ti­sche Daten zu erzeugen. Aufgrund fehlenden Trainings sieht die Ausgabe zu Beginn wie ein Rauschen aus.
  3. Bewertung durch Dis­kri­mi­na­tor: Der Dis­kri­mi­na­tor bekommt sowohl echte Da­ten­pro­ben als auch vom Generator erzeugte Da­ten­sät­ze. Seine Aufgabe ist es, echte von ge­fälsch­ten Daten zu un­ter­schei­den. Al­ler­dings muss auch der Dis­kri­mi­na­tor erst trainiert werden, um präzise zu arbeiten. Das heißt: Dieses Netzwerk startet ebenfalls mit einer ungenauen Ausgabe.
  4. Feedback und Ak­tua­li­sie­rung der Gewichte: Die Parameter beider Netzwerke werden durch Back­pro­pa­ga­ti­on angepasst. Während der Generator lernt, rea­lis­ti­sche­re Daten zu erzeugen, ver­bes­sert der Dis­kri­mi­na­tor seine Fähigkeit, echte von künst­li­chen Da­ten­in­stan­zen zu un­ter­schei­den.
  5. Iteration: Das Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Network wie­der­holt die Schritte 2, 3 und 4, bis der Generator so rea­lis­ti­sche Daten erzeugt, dass der Dis­kri­mi­na­tor diese nicht mehr zu­ver­läs­sig als syn­the­tisch erkennt oder bis das Modell die ge­wünsch­te Qualität erreicht hat.

An­wen­dungs­ge­bie­te: In welchen Bereichen werden GANs ein­ge­setzt?

Die im Segment künst­li­che In­tel­li­genz an­ge­sie­del­ten Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Networks werden bereits in ver­schie­de­nen Branchen er­folg­reich ein­ge­setzt. Als zentrale An­wen­dungs­ge­bie­te gelten:

  • Bild- und Vi­deo­ge­ne­rie­rung: Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Networks werden vor allem in der Film­pro­duk­ti­on und bei der Ent­wick­lung von Games genutzt, um hoch­rea­lis­ti­sche Bilder und Vi­deo­se­quen­zen zu kreieren. Diese Fähigkeit er­mög­licht es Un­ter­neh­men ebenso, ihre Produkte und Dienst­leis­tun­gen – etwa Schuhe oder Klei­dungs­stü­cke – besser zu vi­sua­li­sie­ren. GANs kommen außerdem bei der Er­stel­lung vir­tu­el­ler Um­ge­bun­gen zum Einsatz.
  • Medizin: Im Bereich der me­di­zi­ni­schen Bild­ge­bung werden GANs sowohl zur Schulung von Ärztinnen und Ärzten als auch zur Ver­bes­se­rung von Dia­gno­se­ver­fah­ren ein­ge­setzt. Aufgrund der Wahrung der Pri­vat­sphä­re gestaltet es sich für For­schen­de zudem oftmals schwierig, an me­di­zi­ni­sche Bilder für For­schungs­zwe­cke zu gelangen. Mitt­ler­wei­le werden Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Networks genutzt, um diesem Problem ent­ge­gen­zu­tre­ten.
  • Data Aug­men­ta­ti­on: Das Framework lässt sich verwenden, um zu­sätz­li­che Trai­nings­da­ten für Machine-Learning-Modelle be­reit­zu­stel­len. Dieser Umstand erweist sich vor allem in Si­tua­tio­nen als praktisch, in denen nur wenige reale Beispiele exis­tie­ren.
  • Sprach­er­ken­nung und -synthese: GANs finden zur Erzeugung na­tür­li­cher Sprache und zur Op­ti­mie­rung von Sprach­syn­the­se­sys­te­men Ver­wen­dung. Anders als kon­ven­tio­nel­le Audio- und Sprach­im­ple­men­tie­run­gen sind Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Networks dazu in der Lage, neue Samples zu ge­ne­rie­ren.
  • Wis­sen­schaft: Im wis­sen­schaft­li­chen Kontext leisten Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Networks ebenfalls wichtige Un­ter­stüt­zung. Mithilfe von GANs lassen sich unter anderem Ge­schwin­dig­keits- und Ska­lar­fel­der in tur­bu­len­ten Strö­mun­gen re­kon­stru­ie­ren. Das Framework wurde aber bei­spiels­wei­se auch schon dazu ein­ge­setzt, neue Moleküle für zahl­rei­che Pro­te­in­zie­le zu ge­ne­rie­ren, die in Zu­sam­men­hang mit Ent­zün­dun­gen, Krebs und Fibrose stehen.
  • Kunst und Design: Kunst­schaf­fen­de und De­si­gne­rin­nen be­zie­hungs­wei­se Designer greifen auf GAN-Ar­chi­tek­tu­ren zurück, um in­no­va­ti­ve Kunst­wer­ke und Designs zu er­schaf­fen.
IONOS AI Model Hub
Erste deutsche, mul­ti­mo­da­le KI-Plattform
  • 100 % DSGVO-konform und sicher in Deutsch­land gehostet
  • Die leis­tungs­stärks­ten KI-Modelle auf einer Plattform
  • Kein Vendor Lock-in durch Open Source

Vor- und Nachteile von Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Networks

Hin­sicht­lich der Ge­ne­rie­rung rea­lis­ti­scher künst­li­cher Daten eröffnen Ge­ne­ra­ti­ve Ad­ver­sa­ri­al Networks be­ein­dru­cken­de Mög­lich­kei­ten – ins­be­son­de­re in den Bereichen Bild- und Vi­deoer­zeu­gung. Ein großer Vorteil ist ihre Fähigkeit, ohne explizite Wahr­schein­lich­keits­mo­del­le qua­li­ta­tiv hoch­wer­ti­ge Daten zu erzeugen, was GANs von vielen anderen ge­ne­ra­ti­ven Lern­mo­del­len un­ter­schei­det. Darüber hinaus lässt sich eine Vielzahl von Funk­tio­nen in das Modell in­te­grie­ren, was eine breite Palette an An­wen­dungs­sze­na­ri­en er­mög­licht.

Als zentrales Problem gilt hingegen die Sta­bi­li­tät des Trai­nings­pro­zes­ses. Während des Trainings besteht das Risiko, dass es zu einem so­ge­nann­ten Mo­dus­kol­laps kommt. Ein solcher hat zur Folge, dass der Generator nur noch eine begrenzte Vielfalt an Daten pro­du­ziert. Das Problem tritt vor allem dann auf, wenn der Generator zu häufig trainiert wird, ohne dass eine Ak­tua­li­sie­rung des Dis­kri­mi­na­tors vor­ge­nom­men wird. Darüber hinaus besteht die Gefahr, dass GANs für un­heil­vol­le Zwecke miss­braucht werden – etwa zur Erzeugung echt wirkender Deepfakes, um Des­in­for­ma­tio­nen zu säen oder für Iden­ti­täts­dieb­stäh­le.

Vorteile Nachteile
Qua­li­ta­tiv hoch­wer­ti­ge Daten In­sta­bi­ler Trai­nings­pro­zess
Flexibles Modell Auch für Deepfakes und Co. in­ter­es­sant
Für viele An­wen­dungs­sze­na­ri­en geeignet
Zum Hauptmenü