Generative Adversarial Network einfach erklärt

Bei einem Generative Adversarial Network (GAN) handelt es sich um ein modernes Machine-Learning-Modell, das zwei neuronale Netzwerke verwendet, um realistische synthetische Daten zu erzeugen. Generative Adversarial Networks sind in der Lage, sowohl Bilder und Texte als auch Musik zu kreieren. Die Bereiche, in denen das Konzept Anwendung findet, reichen von der Bild- und Videogenerierung über Kunst und Design bis hin zur Datenaugmentation.

Was bedeutet Generative Adversarial Network?

Ein Generative Adversarial Network – kurz GAN – ist ein Framework zur Erzeugung synthetischer Daten aus dem Bereich Machine Learning, das vor allem für das Training von Netzwerken im Bereich des unüberwachten Lernens Verwendung findet. Das Lernmodell setzt sich aus zwei künstlichen neuronalen Netzwerken – dem Generator und dem Diskriminator – zusammen, die gegeneinander arbeiten:
  • Generator: Die Aufgabe des Generators besteht darin, neue Dateninstanzen zu erzeugen, die täuschend echt wirken, also dem ursprünglichen Datensatz möglichst ähnlich sind. Das generative Neural Network startet mit einem zufälligen Rauschen und erzielt durch Training kontinuierliche Verbesserungen. Dabei lernt der Generator, von einem Vektor aus latenten Variablen auf den spezifischen Ergebnisraum abzubilden, also Ergebnisse nach einer bestimmten Verteilung zu generieren. Das letztliche Ziel des generativen Netzwerks besteht darin, künstliche Daten zu erzeugen, mit denen sich der Diskriminator täuschen lässt.
  • Diskriminator: Dieses Netzwerk wird mithilfe eines bekannten Datensatzes darauf trainiert, echte von synthetischen Daten zu unterscheiden, bis es eine annehmbare Genauigkeit aufweist. Anschließend bewertet der Diskriminator die Authentizität der ihm angezeigten Datensätze. Das heißt, er legt für bereitgestellte Dateninstanzen fest, ob diese sich dem ursprünglichen Datensatz zurechnen lassen oder eine Fälschung darstellen.
Das Training der konkurrierenden Netzwerke erfolgt simultan. Der Generator tritt so lange gegen den Diskriminator an, bis er Daten erzeugt, die letzterer nicht mehr als Fälschung erkennt. Durch eine Fehlerrückführung (Backpropagation) werden die Gewichte der beiden Netzwerke in jedem Trainingsschritt optimiert. Mit dieser Vorgehensweise verbessern sich die beiden neuronalen Netzwerke konstant gegenseitig, wodurch sich die erzeugte Verteilung bei ausreichender Trainingszeit an die echte angleicht. Nachdem das Training abgeschlossen ist, lässt sich der Generator zur Erzeugung realistisch wirkender künstlicher Daten nutzen.
Hinweis
Generative Adversarial Networks wurden zunächst ausschließlich als Modell für Unsupervised Learning genutzt, haben sich jedoch mittlerweile ebenso für Semi-supervised Learning, Supervised Learning und Reinforcement Learning bewährt.

GANs im Vergleich zu anderen Machine-Learning-Modellen

Generative Adversarial Networks (GANs) unterscheiden sich in mehreren Aspekten von anderen Methoden des maschinellen Lernens. GANs fungieren als implizite generative Modelle, was bedeutet, dass sie weder eine direkte Plausibilitätsfunktion (Likelihood-Funktion) modellieren noch Mittel zum Auffinden der latenten Variable zur Verfügung stellen. Stattdessen erzeugen Generative Adversarial Networks neue Dateninstanzen durch den Wettbewerb zwischen den beiden konkurrierenden Netzwerken.
Im Gegensatz zu anderen Ansätzen – die Daten schrittweise generieren – gelingt es GANs, eine vollständige Stichprobe in nur einem Durchgang zu erzeugen. Außerdem gibt es in Bezug auf die Art der vom Netzwerk verwendeten Funktion keine Restriktionen.
KI-Lösungen
Mehr Digital-Power dank Künstlicher Intelligenz
  • In Sekunden zur Online-Präsenz
  • Mehr Wachstum mit KI-Marketing
  • Zeit und Ressourcen sparen

Der Trainingsablauf: Wie funktionieren Generative Adversarial Networks?

Der Trainingsprozess für Generative Adversarial Networks setzt sich aus mehreren Schritten zusammen. Die nachfolgende Übersicht veranschaulicht, wie das Training von GANs im Detail abläuft:
  1. Initialisierung: Zunächst werden die zwei neuronalen Netze – Generator sowie Diskriminator – erstellt und mit zufälligen Parametern initialisiert.
  2. Erzeugung von Fake-Daten: Der Generator erhält als Eingabe einen Zufallsvektor, den er nutzt, um synthetische Daten zu erzeugen. Aufgrund fehlenden Trainings sieht die Ausgabe zu Beginn wie ein Rauschen aus.
  3. Bewertung durch Diskriminator: Der Diskriminator bekommt sowohl echte Datenproben als auch vom Generator erzeugte Datensätze. Seine Aufgabe ist es, echte von gefälschten Daten zu unterscheiden. Allerdings muss auch der Diskriminator erst trainiert werden, um präzise zu arbeiten. Das heißt: Dieses Netzwerk startet ebenfalls mit einer ungenauen Ausgabe.
  4. Feedback und Aktualisierung der Gewichte: Die Parameter beider Netzwerke werden durch Backpropagation angepasst. Während der Generator lernt, realistischere Daten zu erzeugen, verbessert der Diskriminator seine Fähigkeit, echte von künstlichen Dateninstanzen zu unterscheiden.
  5. Iteration: Das Generative Adversarial Network wiederholt die Schritte 2, 3 und 4, bis der Generator so realistische Daten erzeugt, dass der Diskriminator diese nicht mehr zuverlässig als synthetisch erkennt oder bis das Modell die gewünschte Qualität erreicht hat.

Anwendungsgebiete: In welchen Bereichen werden GANs eingesetzt?

Die im Segment künstliche Intelligenz angesiedelten Generative Adversarial Networks werden bereits in verschiedenen Branchen erfolgreich eingesetzt. Als zentrale Anwendungsgebiete gelten:
  • Bild- und Videogenerierung: Generative Adversarial Networks werden vor allem in der Filmproduktion und bei der Entwicklung von Games genutzt, um hochrealistische Bilder und Videosequenzen zu kreieren. Diese Fähigkeit ermöglicht es Unternehmen ebenso, ihre Produkte und Dienstleistungen – etwa Schuhe oder Kleidungsstücke – besser zu visualisieren. GANs kommen außerdem bei der Erstellung virtueller Umgebungen zum Einsatz.
  • Medizin: Im Bereich der medizinischen Bildgebung werden GANs sowohl zur Schulung von Ärztinnen und Ärzten als auch zur Verbesserung von Diagnoseverfahren eingesetzt. Aufgrund der Wahrung der Privatsphäre gestaltet es sich für Forschende zudem oftmals schwierig, an medizinische Bilder für Forschungszwecke zu gelangen. Mittlerweile werden Generative Adversarial Networks genutzt, um diesem Problem entgegenzutreten.
  • Data Augmentation: Das Framework lässt sich verwenden, um zusätzliche Trainingsdaten für Machine-Learning-Modelle bereitzustellen. Dieser Umstand erweist sich vor allem in Situationen als praktisch, in denen nur wenige reale Beispiele existieren.
  • Spracherkennung und -synthese: GANs finden zur Erzeugung natürlicher Sprache und zur Optimierung von Sprachsynthesesystemen Verwendung. Anders als konventionelle Audio- und Sprachimplementierungen sind Generative Adversarial Networks dazu in der Lage, neue Samples zu generieren.
  • Wissenschaft: Im wissenschaftlichen Kontext leisten Generative Adversarial Networks ebenfalls wichtige Unterstützung. Mithilfe von GANs lassen sich unter anderem Geschwindigkeits- und Skalarfelder in turbulenten Strömungen rekonstruieren. Das Framework wurde aber beispielsweise auch schon dazu eingesetzt, neue Moleküle für zahlreiche Proteinziele zu generieren, die in Zusammenhang mit Entzündungen, Krebs und Fibrose stehen.
  • Kunst und Design: Kunstschaffende und Designerinnen beziehungsweise Designer greifen auf GAN-Architekturen zurück, um innovative Kunstwerke und Designs zu erschaffen.

Vor- und Nachteile von Generative Adversarial Networks

Hinsichtlich der Generierung realistischer künstlicher Daten eröffnen Generative Adversarial Networks beeindruckende Möglichkeiten – insbesondere in den Bereichen Bild- und Videoerzeugung. Ein großer Vorteil ist ihre Fähigkeit, ohne explizite Wahrscheinlichkeitsmodelle qualitativ hochwertige Daten zu erzeugen, was GANs von vielen anderen generativen Lernmodellen unterscheidet. Darüber hinaus lässt sich eine Vielzahl von Funktionen in das Modell integrieren, was eine breite Palette an Anwendungsszenarien ermöglicht.
Als zentrales Problem gilt hingegen die Stabilität des Trainingsprozesses. Während des Trainings besteht das Risiko, dass es zu einem sogenannten Moduskollaps kommt. Ein solcher hat zur Folge, dass der Generator nur noch eine begrenzte Vielfalt an Daten produziert. Das Problem tritt vor allem dann auf, wenn der Generator zu häufig trainiert wird, ohne dass eine Aktualisierung des Diskriminators vorgenommen wird. Darüber hinaus besteht die Gefahr, dass GANs für unheilvolle Zwecke missbraucht werden – etwa zur Erzeugung echt wirkender Deepfakes, um Desinformationen zu säen oder für Identitätsdiebstähle.
Vorteile Nachteile
Qualitativ hochwertige Daten Instabiler Trainingsprozess
Flexibles Modell Auch für Deepfakes und Co. interessant
Für viele Anwendungsszenarien geeignet
War dieser Artikel hilfreich?
Page top