Beim „Su­per­vi­sed Learning“ wird ein KI-Modell anhand von ge­kenn­zeich­ne­ten Daten trainiert, Vor­her­sa­gen oder Klas­si­fi­zie­run­gen für neue, un­be­kann­te Daten zu treffen. Lesen Sie weiter, um mehr über Su­per­vi­sed Learning zu erfahren.

Su­per­vi­sed Learning im Überblick

Beim Machine Learning geht es darum, dass Computer Muster erkennen und Regeln erlernen. Statt nur auf die Eingabe eines mensch­li­chen Nutzenden reagieren zu können, sollen Maschinen so in der Lage sein, selbst­stän­dig Ent­schei­dun­gen zu treffen – basierend auf den Regeln, die sie gelernt haben. So können Al­go­rith­men bei­spiels­wei­se lernen, Spam korrekt zu erkennen, oder einen Bild­in­halt verstehen. Für das Anlernen verwenden Ent­wi­ckeln­de ver­schie­de­ne Methoden. Wahr­schein­lich am häu­figs­ten im Einsatz ist Su­per­vi­sed Learning, also das über­wach­te Lernen.

Beim Su­per­vi­sed Machine Learning stellen Ent­wi­ckeln­de den Al­go­rith­men ein vor­be­rei­te­tes Set an Daten als Trai­nings­quel­le zur Verfügung. Das Ergebnis ist somit bereits bekannt. Die Aufgabe der Al­go­rith­men liegt nur darin, das Muster zu erkennen: Warum gehört diese In­for­ma­ti­on in Kategorie A und nicht in Kategorie B?

Über­wach­tes Lernen wird also für solche Al­go­rith­men ein­ge­setzt, die na­tür­li­che Daten (Fotos, Hand­schrif­ten, Sprache usw.) ka­te­go­ri­sie­ren sollen. Zudem sind auch so­ge­nann­te Re­gres­si­ons­pro­ble­me ein typisches An­wen­dungs­feld für Su­per­vi­sed Learning. Hierbei sollen die Al­go­rith­men Vor­her­sa­gen treffen können, bei­spiels­wei­se über Preis­ent­wick­lun­gen oder Kun­den­wachs­tum.

Eine Mischform stellt Semi-su­per­vi­sed Learning dar. Bei dieser Lern­me­tho­de wird nur ein Teil des Da­ten­sat­zes mit Labeln versehen. Der Rest bleibt un­ka­te­go­ri­siert und soll von den Al­go­rith­men selbst­stän­dig zu­ge­ord­net werden. Ein Beispiel hierfür findet man bei der Ge­sichts­er­ken­nung von Facebook. Es reicht aus, ein paar Bilder mit den Namen von Freunden zu versehen. Die rest­li­chen findet der Al­go­rith­mus dann von allein.

Über­wach­tes Lernen anhand eines Beispiels erklärt

Nehmen wir bei­spiel­haft an, man würde Al­go­rith­men trai­nie­ren wollen, Kat­zen­bil­der von Hun­de­bil­dern zu un­ter­schei­den. Die Ent­wi­ckeln­den würden dafür dann ein sehr großes Datenset vor­be­rei­ten. Dieses enthielte Bilder, die alle bereits ein Label besitzen, also einer Kategorie angehören. Man könnte sich hierbei drei ver­schie­de Gruppen vor­stel­len: Hund, Katze, Sonstiges. Wichtig ist, dass die Da­ten­samm­lung auch eine möglichst große Varianz aufweist. Einfach ge­spro­chen: Hat man nur Bilder von schwarzen Katzen in seinem Trai­nings­set, wird der Al­go­rith­mus davon ausgehen, dass alle Katzen ein schwarzes Fell besitzen. Das Datenset sollte die tat­säch­li­che Band­brei­te an Va­ria­tio­nen also möglichst gut abbilden.

Beim Training erhält der Al­go­rith­mus zunächst die Inhalte (und zwar un­sor­tiert), trifft selbst­stän­dig eine Ent­schei­dung und ver­gleicht diese dann mit dem von den Ent­wi­ckeln­den vor­ge­ge­be­nen Output. Das System überprüft sein eigenes Ergebnis mit dem korrekten – und zieht daraus Schlüsse, die sich auf die nächsten Be­ur­tei­lun­gen während des Trainings auswirken. Das Training läuft so lange, bis die Maschine mit seinen Be­ur­tei­lun­gen nah genug an die korrekten Er­geb­nis­se her­an­ge­kom­men ist.

4qVRBYAdLAo.jpg Zur Anzeige dieses Videos sind Cookies von Dritt­an­bie­tern er­for­der­lich. Ihre Cookie-Ein­stel­lun­gen können Sie hier aufrufen und ändern.

Vor- und Nachteile von Su­per­vi­sed Machine Learning

Für welchen Lehr­me­tho­de man sich ent­schei­den sollte, hängt stark von den späteren Aufgaben der Al­go­rith­men ab. Für Ka­te­go­ri­sie­rungs- und Re­gres­si­ons­pro­ble­me ist Su­per­vi­sed Learning den anderen Methoden vor­zu­zie­hen. Generell kann man mit dem über­wach­ten Lernen Al­go­rith­men so trai­nie­ren, dass diese perfekt für das Ein­satz­ge­biet vor­be­rei­tet sind. Da man die komplette Kontrolle über das Trai­nings­ma­te­ri­al behält, braucht man nur genügend Input und Zeit, um die Al­go­rith­men richtig ein­zu­stel­len. Die Betonung liegt hier klar auf Input: Die Zu­sam­men­stel­lung muss groß­flä­chig angelegt sein. Da beim über­wach­ten Lernen jedes Element auch mit einem Etikett versehen sein muss, ist hier ein er­heb­li­cher Aufwand für Ent­wi­ckeln­de gegeben.

Der Aufwand ist zwar relativ hoch, dafür kann man aber auch relativ einfach nach­voll­zie­hen, was vorgeht. Während beim Un­su­per­vi­sed Learning vieles unklar bleibt, weil die Al­go­rith­men ohne wirkliche An­wei­sun­gen für sich arbeiten, ist beim Su­per­vi­sed Learning genau fest­ge­legt, was die Maschine tut. Aber auch das kann wieder ein Nachteil sein: Die an­ge­lern­ten Al­go­rith­men arbeiten dann auch innerhalb der Re­strik­tio­nen, die man ihnen auferlegt hat. Kreative Lö­sungs­an­sät­ze kann man so nicht erwarten.

KI-Lösungen
Mehr Digital-Power dank Künst­li­cher In­tel­li­genz
  • In Sekunden zur Online-Präsenz
  • Mehr Wachstum mit KI-Marketing
  • Zeit und Res­sour­cen sparen

Un­ter­schie­de zu Un­su­per­vi­sed Learning und Semi-su­per­vi­sed Learning

Neben dem Su­per­vi­sed Learning gibt es auch noch Un­su­per­vi­sed Learning und Semi-su­per­vi­sed Learning. Im Folgenden gehen wir jeweils auf die Un­ter­schie­de zwischen diesen beiden Lern­ver­fah­ren und Su­per­vi­sed Learning ein.

Su­per­vi­sed Learning vs. Un­su­per­vi­sed Learning

Während Su­per­vi­sed Learning Da­ten­sät­ze verwendet, bei denen sowohl die Eingaben als auch die zu­ge­hö­ri­gen Ausgaben bekannt sind, sind beim Un­su­per­vi­sed Learning nur die Eingaben bekannt. Dem­entspre­chend zielt Un­su­per­vi­sed Learning im Gegensatz zu Su­per­vi­sed Learning darauf ab, un­be­kann­te Muster oder Struk­tu­ren in den Daten zu entdecken. Daher eignet sich Un­su­per­vi­sed Learning auch für andere Arten von Aufgaben als Su­per­vi­sed Learning, zum Beispiel fürs Clus­te­ring (Grup­pie­rung von Da­ten­punk­ten, ohne sie in Ka­te­go­rien ein­zu­sor­tie­ren).

Da die Ausgaben des Trai­nings­sets beim Un­su­per­vi­sed Learning nicht ge­kenn­zeich­net sind, entsteht für die Ent­wi­ckeln­den ein viel kleinerer Aufwand als beim Su­per­vi­sed Learning – al­ler­dings sind dafür sowohl der Trai­nings­pro­zess als auch das End­ergeb­nis viel un­durch­sich­ti­ger. Es ist also schwer, die Leistung und die Ge­nau­ig­keit der trai­nier­ten Modelle zu bewerten.

Su­per­vi­sed Learning vs. Semi-su­per­vi­sed Learning

Ein großer Nachteil des Su­per­vi­sed Learnings ist der er­heb­li­che Zeit­auf­wand, den Ent­wi­ckeln­de in die Kenn­zeich­nung der Daten in­ves­tie­ren müssen. Semi-su­per­vi­sed Learning verwendet sowohl ge­kenn­zeich­ne­te als auch un­ge­kenn­zeich­ne­te Daten, um diesem Nachteil etwas ent­ge­gen­zu­wir­ken. Dabei lernt das Modell zuerst aus den ge­kenn­zeich­ne­ten Daten und ver­bes­sert sich dann weiter durch die Nutzung der un­ge­kenn­zeich­ne­ten Daten, indem es Muster und Struk­tu­ren erkennt.

Der Haupt­vor­teil von Semi-su­per­vi­sed Learning ist die Effizienz, da weniger Daten gelabelt werden müssen und das Verfahren immer noch eine relativ hohe Ge­nau­ig­keit aufweisen kann. Semi-su­per­vi­sed Learning kann also für ähnliche Klas­si­fi­zie­rungs­pro­ble­me ein­ge­setzt werden wie Su­per­vi­sed Learning, aber versucht den Trai­nings­auf­wand zu op­ti­mie­ren. Al­ler­dings kann die Kom­ple­xi­tät der Mo­dell­bil­dung und die Ab­stim­mung der Balance zwischen ge­la­bel­ten und un­ge­la­bel­ten Daten eine Her­aus­for­de­rung dar­stel­len.

Weitere Lern­ver­fah­ren

Su­per­vi­sed, Un­su­per­vi­sed und Semi-su­per­vi­sed Learning sind nicht einzigen Machine-Learning-Verfahren die ein­ge­setzt werden, um künst­li­che In­tel­li­gen­zen zu trai­nie­ren.

Deep Learning ist ein Lern­ver­fah­ren, wobei bereits trai­nier­te Modelle anhand ihrer Eingaben da­zu­ler­nen und sich stets wei­ter­ent­wi­ckeln. Solche Modelle basieren auf neu­ro­na­len Netzen, die dem mensch­li­chen Gehirn nach­emp­fun­den sind.

Zu­sätz­lich gibt es noch Rein­force­ment Learning, wobei ein Computer durch Versuch und Irrtum lernt, welche Ent­schei­dun­gen die richtigen sind. Ziel davon ist es, eine „Policy“ (Politik) zu ent­wi­ckeln, die die besten Ent­schei­dun­gen trifft, um lang­fris­tig das optimale Ergebnis zu bekommen. Ein Beispiel dafür ist eine KI, die lernt, ein Vi­deo­spiel zu spielen. Die KI erhält von der Trai­nings­um­ge­bung Feedback auf jede Ent­schei­dung und ent­wi­ckelt dadurch Spiel­stra­te­gien.

Fazit

Su­per­vi­sed Learning ist deswegen eine so populäre Variante beim Anlernen von Al­go­rith­men, weil Ent­wi­ckeln­de die komplette Kontrolle behalten. Während bei anderen Lehr­va­ri­an­ten Er­geb­nis­se oft unklar bleiben, ist beim Su­per­vi­sed Machine Learning am Anfang ganz klar, was am Ende des Lern­pro­zes­ses stehen soll. Dafür ist der Aufwand für die Lehrenden aber ent­spre­chend hoch.

Zum Hauptmenü