FLoC: Was ist Federated Learning of Cohorts?

Am 25. Januar 2021 hat Google einen tiefen Einblick in die firmeneigene Vision von einer Cookie-freien, aber dennoch werbevollen Webzukunft präsentiert. Im Blog-Beitrag „Building a privacy-first future for web advertising“ skizzierte der Suchmaschinenriese erstmals detailliert, wie das Ausspielen personalisierter Werbung funktionieren wird, wenn Third-Party-Cookies nicht mehr unterstützt werden. Elementarer Bestandteil der angestrebten Privacy Sandbox (dt. „Privatsphäre-Sandkasten“) ist die Methode des sogenannten Federated Learning of Cohorts (FLoC).

Wir verraten Ihnen, was hinter FLoC steckt und wie die privatsphärenfreundliche Alternative für die Generierung und Verwendung individueller Nutzerprofile genau funktionieren soll.

Was ist FLoC (Federated Learning of Cohorts)?

Am 14. Januar 2020 machte Google die Absicht öffentlich, den eigenen Browser Chrome um eine API mit dem Namen Federated Learning of Cohorts (FLoC) zu erweitern. Ziel dieser Schnittstelle: Nutzer sollen interessenbasierte Werbung erhalten, ohne dass der Browser hierfür auf Tracking-Cookies zurück- und somit entscheidend in die Privatsphäre eingreift. Die FLoC-API fußt zu diesem Zweck auf einem Algorithmus, der den Nutzer des Browsers verschiedenen Kohorten zuweist. Mitglieder einer Kohorte, die man in diesem Fall auch als Interessensgruppen bezeichnen kann, weisen dabei ein ähnliches Surfverhalten auf. Die jeweilige Kohorten-Kennung (engl. cohort id) soll Google und Werbepartnern dann später eine datenschutzfreundliche Schaltung relevanter Werbung ermöglichen, die sowohl mit der ePrivacy-Verordnung als auch mit der neuen DSGVO konform ist.

Hinweis

Kohorten sind als Mittel der Webanalyse keineswegs neu: Insbesondere im E-Commerce ist die Kohortenanalyse seit Jahren als Mittel für einen schnellen Einblick in das Verhalten der Nutzerschaft gefragt.

Warum wird FLoC als neue Methode für personalisierte Werbung benötigt?

Werbeanzeigen sind für viele Unternehmen ein unverzichtbares Mittel, um Traffic für das eigene Webprojekt zu generieren – und für viele Publisher ein ebenso unverzichtbares Mittel, um Geld zu verdienen. Die Nutzer auf der anderen Seite bevorzugen Werbung, die relevant und nützlich für sie ist. Methoden wie Cookies oder Browser-Fingerprinting waren bis dato die einfachste und zielgerichtetste Methode, um die hierfür erforderlichen Nutzerprofile zu erstellen – stehen aufgrund ihres Eingriffs in die Privatsphäre der Browser-Nutzer aber zurecht seit Jahren in der Kritik. FLoC verspricht einen alternativen Ansatz, der Advertiser, Publisher und Nutzer gleichermaßen zufriedenstellen und dabei auch den Datenschutz wahren könnte.

Wie funktioniert Federated Learning of Cohorts?

Der Algorithmus, die elementare Komponente der FLoC-Technologie, befindet sich bis dato noch in einem experimentellen Status. Seine Funktion lässt sich folgendermaßen beschreiben: Auf Basis der Browser-Historie soll er einem Nutzer eine Kohorten-ID zuweisen, die stellvertretend für dessen Interessen steht. Damit der Nutzer nicht anhand dieser ID wiedererkannt werden kann, muss er sich diese Kennung mit mindestens x weiteren Chrome-Usern (eine konkrete Zahl gibt es aktuell noch nicht) teilen. Anhand der ID können Publisher und Advertiser dann die jeweiligen Interessen ablesen und passende Werbeanzeigen etc. schalten.

Bei der Entwicklung und Ausarbeitung des Algorithmus legt Google im Übrigen folgende Prinzipien zugrunde:

  1. Die Kohorten-ID soll Cross-Site-Tracking, also das Website-übergreifende Erfassen des Nutzerverhaltens, verhindern.
  2. Eine Kohorte soll Nutzer mit ähnlichem Browserverhalten zusammenfassen.
  3. Der Algorithmus soll auf Unsupervised Learning basieren, also ohne Eingriff von außen „selbstständig lernen“ können.
  4. Der Algorithmus soll die Verwendung „magischer Zahlen“ auf ein Minimum beschränken, mit anderen Worten: sich durch eine möglichst einfache und klare Parameter-Wahl auszeichnen.
  5. Die Berechnung einer FLoC-Kohorte soll möglichst einfach sein und wenig Rechenaufwand erfordern.

Die Prinzipien stellen sicher, dass die Generierung und Verwaltung der Interessensgruppen transparent und leicht zu verstehen sind und sich nicht von außen beeinflussen lassen. Zudem sollen sie für den bestmöglichen Datenschutz sorgen, da nach dem FLoC-Prinzip zwar weiterhin Daten über Nutzer gesammelt und verwertet werden, die Nutzer aber innerhalb ihrer Kohorten anonymisiert sind.

Die FLoC-Funktionsweise am Beispiel verdeutlicht

Wie Googles Idee des Federated Learning of Cohorts genau funktioniert, lässt sich am besten an einem konkreten Beispiel verdeutlichen. Die grundlegenden Parteien in unserem exemplarischen FLoC-Gedankenspiel sind folgende:

  • Nutzer 1: Browser-Nutzer, dem die Beispiel-Kohorte 123 zugewiesen wird; möchte online Sportschuhe kaufen
  • Nutzer 2: Browser-Nutzer, dem ebenfalls die Beispiel-Kohorte 123 zugewiesen wird; möchte sich online über die neuesten Nachrichten informieren
  • Advertiser: Online-Modeshop, der auf anderen Websites mithilfe von Advertising-Plattformen Werbeanzeigen für die eigenen Produkte schaltet
  • Publisher: News-Seite für die neuesten Nachrichten, die Werbeanzeigen – u. a. die des Online-Modeshops – schaltet
  • Werbeanzeigen-Plattform: Plattform, die Tools und Daten für das Ausspielen von Werbeanzeigen offeriert; vermittelt zwischen Advertiser und Publisher

Schritt 1: Kohorten-Generierung

Im ersten Schritt erstellt der Browser bzw. der FLoC-Algorithmus, auf den sich der Browser stützt, die verschiedenen Interessengruppen. Jede Kohorte erhält eine eindeutige ID.

Schritt 2: Zuweisung der Kohorten-Kennung

Anhand des Browserverlaufs von Nutzer 1 ermittelt der Browser die passende Kohorte, die in diesem Fall die ID 123 hat. Auch der Browser von Nutzer 2 analysiert die Nutzungshistorie, um die passende Kennung zuzuweisen. Die Historie unterscheidet sich zwar geringfügig von dem Nutzungsverlauf von Nutzer 1, weist aber dennoch ausreichend Ähnlichkeiten auf, dass Nutzer 2 ebenfalls die FLoC-ID 123 zugeordnet wird.

Schritt 3: Besuch des Onlineshops (Advertiser)

Nutzer 1 startet seine Websuche nach Sportschuhen. Er stößt auf den Onlineshop des Advertisers und durchforstet dort das ihm offerierte Angebot an Sportschuhen und verwandten Artikeln. Der Advertiser erhält in diesem Zuge die Kohorten-ID von Nutzer 1 und teilt die gewonnenen Erkenntnisse über das Nutzungsverhalten von Mitgliedern der Kohorte 123 mit der Werbeanzeigen-Plattform, mit der er zwecks Anzeigenschaltung zusammenarbeitet.

Schritt 4: Besuch der News-Seite (Publisher)

Nutzer 2 landet auf der Suche nach den neuesten Nachrichten auf der News-Seite unseres Beispiel-Publishers und gibt seine Kohorten-Kennung dabei an den Publisher weiter. Um personalisierte Werbung für Nutzer 2 ausspielen zu können, tritt er an die Werbeanzeigen-Plattform heran, mit der auch der Onlineshop-Betreiber kooperiert. Als Teil der Anfrage übermittelt der Publisher unter anderem auch die FLoC-ID 123.

Schritt 5: Ermittlung der passenden, personalisierten Werbung (Werbeanzeigen-Plattform)

Der Anbieter des Werbeanzeigen-Netzwerks kann nun die passende Werbeanzeige für Nutzer 2 ermitteln, wofür ihm dank Federated Learning of Cohorts folgende Daten zur Verfügung stehen:

  • die Kohorten-ID von Nutzer 2 (123), übermittelt vom Publisher
  • eigene Daten über die Interessen von Browser-Usern der Kohorte 123
  • die vom Advertiser (Onlineshop) übermittelten Daten über Produktinteressen (Laufschuhe) von Nutzern der Kohorte 123

Die Werbeanzeigen-Plattform ermittelt eine Werbeanzeige für Laufschuhe im Beispiel-Onlineshop als passendes Ausspielergebnis für Nutzer 2, der diese sogleich auf der News-Seite präsentiert bekommt – gänzlich ohne den Einsatz von Cookies.

FLoC und der Datenschutz: Eine perfekte Symbiose?

Auf den ersten Blick scheint Federated Learning of Cohorts die perfekte Lösung darzustellen, um Browser-Nutzer in Interessensgruppen zu gliedern, ohne zu diesem Zweck allzu stark in die Privatsphäre dieser User einzugreifen. Zumindest für den amerikanischen Markt scheint Google an dieser Annahme auch keinerlei Zweifel zu hegen: Die Vorbereitungen für die vollständige Implementierung von FLoC in Chrome ist in den USA im vollen Gange. Bereits im zweiten Quartal 2021 sollen testweise erste Anzeigen im Google-Werbenetzwerk Google Ads auf Basis der FLoC-Technik ausgespielt werden.

In Europa hat Google die Tests von Federated Learning of Cohorts derweil auf Eis gelegt. Der Hauptproblempunkt: Es besteht Unklarheit darüber, welche Partei beim Erstellen von Kohorten Datenverantwortlicher und welche Partei Datenverarbeiter ist. Betrachtet man die europäische Rechtslage zu Datenschutz und Privatsphäre, ist dies bei Weitem nicht der einzige Streitpunkt: Die zugeordnete Kohorten-ID, die Nutzer mit einer Interessensgruppe verknüpft, sowie alle hiermit verbundenen Informationen könnten möglicherweise als „personenbezogene Daten“ angesehen werden. Zudem könnte auch die Verarbeitung der Daten, die für die Generierung der Kohorten gesammelt und verwendet werden, gegen die Richtlinien der DSGVO verstoßen, sofern Google keine entsprechende Einwilligung der Nutzer einholt.

In seiner Funktion als Google-Produktmanager der Privacy Sandbox ließ Marshall Vale im März 2021 aber Folgendes verlauten:

Zitat

„It’s the start. We are working to begin testing in Europe as soon as possible. We are 100% committed to the Privacy Sandbox in Europe.“ Marshall Vale, März 2021, Quelle: https://twitter.com/marshallvale/status/1374494962646020098

Übersetzung: Das ist der Anfang. Wir arbeiten daran, so bald wie möglich mit den Tests in Europa zu beginnen. Wir setzen uns zu 100 % für die Privacy Sandbox in Europa ein. (Übersetzt von IONOS)

Die Verantwortlichen bei Google sind also zuversichtlich, dass die FLoC-Tests in Europa ebenfalls bald starten können.

Haben Website-Betreiber die Möglichkeit, FLoC zu blockieren?

Als Betreiber eines Webprojekts werden Sie die Möglichkeit haben, sich für Federated Learning of Cohorts an- bzw. abzumelden. Damit liegt es in Ihrer Hand, ob der Besuch auf Ihrer Website bzw. in Ihrem Onlineshop in die Gestaltung der FLoC-Kohorten einfließen soll oder nicht. Insbesondere für Webpräsenzen mit sensiblen Themen ist dies ein wichtiger Punkt. Zudem möchte Google eine zentrale Schutzinstanz einbinden, die bestimmte Kohorten automatisch löscht, wenn diese eine hohe Zahl an Nutzern aufweisen, die Websites in sensiblen Kategorien aufsuchen. Zu den sensiblen Kategorien zählt der Suchmaschinengigant beispielsweise finanzielle Nöte oder psychische Gesundheit.

Gegen FLoC entscheiden Sie sich, indem Sie im Permissions-Policy-Header folgenden Eintrag einfügen:

interest-cohort=()

Wenn Sie die FLoC-Technik auf diese Weise blockiert haben und diese zu einem späteren Zeitpunkt wieder zulassen wollen, entfernen Sie den Header-Eintrag einfach wieder.

Hinweis

In den bisherigen FLoC-Tests in Chrome wurden Websites, die sich nicht für die Methode ausgetragen haben, automatisch in die Kohorten-Berechnung miteinbezogen, wenn Chrome erkannt hat, dass es sich um Websites handelt, die Werbung oder werbebezogene Ressourcen laden.