Im In­for­ma­ti­ons­zeit­al­ter werden von Or­ga­ni­sa­tio­nen laufend mas­sen­wei­se Daten erhoben. Doch in den meisten Fällen werden die ge­sam­mel­ten Daten ab­ge­spei­chert, ohne aus­ge­wer­tet zu werden. Diese zwar vor­han­de­nen, aber nicht genutzten Daten be­zeich­net man als Dark Data.

Compute Engine
Die ideale IaaS für Ihre Workloads
  • Kos­ten­güns­ti­ge vCPUs und leis­tungs­star­ke de­di­zier­te Cores
  • Höchste Fle­xi­bi­li­tät ohne Min­dest­ver­trags­lauf­zeit
  • Inklusive 24/7 Experten-Support

Was versteht man unter Dark Data?

Unter Dark Data versteht man Daten, welche der Einsicht oder dem Zugriff einer Or­ga­ni­sa­ti­on entzogen sind. Dabei kann es sich um Daten handeln, welche un­voll­stän­dig sind, nicht aus­ge­wer­tet wurden, im Ver­bor­ge­nen exis­tie­ren oder (noch) gar nicht erfasst werden. Es­sen­ti­ell für unser Ver­ständ­nis des Begriffs ist, dass dieser relativ ist. Ob Daten „Dark“ sind, oder nicht, hängt vom Ver­hält­nis der Daten zu einer be­stimm­ten Or­ga­ni­sa­ti­on ab.

Besonders of­fen­sicht­lich ist Dark Data im Zu­sam­men­hang mit Big Data-Ma­nage­ment. Oftmals werden kon­ti­nu­ier­lich so viele Daten erzeugt, dass diese nicht recht­zei­tig ver­ar­bei­tet und aus­ge­wer­tet werden können. In den Worten des bri­ti­schen Sta­tis­ti­kers David Hand:

Zitat

„In Zeiten von Big Data ist es einfach zu denken, wir hätten alle In­for­ma­tio­nen, die wir brauchen, um gute Ent­schei­dun­gen zu treffen. In der Tat sind die Daten jedoch nie voll­stän­dig und stellen viel­leicht nur die Spitze eines Eisbergs dar.“

(„In the era of big data, it is easy to imagine that we have all the in­for­ma­ti­on we need to make good decisions. But in fact the data we have are never complete, and may be only the tip of the iceberg.“)

- David Hand

Be­trach­ten wir vier konkrete Szenarien. Dark Data sind:

  1. Daten, deren Existenz unbekannt ist
  2. Daten, welche mit Un­si­cher­hei­ten belegt sind
  3. Daten, die ungenutzt auf­be­wahrt werden
  4. Daten, welche noch gar nicht erfasst wurden

In allen vier Szenarien dif­fe­ren­zie­ren wir weiterhin zwei distinkte Fälle:

  1. Der Or­ga­ni­sa­ti­on ist bekannt, dass Daten fehlen, bzw. un­voll­stän­dig oder mit einer Un­si­cher­heit belegt sind.

Dieser Fall ist weniger pro­ble­ma­tisch. Besteht ein Be­wusst­sein, dass die vor­lie­gen­den Daten viel­leicht nur die Spitze eines Eisbergs dar­stel­len, kann die Or­ga­ni­sa­ti­on ge­gen­steu­ern. Man kann versuchen, kom­plet­te­re Daten zu erlangen, oder die vor­lie­gen­den Daten mit Hinblick auf Un­si­cher­hei­ten bewerten.

  1. Der Or­ga­ni­sa­ti­on ist nicht bekannt, dass Daten fehlen, bzw. es wird an­ge­nom­men, die vor­lie­gen­den Daten seien voll­stän­dig.

Dieser Fall ist ge­fähr­li­cher. Wird an­ge­nom­men, man hätte auf Grund der vor­lie­gen­den Daten ein voll­stän­di­ges Bild der Sachlage, operiert die Or­ga­ni­sa­ti­on entgegen der Realität. Aus lü­cken­haf­ten Daten gezogene Schlüsse führen zu sub­op­ti­ma­len Ent­schei­dun­gen.

In Zeiten von Big Data und Data Mining sind Or­ga­ni­sa­tio­nen bestrebt, alles aus den Daten her­aus­zu­ho­len.

Was sind ei­gent­lich Daten?

Der Begriff Daten ist seit der ex­plo­si­ons­ar­ti­gen Ver­brei­tung der In­for­ma­ti­ons­tech­no­lo­gie in aller Munde. Von Po­li­ti­kern, Wir­schafts­ver­tre­tern und Wis­sen­schaft­lern glei­cher­ma­ßen gerne genutzt, bleibt der Begriff für viele Menschen nebulös. Denn Daten sind nicht-phy­si­scher Natur – es handelt sich um ein abs­trak­tes Konzept.

Daten sind nicht gleich In­for­ma­tio­nen

Zunächst halten wir fest: Bei Daten handelt es sich um eine Er­schei­nungs­form der In­for­ma­ti­on. In der Tat sind Daten die kleinsten Bausteine, aus denen sich In­for­ma­tio­nen zu­sam­men­set­zen. In etwa so, wie Atome die kleinsten Bausteine der Materie, oder Photonen die kleinsten Bausteine der Energie dar­stel­len.

Hinweis

Wir benutzen hier den Begriff „In­for­ma­ti­on“ als abs­trak­ten Begriff, wie Materie und Energie. Wenn wir von In­for­ma­tio­nen im Plural sprechen, meinen wir konkrete Aus­prä­gun­gen.

Jedes Datum ist für sich genommen be­deu­tungs­los. Erst die In­ter­pre­ta­ti­on mehrerer Daten ergibt eine nutzbare In­for­ma­ti­on. Stellen Sie sich zum Ver­ständ­nis Daten als einzelne Buch­sta­ben vor. Ein einzelner Buchstabe, bei­spiels­wei­se der Buchstabe ‚A‘ hat an sich keine Bedeutung. Erst wenn mehrere Buch­sta­ben kom­bi­niert werden, ergibt sich ein Wort, z. B. „Apfel“. Hier ist zudem die Rei­hen­fol­ge ent­schei­dend — oder können Sie etwas mit dem Wort „eflAp“ anfangen?

Bei In­for­ma­tio­nen handelt es sich also um in Struk­tu­ren zu­sam­men­ge­fass­te, von­ein­an­der ab­ge­grenz­te Daten. Dabei ist der Prozess der In­ter­pre­ta­ti­on vom Kontext abhängig. Das bedeutet, dass eine Reihe von Daten ver­schie­den in­ter­pre­tiert werden kann, wobei sich ggf. mehrere Be­deu­tun­gen ergeben. Denken Sie wieder an das Wort „Apfel“. Anstatt die einzelnen Buch­sta­ben zu einem Wort zu­sam­men­zu­fas­sen, könnten wir die Buch­sta­ben zählen. Heraus käme eine andere, auf denselben Daten ba­sie­ren­de In­for­ma­ti­on.

Stellen wir uns die Ge­samt­heit der Daten einer Or­ga­ni­sa­ti­on als Berg vor. Dann stellt sich die Her­aus­for­de­rung, aus dem Datenberg nützliche In­for­ma­tio­nen her­aus­zu­schür­fen. Im Gegensatz zu einem phy­si­schen Berg, bei dem Wert­stof­fe durch die Ex­trak­ti­on verloren gehen, lässt sich aus einem Datenberg prin­zi­pi­ell mehrmals nütz­li­ches her­aus­ho­len. Es kommt dabei jeweils auf den Kontext und die Per­spek­ti­ve an.

Die Hier­ar­chie der In­for­ma­ti­on

Wenn In­for­ma­tio­nen sich aus Daten zu­sam­men­set­zen, wie Materie aus Atomen, ist es na­he­lie­gend an­zu­neh­men, dass weitere, über­ge­ord­ne­te Struk­tu­ren exis­tie­ren. Tat­säch­lich gibt es eine Hier­ar­chie der In­for­ma­ti­on: ganz unten liegen die Daten, dann folgen In­for­ma­tio­nen und im Anschluss — das Wissen.

Beim Wissen handelt es sich um ver­knüpf­te In­for­ma­tio­nen. Dabei kommt es zu einer Ge­wich­tung der einzelnen In­for­ma­tio­nen. Manche sind primär, andere sekundär. Aus­schlag­ge­bend für das Wissen ist das Konzept der Referenz, welches man heut­zu­ta­ge als (Hyper)-Link kennt: eine In­for­ma­ti­on, welche auf eine andere Wis­sens­ein­heit verweist. Beispiele für Wissen sind Wikipedia-Einträge, Rezepte und do­ku­men­tier­te Prozesse.

Aufbauend auf dem Wissen folgt die In­tel­li­genz. Sie erlaubt, aus erlerntem Wissen und ge­sam­mel­ten Er­fah­run­gen Schlüsse zu ziehen und Muster zu erkennen. Durch das Auf­stel­len und Testen von Hy­po­the­sen wird neues Wissen syn­the­ti­siert. Aus­schlag­ge­bend für die In­tel­li­genz sind aus­führ­ba­re In­for­ma­ti­on, oder anders gesagt: Code. Dabei kann es sich um Al­go­rith­men oder Heu­ris­ti­ken handeln. Wo­hin­ge­gen Daten, In­for­ma­tio­nen und Wissen inert vorliegen, benötigt In­tel­li­genz eine Aus­füh­rungs­um­ge­bung. Zellen, Or­ga­nis­men, Computer und Netzwerke sind allesamt Systeme, welche In­tel­li­genz aufweisen.

Die höchste Ebene in der In­for­ma­ti­ons-Hier­ar­chie ist Weisheit. Bei der Weisheit handelt es sich um die Ge­samt­heit von Wissen und In­tel­li­genz. Weisheit erlaubt das Bewerten ver­schie­de­ner Wege um aus­ge­gli­che­ne Lösung zu finden. Die in­ter­es­san­ten Fragen sind weniger „Was“ (Daten, In­for­ma­tio­nen) oder „Wie“ (Wissen, In­tel­li­genz), sondern „Warum“ und „Wozu“. Ein gutes Beispiel für Weisheit ist eine Bi­blio­thek. Diese umfasst nicht nur Wissen in Form der Bücher und sonstiger Medien, sondern auch In­tel­li­genz in Form der Mit­ar­bei­ter und In­dex­sys­te­me.

Wie entsteht Dark Data?

Or­ga­ni­sa­to­ri­sche Prozesse, welche durch moderne Methoden der In­for­ma­ti­ons­ver­ar­bei­tung un­ter­stützt werden, pro­du­zie­ren laufend Daten. Bei einem gewissen Anteil der Daten wird es sich um Dark Data handeln. Entweder geht die In­for­ma­ti­on, dass Daten exis­tie­ren, verloren, oder fehlt von vorn­her­ein. Oder das Wissen, wie Daten aus­ge­wer­tet werden können, ist nicht vorhanden.

Dark Data fällt in vielerlei Form an. In den Worten des Marketing-Experten Sky Cassidy:

Zitat

„Dark Data sind all die Daten, welche Un­ter­neh­men im Rahmen der normalen Ge­schäfts­pro­zes­se sammeln und auf­be­wah­ren, ohne vor­zu­ha­ben, die Daten aus­zu­wer­ten. Dazu gehören Web-Log­da­tei­en, Website-Besuchs-Sta­tis­ti­ken, Aufnahmen aus Über­wa­chungs­ka­me­ras, E-Mail-Kor­re­spon­denz ehe­ma­li­ger An­ge­stell­ter und vieles mehr.“

(„So as for Dark Data, it’s all the in­for­ma­ti­on companies collect in their regular business processes, don’t use, have no plans to use, but will never throw out. It’s web logs, visitor tracking data, sur­veil­lan­ce footage, email cor­re­spon­den­ces from past employees, and so much more.“)

- Sky Cassidy

Dark Data entsteht durch ver­ges­se­ne oder nicht mehr zu­gäng­li­che Daten

Eine große Klasse von Dark Data besteht aus Daten, auf die kein Zugriff mehr besteht. Dabei kann es sich um ver­ges­se­ne oder nicht mehr zu­gäng­li­che Daten handeln.

Mit­ar­bei­ter speichern kon­ti­nu­ier­lich Daten auf ihren privaten und be­trieb­li­chen Geräten. Es kommt schnell dazu, dass diese Daten in Ver­ges­sen­heit geraten und zu Dark Data werden. Daten auf USB-Sticks und portablen Fest­plat­ten, sowie den internen Da­ten­trä­gern aus­ge­mus­ter­ter Desktop- und Mo­bil­ge­rä­te gehören ebenso dazu, wie Daten in Anhängen von E-Mails und un­ge­nutz­ten Da­ten­ban­ken.

Die geradezu endlose Ska­lier­bar­keit ist einer der Vorteile des Cloud Computing – aber gleich­zei­tig auch ein Fluch. Denn mit Hilfe von Cloud-Speichern ist es möglich, immer weiter Daten an­zu­sam­meln, ohne dabei an eine feste Grenze zu stoßen. Dies verleitet Mit­ar­bei­ter zum un­be­grenz­ten Sammeln jeglicher Daten. Findet die Sammelwut außerhalb streng re­gle­men­tier­ter Prozesse statt, ist das Ergebnis in der Regel Dark Data.

Werden Daten digital ge­spei­chert, muss dies mit Hinblick auf Si­cher­heit und Da­ten­schutz geschehen. Daten werden ver­schlüs­selt, Systeme durch Au­to­ri­sie­rung geschützt. Was jedoch, wenn das Login-Passwort vergessen wurde, oder sich der Schlüssel nicht mehr auffinden lässt? In beiden Fällen kommt es dazu, dass auf die Daten kein Zugriff mehr besteht; der Blick auf die ent­hal­te­nen In­for­ma­tio­nen erlischt.

Aber es gibt noch eine andere Gefahr, den Zugriff auf ei­gent­lich vor­lie­gen­de Daten zu verlieren. Dazu kann es dann kommen, wenn die Daten in nicht mehr zu­gäng­li­chen Form vorliegen. Handelt es sich etwa um ein pro­prie­tä­res Da­tei­for­mat, wird ggf. ein spe­zi­el­les Programm zum Auslesen benötigt. Jedoch kann es sein, dass sich das Programm nicht mehr betreiben lässt, bzw. nicht mehr in der be­nö­tig­ten Version vorliegt. So bleiben die Daten im Vendor Lock-In gefangen.

Dark Data entsteht durch un­voll­stän­di­ge oder veraltete Daten

Bei Dark Data handelt es sich nicht nur um Daten, auf die kein Zugriff mehr besteht. Auch un­voll­stän­di­ge oder veraltete Daten zählen dazu. Lassen wir wieder den Sta­tis­ti­ker David Hand zu Worte kommen:

Zitat

„Dark Data sind Daten, die einem fehlen. Es kann sein, dass man die Daten von heute möchte, aber man hat nur die von gestern. Viel­leicht liegt eine verzerrte Stich­pro­be vor, oder es fehlen bestimmte Fälle in den Daten. Oder die ge­mes­se­nen Werte sind ungenau — denn ein perfektes Mess­in­stru­ment gibt es nicht.“

(„Dark Data are data you don't have. This might be because you want today's data, but all you have is yes­ter­day's. It might be because your sample is distorted, perhaps certain types of cases are missing. It might be because the recorded values are in­ac­cu­ra­te – after all, no me­a­su­re­ment in­stru­ment is perfect.“)

- David Hand

Erinnern wir uns, dass Daten die unterste Ebene der In­for­ma­ti­ons-Hier­ar­chie ausmachen. Un­ge­nau­ig­kei­ten und Ab­wei­chun­gen der Daten ma­ni­fes­tie­ren sich in den höheren In­for­ma­ti­ons-Ebenen. Dabei kommt es in der Regel zu Kaskaden-Effekten: kleine Ab­wei­chun­gen führen zu großen Än­de­run­gen. So können lü­cken­haf­te Daten gra­vie­ren­de Aus­wir­kun­gen haben.

Ähnlich verhält es sich mit ver­al­te­ten Daten. Denken wir bei­spiels­wei­se an die Geo­lo­ca­ti­on eines Nutzers, welche als Teil eines Da­ten­sat­zes ge­spei­chert wird. Da sich die Geo­lo­ca­ti­on mit der Bewegung des Nutzers ständig ändert, ist die ent­hal­te­ne In­for­ma­ti­on ggf. nur dann nützlich, wenn die Daten in Echtzeit aus­ge­wer­tet werden. Möchte man einem Nutzer bei­spiels­wei­se ein orts­ab­hän­gi­ges Angebot machen, muss dies geschehen, solange der Nutzer noch vor Ort ist.

Dark Data entsteht durch nicht aus­ge­wer­te­te Daten

Eine große Klasse von Dark Data besteht in erfassten und ge­spei­cher­ten, jedoch nicht aus­ge­wer­te­ten Daten. Ein besonders hohes Volumen an Dark Data stammt aus Quellen, welche au­to­ma­ti­siert Daten erzeugen. Dazu gehören Sensoren, sowie Log­da­tei­en und Besuchs-Sta­tis­ti­ken von Websites. Die erzeugten Daten werden oft für längere Zeiträume ge­spei­chert, ohne dass die darin ent­hal­te­nen In­for­ma­tio­nen ex­tra­hiert und aus­ge­wer­tet würden.

Manche Daten liegen in Formaten vor, welche auf­wen­di­ge Verfahren zur Aus­wer­tung benötigen. Dazu gehören in Bild-Dateien ent­hal­te­ne Texte, wie auch ge­spro­che­nes Wort in Audio-Dateien. Generell enthalten digitale Bilder eine Fülle an In­for­ma­tio­nen, die sich au­to­ma­ti­siert nur mit modernen Methoden der künst­li­chen In­tel­li­genz er­schlie­ßen lassen. Mit Mus­ter­er­ken­nung und Klas­si­fi­zie­rung werden in Bilddaten ab­ge­bil­de­te Objekte iden­ti­fi­ziert und zu­ge­ord­net. Da es sich noch um relativ neue Ansätze handelt, dürfte der Großteil des weltweit ge­spei­cher­ten Bild­ma­te­ri­als Dark Data enthalten.

In einem weiteren Fall entsteht Dark Data durch vor­han­de­ne, aber nicht aus­ge­wer­te­te Daten. Nämlich dann, wenn die Daten lediglich im Zuge der Re­vi­si­ons­si­cher­heit ge­spei­chert und auf­be­wahrt werden, ohne dass ein Wille bestände, die Daten aus­zu­wer­ten. Treffend bringt Sta­tis­ti­ker David Hand das Problem auf den Punkt:

Zitat

„Es kann sogar sein, dass die Daten vorhanden sind, aber un­be­rück­sich­tigt bleiben. Sie verroten un­be­ach­tet in einem riesigen Daten-Lagerhaus vor sich hin, da sie lediglich aus Com­pli­ance-Gründen erfasst wurden.“

(„It might even be that the data are available, but un­ex­ami­ned, gently decaying in a giant data warehouse, unlooked at because they were collected purely for com­pli­ance reasons.“)

- David Hand

Dark Data entsteht durch noch nicht erfasste Daten

Neben den bereits be­spro­che­nen Formen der Dark Data gibt es noch eine weitere. Diese ist eher theo­re­ti­scher Natur, denn es handelt sich um Daten, welche noch gar nicht erfasst worden sind. Natürlich liegen diese (noch gar nicht exis­tie­ren­den) Daten außerhalb der Sicht der Or­ga­ni­sa­ti­on. Daher zählen sie ebenfalls zu Dark Data.

Sta­tis­ti­ker David Hand zieht eine Analogie zur aus der As­tro­phy­sik bekannten „dunklen Materie“:

Zitat

„Genau so, wie das Universum zu einem großen Teil aus dunkler Materie besteht, welche für uns un­sicht­bar, aber dennoch präsent ist, ist das In­for­ma­ti­ons-Universum voller Dark Data, welche wir auf unsere eigene Gefahr hin übersehen.“

(„Just as much of the universe is composed of dark matter, invisible to us but no­ne­thel­ess present, the universe of in­for­ma­ti­on is full of Dark Data that we overlook at our peril.“)

-David Hand

Warum ist Dark Data ein Problem?

Dark Data ist ein Problem für Un­ter­neh­men und andere Or­ga­ni­sa­tio­nen. Dafür gibt es einige Gründe. Wir be­spre­chen hier nur Fälle, in denen tat­säch­lich Daten vorliegen. Fälle, in denen die Daten noch gar nicht exis­tie­ren, klammern wir aus.

Dark Data auf­zu­be­wah­ren ist in­ef­fi­zi­ent

Die Spei­che­rung jeglicher Daten benötigt Res­sour­cen. Dazu gehören ins­be­son­de­re Spei­cher­platz und Energie auf Seiten des Speicher-Be­trei­bers. Dies ver­ur­sacht Kosten auf Seiten der Or­ga­ni­sa­ti­on, welche die Daten ihr Eigen nennt. Es wird also Aufwand betrieben, um die Daten auf­zu­he­ben.

Die Effizienz ist definiert als Quotient von Nutzen und Aufwand. Zieht man bei geringem Aufwand einen hohen Nutzen, spricht man von einer hohen Effizienz. Ein geringer Nutzen bei hohem Aufwand bedeutet hingegen, dass die Effizienz niedrig ist.

Effizienz = Nutzen / Aufwand

Daten sollen ei­gent­lich von Nutzen sein. Bei Dark Data ist der tat­säch­li­che Nutzen begrenzt. Dennoch muss zur Auf­be­wah­rung der Daten kon­ti­nu­ier­lich Aufwand betrieben werden. Folglich ist die Spei­che­rung von Dark Data in­ef­fi­zi­ent.

Man findet die In­for­ma­ti­ons-Nadel im Dark Data-Heuhaufen nicht

Stellen wir uns die Ge­samt­heit der Daten einer Or­ga­ni­sa­ti­on als Eisberg vor. Dann handelt es sich beim Großteil der Daten um Dark Data. Leider ist es nicht so, dass sich die nütz­li­chen Daten an der Ober­flä­che sammeln. Vielmehr sind diese mit Dark Data vermischt und lassen sich nicht einfach auf­tren­nen. Um nützliche Daten zu finden, muss man den gesamten Berg durch­su­chen.

Durch die schiere Masse an Dark Data bleiben an sich nützliche In­for­ma­tio­nen im Ver­bor­ge­nen. Oft ist nicht klar, ob Daten überhaupt von Wert sind. Fehlende oder feh­ler­haf­te Daten führen zu in­kor­rek­ten In­for­ma­tio­nen. So be­ein­flusst Dark Data, welche Schlüsse aus den vor­lie­gen­den In­for­ma­tio­nen gezogen werden. Dies schränkt ein, wie in­tel­li­gent sich die Or­ga­ni­sa­ti­on verhalten kann.

Niemand weiß, was alles in Dark Data steckt

Dark Data ist per de­fi­ni­tio­nem un­durch­sich­tig. Man kann sich nie sicher sein, ob nicht doch nütz­li­ches enthalten ist. Ebenfalls lässt sich nicht aus­schlie­ßen, dass die Daten sensible In­for­ma­tio­nen enthalten, welche nicht in die falschen Hände gelangen dürfen.

Daten werden in der Regel für längere Zeiträume ge­spei­chert. Dabei hat Dark Data für die Or­ga­ni­sa­ti­on nur einen geringen Nutzen. So besteht oft eine mangelnde Mo­ti­va­ti­on, die Daten ab­zu­si­chern. Ungenutzt ge­spei­cher­te Daten geraten leicht ins Vergessen. Dies macht es wahr­schein­li­cher, un­zu­rei­chend ge­si­cher­te Dark Data vor­zu­fin­den.

Prin­zi­pi­ell können Daten immer In­for­ma­tio­nen umfassen, die be­son­de­rem Schutz un­ter­lie­gen. Zumeist sind einzelne Daten harmlos; hingegen lassen sich aus Da­ten­men­gen ggf. sensible In­for­ma­tio­nen ex­tra­hie­ren. Bei­spiels­wei­se lassen sich aus über längeren Zeit­räu­men erhobenen Ortsdaten Be­we­gungs­pro­fi­le erstellen. Beim Verlust von Dark Data droht also ein hohes Risiko von Schäden.

Neben dem Ausleiten sensibler Daten gibt es ein weiteres Risiko im Zu­sam­men­hang mit Dark Data. Denn diese Daten werden evtl. nach einem Stö­rungs­fall bei der Disaster Recovery nicht wie­der­her­ge­stellt. Stellen wir uns ein System vor, welches sauber lief. Man dachte, alle Kom­po­nen­ten seien bekannt, hält von diesen Kom­po­nen­ten Cloud-Backups vor. Was niemand wusste: eine der Kom­po­nen­ten bestand aus Dark Data. Bei der Wie­der­her­stel­lung des Systems fehlt ein kri­ti­scher Teil. Im schlimms­ten Fall droht in der Folge der Ausfall wichtiger Systeme.

Managed Nextcloud by IONOS Cloud
Team­ar­beit in der eigenen Cloud
  • Voll­stän­di­ge Da­ten­sou­ve­rä­ni­tät in deutschen Re­chen­zen­tren
  • Managed Service ohne Ad­mi­nis­tra­ti­ons­auf­wand
  • File-Sharing, Do­ku­men­ten­be­ar­bei­tung & Kom­mu­ni­ka­ti­on

Dark Data lässt sich schwer entsorgen

Ein Datenberg ist nur schwer zu über­bli­cken. Vor­lie­gen­de Dark Data könnte nützliche oder sensible In­for­ma­tio­nen enthalten. Ggf. sind für die Auf­be­wah­rung der Daten bestimmte La­ger­fris­ten vor­ge­schrie­ben. So ist es nicht ohne weiteres möglich, die Daten zu entsorgen.

Ver­gleich­bar ist dieser Zustand in etwa mit Son­der­müll, der sich nur schwer oder gar nicht auf­tren­nen lässt. Enthält eine Tonne Müll ein Gramm hoch­gif­ti­ges Material, wird die ganze Tonne als Son­der­müll behandelt. Also werden die Daten weiter auf­ge­ho­ben, der Datenberg wächst immer weiter an. Damit steigen auch die bei der Spei­che­rung an­fal­len­den Kosten.

Zum Hauptmenü