banner

Blog

Dec 10, 2023

So erklären Sie Datennetze, Stoffe und Wolken

Von Isaac Sacolick

Mitwirkender Herausgeber, InfoWorld |

Ihr CEO weiß, was eine Datenbank ist, und denkt wahrscheinlich, dass ein Data Warehouse ein großer Datentresor ist, der für Berichte und Analysen verwendet wird. Sie wissen wenig über NoSQL-Datenspeicher, warum sie einen Spark-Cluster benötigen oder wie Data Lakes zur Aufnahme strukturierter und unstrukturierter Daten verwendet werden.

CEOs und Unternehmensführer konzentrieren sich auf den Geschäftswert von Daten, Analysen und maschinellem Lernen und kümmern sich weniger um die zugrunde liegenden Technologien.

Doch darin liegt ein Paradoxon, denn sie wollen verstehen, wie wertvoll es ist, Zeit und Geld in neue Technologien zu investieren. Versuchen Sie, die neuesten Datenmanagementtechnologien zu erklären, einschließlich Datennetze, Datenstrukturen und verteilte Datenwolken, und beobachten Sie, wie Ihrem CEO der Kopf schwirrt.

Es sind auch nicht nur CEOs. Die Datentechnologie ist seit den Anfängen des Webs explosionsartig gewachsen, als die Hauptdebatte darin bestand, ob man sein Data Warehouse auf Oracle, Microsoft oder Open Source aufbauen sollte. Viele Nicht-IT-Führungskräfte begnügen sich heute damit, zu glauben, dass sich die Daten „in der Cloud“ befinden und dass Datenintegration, -qualität und -leistung „IT-Probleme“ sind.

Jeder, der mit Daten arbeitet, sollte bereit sein, die wichtigsten Technologien und Praktiken in einer leicht verständlichen Sprache zu erklären. In meinem Buch „Digital Trailblazer“ erzähle ich den Vorstandsmitgliedern unseres Startups eine Geschichte darüber, was ein Browser-Cookie ist, als das Web noch neu war. Man weiß nie, wann man das Mikrofon zur Beantwortung einer technischen Frage in die Hand bekommt. Die Reaktion mit Technobabble kann wichtige Investitionen leicht abschrecken oder verlangsamen.

Gordon Allott, Präsident und CEO von K3, schlägt vor, mit einer einfachen Antwort zu beginnen: „Data Lake, Data Warehouse, Mesh und Fabric beziehen sich alle nur auf die gesamte Datenstrategie des Unternehmens.“

Es ist wichtig, die Antworten einfach zu halten, reicht aber oft nicht aus. Wenn mich eine Führungskraft nach einem Fachbegriff fragt, möchte ich die Frage so beantworten, dass Neugierde und Folgefragen geweckt werden.

Beginnen wir damit, zu erklären, was ein Datennetz ist. Steven Lin, Produktmarketingmanager bei Semarchy, gab diese prägnante Antwort: „Ein Datennetz ist ein dezentraler Ansatz zur Datenverwaltung, bei dem mehrere Teams innerhalb eines Unternehmens für ihre eigenen Daten verantwortlich sind, was Zusammenarbeit und Flexibilität fördert“, sagte er.

Diese Definition enthält keine komplexen Wörter und stellt die Probleme vor, die Datennetze lösen sollen, die Art der Lösung und warum sie wichtig ist.

Erwarten Sie jedoch, dass Sie nach weiteren technischen Details gefragt werden, insbesondere wenn die Führungskraft über Vorkenntnisse in anderen Datenverwaltungstechnologien verfügt. Zum Beispiel: „Sollten Data Warehouses und Data Lakes nicht das Problem der Datenverwaltung lösen?“

Diese Frage kann zur Falle werden, wenn man sie mit den technischen Unterschieden zwischen Data Warehouses, Lakes und Meshes beantwortet. Konzentrieren Sie Ihre Antwort stattdessen auf das Geschäftsziel.

Satish Jayanthi, Mitbegründer und CTO von Coalesce, bietet diesen Vorschlag an: „Die Datenqualität beeinflusst oft die Genauigkeit von Geschäftsanalysen und Entscheidungen. Durch die Implementierung von Data-Mesh-Paradigmen können die Qualität und Genauigkeit der Daten verbessert werden, was zu einem größeren Vertrauen bei Unternehmen führt, Daten umfassender für fundierte Entscheidungen zu nutzen.“

Diese Antwort gefällt mir und ich hoffe, dass die Führungskraft tiefer in die Frage eintauchen möchte, wie Data-Mesh-Paradigmen zur Verbesserung der Datenqualität beitragen. Jayanthi antwortet: „Eines der Grundprinzipien, der Domainbesitz, garantiert, dass das Team, das die Daten erstellt, für Qualität und Genauigkeit verantwortlich ist. Dieses Prinzip der Daten als Produkt stellt sicher, dass die mit anderen Gruppen geteilten Daten korrekt, wiederverwendbar und selbstdokumentierend sind und hohen Standards entsprechen.“

Wenn Sie mit Datennetzen noch nicht vertraut sind und in die technischen Details eintauchen möchten, empfehle ich Ihnen, den zentralen Artikel von Zhamak Dehghani über den Übergang von einem monolithischen Datensee zu einem verteilten Datennetz zu lesen.

Der CFO hat das Gespräch über Data Meshes mitgehört und möchte nun wissen, warum der Chief Data Officer lieber in eine Data Fabric als in ein Data Mesh investiert.

Der CFO stellt eigentlich drei Fragen:

Wenn Sie mit einer zusammengesetzten Frage konfrontiert werden, empfehle ich, langsamer zu werden, tief durchzuatmen, den Kontext des Fragestellers zu berücksichtigen und eine dekonstruierte Antwort zu geben. Ich könnte damit beginnen: „Lassen Sie uns zunächst über die Datenstruktur und ihre Bedeutung sprechen.“

Ross Stuart, leitender Lösungsarchitekt bei AHEAD, schlägt vor, dem CFO dabei zu helfen, das Erscheinungsbild eines Stoffes und seine Funktionsweise visuell zu erarbeiten. „Eine Datenstruktur ist ein Begriff, der die Architektur beschreibt, bei der unterschiedliche Systeme wie eine Struktur miteinander verwoben werden, um eine konsistente Ebene über den Daten einer Organisation zu schaffen“, sagt er.

Ivan Batanov, Senior Vice President of Engineering bei Crux, fügt hinzu: „Eine Data-Fabric-Architektur kann verbesserte Erkenntnisse und Analysen effizient liefern und unterstützt die Vernetzung von Daten aus unterschiedlichen Quellen.“

An diesem Punkt sollten Sie innehalten und Ihrem Publikum ein paar Sekunden Zeit geben, um die Beziehung zwischen Datennetzen und Datenstrukturen zu verstehen, einschließlich des offensichtlichen Konflikts zwischen den beiden Ansätzen. Wie könnten Sie sie zusammenbringen? Ich schlage vor, so etwas zu sagen:

Was wir in diesen Fragen und Antworten enthüllen, sind verschiedene organisatorische Rollen und ihre Datenverantwortung. Wir möchten, dass Unternehmensteams Citizen Data Science nutzen und Daten für die Entscheidungsfindung nutzen, während Organisationen den Chief Data Officer benötigen, der sich auf eine proaktive Datenverwaltung konzentriert, um Reibungsverluste und Risiken bei der Demokratisierung von Daten zu reduzieren.

Nun kommen wir zu einer dritten Datenverwaltungsgruppe, deren Aufgabe es ist, Daten zu speichern und zu strukturieren, um Nutzungsanforderungen, Leistungsziele und Sicherheitsanforderungen zu unterstützen. „Wo sollen wir Datensatz X speichern?“ lautet die Herausforderung, und die Antwort ist nicht einfach. In den meisten Unternehmen gibt es keine einheitliche Architektur für die Speicherung, Verwaltung und Nutzung von Daten.

James Malone, Leiter Produktmanagement bei Snowflake, sagt: „Anstatt das ‚Wie‘ hinter der Speicherung von Informationen anzugeben, stellt eine Datenwolke das ‚Was‘ dar, das jemand mit der richtigen Mischung von Technologien erhält“, sagt er. „Die Daten-Cloud ermöglicht es Unternehmen, auszuwählen, was für sie funktioniert, anstatt nur eine Vorgehensweise vorzuschreiben und voranzutreiben. Anwendungsfälle ändern sich, Bedürfnisse ändern sich und technische Veränderungen – deshalb konzentriert sich die Daten-Cloud auf Flexibilität und Nutzen.“

Hillary Ashton, Chief Product Officer von Teradata, fügt ein wichtiges Detail hinzu, das sie dem CFO mitteilen möchte. „Daten-Clouds können in jeder Kombination aus öffentlichen Clouds, privaten Clouds vor Ort, Hybrid-Clouds und Multi-Clouds bereitgestellt werden“, sagt sie. „Aber das ‚Gehirn‘ jeder Datencloud ist die Cloud-Analyseplattform, die Daten aus allen Quellen und Architekturen verarbeitet und verbindet. Um den größtmöglichen Nutzen aus Ihren Daten zu ziehen, kommt es vor allem auf die Fähigkeit an, Ihre Analyse-Engine und -Funktionen im gesamten Unternehmen zu skalieren, damit auch Teams, die über Datenwissenschaftler hinausgehen, auf Daten zugreifen, diese abfragen und in Erkenntnisse umwandeln können.“

An diesem Punkt suchen der CEO und der CFO möglicherweise nach einem einfachen Knopf, den sie drücken können, deshalb erinnere ich sie an das handwerkliche Geschick, das in den einfachsten Dingen erforderlich ist. „Um ein tolles Brot zu backen, braucht man fünf Zutaten: Mehl, Wasser, Hefe, Salz und Zucker, im richtigen Verhältnis, mit den richtigen Techniken zubereitet, für die richtige Zeit gebacken und elegant präsentiert für das gewünschte Erlebnis .“

Jeder, der schon einmal versucht hat, Brot zu backen, weiß, wie schwierig es ist, regelmäßig ein gutes Brot zu backen. Brotbücher enthalten Hunderte von Rezepten und die Techniken entwickeln sich ständig weiter.

Das Speichern, Verwalten, Integrieren, Verwalten und Verwenden von Daten klingt einfach, aber Sie benötigen die richtigen Zutaten, Tools und Praktiken, um die datengesteuerte Organisation zu stärken.

Lesen Sie als nächstes Folgendes:

Isaac Sacolick ist Präsident von StarCIO und Autor des Amazon-Bestsellers „Driving Digital: The Leader's Guide to Business Transformation through Technology“ und „Digital Trailblazer: Essential Lessons to Jumpstart Transformation and Accelerate Your Technology Leadership“. Er befasst sich mit agiler Planung, Entwicklung, Datenwissenschaft, Produktmanagement und anderen Best Practices für die digitale Transformation. Sacolick ist ein anerkannter Top-CIO im sozialen Bereich und Influencer für die digitale Transformation. Er hat mehr als 900 Artikel auf InfoWorld.com, CIO.com, seinem Blog Social, Agile, and Transformation und anderen Websites veröffentlicht.

Copyright © 2023 IDG Communications, Inc.

Lesen Sie als nächstes Folgendes:
AKTIE