Data-Governance-Serie Teil 3 – Metadaten als Weg zum Daten-Zen

Data-Governance-Serie Teil 3 – Metadaten als Weg zum Daten-Zen

In den ersten beiden Artikeln dieser Reihe habe ich erklärt, was Data Governance ist und warum die Einführung von Data Governance eher einen organisatorischen als ein technischen Wandel darstellt. Data Governance ist dabei besonders wichtig, wenn es um sensible Daten geht, beispielsweise um die Sozialversicherungsdaten der Bürger, wie in unseren Projekten im Customer Cluster Social Security. In diesem Beitrag geht es um die Daten, die Data Governance ermöglichen. Das sind nicht die operativen Daten in ERP- oder CRM-Systemen, sondern die Metadaten, die Governance-Prozesse unterstützen und erst durchführbar machen. Diese Daten bezeichnen wir als Metadaten.

Die folgenden Abschnitte beschreiben die verschiedenen Metadaten-Arten, die bei der Umsetzung von Data Governance verwendet werden. Ich benutze die Terminologie des DAMA DMBOK, um nachfolgende Recherche zu erleichtern. Wir betrachten die zehn Knowledge Areas (Data Governance als elfte Area lasse ich bewusst außen vor) und zeigen, wie sie mit Data Governance interagieren und welche Metadaten in den jeweiligen Bereichen entstehen oder benötigt werden.

1. DATEN-ARCHITEKTUR

Die Daten-Architektur beschäftigt sich mit Design und Pflege von Datenstrukturen, Taxonomien, Domänenmodellen und Rahmenwerken, die die Geschäftsstrategie stützen.

Warum das wichtig ist: Governance beginnt mit dem Verständnis des „Warum“. Es ist wichtig, aus rechtlicher und fachlicher Sicht zu wissen, warum bestimmte Daten erhoben und gespeichert werden.

Diese Begründungen (Business Rules, Compliance-Anforderungen, Aufbewahrungsfristen) sind selbst Metadaten, die Governance-Prozesse steuern. Architektur liefert das konzeptionelle Vokabular, die Domänenaufteilung und die Grundannahmen, auf denen alle weiteren Regeln aufbauen.

2. DATA MODELING AND DESIGN

Modellierung erstellt die konkreten Repräsentationen der Daten — logische und physische Modelle, Normalisierungsentscheidungen, Attributdefinitionen.

Warum das wichtig ist: Modellierung beschreibt das „Wie“ der Speicherung und stellt sicher, dass Daten in einer Weise strukturiert sind, die Governance-Anforderungen abbildet.

Metadaten hier sind Feldbeschreibungen, Datentypen, Kardinalitäten, Validierungsregeln und Beziehungen. Diese Informationen sind nötig, damit Datenverantwortliche wissen, welche Regeln wo greifen. Die Architektur gibt die Leitplanken (Namen, Referenzmodelle), Modellierung füllt sie mit Details und identifiziert praktische Probleme, die ggf. Auswirkungen auf die Architektur haben.

3. DATA STORAGE AND OPERATIONS

Hier geht es um die technische Plattform: Datenbanken, Data Lakes, Blob-Storage, Backup-Strategien, Retention-Mechanismen und Betriebsprozesse.

Warum das wichtig ist: Das „Wo“ beeinflusst, welche Sicherheits- und Qualitätsmaßnahmen technisch durchsetzbar sind. Standort, Cloud/On-Premise-Entscheidungen, Partitionierung und Replikation sind Metadaten, die Governance beeinflussen, etwa wenn Datenschutz- oder Residency-Vorgaben einzuhalten sind.

Auch Operational-Metadaten wie Zugriffsprotokolle, Storage-Klassen oder Backup-Frequenzen sind wichtig für Audit und Kontrolle.

4. DATA SECURITY

Datensicherheit umfasst Richtlinien, Zugriffsmodelle, Verschlüsselung, Masking, Rollen und Verantwortlichkeiten — konzeptionell, modell- und technisch.

Warum das wichtig ist: Sicherheitsanforderungen sind oft der Haupttreiber für Governance. Metadaten dazu sind Klassifizierungen (z. B. vertraulich, öffentlich), Zugriffsrechte, Verschlüsselungsstatus, Masking-Level und Audit-Logs.

Governance-Prozesse müssen diese Metadaten nutzen, um Berechtigungen, Datenzugriffe und Compliance nachzuweisen. Konzeptionelle Regeln (z. B. DSGVO-Anforderungen) werden zu technischen Controls (z. B. Verschlüsselung, RBAC), die wiederum als Metadaten im System dokumentiert und überwacht werden müssen.

5. DATA INTEGRATION AND INTEROPERABILITY

Integration und Interoperabilität sorgen dafür, dass Systeme miteinander reden, hierbei geht es um APIs, ETL/ELT-Prozesse, Messaging und Datenformate.

Warum das wichtig ist: Wenn du die Integrationsflüsse nicht kennst, hast du blinde Flecken. Metadaten hier umfassen Schnittstellendefinitionen, API-Kataloge, Übertragungsformate, Zeitstempel, Transformationsregeln und Fehlerbehandlungsstrategien.

Diese Informationen sind zentral, damit Governance weiß, welche Daten wohin laufen, wie sie transformiert werden und wo Qualitäts- oder Sicherheitsprobleme entstehen können. Modellierung definiert die Schnittstellen-Semantik; die technische Ebene implementiert und überwacht die Flüsse. Beide liefern Metadaten für die Governance.

6. REFERENCE AND MASTER DATA MANAGEMENT

MDM und Referenzdaten schaffen eine „Single Source of Truth“ für Kernobjekte wie Kunden, Produkte, Lieferanten.

Warum das wichtig ist: Konsistente Masterdaten sind Voraussetzung für verlässliche Berichte und Prozesse.

Metadaten sind Hierarchien, gültige Werte, Mapping-Tabellen, Versionierung und Provenienzinformationen. Governance nutzt diese Metadaten, um Konflikte zu lösen, Dubletten zu erkennen und Verantwortlichkeiten zuzuweisen. Ohne MDM-Metadaten bleibt Data Governance in vielen Fällen ineffektiv, weil unterschiedliche Einheiten unterschiedliche „Wahrheiten“ leben.

7. DATA WAREHOUSING AND BUSINESS INTELLIGENCE

Data Warehouses und BI-Lösungen konsolidieren Daten und liefern Berichte, Dashboards und KPIs — sie machen Governance-Ergebnisse sichtbar.

Warum das wichtig ist: Das Warehouse ist häufig der Ort, an dem Datenqualität und Governance-Maßnahmen bewertet werden.

Metadaten hier sind Datenlinien, Qualitätskennzahlen, Berichtdefinitionen und Datenverantwortliche. BI-Reports zeigen Stakeholdern den Zustand der Datenlandschaft und sind somit ein wichtiges Kommunikationsmittel für Governance. Es ist sinnvoll, die vorhandene Reporting-Infrastruktur zu verwenden, statt separate Mechanismen nur für Governance aufzubauen.

8. METADATA MANAGEMENT

Metadatenmanagement ist zentral: Business-Glossar, Data Dictionary, Data Lineage, technische Metadaten und Policies.

Warum das wichtig ist: Governance lebt von Verständlichkeit. Metadaten erklären Bedeutung, Herkunft und Transformationen von Daten. Ohne gute Metadaten fehlen die Grundlagen für Verantwortlichkeiten, Entscheidungen und Audits.

Bestandteile des Metadata Management:

Informationsmodellierung für die Übersetzung von Geschäftsbegriffen in Datenkonzepte.

Data Dictionary zur Definition von Feldern, Formaten und Regeln.

Data Lineage zur Nachverfolgung von Datenflüssen und Transformationen. Diese Elemente sind das Rückgrat vieler Governance-Prozesse.

9. DATA QUALITY MANAGEMENT

Datenqualität sichert Korrektheit, Vollständigkeit, Konsistenz und Aktualität.

Warum das wichtig ist: Datenqualität ist ein Werttreiber. Metadaten hierzu sind Qualitätsdimensionen, Metriken, SLAs, Fehlerklassifizierungen und Korrekturmaßnahmen.

Governance definiert, welche Qualitätsniveaus notwendig sind, und nutzt diese Metadaten zur Überwachung und Verbesserung. Datenqualität verbindet Modellierung (Definition von Qualitätsanforderungen) mit technischer Umsetzung (Monitoring, Cleansing, Validierung).

10. DOCUMENTS AND CONTENT MANAGEMENT

Unstrukturierte Daten: Dokumente, E-Mails, Multimedia. Ich behandle sie nicht separat, weil Governance strukturierte und unstrukturierte Daten gleichermaßen umfassen sollte.

DAS GANZE ZUSAMMENFÜGEN

Wenn du die anderen zehn Bereiche integrierst und pflegst, entsteht Data Governance als organisatorisches Ergebnis, also die Rollen, Zuständigkeiten, Prozesse und Kontrollen, die nötig sind, um Daten als wertvolles Asset zu managen. Ich habe Data Governance selbst bewusst nicht als eigenen Baustein beschrieben, weil es das Ergebnis der Integration der anderen Disziplinen ist.

WAS MAN PRAKTISCH GEWINNT

Wenn die Bausteine stimmen, entstehen greifbare Vorteile:

Business-Metadaten erhöhen Verständnis und reduzieren wiederkehrende Klärungen.

Technische Metadaten helfen, Daten korrekt zu finden und zu nutzen.

Operationale Metadaten zeigen, wie Daten in Prozessen verwendet werden.

Strukturelle Metadaten ermöglichen tiefere Analysen und Erkenntnisse.

Referenz- und Stammdaten schaffen eine gemeinsame Sprache und reduzieren Inkonsistenzen.

Kurz: Ein abgestimmtes Zusammenspiel von Menschen, Prozessen und Systemen, das persönliche „Data-Zen“.

Realistisch bleiben

Das ist das optimistische Zielbild. Data Governance löst jedoch nicht sofort alle Probleme. Organisatorische Widerstände, technische Altlasten, uneinheitliche Verantwortlichkeiten und menschliche Fehler bleiben Herausforderungen. Was ich skizziert habe, ist der „Happy Path“: ein Leitbild, kein Versprechen. Trotzdem ist ein klares Zielbild nützlich, um Prioritäten zu setzen und Fortschritt messbar zu machen. Bei vielen unserer Kunden der öffentlichen Verwaltung ist dieses Zielbild auch durch den Gesetzgeber gegeben, allerdings stehen gerade große Organisationen im öffentlichen Sektor vor speziellen Herausforderungen bei der Umsetzung.

Im abschließenden Artikel der Serie bespreche ich, welche organisatorischen Veränderungen nötig sind, welche Rollen benötigt werden (z. B. Data Owner, Data Stewards, Data Custodians) und wie der Start in Richtung Data Governance praktisch aussehen kann.

Autor Dr. Benjamin Kettner 

Firmenkontakt und Herausgeber der Meldung:

virtual7 GmbH
Amalienbadstr. 41d
76227 Karlsruhe
Telefon: +49 (721) 619017-0
Telefax: +49 (721) 619017-29
http://www.virtual7.de

Ansprechpartner:
Moritz Wagner
Content Creator
E-Mail: moritz.wagner@virtual7.de
Für die oben stehende Story ist allein der jeweils angegebene Herausgeber (siehe Firmenkontakt oben) verantwortlich. Dieser ist in der Regel auch Urheber des Pressetextes, sowie der angehängten Bild-, Ton-, Video-, Medien- und Informationsmaterialien. Die United News Network GmbH übernimmt keine Haftung für die Korrektheit oder Vollständigkeit der dargestellten Meldung. Auch bei Übertragungsfehlern oder anderen Störungen haftet sie nur im Fall von Vorsatz oder grober Fahrlässigkeit. Die Nutzung von hier archivierten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Eine systematische Speicherung dieser Daten sowie die Verwendung auch von Teilen dieses Datenbankwerks sind nur mit schriftlicher Genehmigung durch die United News Network GmbH gestattet.

counterpixel

Comments are closed.

Für die oben stehenden Pressemitteilungen, das angezeigte Event bzw. das Stellenangebot sowie für das angezeigte Bild- und Tonmaterial ist allein der jeweils angegebene Herausgeber verantwortlich. Dieser ist in der Regel auch Urheber der Pressetexte sowie der angehängten Bild-, Ton- und Informationsmaterialien. Die Nutzung von hier veröffentlichten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber.