
Data-Governance-Serie Teil 3 – Metadaten als Weg zum Daten-Zen
Die folgenden Abschnitte beschreiben die verschiedenen Metadaten-Arten, die bei der Umsetzung von Data Governance verwendet werden. Ich benutze die Terminologie des DAMA DMBOK, um nachfolgende Recherche zu erleichtern. Wir betrachten die zehn Knowledge Areas (Data Governance als elfte Area lasse ich bewusst außen vor) und zeigen, wie sie mit Data Governance interagieren und welche Metadaten in den jeweiligen Bereichen entstehen oder benötigt werden.
1. DATEN-ARCHITEKTUR
Die Daten-Architektur beschäftigt sich mit Design und Pflege von Datenstrukturen, Taxonomien, Domänenmodellen und Rahmenwerken, die die Geschäftsstrategie stützen.
Warum das wichtig ist: Governance beginnt mit dem Verständnis des „Warum“. Es ist wichtig, aus rechtlicher und fachlicher Sicht zu wissen, warum bestimmte Daten erhoben und gespeichert werden.
Diese Begründungen (Business Rules, Compliance-Anforderungen, Aufbewahrungsfristen) sind selbst Metadaten, die Governance-Prozesse steuern. Architektur liefert das konzeptionelle Vokabular, die Domänenaufteilung und die Grundannahmen, auf denen alle weiteren Regeln aufbauen.
2. DATA MODELING AND DESIGN
Modellierung erstellt die konkreten Repräsentationen der Daten — logische und physische Modelle, Normalisierungsentscheidungen, Attributdefinitionen.
Warum das wichtig ist: Modellierung beschreibt das „Wie“ der Speicherung und stellt sicher, dass Daten in einer Weise strukturiert sind, die Governance-Anforderungen abbildet.
Metadaten hier sind Feldbeschreibungen, Datentypen, Kardinalitäten, Validierungsregeln und Beziehungen. Diese Informationen sind nötig, damit Datenverantwortliche wissen, welche Regeln wo greifen. Die Architektur gibt die Leitplanken (Namen, Referenzmodelle), Modellierung füllt sie mit Details und identifiziert praktische Probleme, die ggf. Auswirkungen auf die Architektur haben.
3. DATA STORAGE AND OPERATIONS
Hier geht es um die technische Plattform: Datenbanken, Data Lakes, Blob-Storage, Backup-Strategien, Retention-Mechanismen und Betriebsprozesse.
Warum das wichtig ist: Das „Wo“ beeinflusst, welche Sicherheits- und Qualitätsmaßnahmen technisch durchsetzbar sind. Standort, Cloud/On-Premise-Entscheidungen, Partitionierung und Replikation sind Metadaten, die Governance beeinflussen, etwa wenn Datenschutz- oder Residency-Vorgaben einzuhalten sind.
Auch Operational-Metadaten wie Zugriffsprotokolle, Storage-Klassen oder Backup-Frequenzen sind wichtig für Audit und Kontrolle.
4. DATA SECURITY
Datensicherheit umfasst Richtlinien, Zugriffsmodelle, Verschlüsselung, Masking, Rollen und Verantwortlichkeiten — konzeptionell, modell- und technisch.
Warum das wichtig ist: Sicherheitsanforderungen sind oft der Haupttreiber für Governance. Metadaten dazu sind Klassifizierungen (z. B. vertraulich, öffentlich), Zugriffsrechte, Verschlüsselungsstatus, Masking-Level und Audit-Logs.
Governance-Prozesse müssen diese Metadaten nutzen, um Berechtigungen, Datenzugriffe und Compliance nachzuweisen. Konzeptionelle Regeln (z. B. DSGVO-Anforderungen) werden zu technischen Controls (z. B. Verschlüsselung, RBAC), die wiederum als Metadaten im System dokumentiert und überwacht werden müssen.
5. DATA INTEGRATION AND INTEROPERABILITY
Integration und Interoperabilität sorgen dafür, dass Systeme miteinander reden, hierbei geht es um APIs, ETL/ELT-Prozesse, Messaging und Datenformate.
Warum das wichtig ist: Wenn du die Integrationsflüsse nicht kennst, hast du blinde Flecken. Metadaten hier umfassen Schnittstellendefinitionen, API-Kataloge, Übertragungsformate, Zeitstempel, Transformationsregeln und Fehlerbehandlungsstrategien.
Diese Informationen sind zentral, damit Governance weiß, welche Daten wohin laufen, wie sie transformiert werden und wo Qualitäts- oder Sicherheitsprobleme entstehen können. Modellierung definiert die Schnittstellen-Semantik; die technische Ebene implementiert und überwacht die Flüsse. Beide liefern Metadaten für die Governance.
6. REFERENCE AND MASTER DATA MANAGEMENT
MDM und Referenzdaten schaffen eine „Single Source of Truth“ für Kernobjekte wie Kunden, Produkte, Lieferanten.
Warum das wichtig ist: Konsistente Masterdaten sind Voraussetzung für verlässliche Berichte und Prozesse.
Metadaten sind Hierarchien, gültige Werte, Mapping-Tabellen, Versionierung und Provenienzinformationen. Governance nutzt diese Metadaten, um Konflikte zu lösen, Dubletten zu erkennen und Verantwortlichkeiten zuzuweisen. Ohne MDM-Metadaten bleibt Data Governance in vielen Fällen ineffektiv, weil unterschiedliche Einheiten unterschiedliche „Wahrheiten“ leben.
7. DATA WAREHOUSING AND BUSINESS INTELLIGENCE
Data Warehouses und BI-Lösungen konsolidieren Daten und liefern Berichte, Dashboards und KPIs — sie machen Governance-Ergebnisse sichtbar.
Warum das wichtig ist: Das Warehouse ist häufig der Ort, an dem Datenqualität und Governance-Maßnahmen bewertet werden.
Metadaten hier sind Datenlinien, Qualitätskennzahlen, Berichtdefinitionen und Datenverantwortliche. BI-Reports zeigen Stakeholdern den Zustand der Datenlandschaft und sind somit ein wichtiges Kommunikationsmittel für Governance. Es ist sinnvoll, die vorhandene Reporting-Infrastruktur zu verwenden, statt separate Mechanismen nur für Governance aufzubauen.
8. METADATA MANAGEMENT
Metadatenmanagement ist zentral: Business-Glossar, Data Dictionary, Data Lineage, technische Metadaten und Policies.
Warum das wichtig ist: Governance lebt von Verständlichkeit. Metadaten erklären Bedeutung, Herkunft und Transformationen von Daten. Ohne gute Metadaten fehlen die Grundlagen für Verantwortlichkeiten, Entscheidungen und Audits.
Bestandteile des Metadata Management:
Informationsmodellierung für die Übersetzung von Geschäftsbegriffen in Datenkonzepte.
Data Dictionary zur Definition von Feldern, Formaten und Regeln.
Data Lineage zur Nachverfolgung von Datenflüssen und Transformationen. Diese Elemente sind das Rückgrat vieler Governance-Prozesse.
9. DATA QUALITY MANAGEMENT
Datenqualität sichert Korrektheit, Vollständigkeit, Konsistenz und Aktualität.
Warum das wichtig ist: Datenqualität ist ein Werttreiber. Metadaten hierzu sind Qualitätsdimensionen, Metriken, SLAs, Fehlerklassifizierungen und Korrekturmaßnahmen.
Governance definiert, welche Qualitätsniveaus notwendig sind, und nutzt diese Metadaten zur Überwachung und Verbesserung. Datenqualität verbindet Modellierung (Definition von Qualitätsanforderungen) mit technischer Umsetzung (Monitoring, Cleansing, Validierung).
10. DOCUMENTS AND CONTENT MANAGEMENT
Unstrukturierte Daten: Dokumente, E-Mails, Multimedia. Ich behandle sie nicht separat, weil Governance strukturierte und unstrukturierte Daten gleichermaßen umfassen sollte.
DAS GANZE ZUSAMMENFÜGEN
Wenn du die anderen zehn Bereiche integrierst und pflegst, entsteht Data Governance als organisatorisches Ergebnis, also die Rollen, Zuständigkeiten, Prozesse und Kontrollen, die nötig sind, um Daten als wertvolles Asset zu managen. Ich habe Data Governance selbst bewusst nicht als eigenen Baustein beschrieben, weil es das Ergebnis der Integration der anderen Disziplinen ist.
WAS MAN PRAKTISCH GEWINNT
Wenn die Bausteine stimmen, entstehen greifbare Vorteile:
Business-Metadaten erhöhen Verständnis und reduzieren wiederkehrende Klärungen.
Technische Metadaten helfen, Daten korrekt zu finden und zu nutzen.
Operationale Metadaten zeigen, wie Daten in Prozessen verwendet werden.
Strukturelle Metadaten ermöglichen tiefere Analysen und Erkenntnisse.
Referenz- und Stammdaten schaffen eine gemeinsame Sprache und reduzieren Inkonsistenzen.
Kurz: Ein abgestimmtes Zusammenspiel von Menschen, Prozessen und Systemen, das persönliche „Data-Zen“.
Realistisch bleiben
Das ist das optimistische Zielbild. Data Governance löst jedoch nicht sofort alle Probleme. Organisatorische Widerstände, technische Altlasten, uneinheitliche Verantwortlichkeiten und menschliche Fehler bleiben Herausforderungen. Was ich skizziert habe, ist der „Happy Path“: ein Leitbild, kein Versprechen. Trotzdem ist ein klares Zielbild nützlich, um Prioritäten zu setzen und Fortschritt messbar zu machen. Bei vielen unserer Kunden der öffentlichen Verwaltung ist dieses Zielbild auch durch den Gesetzgeber gegeben, allerdings stehen gerade große Organisationen im öffentlichen Sektor vor speziellen Herausforderungen bei der Umsetzung.
Im abschließenden Artikel der Serie bespreche ich, welche organisatorischen Veränderungen nötig sind, welche Rollen benötigt werden (z. B. Data Owner, Data Stewards, Data Custodians) und wie der Start in Richtung Data Governance praktisch aussehen kann.
Autor Dr. Benjamin Kettner
virtual7 GmbH
Amalienbadstr. 41d
76227 Karlsruhe
Telefon: +49 (721) 619017-0
Telefax: +49 (721) 619017-29
http://www.virtual7.de
Content Creator
E-Mail: moritz.wagner@virtual7.de
![]()