Data Governance

Datengrundsätze

Was ist Data Governance?

 

"Data Governance ist eine Sammlung von Methoden und Prozessen, die dazu beitragen, die formale Verwaltung von Datenbeständen innerhalb eines Unternehmens sicherzustellen.
Data Governance formalisiert die Definition, Produktion und Verwendung von Daten, um Risiken zu verwalten und die Qualität und Verwendbarkeit ausgewählter Daten zu verbessern."

Ein zentrales Ziel von Data Governance ist die Verbesserung der Datenqualität. Dazu ist vieles notwendig: von Data Stewardship über Data Discovery bis hin zu Data Security. Alle Bestandteile und Initiativen haben gemeinsam, dass sie die Entwicklung der Daten als wichtiges Ziel und als strategisches Mittel für die Zukunft sehen. Es braucht eine koordinierte Steuerung über den gesamten Daten-Lebenszyklus.

Der Satz "Data is the new oil" von Clive Humby aus dem Jahr 2006 ist vielen bekannt. Einen anderen Vergleich von Dan Vasset finden wir in Bezug auf Data Governance noch passender:

"Like water, data needs to be accessible, it needs to be clean und it is needed to survive."

Daten müssen grundsätzlich einmal verfügbar und auffindbar sein. Darüber hinaus muss auch die Qualität der Daten passen, um sie nutzen zu können. Denn: Unternehmen brauchen qualitative Daten um in Zukunft überleben zu können.

Wozu braucht man Data Governance?

 

Einfach gesagt: Um seine Datenlandschaft im Griff zu behalten.
Die gängigsten Fragestellungen, die sich rund um Daten stellen, sind unter anderem:

  • Welche Daten habe ich zur Verfügung und wo finde ich Sie?
  • Wer darf welche Daten nutzen/ändern/löschen?
  • Sind meine Daten noch aktuell? Wie lange muss ich sie aufbewahren?
  • Wann müssen welche Art von Daten wie gelöscht werden?
  • Entsprechen meine Daten der geforderten Qualität?
  • Weiß ich, welche Daten personenbezogen sind, wenn der Kunde Auskunft darüber haben möchte?

Wir brauchen Data Governance also um

  • die Datenqualität kontrollieren und verbessern,
  • die Daten angemessen schützen,
  • die bestehende Daten-Landschaft katalogisieren und
  • den gesamten Lebenszyklus von der Erstellung bis zur Archivierung der Daten steuern zu können.

Wir brauchen Data Governance außerdem, um Rollen und Verantwortlichkeiten über Datenobjekte klar festzulegen. Oft werden Data Governance-Aufgaben schon implizit von jemanden erledigt, ohne dass er oder sie dazu eine bestimmte Rolle trägt.

Durch die klare Definition von Rollen werden solche implizite Verantwortlichkeiten manifestiert und Mandate vergeben. Damit schafft man Wertschätzung und hoffentlich auch die benötigten Ressourcen.

Warum ist Data Governance wichtig?

 

Zahlreiche Umfragen und Studien zeigen die Einschätzung von Führungskräften, dass es einen direkten Zusammenhang zwischen effektiver Nutzung von Daten und besseren Unternehmensergebnissen gibt. Beispielsweise glauben 77% der befragten Führungskräfte vom Harvard Business Review , dass eine erfolgreiche Datenstrategie entscheidend für den Geschäftserfolg ist.

Dabei ist es völlig egal, ob Sie das Wissen aus Ihren Daten für eine personalisierte Begeisterung ihrer Kunden einsetzen, daraus neuartige Produkt- oder Geschäftsideen entwickeln oder die Qualität Ihrer Produkte verbessern. Es ist auch weniger relevant, um welche Daten es sich handelt, Buchhaltungsdaten, IoT-Daten oder Daten aus Ihrer Produktion.

Wichtig ist, dass Ihre Basis immer hochwertige Daten sind. In der richtigen Qualität und Granularität. Data Governance setzt genau hier an. Damit haben Sie Ihre Daten im Griff und können das unglaubliche Potential heben, das bereits jetzt in Ihren Daten schlummert.

Ohne dass Unternehmen ihre Daten im Griff haben, also ohne Data Governance, wird es zukünftig sehr schwer sein, den Erfolg aufrecht zu erhalten oder auszubauen.

Machen Sie schon Data Governance?

 

Wenn wir mit unseren Projektpartnern das Thema Data Governance erarbeiten, wird eines sehr oft früh ersichtlich: Einige der betroffenen Aufgaben werden ohnehin bereits erledigt und gehören mehr oder weniger zum Tagesgeschäft.

So weiß man z.B. meist wer im Unternehmen zuständig ist, wenn

  • die Daten eines Berichts nicht zusammenpassen,
  • sich Fehler in den Stammdaten zeigen, oder
  • man Zugriff auf bestimmte Daten benötigt.

Aus Sicht von Data Governance werden diese Aufgaben der Rolle des "Data Steward" zugeordnet.

Auch wenn diese Rolle oft nicht offiziell besetzt wurde: Meist weiß man in diesem Fall, wen man fragen muss und wer über diese eine Datenquelle üblicherweise Bescheid weiß. Oft sind diese Aufgaben nicht formalisiert, sind aber aus der betrieblichen Realität nicht wegzudenken.

Es handelt sich dabei um implizite Verantwortlichkeiten. Oft haben die betroffenen Personen jahrelang Wissen und Erfahrung in ihrer täglichen Arbeit aufgebaut und sind dadurch in diese Rolle "hineingerutscht". Sie kümmern sich (neben ihren täglichen Aufgaben) um einen bestimmten Datenbereich.

Mit Data Governance werden solche Verantwortlichkeiten in eine Struktur gebracht und Verbindlichkeit geschaffen. Auch die dafür notwendigen Ressourcen werden so sichtbarer. Nur so kann sichergestellt werden, dass für jede Datenquelle eine Ansprechperson definiert wurde und jeder nachsehen kann, wie diese eine Kennzahl denn nun berechnet wird. Und dass dieses Wissen auch langfristig in Ihrem Unternehmen bleibt.

Was ist Data Governance NICHT?

Data Governance umfasst viele verschiedene Begriffe und Definitionen. Wenn man sich damit beschäftigt, ist es wichtig sich über mögliche Irrtümer im Klaren zu sein.

Nummer 1: Data Governance ist nicht nur Data Stewardship!

Data Stewards bekleiden eine zentrale Rolle im Data Governance. Sie kümmern sich um die Daten und deren Qualität, deshalb sind natürlich besonders wichtig und eine Grundvoraussetzung. Aber das alleine ist noch kein Data Governance! Es braucht den organisatorischen Rückhalt und die dazugehörigen Prozesse für die Steuerung des Daten-Lebenszyklus von der Erzeugung über die Nutzung bis zur Archivierung bzw. Löschung der Daten.

Nummer 2: Data Governance ist keine Software!

Die Steuerung des Daten-Lebenszyklus kann ohne Zweifel durch Werkzeuge unterstützt und erleichtert werden. Diese können aber nur dann sinnvoll eingesetzt werden, wenn zuvor die organisatorischen Rahmenbedingungen mit Rollen, Prozessen und Ressourcen geschaffen wurden. Auch wenn Tool-Hersteller vieles versprechen, eine Software ersetzt nicht ein Data Governance-Programm.

Nummer 3: Data Governance ist kein Projekt mit einem Abschluss, sondern ein ständiger Prozess!

Dieser Punkt ist aus unserer Sicht besonders wichtig! Für die Vorbereitung und Einführung von Data Governance im Unternehmen sollte eine kompetente Projektgruppe gebildet werden. Darin sollten möglichst viele der betroffenen Stakeholder vertreten sein. Dieses Projekt soll die organisatorischen Rahmenbedingungen schaffen. Mit dem Abschluss des Einführungsprojektes startet erst die eigentlich Arbeit.

Nur wenn Data Governance sich in das Tagesgeschäft integriert und dauerhaft gelebt wird, kann es erfolgreich sein.

Wie beginne ich mit Data Governance?

Im Rahmen von Kunden-Projekten und Data Governance Workshops stellt sich nach dem Einstieg ins Thema natürlich sehr bald die Frage: Wie starten wir nun am besten? Wie bringen wir unsere Data Governance Initiative "auf die Straße"?

Wir wollen Ihnen hier ein paar Tipps geben, wie Sie mit Data Governance am Besten starten.

Zu Beginn ist es aus unserer Sicht am Wichtigsten, den Status Quo zu erheben und zu analysieren. Niemand beginnt von Null, denn in jedem Unternehmen werden einige Aufgaben, die zu Data Governance gehören, ja ohnehin schon gemacht.  Diese müssen sichtbar gemacht werden.

Bei dieser Analyse sollten Sie feststellen, wo es bereits gut läuft und wo es Probleme und damit Verbesserungsmöglichkeiten gibt. Außerdem sollte man sich die Frage stellen: Was kann ich aktuell NICHT machen, weil es die Datenqualität nicht erlaubt? Die Antworten darauf liefern uns bereits mögliche Inhalte für den Data Governance Business Case.

Dieser Business Case ist wichtig, denn er dokumentiert die Notwendigkeit und den Nutzen von Data Governance in Ihrem Unternehmen. Denn Eines ist auch klar: Sie benötigen das Mandat der Geschäftsführung. Ohne Rückhalt und entsprechende Ressourcen ist der Erfolg Ihrer Data Governance Initiative von Beginn an gefährdet.

Iterative Data Governance

Ist die strategische Entscheidung zum Start eines Data Governance Programms gefallen, stellt sich dann die Frage nach einem geeigneten Startpunkt. Entscheiden sich Unternehmen dafür, strukturiertes Data Governance einzuführen geschieht dies in der Regel im Rahmen von den bereits erwähnten Data Governance Initiativen, also einzelnen Projekten, die dazu dienen, schrittweise die strukturierte Steuerung von Datenlebenszyklen zu erreichen.

Bei der Auswahl an möglichen Kandidaten für eine Data Governance Initiative können verschiedene Richtungen eingeschlagen werden.

  1. Einerseits über einen Data Catalog und die Katalogisierung der bestehenden Datenlandschaft. Welche Daten sind im Unternehmen vorhanden, was passiert mit diesen und wo sind gegebenenfalls Anomalien?
  2. Andererseits kann die Data Governance Initiative auch anforderungsgetrieben sein. Was sind die wichtigsten Kennzahlen und welche Daten werden für Reports benötigt? Sind bereits vorhandene Prozesse oder Zuständigkeiten nutzbar?

Der erste, eher technische Ansatz orientiert sich am Gesamtbestand der Daten im Unternehmen und versucht diesen greifbar zu machen. Daten werden katalogisiert und mit einem organisatorischen Überbau versehen. Der Vorteil dabei ist, dass die Menge an Daten zwar recht umfangreich, aber auch in ihrer Gesamtheit bekannt ist. Es besteht wenig Risiko, dass einzelne Bereiche "übersehen" werden und vor allem wird der gesamtorganisatorische Bedarf aufgezeigt. Spezialisierte Werkzeuge für Data-Catalogs und Data Profiling können hier unterstützen und einzelne Teilschritte können effizient automatisiert werden. Einer der Nachteile dieses Ansatzes ist die Fehlende Differenzierung und Priorisierung der Datenbereiche. Aufgrund der großen Menge an Daten und der hohen Komplexität (geschuldet den Anforderungen der operativen Prozesse und gegebenenfalls den Vorsystemen) wird nur schwer unterschieden, welche Daten nun angepasster Steuerungsmechanismen bedürfen und für welche bestehende Prozesse in den Vorsystemen ausreichend sind.

Überzeugen Sie Ihre Stakehoder

Für eine erfolgreiche Data Governance Initiative sind entsprechende Ressourcen und der Rückhalt im Management essentiell.

Um die entsprechenden Personen davon zu überzeugen, stellt sich natürlich zwangsläufig die Frage, wer überhaupt die Stakeholder der Data Governance Initiative sind. Es gilt die Personen zu identifizieren, deren Unterstützung oder Mitwirkung erforderlich ist, aber auch jene Personen, die von einer erfolgreichen Umsetzung direkt profitieren. Diese können sowohl intern wie extern sein. Externe Stakeholder können beispielsweise Partnerunternehmen mit gemeinsamer Ausrichtung sein.

Sind die Personen identifiziert, gilt es noch inhaltlich entscheidende Fragen vorzubereiten:

  • Was können wir derzeit nicht tun oder entscheiden, weil unsere Datenlandschaft unzureichend gesteuert ist?
  • Welches Potential schlummert in unseren Daten? Was könnten wir erreichen?
  • Und, welche Auswirkung hätte die erfolgreiche Umsetzung der Data Governance Initiative?
    • Zum Beispiel ein verbesserter Zugang zu Daten,
    • ein besseres Verständnis für unsere Daten,
    • die Hebung der Datenqualität und somit eine besser Entscheidungsgrundlage oder
    • eine effizientere und kontrollierbare Nutzung der Daten.

Data Governance und Data Science

In diesem Interview erklärt unser Chief Data Scientist Dr. Mario Schnalzenberger, warum Data Governance aus Sicht eines Data Scientisten wichtig ist.

Data Governance und Datenschutz

In diesem Interview mit Mag. Julia Crosina-Schreiber, Leiterin der Rechtsabteilung der ACP Gruppe, erfahren Sie, welche Zusammenhänge es zwischen Data Governance und Datenschutz gibt, beziehungsweise wie Ihnen Data Governance bei der Einhaltung des Datenschutzrechtes hilft und welche Vorteile damit verbunden sind.

   

 

Was ist Data Governance?

"Data Governance ist eine Sammlung von Methoden und Prozessen, die dazu beitragen, die formale Verwaltung von Datenbeständen innerhalb eines Unternehmens sicherzustellen.

Data Governance formalisiert die Definition, Produktion und Verwendung von Daten, um Risiken zu verwalten und die Qualität und Verwendbarkeit ausgewählter Daten zu verbessern."

Ein zentrales Ziel von Data Governance ist die Verbesserung der Datenqualität. Dazu ist vieles notwendig: von Data Stewardship über Data Discovery bis hin zu Data Security. Alle Bestandteile und Initiativen haben gemeinsam, dass sie die Entwicklung der Daten als wichtiges Ziel und als strategisches Mittel für die Zukunft sehen. Es braucht eine koordinierte Steuerung über den gesamten Daten-Lebenszyklus.

Der Satz "Data is the new oil" von Clive Humby aus dem Jahr 2006 ist vielen bekannt. Einen anderen Vergleich von Dan Vasset finden wir in Bezug auf Data Governance noch passender:

"Like water, data needs to be accessible, it needs to be clean und it is needed to survive."

Daten müssen grundsätzlich einmal verfügbar und auffindbar sein. Darüber hinaus muss auch die Qualität der Daten passen, um sie nutzen zu können. Denn: Unternehmen brauchen qualitative Daten um in Zukunft überleben zu können.

 

Wozu braucht man Data Governance?

 

Einfach gesagt: Um seine Datenlandschaft im Griff zu behalten.
Die gängigsten Fragestellungen, die sich rund um Daten stellen, sind unter anderem:

  • Welche Daten habe ich zur Verfügung und wo finde ich Sie?
  • Wer darf welche Daten nutzen/ändern/löschen?
  • Sind meine Daten noch aktuell? Wie lange muss ich sie aufbewahren?
  • Wann müssen welche Art von Daten wie gelöscht werden?
  • Entsprechen meine Daten der geforderten Qualität?
  • Weiß ich, welche Daten personenbezogen sind, wenn der Kunde Auskunft darüber haben möchte?

Wir brauchen Data Governance also um

  • die Datenqualität kontrollieren und verbessern,
  • die Daten angemessen schützen,
  • die bestehende Daten-Landschaft katalogisieren und
  • den gesamten Lebenszyklus von der Erstellung bis zur Archivierung der Daten steuern zu können.

Wir brauchen Data Governance außerdem, um Rollen und Verantwortlichkeiten über Datenobjekte klar festzulegen. Oft werden Data Governance-Aufgaben schon implizit von jemanden erledigt, ohne dass er oder sie dazu eine bestimmte Rolle trägt.

Durch die klare Definition von Rollen werden solche implizite Verantwortlichkeiten manifestiert und Mandate vergeben. Damit schafft man Wertschätzung und hoffentlich auch die benötigten Ressourcen.

 

Was ist Data Governance NICHT?

Data Governance umfasst viele verschiedene Begriffe und Definitionen. Wenn man sich damit beschäftigt, ist es wichtig sich über mögliche Irrtümer im Klaren zu sein.

Nummer 1: Data Governance ist nicht nur Data Stewardship!

Data Stewards bekleiden eine zentrale Rolle im Data Governance. Sie kümmern sich um die Daten und deren Qualität, deshalb sind natürlich besonders wichtig und eine Grundvoraussetzung. Aber das alleine ist noch kein Data Governance! Es braucht den organisatorischen Rückhalt und die dazugehörigen Prozesse für die Steuerung des Daten-Lebenszyklus von der Erzeugung über die Nutzung bis zur Archivierung bzw. Löschung der Daten.

Nummer 2: Data Governance ist keine Software!

Die Steuerung des Daten-Lebenszyklus kann ohne Zweifel durch Werkzeuge unterstützt und erleichtert werden. Diese können aber nur dann sinnvoll eingesetzt werden, wenn zuvor die organisatorischen Rahmenbedingungen mit Rollen, Prozessen und Ressourcen geschaffen wurden. Auch wenn Tool-Hersteller vieles versprechen, eine Software ersetzt nicht ein Data Governance-Programm.

Nummer 3: Data Governance ist kein Projekt mit einem Abschluss, sondern ein ständiger Prozess!

Dieser Punkt ist aus unserer Sicht besonders wichtig! Für die Vorbereitung und Einführung von Data Governance im Unternehmen sollte eine kompetente Projektgruppe gebildet werden. Darin sollten möglichst viele der betroffenen Stakeholder vertreten sein. Dieses Projekt soll die organisatorischen Rahmenbedingungen schaffen. Mit dem Abschluss des Einführungsprojektes startet erst die eigentlich Arbeit.

Nur wenn Data Governance sich in das Tagesgeschäft integriert und dauerhaft gelebt wird, kann es erfolgreich sein.

 

Warum ist Data Governance wichtig?

 

Zahlreiche Umfragen und Studien zeigen die Einschätzung von Führungskräften, dass es einen direkten Zusammenhang zwischen effektiver Nutzung von Daten und besseren Unternehmensergebnissen gibt. Beispielsweise glauben 77% der befragten Führungskräfte vom Harvard Business Review , dass eine erfolgreiche Datenstrategie entscheidend für den Geschäftserfolg ist.

Dabei ist es völlig egal, ob Sie das Wissen aus Ihren Daten für eine personalisierte Begeisterung ihrer Kunden einsetzen, daraus neuartige Produkt- oder Geschäftsideen entwickeln oder die Qualität Ihrer Produkte verbessern. Es ist auch weniger relevant, um welche Daten es sich handelt, Buchhaltungsdaten, IoT-Daten oder Daten aus Ihrer Produktion.

Wichtig ist, dass Ihre Basis immer hochwertige Daten sind. In der richtigen Qualität und Granularität. Data Governance setzt genau hier an. Damit haben Sie Ihre Daten im Griff und können das unglaubliche Potential heben, das bereits jetzt in Ihren Daten schlummert.

Ohne dass Unternehmen ihre Daten im Griff haben, also ohne Data Governance, wird es zukünftig sehr schwer sein, den Erfolg aufrecht zu erhalten oder auszubauen.

 

Machen Sie schon Data Governance?

 

Wenn wir mit unseren Projektpartnern das Thema Data Governance erarbeiten, wird eines sehr oft früh ersichtlich: Einige der betroffenen Aufgaben werden ohnehin bereits erledigt und gehören mehr oder weniger zum Tagesgeschäft.

So weiß man z.B. meist wer im Unternehmen zuständig ist, wenn

  • die Daten eines Berichts nicht zusammenpassen,
  • sich Fehler in den Stammdaten zeigen, oder
  • man Zugriff auf bestimmte Daten benötigt.

Aus Sicht von Data Governance werden diese Aufgaben der Rolle des "Data Steward" zugeordnet.

Auch wenn diese Rolle oft nicht offiziell besetzt wurde: Meist weiß man in diesem Fall, wen man fragen muss und wer über diese eine Datenquelle üblicherweise Bescheid weiß. Oft sind diese Aufgaben nicht formalisiert, sind aber aus der betrieblichen Realität nicht wegzudenken.

Es handelt sich dabei um implizite Verantwortlichkeiten. Oft haben die betroffenen Personen jahrelang Wissen und Erfahrung in ihrer täglichen Arbeit aufgebaut und sind dadurch in diese Rolle "hineingerutscht". Sie kümmern sich (neben ihren täglichen Aufgaben) um einen bestimmten Datenbereich.

Mit Data Governance werden solche Verantwortlichkeiten in eine Struktur gebracht und Verbindlichkeit geschaffen. Auch die dafür notwendigen Ressourcen werden so sichtbarer. Nur so kann sichergestellt werden, dass für jede Datenquelle eine Ansprechperson definiert wurde und jeder nachsehen kann, wie diese eine Kennzahl denn nun berechnet wird. Und dass dieses Wissen auch langfristig in Ihrem Unternehmen bleibt.

 

Wie beginne ich mit Data Governance?

Im Rahmen von Kunden-Projekten und Data Governance Workshops stellt sich nach dem Einstieg ins Thema natürlich sehr bald die Frage: Wie starten wir nun am besten? Wie bringen wir unsere Data Governance Initiative "auf die Straße"?

Wir wollen Ihnen hier ein paar Tipps geben, wie Sie mit Data Governance am Besten starten.

Zu Beginn ist es aus unserer Sicht am Wichtigsten, den Status Quo zu erheben und zu analysieren. Niemand beginnt von Null, denn in jedem Unternehmen werden einige Aufgaben, die zu Data Governance gehören, ja ohnehin schon gemacht.  Diese müssen sichtbar gemacht werden.

Bei dieser Analyse sollten Sie feststellen, wo es bereits gut läuft und wo es Probleme und damit Verbesserungsmöglichkeiten gibt. Außerdem sollte man sich die Frage stellen: Was kann ich aktuell NICHT machen, weil es die Datenqualität nicht erlaubt? Die Antworten darauf liefern uns bereits mögliche Inhalte für den Data Governance Business Case.

Dieser Business Case ist wichtig, denn er dokumentiert die Notwendigkeit und den Nutzen von Data Governance in Ihrem Unternehmen. Denn Eines ist auch klar: Sie benötigen das Mandat der Geschäftsführung. Ohne Rückhalt und entsprechende Ressourcen ist der Erfolg Ihrer Data Governance Initiative von Beginn an gefährdet.

 

Iterative Data Governance

Ist die strategische Entscheidung zum Start eines Data Governance Programms gefallen, stellt sich dann die Frage nach einem geeigneten Startpunkt. Entscheiden sich Unternehmen dafür, strukturiertes Data Governance einzuführen geschieht dies in der Regel im Rahmen von den bereits erwähnten Data Governance Initiativen, also einzelnen Projekten, die dazu dienen, schrittweise die strukturierte Steuerung von Datenlebenszyklen zu erreichen.

Bei der Auswahl an möglichen Kandidaten für eine Data Governance Initiative können verschiedene Richtungen eingeschlagen werden.

  1. Einerseits über einen Data Catalog und die Katalogisierung der bestehenden Datenlandschaft. Welche Daten sind im Unternehmen vorhanden, was passiert mit diesen und wo sind gegebenenfalls Anomalien?
  2. Andererseits kann die Data Governance Initiative auch anforderungsgetrieben sein. Was sind die wichtigsten Kennzahlen und welche Daten werden für Reports benötigt? Sind bereits vorhandene Prozesse oder Zuständigkeiten nutzbar?

Der erste, eher technische Ansatz orientiert sich am Gesamtbestand der Daten im Unternehmen und versucht diesen greifbar zu machen. Daten werden katalogisiert und mit einem organisatorischen Überbau versehen. Der Vorteil dabei ist, dass die Menge an Daten zwar recht umfangreich, aber auch in ihrer Gesamtheit bekannt ist. Es besteht wenig Risiko, dass einzelne Bereiche "übersehen" werden und vor allem wird der gesamtorganisatorische Bedarf aufgezeigt. Spezialisierte Werkzeuge für Data-Catalogs und Data Profiling können hier unterstützen und einzelne Teilschritte können effizient automatisiert werden. Einer der Nachteile dieses Ansatzes ist die Fehlende Differenzierung und Priorisierung der Datenbereiche. Aufgrund der großen Menge an Daten und der hohen Komplexität (geschuldet den Anforderungen der operativen Prozesse und gegebenenfalls den Vorsystemen) wird nur schwer unterschieden, welche Daten nun angepasster Steuerungsmechanismen bedürfen und für welche bestehende Prozesse in den Vorsystemen ausreichend sind.

Eine anforderungsgetriebene Herangehensweise hingegen beginnt mit der Priorisierung der Daten und schafft somit einen Fokus auf jene Bereiche, deren strukturierte Steuerung (Governance) den größten Einfluss hat. Das Thema Daten wird sozusagen von Hinten aufgerollt. Beginnend mit den verwendeten Kennzahlen und Berichten wird evaluiert, welche Daten darauf Einfluss haben und ob deren aktuelle Steuerungsmechanismen gut genug oder ausbaufähig sind. Dieser Ansatz erleichtert es, einzelne "PainPoints" in der Datenlandschaft herauszuheben und das Data Governance Programm dahingehend zu priorisieren.

Die grundlegende Entscheidung bei der Wahl der Herangehensweise ist, ob die Governance Strukturen komplett neu aufgebaut werden sollen (mit dem Fokus auch wirklich alle Datenbereiche abzudecken), oder ob bestehende Strukturen umgebaut werden sollen und die Priorisierung nach Einfluss der Daten auf (entscheidungsrelevante) Kennzahlensysteme erfolgen soll.

 

Überzeugen Sie Ihre Stakehoder

Für eine erfolgreiche Data Governance Initiative sind entsprechende Ressourcen und der Rückhalt im Management essentiell.

Um die entsprechenden Personen davon zu überzeugen, stellt sich natürlich zwangsläufig die Frage, wer überhaupt die Stakeholder der Data Governance Initiative sind. Es gilt die Personen zu identifizieren, deren Unterstützung oder Mitwirkung erforderlich ist, aber auch jene Personen, die von einer erfolgreichen Umsetzung direkt profitieren. Diese können sowohl intern wie extern sein. Externe Stakeholder können beispielsweise Partnerunternehmen mit gemeinsamer Ausrichtung sein.

Sind die Personen identifiziert, gilt es noch inhaltlich entscheidende Fragen vorzubereiten:

  • Was können wir derzeit nicht tun oder entscheiden, weil unsere Datenlandschaft unzureichend gesteuert ist?
  • Welches Potential schlummert in unseren Daten? Was könnten wir erreichen?
  • Und, welche Auswirkung hätte die erfolgreiche Umsetzung der Data Governance Initiative?
    • Zum Beispiel ein verbesserter Zugang zu Daten,
    • ein besseres Verständnis für unsere Daten,
    • die Hebung der Datenqualität und somit eine besser Entscheidungsgrundlage oder
    • eine effizientere und kontrollierbare Nutzung der Daten.

 

Data Governance und Data Science

In diesem Interview erklärt unser Chief Data Scientist Dr. Mario Schnalzenberger, warum Data Governance aus Sicht eines Data Scientisten wichtig ist.

 

Data Governance und Datenschutz

In diesem Interview mit Mag. Julia Crosina-Schreiber, Leiterin der Rechtsabteilung der ACP Gruppe, erfahren Sie, welche Zusammenhänge es zwischen Data Governance und Datenschutz gibt, beziehungsweise wie Ihnen Data Governance bei der Einhaltung des Datenschutzrechtes hilft und welche Vorteile damit verbunden sind.

Datengrundsätze

Auf Basis guter Daten können bessere Entscheidungen getroffen werden und innovative Geschäftsmodelle entwickelt werden.
In unserer datengetriebenen Gesellschaft werden für Unternehmen Daten in Zukunft so wichtig sein, wie es das Wasser für uns Menschen ist - überlebenswichtig.
Deshalb ist es auch unserer Sicht wichtig, dass in Bezug auf Daten folgende Grundsätze gelebt werden:

 

1. Daten werden als strategisches Kapital des Unternehmens anerkannt

Hier muss das Credo lauten: Von "meinen Daten" zu "unseren Daten".

Daten sind eine wertvolle Ressource und Grundlage von Unternehmensentscheidungen. Sie sollten auch dementsprechend behandelt, kontrolliert und gesichert werden. Die Entscheidungsträger und alle handelnden Personen im Unternehmen müssen sich auf die Qualität und Verfügbarkeit der Daten verlassen können.

2. Daten werden klare Verantwortlichkeiten zugewiesen

Es ist wichtig, dass Daten nicht in "Silos" (Applikationen) gehalten, sondern unternehmensweit geteilt und nutzbar gemacht werden. Dazu ist es unbedingt notwendig, dass die Daten exakt definiert und für alle klar beschrieben werden. Ein gemeinsames Vokabular muss geschaffen werden. Dies erleichtert die korrekte Verwendung und die Verknüpfung von Daten aus verschiedenen Unternehmensbereichen.

Für die unternehmenswerte Nutzung von Daten sind Regeln und Verantwortlichkeiten für die Definition und den Schutz von Daten notwendig. Der Zugriff auf Daten muss durch definierte Schnittstellen erfolgen, Daten müssen vor unerlaubtem Zugriff geschützt werden.

Data Owners bzw. Data Stewards sind verantwortlich für die Definition, die Nutzung und den Schutz der Daten.

3. Daten müssen gemäß internen und externen Regeln verwaltet werden

Gesetze und Richtlinien wie z.B. das österreichische Datenschutzgesetz (DSG) geben die Rahmenbedingungen für den Schutz und die Vertraulichkeit von bestimmten Daten vor, z.B. wenn es sich um personenbezogene und besonders schützenswerten Daten handelt.

Dementsprechend muss die Verteilung und Bereitstellung von Daten immer auch unter dem Gesichtspunkt des kontrollierten Zugriffs und Schutzes von sensiblen Daten geschehen.

Dies braucht ebenso klare Regeln und Verantwortlichkeiten. Die Nutzung von Daten muss aufgezeichnet und kontrolliert werden.

4. Die Datenqualität muss über den gesamten Lebenszyklus sichergestellt werden

Die Standards und Regeln für Datenqualität müssen klar und für alle nachvollziehbar definiert werden. Datenqalität muss messbar sein, dadurch wird eine Kontrolle und Verbesserung der Datenqualität möglich.

Die Konsistenz, Zuverlässigkeit und Vollständigkeit der Daten sind wichtige Kriterien für die Nutzbarkeit von Daten im Unternehmen. Entscheidungsträger müssen sich auf die Verfügbarkeit und Korrektheit der Daten verlassen können.

 

Um diese Grundsätze im Unternehmen zu verankern und auch tatsächlich zu leben, braucht es Data Governance und ein Team, das für die Umsetzung sorgt.
Erstmals formuliert wurden diese Grundsätze vor rund 10 Jahren von Robert S. Seiner, einem der bekanntesten Experten und Autoren zum Thema Data Governance. Sie haben unserer Sicht nichts an Relevanz und Dringlichkeit verloren. Im Gegenteil - sie werden immer wichtiger.

Data Governance Webinar

    

Die richtige Qualität der Daten

Dass eine gute Datenqualität enorm wichtig ist, haben wir schon mehrfach angesprochen. Doch was sind die entscheidenden Merkmale für Datenqualität?
Wir finden diese 6 Kriterien besonders wichtig: Die Daten müssen vollständig, aktuell, konsistent, einzigartig, konform und genau sein.

 

Vollständigkeit

Es müssen alle Daten vorhanden sein, um die jeweilige Aufgabe (operativ oder analytisch) bewältigen zu können. Ein Fehlen von notwendigen Daten führt dazu, dass Prozesse möglicherweise ins Stocken geraten. Um die Unterstützung von Geschäftsprozessen sicherzustellen, sind eine Definition von Pflichtfeldern (im Kontext der jeweiligen Aufgabe) sowie automatisierte Prüfungen an ausgewählten Prozesspunkten empfehlenswert.
Es ist ein mehr oder weniger schmaler Grat zwischen der obsessiven Sammlung aller möglichen Daten und deren Beschränkung auf prozessgegeben notwendige (und am Beispiel der DSGVO auch erlaubten) Menge an zu füllenden Attributen. Nicht mehr benötigte Daten belasten technische wie organisatorische Ressourcen und sind nachhaltig zu löschen.

Aktualität

Veraltete Informationen sind eine beträchtliche "Prozess-Bremse". Auf Basis von veralteten Daten werden nicht nur potentiell falsche Entscheidungen getroffen, sondern diese führen auch in manchen Fällen zu falschen / unnötigen Aktionen in operativen Prozessen. Ein gängiges Beispiel sind veraltete Kundendaten die zum Beispiel zu "falschen" Mailings führen. Zentralisierte Daten-Drehscheiben oder auch die dezitierte Festlegung auf "führende-Systeme" für einen bestimmten Datenbereich können hier Abhilfe schaffen, um das Datenqualitätsmerkmal für alle Beteiligten leichter erreichbar zu machen.

Dennoch muss nicht jeder Datenbestand in Echtzeit vorliegen. Eine genaue Betrachtung der Prozesse zeigt auf wo eine schnellere / hochfrequente Aktualisierung zur Produktivität beiträgt.

Konsistenz

Datensätze verschiedener Systeme dürfen sich nicht widersprechen. Es kommt in der Praxis häufig vor, dass aus unterschiedlichen Gründen Daten in mehreren Systemen redundant gehalten werden. In vielen Fällen aus praktikabilitätsgründen eingeführt, führt dies im besten Fall „nur“ zu Mehraufwand für die Dateneingabe. Im schlimmsten Fall entstehen Fehler, etwa beim Übertrag der Daten in Folgesysteme oder deren Nutzung zu analytischen Zwecken. Heute aktuelle Integrationsmechanismen können hier Abhilfe schaffen, entbinden aber nicht von der "Designentscheidung", welche der redundanten (aber dennoch abweichenden) Daten nun als gültig zu sehen sind.

Genauigkeit/Granularität

Daten müssen ausreichend genau sein. Denn nicht jeder Geschäftsprozess benötigt Daten bis auf die x-te Kommastelle (bzw. kann diese sinnvoll nutzen / darstellen). Die Genauigkeit betrifft jedoch nicht nur das "Datenformat" einzelner Attribute, sondern in vielen Fällen auch die Granularität der Daten. So können manche Werte z.B. nur auf Monat-Ebene sinnvoll in die Analysen integriert werden, wohingegen andere (z.B. Messdaten) in kleinen Zeitscheiben erforderlich sind.
Die Genauigkeit ist nicht nur Teil kontinuierlicher Qualitätsprüfungen, sondern vor allem eine Designentscheidung in Abstimmung mit den fachlichen Anforderungen.

Einzigartigkeit

Begleitend zur Konsistenz passt die Einzigartigkeit. Doppelte Werte blähen nicht nur den Datenbestand unnötig auf, sondern sorgen bei Abweichungen (siehe Konsistenz) auch für unnötige Rückfragen und somit vermeidbare Prozessaufwände. Aus Sicht von Analyseaufgaben behindern solche mehrfachen Werte die Bildung von Kennzahlen erheblich. Ein automatisiertes Data Quality Monitoring oder Data Profiling bietet einen nachhaltigeren Weg zu sauberen Daten.

Konformität

Daten müssen den Anforderungen der Systeme und der Prozesse entsprechen. Dieses Merkmal wird einerseits im Bereich von systemübergreifenden Schnittstellen schlagend (z.B. in Form standardisierter Datentypen für Datumswerte) aber auch für die Integration von Daten in analytische Modelle (klare Definition des Formates von Fremdschlüssel).

Verbesserungsbedarf in der Konformität zeigt sich jedoch frühzeitig in Auswertungen, da hier offensichtliche Probleme in der Verdichtung von Daten oder schon im Aufbau der OLAP Modelle ans Licht kommen.