Data Governance as a Service – Azure Purview als Preview verfügbar

Wolfgang Strasser
Freitag, 04. Dezember 2020

Die Anzahl an Systemen, Formaten und auch die Menge an Daten in Unternehmen wurde und wird immer mehr. Die Wichtigkeit von Daten und der tiefere Einblick in „das neue Öl“ der Informationstechnologie sind von entscheidender Wichtigkeit für ein erfolgreiches Wirtschaften in der Zukunft.

Bereits 2006 hat Clive Humby die Wichtigkeit von Daten angeführt und sie – wie oben bereits erwähnt – mit dem Slogan „Data is the new oil!“ beschrieben. Was aber oft bei der Erwähnung dieses Satzes vergessen wird, ist der Zusatz – „It’s valualbe, but if unrefined it cannot really be used“. Daten sind wichtig, aber nur Daten sammeln und die wichtigen Informationen (die Schätze) nicht aus den Daten extrahieren – bei diesem Ansatz geht sehr viel an Erfolgsmöglichkeiten verloren. Beim Azure Data and Analytics Event hat Satya Nadella erwähnt, dass 50% der Fortune 1000 Leaders Daten nicht als wichtiges Asset im Unternehmen behandeln.

Ein wichtiges Instrument, um Herr über die Datenlandschaft zu werden, ist Data Governance. In der Vergangenheit war die Lösungsseite von Microsoft für Data Governance eher dünn besiedelt – die erste Version des Azure Data Catalogs konnte nicht wirklich Fuß fassen.

Das hat sich gestern Abend geändert! Am Azure Data and Analytics Event wurde der neue Azure Data Governance Service, Azure Purview (deutsch: Zuständigkeits-/Aufgabenbereich) in einer Preview vorgestellt.

Purview erlaubt es:

  • Datenquellen zu durchsuchen um daraus Metadaten, Schema und Inhalte zu analysieren
  • Klassifikationen zu definieren und diese in Scanläufen mit den Daten zu überprüfen
  • einen Data Catalog aufzubauen, diesen zu durchsuchen
  • eine end-to-end Sicht der Daten über System, Datenformats und Technologiegrenzen zu verfolgen, analysieren und auszuwerten (Data Lineage)
  • Data Stewards die Datenlandschaft zu analysieren, die richtigen Quellen der Daten zu finden, die Datenqualität mit Klassifikationen zu überprüfen und für weitere Nutzung zur Verfügung zu stellen

1_AzurePurview

Purview bietet eine Reihe von Datenquellen, die in den Analyseprozess eingebunden werden können. Aktuell stehen vor allem Azure Dienste (Data Lake Storage, Azure SQL Database, Synapse Analytics, ..) aber auch z.B. ein on-premises SQL Server als Datenquellen zur Auswahl. Die Strukturen der Elemente in diesen Datenquellen werden analysiert und können mit Data Qualitity Klassifizierungsregeln hinterlegt werden, welche bei den nächsten Analyseläufen dann überprüft werden. Mit diesen Metadaten wird der Data Catalog, Purview DataMap, befüllt und kann dann durchsucht werden:

2_AzurePurview_Metadaten

Eines meiner persönlichen Highlights war die präsentierte Data Lineage Ansicht. Ich traue mich schon fast zu schreiben – jahrzehntelanges Warten hat nun (hoffentlich) ein Ende. Die ersten Demos sehen ja schon mal sehr gut aus:

3_AzurePurview_Demo

Azure Purview ist mit Stand gestern (3. Dezember 2020) als Preview verfügbar und kann bereits im Azure Portal provisioniert werden – was ich natürlich bereits gemacht habe!

4_AzurePurview_Verfuegbar

Über die ersten Erfahrungen und Tests werde ich natürlich gerne auch in diesem Blog berichten.

5_AzurePurview_Tests

 

Mehr Informationen:

 

Weitere Blogbeiträge

zum Thema Analytics

Updates for innovators: Abonnieren Sie unseren Blog