Bild: zVg

Dass die gerade von Unternehmen erzeugten Daten beständig wachsen, besonders die digitalen, ist eine banale Aussage. Nichtsdestotrotz erfreut sie sich gerade bei Marketing- und Werbetreibenden grosser Popularität. Speicherhersteller auf Hard- und Software-Seite begrūnden damit ihre Angebote an immer mächtiger und leistungsfähiger werdenden Systemen, und die Anbieter von Tools setzen auf Artificial Intelligence (AI) und Machine Learning (ML), um irgendwie Ordnung und Sinn in die Datenwelt hineinzubekommen.

Bei Alation spricht man neben solchen Aktivitäten sogar von "Data Culture". Das 2012 gegrūndete Unternehmen mit Sitz in Redwood City, Kalifornien, sieht seine "Vision" darin, sich für die Bedeutung von Data Search und Discovery einzusetzen. Dazu hat man sich besonders für die Entwicklung eines auf Machine Learning (ML) gestützten "Data Catalog" stark gemacht. Alation hat etwa 260 Mitarbeiter und will diese in der nächsten Zeit auf 400 erhöhen. Wie CEO Satyen Sangani auf einer Zoom-Präsentation im Oktober berichtete, habe das Startup in den letzten drei Jahren ein durchschnittliches Wachstum (CAGR) von 110 Prozent vorgelegt.

Alations Konzept eines Data Catalog will ML mit menschlichen Interpretationen und Rückschlüssen verbinden, um die mit dem Wachstum von Daten und dem Metadaten-Management verbundenen Herausforderungen zu bewältigen. Seine Plattform rund um die Kernprodukte Alation Data Catalog und Behavioral Analysis Engine liefert den Kunden – häufig grosse Unternehmen – Lösungen für Data Intelligence: Neben Data Search & Discovery sind das Data Governance, Data Stewardship, Analytics und Digital Transformation.

Zu den Kunden gehören u.a. American Family Insurance, Cisco, Exelon, Finnair, Munich Re, New Balance, Pfizer, Scandinavian Airlines, US Foods und Vattenfall. Bei den Venture Capitalists, die Alation unterstützen, finden sich Costanoa, Data Collective und Salesforce Ventures. Zum Go to Market gehört bei Alation ein ausgeprägtes Ökosystem von Partnerschaften – darunter mit Cloudera, MicroStrategy, Salesforce, Tableau, Teradata und Trifacta.

Ein Data Catalog besteht laut Alation aus einer Sammlung von Metadaten über Informationen, die sich in den verschiedenen IT-Systemen eines Unternehmens oder einer Organisation befinden. Dazu gehören Informationen aus Search & Discovery, Data Governance & Curation sowie Collaboration & Analysis. Alation nimmt für sich in Anspruch, die Technologie von Data Catalog kommerzialisiert und in den Markt eingefūhrt zu haben. Der Co-Founder und CEO Sangani berichtet, dass er während seiner Tätigkeit bei Oracle entsprechende Erfahrungen und Ideen gesammelt hatte. Dies gehe auch zurück darauf, dass es immer wichtiger wurde, sich mit "Big" Data zu beschäftigen.

Während der Präsentation kam auch Andreas Hähre, Head of Information Governance bei dem schwedischen Unternehmen Vattenfall, zu Wort. Vattenfall befindet sich zu 100 Prozent im Besitz des schwedischen Staates und ist ein Energieunternehmen, das als fūnftgrösster Strom- und Wärmeerzeuger in Europa eingestuft wird. Wir haben mit Hähre gesprochen und ihn gefragt, warum man bei seinem Unternehmen Alation einsetzt. Man habe eine Ausschreibung durchgefūhrt, und Alation habe sich gegen einige Marktfūhrer auf dem Gebiet der Datensammlung und -analyse behaupten können, sagt Hähre: "Wir haben mit mehreren Data-Catalog-Anbietern einen Proof of Concept durchgefūhrt. Die Aufgabe war bei allen die gleiche und sollte von unserem Core Team für Information Governance mit durchgefūhrt werden."

Hähre beschreibt, was sein Unternehmen mit dem Einsatz der Alation-Technologie erreichen will: "Es geht im Prinzip um unsere Data Assets, unsere Data Flows und letztlich auch Reports und Analytics. Darüber haben wir noch ein System, welches unsere dazugehörigen Prozesse abbildet. Jedenfalls wollen wir unsere Daten sauber beschreiben, und dazu gehört auch das Business Glossary. Wir glauben, dass die Kollegen nicht nach Tabellen oder Feldern suchen, sondern sie starten zum Beispiel mit der Frage: Was ist ein FTE (Full Time Equivalent)? Der Kollege/die Kollegin findet dann einen Artikel in Alation und kann sich die Definition von FTE für Vattenfall durchlesen. Wenn man dann die Informationen benutzen möchte, kann man sich auf die „Datenseite“ des Datenkataloges durchklicken. Dort findet man Ansprechpartner, Klassifikationen, aber eben auch die Metadaten um FTE."

Bei Vattenfall sieht man laut Hähre derzeit vor allem folgende Use-Cases für Alation:

• Definitionen und Erklärungen zu Business Terms/KPIs finden;
• leichtes Auffinden von Daten, die irgendwo in Vattenfall verfügbar sind;
• Lineage:
o "Woher kommen die Daten, wohin gehen sie. Wer benutzt diese Daten. (Hier auch wichtig das Thema Compliance. Nutzen wir die Daten im legalen Rahmen?)
o Lineage erlaubt uns auch eine Impact-Analyse, wenn untergeordnete Systeme verändert werden. Wen betrifft diese Änderung?“
• Onboarding und Knowledge Capture: "Wenn neue Mitarbeiter kommen, müssen diese mühsam die ganzen Vattenfall-Begriffe lernen. Wir wollen das erleichtern, indem diese im Katalog gepflegt sind. Darüber hinaus gibt es in Unternehmen immer eine Fluktuation von Mitarbeitern. So kommt es vor, dass Wissen abfliesst. Dieses Wissen wollen wir von vornherein zentral sammeln und allen zur Verfügung stellen, so dass ein etwaiger Abgang eines Mitarbeiters schneller zu überwinden ist."
• Datenqualität: "Jetzt ist Alation kein Data Quality Tool, aber wir wollen doch die High-Level Datenqualität in Alation darstellen und transparent machen. In einem späteren Schritt wollen wir dann auch die 'tägliche' Datenqualität in Alation anzeigen."

Die Analysten von Gartner ordnen Alation bereits in den oberen Bereich der Leader bei Metadata Management Solutions ein. Zu den Stärken des Anbieters zählen sie seine Sichtbarkeit am Markt, den Ausbau des Partnersystems und seine Fähigkeiten bei Data Valuation und aktiven Metadaten. Kritikpunkte finden sie bei den Verfahren für Lizenzvergabe und Preisgestaltung, wobei sie sich auf die Aussagen von Referenzkunden berufen.

Alle Bilder: zVg
Alle Bilder: zVg