Die Medaillon-Architektur: Wann und warum?

Die Medaillon-Architektur ist ein bewährter Ansatz für Data Lakes und Lakehouses. Sie wird eingesetzt, wenn Unternehmen Daten aus unterschiedlichen Quellen integrieren und gleichzeitig Transparenz, Skalierbarkeit und Nachvollziehbarkeit sicherstellen müssen. Gerade in der Finanz- und Versicherungsbranche, wo regulatorische Anforderungen hoch und Datenvolumen enorm sind, verspricht dieses Prinzip Ordnung und Vertrauen. Die Idee dahinter ist einfach: Daten werden in drei Schichten organisiert, jede mit einer klaren Aufgabe.

  • Bronze: Rohdaten im Originalformat, ergänzt um Herkunft und Zeitstempel.
    Ziel: Vollständigkeit und Nachvollziehbarkeit.
  • Silber: Bereinigte und harmonisierte Daten, angereichert mit Metadaten.
    Ziel: Qualität und Konsistenz.
  • Gold: Kuratierte, konsolidierte Daten für Berichte, Dashboards und KI-Anwendungen.
    Ziel: Klarheit für Entscheidungen.

Diese Struktur reduziert Komplexität und ermöglicht eine schrittweise Qualitätssteigerung, ohne dabei die Flexibilität zu verlieren

Proof-of-Concept: Die Medaillon-Architektur in der Praxis

Wie die vielversprechende Theorie in der Praxis funktioniert, haben wir im Rahmen eines Proof-of-Concept im InventxLab angeschaut.

Bronze – Anbindung ohne Bauchweh

Der erste Schritt in der Medaillon-Architektur ist unspektakulär, aber entscheidend: Daten müssen zuverlässig und nachvollziehbar in die Plattform gelangen. In unserem Proof-of-Concept haben wir verschiedene Quellen angebunden, von exportierten Dateien bis hin zu öffentlichen Schnittstellen. Ziel war nicht maximale Geschwindigkeit, sondern maximale Stabilität. Jede Anbindung sollte eindeutig identifizierbar sein, um Duplikate und Inkonsistenzen zu vermeiden.

Die Rohdaten werden im Originalformat gespeichert, ergänzt um Herkunft und Zeitstempel. Diese Transparenz ist essenziell, um regulatorische Anforderungen wie Nachvollziehbarkeit und Auditierbarkeit zu erfüllen. Erst wenn Bronze stabil steht, kann die Transformation in die nächsten Schichten erfolgen.

Unser wichtigstes Learning: Stabilität vor Tempo – ein klares, nachvollziehbares Landing (Originalformat + Quelle/Zeit) spart später den meisten Aufwand.

Silber – Aus Rohmaterial wird verlässliche Grundlage

In der Silber-Schicht beginnt die eigentliche Veredelung der Daten. Wir haben uns bewusst auf wenige, saubere Schritte konzentriert: Duplikate entfernen, Formate vereinheitlichen, Schreibweisen glätten und Felder harmonisieren. Dieser Schritt schafft die Grundlage für konsistente Analysen und reduziert die Fehleranfälligkeit in nachgelagerten Prozessen.
Besonders spannend wurde es bei unstrukturierten Inhalten wie Audio- und Videodaten. Mit Azure AI Services – etwa dem Azure AI Video Indexer und Azure AI Speech – konnten wir Transkripte, Stichworte und thematische Hinweise automatisiert extrahieren. Diese Metadaten haben wir direkt in unser reguläres Datenmodell integriert. 

Unser wichtigstes Learning: Unstrukturierte Daten müssen nicht kompliziert sein, wenn man sie auf wenige, sinnvolle Felder herunterbricht. Ein gutes Transkript plus klare Labels sind oft mehr wert als zehn «smarte» Features, die niemand erklären kann.

Gold – Konsum dort, wo Entscheidungen fallen

Die Gold-Schicht ist kein Feuerwerk, sondern ein verlässlicher Raum vor dem Konsumieren: Daten werden fachlich verdichtet, einheitlich benannt und zu geprüften Datensätzen zusammengeführt. Damit steigt die Qualität nochmals – widerspruchsfreie Kennzahlen, stabile Schlüsselfelder, klar dokumentierte Abteilungen. Die Datensätze sind so vorbereitet, dass sie im nächsten Schritt reibungslos genutzt werden können, sei es im Dashboard, in einem Report oder als Kontext für eine KI-Abfrage oder Machine Learning. Entscheidungen basieren nicht mehr auf isolierten Punkten, sondern auf konsolidierten, nachvollziehbaren Informationen – das ist der konkrete Mehrwert der Medaillon-Architektur.

Wir haben bewusst auf Klarheit gesetzt: Wenige, klar definierte Daten, direkt hergeleitet aus Bronze und Silber. Wer wissen will, woher eine Zahl kommt, findet die Spur. Diese Transparenz reduziert Diskussionen über Datenqualität und beschleunigt die Entscheidungsfindung.

Unser wichtigstes Learning: Weniger Kennzahlen, mehr Klarheit. Eine kleine, sauber definierte Semantik mit sichtbarer Herkunft schafft Vertrauen und führt schneller zu Entscheidungen.

Ein konkretes Beispiel: Skill-Übersicht für das HR erstellen

Wir zeigen anhand eines konkreten Beispiels, wie sich mit öffentlich zugänglichen Daten eine strategische Sicht auf Skill-Trends entwickeln lässt, ohne interne Personendaten zu nutzen oder Mitarbeitende zu beurteilen. Ausgangspunkt waren ausschliesslich öffentliche Informationen wie Rollenbezeichnungen und LinkedIn-Profile. In der Bronze-Schicht wurden diese Daten unverändert aufgenommen, ergänzt um Herkunft und Zeitstempel. In Silber erfolgte die Harmonisierung, zum Beispiel mit der Vereinheitlichung von Begriffen wie «Entra ID» und «Azure AD». Gold brachte die Daten schliesslich in eine Form, die für das HR unmittelbar nutzbar ist: eine aggregierte Übersicht darüber, welche Kompetenzen im Unternehmen vorhanden sind und wie sich diese im Vergleich zu externen Trends verändern.

Der Mehrwert liegt dabei in der Klarheit, die resultierende Kompetenzlandschaft bietet Orientierung für Weiterbildung und Recruiting, ohne interne Personendaten zu vermischen.

Learnings aus dem PoC

Unser Proof-of-Concept hat gezeigt, dass weniger oft mehr ist. Statt zehn parallele Ideen zu verfolgen, haben wir einen schmalen, stabilen Pfad gewählt und damit schneller Ergebnisse erzielt. Automatisierung ist hilfreich, aber ihr Wert entsteht erst durch Einordnung. Ein Service wie der Video Indexer spart Zeit, aber erst die klare Kontextualisierung macht die Daten nutzbar.

Ein weiteres zentrales Learning: Transparenz schlägt Perfektion. In der Praxis ist es wichtiger, dass jeder Datensatz seinen Ursprung klar erkennen lässt, als dass die erste Version makellos ist. Diese Haltung reduziert Diskussionen und schafft Vertrauen. Das ist besonders wichtig in Branchen, in denen regulatorische Anforderungen hoch sind. Dabei hat sich bestätigt, dass die Medaillon-Architektur weit über die technische Schichtung hinaus ein methodischer Ansatz ist, der Klarheit und Struktur in komplexe Datenlandschaften bringt.

Fazit

Die Medaillon-Architektur ist kein Zaubertrick, sondern eine Haltung: Daten sollen verlässlich, anschlussfähig und erklärbar sein. Bronze sorgt für Ruhe, Silber für Qualität, Gold für Wirkung. Mit Microsoft Fabric als Datenplattform haben wir gezeigt, wie sich dieser Ansatz pragmatisch umsetzen lässt und warum er für die Finanz- und Versicherungsbranche besonders relevant ist.

Mehr zu diesem Thema:

AI-Ready Data: ein Wegweiser für die Schweizer Finanzindustrie – Inventx

Moderne Datenarchitektur für die Finanzindustrie – Inventx