Was ist Datenintegration?
Laut Wirtschaftslexikon Gabler ist Datenintegration die „Integration von Daten mehrerer betrieblicher Funktionsbereiche mit dem Ziel, dieselben Daten unmittelbar für verschiedene Aufgaben nutzbar zu machen.“
Konkret bedeutet dies, dass Daten aus verschiedenen Unternehmensbereichen zusammengeführt werden. Diese Daten werden dann in eine bestimmte Form gebracht und stehen authorisierten Benutzern als Informationen zur Verfügung. Diese Informationen können dann in Form einer Tabelle, eines Reports oder direkt auf einem Dashboard (visualsierte Datenanalyse-Plattform) ausgewertet werden.
Was ist ein ETL-Prozess?
Ziel des ETL-Prozesses ist es, die Daten in einem System zu aktualisieren. Dieses Sytem ist normalerweise ein Datamart, ein Data Warehouse oder eine weitere Business Intelligence-Applikation, wie z.B. eine OLAP-Applikation.
Der ETL-Prozess besteht aus drei Schritten:
Die Informationen werden aus dem Quellsystem oder aus Quellsystemen extrahiert. In diesem Schritt werden die Daten gleich auf Konsistenz geprüft.
Die Daten werden bearbeitet und in ein neues Format gebracht. Das Format kann z.B. vom Fachbereich definiert werden oder die Daten müssen in eine bestimmte Form gebracht werden, so dass sie reibungslos integriert werden können.
Die Daten werden in die Zielstruktur geladet.
Welche Anforderungen sollen die heutigen Datenintegrationsplattformen abdecken?
Angesichts der heutigen Mega-Trends, wie z.B. Big Data, Business- sowie Data-Analytics steigen auch die Anforderungen an die Softwareprodukte, mit welchen man eine Datenintegration betreibt. Unten listen wir die wichtigen Merkmale, die bei der Auswahl eines Datenintegration-Tools in der Regel berücksichtigt werden, auf:
- Echtzeit
- Grafische Oberfläche
- Schnelligkeit bei der Beladung von Daten
- Schnelle Entwicklung
- Leicht zu erlernen
- Leichte Bedienung
- Geringe Kosten
- Unkomplizierte Integration in die Gesamtsystemlandschaft
- Hohe Skalierbarkeit
- Verfügbarkeit
- Erweiterbarkeit der Plattform
- Datenbearbeitungsfunktionen
- Modellierung
- Höhere Agilität
- Cloud-Optionen
- Funktionalitäten zur Verbesserung der Datenqualität
- Keine Datenredudanz
- Fehlerquotenreduzierung
- Einheitliche flexible Plattform
- Metadaten-gesteuerte Beladung
Kennen Sie die Leader im Gartner’s Magic Quadrant für Data Integration?
Die meisten Unternehmen bewerten ihre Datenintegrationsplattform als strategisch. Das führt dazu, dass die Anforderungen an die Datenintegration noch weiter steigen. Gartner hat 13 Datenintegrations-Software-Anbieter nach diversen Kriterien bewertet und in einer zweiachsigen Darstellung (dem sogenannten Magic Quadrant) angeorndet. Ziel des Magic Quadrant ist es, den Entscheidern die Toolauswahl zu erleichtern. Im Folgenden werden die 2 Achsen beschrieben und die Kriterien aufgelistet.
Der Magic Quadrant besteht aus 2 Dimensionen oder Achsen:
- Die Achse X stellt Gartners Einschätzung zur Visionskraft des Anbieters dar („completeness of vision“).
- Die Achse Y zeigt Gartners Einschätzung in die Umsetzungsfähigkeit des Software-Unternehmens („ability to execute“).
Mit Hilfe der zwei Achsen werden 4 verschiedenen Quadraten gebildet (Niche players, Visionaries, Challenger und Leaders). Die Anbieter werden entsprechend ihrer Bewertung eingeordnet.
Kriterien für die Bewertung
Die ETL-Software-Anbieter wurden anhand der folgenden Aspekte beurteilt:
- Konnektivität / Adapter-Funktionen (Datenquelle und Zielsystem-Support)
- Datenbelieferung
- Datentransformationsfunktionen
- Metadaten und Datenmodellierung
- Fähigkeiten der Design- und Entwicklungsumgebung
- Support-Funktionen zur Information-Governance (Datenqualität, Profiling und Mining-Funktionen)
- Bereitstellungsoptionen und Echtzeit-Fähigkeit
- Betriebs- und Verwaltungsfunktionen
- Architektur- und Integrationsfähigkeiten
- Dienst-Aktivierungsfunktionen
Die Leader im Jahr 2015
IBM
ETL-Produkte:
- IBM InfoSphere Information Server Enterprise Edition (einschließlich InfoSphere Information Server for Data Integration und InfoSphere Business Information Exchange)
- InfoSphere Federation Server
- InfoSphere Data Replication
- InfoSphere Information Server Enterprise Hypervisor Edition
- WebSphere Cast Iron Live
Kunden (ETL-Produkte):
Mehr als 10.700 Unternehmen weltweit
Informatica
ETL-Produkte:
- Informatica Platform (einschließlich PowerCenter, PowerExchange, Data Services, Data Replication, Ultra Messaging, Big Data, B2B Data Exchange und Data Integration Hub)
- Vibe Data Stream
- Informatica Cloud Integration
Kunden (ETL-Produkte):
Mehr als 5.500 Unternehmen weltweit
Oracle
ETL-Produkte:
- Oracle Data Integrator (ODI)
- Oracle GoldenGate
- Oracle Data Service Integrator
Kunden (ETL-Produkte):
Mehr als 10.000 Unternehmen weltweit
SAP
ETL-Produkte:
- SAP Data Services
- SAP Replication Server
- SAP Landscape Transformation Replication Server
- SAP Process Orchestration
- SAP Hana Cloud Integration
- SAP Hana Enterprise Information Management (EIM, einschließlich SAP Hana Smart Data Integration und SAP Hana Smart Data Quality)
- SAP Agile Data Preparation
- SAP PowerDesigner
Kunden (ETL-Produkte):
Mehr als 15.000 Unternehmen weltweit
SAS
ETL-Produkte:
- Data Management Platform
- Federation Server
- SAS/Access
- SAS Data Loader for Hadoop
- SAS Event Stream Processing
Kunden (ETL-Produkte):
Mehr als 14.000 Unternehmen weltweit