OLAP und In Memory sind zwei Schlagworte, die im Business Intelligence-Alltag sehr verbreitet sind. In dieser Video-Serie lernen Sie die Grundkonzepte, Vorteile, Architekturen und konkrete Anwendungen in der Praxis (Video-Teil 1, Video-Teil 2), welche Business Intelligence-Methode für Sie am geeignetsten ist und wie Sie in kurzer Zeit die richtige Business Intelligence-Software auswählen sowie einführen können (Video-Teil 3).
In diesem Video lernen Sie in Theorie und Livedemo:
- Was OLAP ist.
- Auf welchem Grundkonzept OLAP aufbaut.
- Wie OLAP den Datenraum in Dimensionen, Fakten und Hierarchien strukturiert.
- Welche Auswertungsmöglichkeiten und Analyse-Funktionalitäten OLAP bietet.
- Wie Sie OLAP integrieren und die Daten beladen (Architektur).
OLAP (OnLine Analytical Processing) ist ein Sammelbegriff für Technologien aus dem Bereich Business Intelligence. OLAP ermöglicht eine schnelle und flexible Analyse Ihrer Daten durch:
- Umwandlung der Daten in mehrdimensionale Würfel
- Aufsummierung voraggregierter und abgeleiteter Daten
- Flexibles und schnelles Query Management
- Verschiedene Berechnungs- und Modellierungsfunktionen.
Wir sehen im Folgenden genauer, wie die Datenanalyse im Rahmen dieses Business Intelligence-Verfahrens stattfindet. Die Daten werden in Fakten und Dimensionen untergliedert. Kennzahlen oder Fakten sind z.B. verkaufte Stücke, Umsatz, Kosten, Gewinn. Alles was gezählt oder gemessen werden kann, wird als Kennzahl bezeichnet. Mit Hilfe der Dimensionen oder Auswertekriterien, wird die Frage „Wonach wird die Zählung/Messung gegliedert?“ beantwortet. Bespiele hierzu sind: Zeit (z.B. Monat 07/2011), Produkt, Niederlassung.
Eine gängige Erweiterung des Dimensionskonzeptes bilden die Hierarchien. Hierarchien bringen Dimensionen in eine Reporting-geeignete hierarchische (baumartige) Struktur. Ein Beispiel ist die folgende Hierarchie für die Dimension „Zeit:
- Jahr
- Halbjahr
- Quartal
- Tag
Die Hierarchie für die Dimension „Zeit“ wird in folgender Abbildung (rechts) gezeigt. Ein anderes Beispiel für eine Hierarchie ist die organisatorische Hierarchie. Z.B.: Team, Abteilung, Firma, Konzern.
Dimensionen und Kennzahlen bilden zusammen die Datenräume. Die Datenräume sind Bestandteile virtueller Würfel. Wie Sie im Bild sehen, könnte z.B. der Schnittpunkt zwischen Kunde A und Produkt C für einen bestimmten Zeitraum ausgewertet werden. Desweiteren können diese Schnittpunkte über beliebige Teilwürfel aggregiert werden.
Die Präsentation der Informationen erfolgt im Rahmen dieses Verfahrens dynamisch durch:
- Drill-Down (Detaillieren)
Die Dimension „Produkte“ z.B. kann man in verschiedene Aggregationsstufen untergliedern und die Kennzahlen pro Ebene ermitteln: Z.B.: Produktlinie –> Produktgruppe –> Einzelnes Produkt - Roll-Up (Verdichten)
Roll-Up ist das Gegenteil von Drill-Down. Damit kann man sich auf höhere Aggregationsstufen konzentrieren und sich die Gesamtbeträge pro Produktlinie, Land oder Jahr anschauen. Man geht vom speziellen zum allgemeinen (vom einzelnen Produkt zur Produktlinie) und rollt sozusagen die Dimensionen auf der Auswertungs-oberfläche nach oben. - Slice & Dice
Man spricht von Slice, wenn nur eine Scheibe (Slice) des gesamten Würfels betrachtet wird. Z.B. in der Abbildung kann man die Scheibe „Fernseher und Heimkino“ oder die Scheibe „Germany“ erkennen. Der Betrachtungszeitraum wird nur auf den Bereich „Fernsehen und Heimkino“ oder „Germany“ eingeschränkt.
- Dice (Würfeln)
Dice bedeutet, dass die Achsen in der Darstellung ausgetauscht werden können. Der Würfel wird sozusagen gedreht. Im Reporting unten kann man das genau erkennen. Im oberen Teil ist der Gesamteinkaufsbetrag für alle Produkte pro Niederlassung aufgelistet, während im unteren Teil die beiden Dimensionen (Produkte, Niederlassungen) vertauscht sind. - Rückschreiben (Writeback)
Das Rückschreiben in die OLAP Datenbanken ist zur Erledigung von Planungsaufgaben (Eingabe der Soll-Werte z.B.) möglich. Die Werte der Datenbanken können überschrieben werden, indem man einen neuen Wert in eine Zelle der auf der Oberfläche des Auswertungstools zu sehenden Tabelle eingibt. Der neue Wert wird dann in die Datenbanken zurückgeschrieben. Fast alle OLAP-Datenbanken unterstützen diese Writeback-Funktionalität.
Relationales OLAP
Neben den klassischen OLAP-Datenbanken gibt es auch OLAP-Ansätze auf relationalen Datenbanken (ROLAP). ROLAP-Ansätze basieren auf der in der Business Intelligence-Welt bekannten Starschema Modellierung (siehe Bild unten). Diese basiert auf einer Strukturierung in Faktentabellen. Die Dimensionen werden in die einzelnen Tabellen aufgeteilt. Jede Tabelle ist durch einen Primärschlüssel gekennzeichnet. Die Schlüssel sind mit den einzelnen Fakten bzw. Ausprägungen / Werten verknüpft. Im Beispiel werden in der zentralen Tabelle die Transaktionsbeträge gespeichert. Diese werden mit den Ausprägungen einer Dimension (z.B. Branche) über einen Schlüssel (z.B. Branch_ID) in Zusammenhang gebracht.
Wichtige OLAP-Datenbanken sind:
- PALO (eine Open Source Business Intelligence-Software)
- TM1 von IBM
- MS SSAS (Microsoft SQL Server Analysis Services)
- HYPERION Essbase (ORACLE)
- INFOR
- SAP BW
Erfahren Sie jetzt die Leader im aktuellen Gartner’s Magic Quadrant für Business Intelligence-Software!
Typischer Systemaufbau und Datenbeladung
Die Ausgangsbasis bilden operative Datenbanken, die den Quellsystemen, wie z.B. ERP-, CRM- und anderen Systeme, hinterlegt sind. Die Daten der Quellsysteme werden häufig in der Praxis im ersten Schritt in vorgeschaltete Datamarts und im Anschluss in die OLAP Datenbank geladen. Die Architektur dieses Konzepts besteht aus diesem Grund aus zwei ETL-Schichten: „ETL to Datamart“ und „ETL to OLAP-DB“. „ETL to OLAP-DB“ führt eine Beladung der Fakten (oft ist eine Voraggregation erforderlich) und Dimensionen in der OLAP Datenbank durch. Um die Auswertungen der Daten anzuschauen, muss man den OLAP Viewer verwenden.
Erleben Sie live eine Business Intelligence-Anwendung „Cubeware mit SSAS (Datenbeladung, Analyse, Dashboards)“ direkt aus der Praxis!
Sie haben an dieser Stelle die berechtigte Frage: Wie kann man auf die Datenbanken zugreifen? Über geeignete Clients kann man auf den Server zugreifen. Alle OLAP Datenbanken verfügen über Excel-Add-Ins, die mit der ausgewählten Business Intelligence-Software mitgeliefert werden. Für eine Web-Anwendung ist allerdings der Erwerb einer zusätzlichen Software erforderlich. Man muss sich bei der Softwareauswahl über die Lizenzierung Gedanken machen, sowie sich Vergleichsstudien über Business Intelligence-Software anschauen!
So, das wars für heute. Im nächsten Artikel lernen Sie die Vorteile der In Memory- Technologie kennen und erfahren, welches der beiden Business Intelligence-Verfahren zu Ihren Anforderungen passt!