info@comelio.com

  • Berlin, Germany
    Comelio GmbH
    Fon: +49.30.8145622.00
    Fax: +49.30.8145622.10

  • Miami, USA
    Comelio, Inc. (Regus)
    Fon: +1.305.395.7962
    Fax: +1.305.395.7964

  • Chennai, India
    Comelio Business Solutions Pvt. Ltd.
    Fon: +9144.420.13545
    Fax: +91.44.420.13551

Data Warehousing und OLAP

  • Integration aus beliebigen Datenquellen
  • Traditionelle Datenaufbereitung und -Präsentation
  • Statistische Analyse und Mustererkennung über Data Mining
  • Prognose

Der Fokus des Data-Warehouse-Ansatzes liegt in der Bereitstellung großer Mengen an Daten, die eine erhebliche Unterstüzung von Transaktions-, Kontroll- und Planungsaktivitäten einer Organisation leisten sollen. Insbesondere Analysen und Auswertungen stehen im Zentrum der gewünschten Nutzung dieser Systeme. Dabei werden nicht nur unternehmensinterne Daten aus unterschiedlichen operativen Datenbanken in das Data Warehouse übernommen, sondern es werden zusätzlich auch externe Datenbanken mit z.B. Markt- oder Produktdaten in die Datenbasis übernommen. Die Zusammenstellung der Daten bzw.die Modellierung der Datenstruktur entspricht daher auch in den ursprünglichen operativen Bereichen nicht mehr der Struktur dieser Bereiche, sondern wird in eine ganz neue Struktur für die Abarbeitung der speziellen Data-Warehouse-Aufgaben gebracht. Durch die unternehmensweite Nutzung für strategische, taktische und operative Analysewerkzeuge sind an das Datenmodell hohe Anforderungen zu stellen. Es enthält für eine umfassende und integrative Sicht historische, aktuelle und verdichte Daten. Diese Verdichtungen und Aggregationsstufen liefern die Dimensionen, in denen sich Auswertungen des Datenbestandes bewegen werden. Bei der Wahl des Datenmodells sind folgende Eigenschaften zu berücksichtigen: Grundprinzip der Datenmodellierung ist die Multidimensionalität solcher Ansätze. Im Gegensatz zu einem eher prozessorientierten Ansatz, bei dem die typischen Transaktionen eines Unternehmens im Fokus stehen, d.h. Aufträge, Kunden, Lieferanten und Produkte sowie die Prozesse, an denen sie teilnehmen, oder die Rollen, welche sie im Rahmen von Transaktionen inne haben. Die Multidimensionalität basiert auf einer anderen Struktur der Schema-Objekte in der Datenbank, welche mehr auf Analysezwecke und gerade nicht auf geschäftliche Transaktionen und Prozesse hin optimiert wird. In solchen Systemen können Antwortzeiten zu für Auswertungen deutlich länger dauern als bspw. in einem Data Warehouse. Dies führt zu einer starken Denormalisierung, um schnellere Antwortzeiten zu erreichen. Beispiele für Dimensionen sind u.a. monatlicher Gewinn- und Verlusbericht, gruppiert nach Produkten und Regionen und - womit man dann den dreidimensional vorstellbaren Raum verlassen hat - auch noch im Zeitverlauf oder bezogen auf eine weitere andere Einheit. In der Datenmodellierung ist mit einer Dimension nach Codd die höchste Ebene eines Datenkonsolidierungspfades gemeint. In diesem Sinne stellt es also ein Attribut einer Merkmalsausprägung dar.
Mit einer Typologie von Dimensionen lässt sich auch gleichzeitig eine Verwendung der Data-Warehouse-Technologie beschreiben. Im betriebswirtschaftlichen Umfeld könnte eine solche Typisierung auf die groben Bereiche Zeit, Wertetyp oder Szenarien (Istzahlen, Sollwerte, Plangrößen) und Maßeinheiten beliebiger Art hinauslaufen. Jede einzelne Dimension lässt sich weiter charakterisieren mit den Konzepten hierarchisch, nicht hierarchisch und kategorisch.

Hierarchische Dimension
Zwischen Positionen einer Dimension befinden sich vertikale Beziehungen, was eine Verdichtung anhand der vertikalen Ebene ermöglicht. Detaildaten können so zu Übesichtszahlen verdichtet und auch wiedre aufgeschlüsselt werden.
Nicht-hierarchische Dimensionen
Zwischen Dimensionspositionen bestehen keine vertikalen Beziehungen. Stattdessen existiert nur eine einfache innere Struktur, sodass keine Verdichtung durchführbar ist. Oftmals ermöglichen sie die Darstellung verschiedene Szenarien oder gleichrangiger Vergleiche.
Kategorische Dimensionstypen
Typische kategorische Attribute erlauben keine Verdichtungen. Stattdessen stellen die Ausprägungen dieses Dimensionstyps Zustandswerte dar, welche grundsätzlich wichtig für die Beschreibung von Objekten sind.
  • Ausrichtung auf die unternehmensbezogenen Sachverhalte:

In einer ersten Phase muss der Informationsbedarf analysiert werden. Dies bezieht sich auf den Geschäftszweck, den das Data Warehouse erfüllen soll, und aus dem die Einzelinformationen zu bestimmen sind, welche im Data Warehouse explizit zu erfassen sind. Dies stellt eine analytische und beratende Aktivität dar, bei welche die Anwender ausdrücklick mit einbezogen sind. Zusätzlich muss die Herfkunft der Daten bestimmt werden, wobei bei externen Datenquellen auch Übertragungsformate und Schnittstellen zu berücksichtigen sind. Greift man auf historische Daten zurück, so müssen diese für eine kontinuierliche Nutzung im neuen System migrieren.
In einer zweiten Phase wird die Lösung des zuvor beschriebenen Anforderungskatalogs entwickelt. Dabei werden geeignete Standardwerkzeuge ausgewählt und um die entsprechenden individuellen Bedingungen erweitert. Zwei grundlegende Fragen bei der Umsetzung der Lösung stellen dabei die Aktualität der Daten im Data Warehouse und die möglichen Aggregationsformen der Daten dar. Aus den Aggregationsformen lassen sich später die Dimensionen ableiten, in denen die Analyseroutinen durchgeführt werden sollen. In jedem Fall ergeben sich grundlegende Unterschiede in Größe, Komplexität und Datenmodellierung der Data-Warehouse-Datenbank im Vergleich zu den operativen Datenbanken den Organisation.
In einer dritten Phase wird die Lösung dann umgesetzt und implementiert. Dies sollte auch immer eine Anwenderschulung zur optimalen Nutzung der bereit gestellten Werkzeuge und Ausgabemedien enthalten. Weitere Phasen für Tests und und evtl. Korrektur- oder Erweiterungsaktivitäten können sich sofort oder zu einem späteren Zeitpunkt bei z.B. geänderten Anforderungen anschließen.

  • DB-Entwicklung
  • Analysewerkzeuge wie Data Mining oder Knowledge Discovery
  • Installation und Konfiguration in Oracle oder MS SQL Server
  • Programmierung mit C sharp, VB.NET, VBA, Java oder innerhalb des DBMS mit Transact SQL oder PL/SQL