Der Fokus des Data-Warehouse-Ansatzes liegt in der Bereitstellung großer Mengen an Daten, die eine erhebliche Unterstüzung von Transaktions-, Kontroll- und Planungsaktivitäten einer Organisation leisten sollen. Insbesondere Analysen und Auswertungen stehen im Zentrum der gewünschten Nutzung dieser Systeme. Dabei werden nicht nur unternehmensinterne Daten aus unterschiedlichen operativen Datenbanken in das Data Warehouse übernommen, sondern es werden zusätzlich auch externe Datenbanken mit z.B. Markt- oder Produktdaten in die Datenbasis übernommen. Die Zusammenstellung der Daten bzw.die Modellierung der Datenstruktur entspricht daher auch in den ursprünglichen operativen Bereichen nicht mehr der Struktur dieser Bereiche, sondern wird in eine ganz neue Struktur für die Abarbeitung der speziellen Data-Warehouse-Aufgaben gebracht. Durch die unternehmensweite Nutzung für strategische, taktische und operative Analysewerkzeuge sind an das Datenmodell hohe Anforderungen zu stellen. Es enthält für eine umfassende und integrative Sicht historische, aktuelle und verdichte Daten. Diese Verdichtungen und Aggregationsstufen liefern die Dimensionen, in denen sich Auswertungen des Datenbestandes bewegen werden. Bei der Wahl des Datenmodells sind folgende Eigenschaften zu berücksichtigen: Grundprinzip
der Datenmodellierung ist die Multidimensionalität solcher Ansätze.
Im Gegensatz zu einem eher prozessorientierten Ansatz, bei dem die typischen Transaktionen
eines Unternehmens im Fokus stehen, d.h. Aufträge, Kunden, Lieferanten und
Produkte sowie die Prozesse, an denen sie teilnehmen, oder die Rollen, welche
sie im Rahmen von Transaktionen inne haben. Die Multidimensionalität basiert
auf einer anderen Struktur der Schema-Objekte in der Datenbank, welche mehr auf
Analysezwecke und gerade nicht auf geschäftliche Transaktionen und Prozesse
hin optimiert wird. In solchen Systemen können Antwortzeiten zu für
Auswertungen deutlich länger dauern als bspw. in einem Data Warehouse. Dies
führt zu einer starken Denormalisierung, um schnellere Antwortzeiten zu erreichen.
Beispiele für Dimensionen sind u.a. monatlicher Gewinn- und Verlusbericht,
gruppiert nach Produkten und Regionen und - womit man dann den dreidimensional
vorstellbaren Raum verlassen hat - auch noch im Zeitverlauf oder bezogen auf eine
weitere andere Einheit. In der Datenmodellierung ist mit einer Dimension nach
Codd die höchste Ebene eines Datenkonsolidierungspfades gemeint. In diesem
Sinne stellt es also ein Attribut einer Merkmalsausprägung dar.
Mit einer Typologie von Dimensionen lässt sich auch gleichzeitig eine Verwendung
der Data-Warehouse-Technologie beschreiben. Im betriebswirtschaftlichen Umfeld
könnte eine solche Typisierung auf die groben Bereiche Zeit, Wertetyp oder
Szenarien (Istzahlen, Sollwerte, Plangrößen) und Maßeinheiten
beliebiger Art hinauslaufen. Jede einzelne Dimension lässt sich weiter charakterisieren
mit den Konzepten hierarchisch, nicht hierarchisch und kategorisch.
In einer ersten Phase muss der Informationsbedarf analysiert werden. Dies bezieht sich auf den Geschäftszweck, den das Data Warehouse erfüllen soll, und aus dem die Einzelinformationen zu bestimmen sind, welche im Data Warehouse explizit zu erfassen sind. Dies stellt eine analytische und beratende Aktivität dar, bei welche die Anwender ausdrücklick mit einbezogen sind. Zusätzlich muss die Herfkunft der Daten bestimmt werden, wobei bei externen Datenquellen auch Übertragungsformate und Schnittstellen zu berücksichtigen sind. Greift man auf historische Daten zurück, so müssen diese für eine kontinuierliche Nutzung im neuen System migrieren.
In einer zweiten Phase wird die Lösung des zuvor beschriebenen Anforderungskatalogs entwickelt. Dabei werden geeignete Standardwerkzeuge ausgewählt und um die entsprechenden individuellen Bedingungen erweitert. Zwei grundlegende Fragen bei der Umsetzung der Lösung stellen dabei die Aktualität der Daten im Data Warehouse und die möglichen Aggregationsformen der Daten dar. Aus den Aggregationsformen lassen sich später die Dimensionen ableiten, in denen die Analyseroutinen durchgeführt werden sollen. In jedem Fall ergeben sich grundlegende Unterschiede in Größe, Komplexität und Datenmodellierung der Data-Warehouse-Datenbank im Vergleich zu den operativen Datenbanken den Organisation.
In einer dritten Phase wird die Lösung dann umgesetzt und implementiert. Dies sollte auch immer eine Anwenderschulung zur optimalen Nutzung der bereit gestellten Werkzeuge und Ausgabemedien enthalten. Weitere Phasen für Tests und und evtl. Korrektur- oder Erweiterungsaktivitäten können sich sofort oder zu einem späteren Zeitpunkt bei z.B. geänderten Anforderungen anschließen.
comelio.com


