info@comelio.com

  • Berlin, Germany
    Comelio GmbH
    Fon: +49.30.8145622.00
    Fax: +49.30.8145622.10

  • Miami, USA
    Comelio, Inc. (Regus)
    Fon: +1.305.395.7962
    Fax: +1.305.395.7964

  • Chennai, India
    Comelio Business Solutions Pvt. Ltd.
    Fon: +9144.420.13545
    Fax: +91.44.420.13551

Projekte

In den folgenden Abschnitten werden die Tools und Prozesse beim Erstellen einer Data Mining-Lösung beschrieben.

Erstellen eines Analysis Services-Projekts

Wenn Sie eine Data Mining-Lösung erzeugen, müssen Sie zunächst ein Analysis Services-Projekt über Business Intelligence Development Studio erstellen. Jedes Data Mining-Projekt enthält die folgenden vier Arten von Objekten: Datenquellen; Datenquellensichten, die auf den Datenquellen basieren; Miningstrukturen, die definieren, wie die Daten im Modell verwendet werden, und Miningmodelle, die Muster erstellen und speichern.

Definieren einer Datenquelle  Die Datenquelle definiert die Verbindungszeichenfolge und die Authentifizierungsinformationen, die der Analysis Services-Server für den Verbindungsaufbau mit der Datenquelle verwendet. Die Datenquelle kann mehrere Tabellen oder Sichten enthalten. Analysis Services kann Datasets aus sowohl relationalen als auch OLAP-Datenbanken (Online Analytical Processing) oder von externen Anbietern nutzen.

Nachdem Sie diese Verbindung zur Datenquelle definiert haben, können Sie eine Sicht erstellen, die die spezifischen Daten identifiziert, die für das Modell relevant sind. Über die Datenquellensicht können Sie eine Anpassung der Art und Weise vornehmen, auf die die Daten in der Datenquelle dem Miningmodell bereitgestellt werden. Sie können die Struktur der Daten ändern, um diese relevanter für Ihr Projekt zu machen. Darüber hinaus können Sie ausschließlich bestimmte Arten von Daten auswählen. Wenn Sie die Daten filtern möchten, können Sie dies in der Datenquellensicht oder in Filtern vornehmen, die auf der Ebene des Modells angewandt werden.

Die Anforderungen darüber, wie viele Daten Sie benötigen und wie diese Daten bereinigt und formatiert werden sollen, können sich abhängig vom Algorithmus, den Sie für die Untersuchung der Daten verwenden, unterscheiden.

Hinzufügen von Miningstrukturen zu einem Analysis Services-Projekt  Sobald genügend Daten zur Verfügung stehen, um mit der Analyse zu beginnen, wählen Sie die Datenquellen aus, die für Ihr Geschäftsproblem am relevantesten sind. Des Weiteren fügen Sie Miningstrukturen zum Projekt hinzu. Eine Miningstruktur definiert die Datenspalten und die Spalten mit geschachtelten Tabellen, die aus der Datenquellensicht oder einem OLAP-Cube im Projekt stammen.

Um eine neue Miningstruktur hinzuzufügen, starten Sie den Data Mining-Assistenten. Dieser führt Sie durch den Prozess der Definition der Daten und der optionalen Erstellung eines ersten Data Mining-Modells. Wenn Sie eine Struktur erstellen, können Sie Ihre Daten auch so partitionieren, dass diese ein Trainingdataset, das für die Erstellung von Modellen verwendet wird, und ein Testdataset enthalten, das dafür verwendet werden kann, alle Miningmodelle, die auf der Struktur basieren, zu testen oder zu überprüfen. Mithilfe der Registerkarte Miningstruktur im Data Mining-Designer können Sie vorhandene Miningstrukturen ändern. Dies schließt auch das Hinzufügen von Spalten und geschachtelten Tabellen ein.

Verwenden von Data Mining-Modellen  Jeder Miningstruktur fügen Sie ein oder mehrere Miningmodelle hinzu. Das Miningmodell definiert den Algorithmus oder die Analysemethode, die Sie auf die Daten anwenden werden. Sie verarbeiten jedes Modell, indem Sie die Daten in der Datenquellensicht an den Algorithmus übergeben, der ein mathematisches Modell der Daten erstellt. Dieser Prozess ist auch bekant als Trainieren des Modells.

Nachdem das Modell verarbeitet wurde, können Sie das Miningmodell entweder visuell untersuchen oder Vorhersageabfragen für das Miningmodell ausführen.

Analysis Services stellt mehrere Optionen für die Verarbeitung von Miningmodellobjekten zur Verfügung. Dazu zählt auch die Möglichkeit, bestimmen zu können, welche Objekte wie verarbeitet werden. Beispielsweise können Sie eine Struktur verarbeiten und die Daten zwischenspeichern und daraufhin neue Modelle zur Struktur hinzufügen. Wenn die Daten zwischengespeichert werden, können Sie die Drillthrough-Abfragen verwenden, um detaillierte Informationen über die im Modell verwendeten Fälle zurückzugeben.

Überprüfen von Data Mining-Modellen  Nachdem Sie die Modelle verarbeitet haben, können Sie die Ergebnisse analysieren und entscheiden, welche Modelle ihrer Aufgabe am besten gerecht wurden. Analysis Services stellt im Data Mining-Designer für jeden Miningmodelltyp auf der Registerkarte Miningmodell-Viewer Viewer zur Verfügung, die Sie beim Prüfen der Miningmodelle verwenden können.

Außerdem stellt Analysis Services auf der Registerkarte Mininggenauigkeitsdiagramm des Designers Tools bereit, mit denen Sie Miningmodelle direkt miteinander vergleichen und das für Ihre Problemstellung am besten geeignete Modell auswählen können. Zu diesen Tools gehören ein Prognosegütediagramm, ein Gewinndiagramm und eine Klassifikationsmatrix.

Darüber hinaus können Sie den in SQL Server 2008 neu verfügbaren, übergreifenden Überprüfungsbericht verwenden, um eine iterative Unterstichprobe Ihrer Daten durchzuführen, um zu bestimmen, ob das Modell zu einem bestimmten Dataset tendiert. Die vom Bericht gelieferten Statistiken können für den objektiven Vergleich von Modellen und die Bewertung der Qualität Ihrer Trainingsdaten herangezogen werden.

Erstellen von Vorhersagen  Das wichtigste Ziel der meisten Data Mining-Projekte liegt darin, mithilfe eines Miningmodells Vorhersagen zu treffen. Nachdem Sie Miningmodelle geprüft und miteinander verglichen haben, können Sie mit einem von mehreren Tools Vorhersagen generieren. Analysis Services stellt eine als Data Mining-Erweiterungen (Data Mining Extensions, DMX) bezeichnete Abfragesprache zur Verfügung, die die Basis für das Generieren von Vorhersagen bildet und leicht skriptfähig ist. Zur Unterstützung beim Generieren von DMX-Vorhersageabfragen stellt SQL Server einen Abfrage-Generator (verfügbar in SQL Server Management Studio und in Business Intelligence Development Studio) und DMX-Vorlagen für den Abfrage-Editor in Management Studio zur Verfügung. Von BI Development Studio aus können Sie über die Registerkarte Miningmodellvorhersage des Data Mining-Designers auf den Abfrage-Generator zugreifen.

SQL Server Management Studio

Nachdem Sie mithilfe von BI Development Studio Miningmodelle für Ihr Data Mining-Projekt generiert haben, können Sie die Modelle in Management Studio verwalten und verwenden sowie Vorhersagen erstellen. Durch die Verwendung der Abfragetools in SQL Server Management Studio können Sie die Daten in Ihren Modellen durchsuchen, komplexe Inhaltsabfragen erstellen oder Data Mining-Objekte verwalten, die in einer Instanz von SQL Server gespeichert sind.

SQL Server Reporting Services

Nachdem Sie ein Miningmodell erstellt haben, möchten Sie die Ergebnisse ggf. einem breiteren Publikum zukommen lassen. Da die Ergebnisse des Data Mining in einem konsistenten Schema gespeichert werden, auf das direkt mithilfe von Datenbankabfragen zugegriffen werden kann, können Sie eine Vielzahl an Clienttools verwenden, um die Ergebnisse der Analyse darzustellen, die Muster im Modell zu durchsuchen oder Vorhersagen vorzunehmen.

Sie können den Berichts-Designer in Microsoft SQL Server Reporting Services zum Erstellen von Berichten verwenden, mit denen Sie die in einem Miningmodell enthaltenen Informationen präsentieren. Als Basis für einen Bericht eignen sich die Ergebnisse einer beliebigen DMX-Abfrage. Darüber hinaus können Sie die Parametrisierungs- und Formatierungsfunktionen nutzen, die Reporting Services zur Verfügung stehen.

Programmgesteuertes Verwenden von Data Mining

Sie haben in Analysis Services Zugriff auf mehrere Tools, die die programmgesteuerte Verwendung von Data Mining unterstützen. Mit DMX steht Ihnen eine Sprache zur Verfügung, die Sie zum Erstellen, Trainieren und Verwenden von Data Mining-Modellen verwenden können. Sie können diese Tasks auch mit einer Kombination aus XML für Analysis (XMLA) und Analysis Services Scripting Language (ASSL) oder mithilfe von Analysis Management Objects (AMO) ausführen.

Mithilfe von Data Mining-Schemarowsets können Sie auf alle Metadaten zugreifen, die mit Data Mining verknüpft sind. Sie können mithilfe von Schemarowsets z. B. ermitteln, welche Datentypen ein Algorithmus unterstützt oder welche Modellnamen in einer Datenbank vorhanden sind.