Die erste Möglichkeit, mit Hilfe der Techniken des W3C und damit unabhängig von herstellerspezifischen Konstruktionen Metadaten zu verwalten, stellt der RDF-Standard dar. Das Akronym löst sich zu Resource Description Framework auf und stellt eine Möglichkeit dar, allgemeine Metadaten von einem Dokument (im Sinne des Standards stellt dies eine Ressource dar) sowie auch innerhalb desselben spezifischen Angaben zu den Metadaten der Dokumentinhalte zu verwalten. Dieser Abschnitt soll zunächst die Prinzipien des Standards einführen und dann diese an einigen Beispielen darlegen. Er orientiert sich innerhalb seines Aufbaus also an der vorherigen Darstellung von XML Schema.
Für die Verwaltung von Metadaten sowie die Erstellung einfacher Ontologien eignet sich das Resource Description Framework. Es stellt eine mögliche Lösung für die Abbildung des semantischen Internets dar und kann auch im internen Unternehmenseinsatz für die Abbildung von Metainformationen für Ressourcen genutzt werden. In eine Erweiterung ist es zusätzlich für ontologische Modellierung verwendbar. Sein Datenmodell sowie die allgemeinen Zielsetzungen, die man während der Softwareentwicklung mit seinem Einsatz verfolgen kann, sollen in diesem Abschnitt beschrieben werden.
Eine große Herausforderung für alle Syntaxstrukturen, welche sich mit der Abbildung von Meta-Informationen beschäftigen, stellt die Formalisierung der Strukturen der Meta-Informationen selbst dar. Dies ist gerade im Hinblick auf die Möglichkeiten, die Informationen zu durchsuchen und Informationen zu extrahieren, von besonderer Bedeutung. Daher weist die Syntax von RDF folgende Zielsetzungen auf:
Mit Hilfe der RDF-Syntax sollen Metadaten von Textdokumenten (typischerweise in einem XML-Vokabular, das über ein Schema-Dokument validiert werden kann) erfassen, um diese durchsuchbar zu machen. Der Standard basiert auf den folgenden Bausteinen , welche auch im Element-Namen der RDF-Syntax erscheinen:
Beispiel: http://www.example.org/index.html has a creator whose value is John Smith
Die Datenrepräsentation von RDF entspricht einer 3-Tupel-Notation in einer einfachen Graph-Form. Sie wird in diesem Artikel übersichtsartig dargestellt, wobei auch auf die XML-Notation dieser Form eingegangen wird.
Für das RDF-Konzept stehen drei unterschiedlichen Notationen zur Verfügung, von denen die ersten beiden (grafische Notation und die 3-Tupel-Notation) für das Verständnis der Aussagen in einem RDF-Dokument verwendet werden können.
RDF lässt sich in einer einfachen Graph-Form, dem so genannten RDF-Graph, ausdrücken. Er besteht aus zwei Knoten und einer gerichteten, markierten Kante, wobei die Knoten wahlweise eine Ressource oder ein Literal repräsentieren. Dabei wird eine Ressource als Oval und ein Literal als Rechteck dargestellt. Die Beschriftung der Kante stellt dabei die Eigenschaft (property) der Aussage (statement) dar, welche durch den gesamten Graph abgebildet wird. Der Startknoten repräsentiert das Subjekt der Aussage, der Zielknoten dagegen ihr Objekt. Die Rechtecke stellen stets Blätter des RDF-Graphen dar, d.h. von ihnen gehen wiederum keine Kanten aus. Sie repräsentieren daher ständig Objekte einer Aussage [Vgl. W3C, RDF: Concepts, 2004, Abschnitt 6.2 unter http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/#section-rdf-graph.].
Die 3-Tupel-Notation stellt im Standard in Beispielen eine Formalisierung der Graph-Notation bzw. der Aussagen von RDF dar, ohne diese in RDF-Syntax auszudrücken. Das heißt, es entstehen keine XML-Ausdrücke, sondern eine textuell anders gefasste Variante, welche in knapper Form eine Aussage erfasst [Vgl. W3C, RDF: Test cases, 2004, Abschnitt 3.1 unter http://www.w3.org/TR/rdf-testcases/#ntrip_grammar.].
Neben den 3-Tupeln entwickelt das W3C auch eine erweiterte Tupel-Dartsellung für n-Tupel, wie sie z.B. in Form von 4-Tupeln für die reifizierten Aussagen notwendig sind. Die allgemeine Syntax lautet leicht verkürzt -:
ntripleDoc ::= line*
triple ::= subject ws+ predicate ws+ object ws* '.' ws*
subject ::= uriref | nodeID
predicate ::= uriref
object ::= uriref | nodeID | literal
uriref ::= '<' absoluteURI '>'
nodeID ::= '_:' name
literal ::= langString | datatypeString
langString ::= '"' string '"' ( '@' language )?
datatypeString ::= '"' string '"' '^^' uriref
Während die grafische Darstellung für eine gut lesbare und tatsächlich nur grafische Repräsentation der RDF-Aussagen verwendbar ist, und die 3-Tupel-Notation nur als sehr schematische, aber nicht in XML-Form verarbeitbare Syntax einsetzbar ist, liegt natürlich das Hauptaugenmerk des gesamten RDF-Standards und seine eigentliche Verwendung auf der XML-Notation. Dabei stellen RDF-Dokumente eigene, wohlgeformte XML-Dokumente dar. Sie enthalten innerhalb des rdf-Namensraums eine Serialisierung der über die 3-Tupel angegebenen Aussagen [Vgl. die komplette Syntaxdarstellung in W3C, RDF: Syntax, 2004 unter http://www.w3.org/TR/rdf-schema/.].
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:contact="http://www.w3.org/2000/10/swap/pim/contact#">
<contact:Person rdf:about="http://www.w3.org/People/EM/contact#me">
<contact:fullName>Eric Miller</contact:fullName>
<contact:mailbox rdf:resource="mailto:em@w3.org"/>
<contact:personalTitle>Dr.</contact:personalTitle>
</contact:Person>
</rdf:RDF>
[Vgl. W3C, RDF: Primer, 2004, Abschnitt 1 unter http://www.w3c.org/TR/rdf-primer/#intro.]
Dies ergibt als Graph folgende Darstellung [Vgl. W3C, RDF: Primer, 2004, Abschnitt 1 unter http://www.w3c.org/TR/rdf-primer/#intro.]:
Dieser Artikel zeigt übersichtsartig die verschiedenen Syntax-Bereiche von RDF Schema. Es sind einige Ähnlichkeiten mit OWL zu erkennen, da sich OWL als Erweiterung zu RDF Schema versteht. Insbesondere an den verschiedenen vorhandenen Elementen fällt deutlich auf, wie grundlegend Ontologien abgebildet werden können.
Mit Hilfe weiterer Syntaxkonstrukte lassen sich jetzt nicht nur allgemeine Dokumentmetainformationen speichern, sondern zusätzlich so genannte RDF Schemata erstellen. Sie erlauben die Generierung von Vokabularen, die Ressourcen und ihre Eigenschaften sowie die Beziehungen von Datenstrukturen untereinander im Hinblick auf die Ressource beschreiben können. Für diese speziellen Elemente existiert der eigene Namensraum rdfs. Dabei werden folgende Strukturen verwendet
RDF und RDF Schema bieten viele Möglichkeiten, Ontologien in XML-Strukturen zu modellieren, aufzubauen und auch auf Gültigkeit zu prüfen, bevor die Verarbeitung dieser Daten einsetzt. Dieser Artikel soll kurz die vorhandene Syntax bewerten und mit anderen Techniken wie OWL oder XTML vegleichen.
Da RDF sich auch in Graphenform abbilden lässt bzw. syntaktisch die eine 3-Tupel-Konzeption (Subjekt, Prädikat, Objekt) aufweist, entspricht diese Struktur den Konzeptmerkmalen eines semantischen Netzes. Zu diesen Merkmalen gehören der Konzeptname, die Extension (Menge aller Objekte) und die Intension (Merkmale der zu einem Konzept gehörenden Objekte) . Da in RDF die Möglichkeit besteht, Beziehungen zwischen Konzepten semantisch abzubilden, basieren sie auf so genannten assoziativen Beziehungen, die formal als zweistellige Relationen verstanden werden können. Dies ergibt in diesem Verständnis wie auch hinsichtlich des RDF Graphen ein Assoziationsmodell, welches Knoten für die Abbildung von Konzepten (Subjekt) und Kanten für die assoziativen Beziehungen (Prädikat) besitzt. Dabei lassen sich folgende zwei Graphen-Typen unterscheiden:
Möchte man RDF für die Erstellung von Ontologien einsetzen und nicht nur einfache Zusatz- bzw. Dokumentmetainformationen zu einem Dokument speichern, dann ergibt sich ein zunächst eingeschränkter Einsatzbereich. Es ist zwar grundsätzlich möglich, die Grundbausteine von Ontologien in RDF wiederzufinden und dementsprechend auch Ontologien in RDF zu modellieren, aber wie die spätere Darstellung von XML Topic Maps zeigen wird die Verwendung ist nicht so ausgebildet und raffiniert wie in anderen Technologien.
Prinzipiell kann ein RDF Schema durchaus eine Ontologie abbilden. Objekte, Klassen und Eigenschaften sind modellierbar. Dies gilt auch für die Beziehungen zwischen Daten, die über die vordefinierten Eigenschaften INSTANZ VON oder TEIL VON ausgedrückt werden können. Dies dürften die wichtigsten Beziehungen oder zumindest die am häufigsten anzutreffenden Beziehungen zwischen Daten sein. Für alle darüber hinaus gehenden Beziehungsstrukturen, die notwendigerweise abgebildet werden sollen, lässt sich RDF nicht so angenehm verwenden wie die XML Topic Maps. Zusätzlich lassen sich auch Einschränkungen im Hinblick auf eine Domäne realisieren sowie Bereichsbeschränkungen für Attribute.
Im Hinblick auf Ontologien bietet RDF zwei wichtige Eigenschaften:
Was an RDF zu kritisieren ist , liegt in der eingeschränkten Ausdruckskraft der gesamten Syntax begründet. Es besteht keine ausgereifte Möglichkeit, logische Axiome, die für die modellierten Daten bestehen, abzubilden. Nur durch die Angabe der Bezeichnungen bzw. Namen von Klassen und ihrer Eigenschaften, also ihrer Typen, lassen sich Objekte definieren. Damit sind allerdings keine bedeutungstragenden Informationen oder komplexe Beziehungen, welche sich über Axiome abbilden lassen, möglich.
Da RDF und RDF Schema jeweils bereits verabschiedete Standards sind, ist eine Verwendung problemlos möglich. Zusätzlich existieren geeignete Verarbeitungstechniken n unterschiedlichen Programmiersprachen, mit deren Hilfe modellierte bzw. ausgezeichnete Daten auch abgefragt werden können.
comelio.com


