Gestörte Beziehung

01.12.2001

Internet Professionell Dezember 2001

Content-Syndicatoren kämpfen neben dem allgemeinen Zahlungsunwillen im Web mit verschiedenen technischen Standards ihrer Lieferanten und Kunden. Internet Pro erklärt Lösungsansatze.


XML allein reicht für Content-Syndication nicht aus. Daten sind für jede Aufgabe, jeden Kunden unterschiedlich strukturiert und werden entsprechend unterschiedlich in XML umgesetzt und übermittelt. Für jede Verbindung von Informationsquellen sind spezielle Konvertierungsregeln notwendig, die Zeit und damit Geld kosten.
Für Wirtschaftsexperten ist das einer der Hauptgründe der Pleitewelle unter den Content-Brokern. Der Verband der deutschen Content-Wirtschaft (VDCW, www.vdcw.de) fordert die Marktteilnehmer an einen Tisch, um sich auf zu unterstützende Standards zu einigen. Doch für die meisten Content-Syndicatoren steht das Thema Technologie nicht im Vordergrund, sondern das Know-How um Inhalte. Klar, sie wollen zuerst ihre Beratungsleistungen verkaufen und dann die Inhalte. Mit Ersterem lässt sich momentan mehr Geld verdienen. Dito mit speziellen Services für die Datenaufbereitung und -konvertierung.
Schlussendlich wird der Syndication-Markt nur dann funktionieren, wenn Produzenten, Distributoren und Empfänger unabhängig voneinander arbeiten, die Inhalte aber automatisiert übertragen werden können.
Voraussetzung dafür sind Fähigkeiten der eingesetzten Software, mit semantischen Strukturen umzugehen. Die Inhalte, welche die User letztendlich zu sehen oder zu hören bekommen, sind dabei nicht der Punkt. Die Informationen über die Inhalte, die Metadaten, sind entscheidend für die Verarbeitung, Katalogisierung, Durchsuchbarkeit und Verteilung des Contents. Derzeit sind für Content-Syndication zwei Formate besonders beachtenswert: das ICE-Protokoll und News ML.
Häufiger zu finden sind noch das News Industry Text Format (NITF), Publishing Requirements for Industry Standard Metadata (Prism) und Topic Maps. Das seit 1990 existierende NITF (www.nitf.org) wird von Verlagen und Nachrichtenagenturen genutzt, aber auch vom Content-Syndicator Screaming Media. Die Metadaten der NITF-Tags liefern Informationen über Copyright, behandelte Themen, Organisationen, Veranstaltungen und Ereignisse, Veröffentlichungsdatum, Ort der Handlung und Publikation.
Im Dezember 2000 wurde mit Prism (www.prismstandard.org) ein weiteres Metadatenvokabular verabschiedet. Es soll den herstellerunabhängigen Content-Austausch im Online- und Print-Bereich sichern. Vorhandene Standards wie XML, RDF (Resource Description Framework, ein XML-basierter W3C-Standard zur Wissensrepräsentation im Web), News ML und Dublin Core, der in Bibliotheken genutzt wird, kombiniert Prism.
Als weitere interessante Alternative gelten Topic Maps (www.topicmaps.org, www.oasis-open.org/cover/topicMaps.html). Mit Topic Maps werden unstrukturierte Informationen navigier- und suchbar gemacht. Eine Topic Map legt man nachträglich als Navigationsebene über den Artikel. Damit können Informationen organisiert und assoziativ verbunden werden.
Inwieweit sich Prism und Topic Maps durchsetzen, bleibt abzuwarten.

ICE-Protokoll
Die IDE-Allianz, bestehend aus Verlagen und Software-Unternehmen, schlug 1998 dem W3C (www.w3c.org/TR/Note-ice.html) das Information and Content Exchange Protokoll (www.icestandard.org) vor. Die Chancen, akzeptiert zu werden, stehen nach wie vor nicht schlecht. Seit einem Jahr ist es etwas ruhiger geworden, doch ICE 2.0 steht in den Startlöchern.
Das ICE-Protokoll setzt auf XML Document Type Definitions (DTDs). Die Spezifikation definiert Regeln für die automatische Verteilung von jeglichen Inhalten zwischen Websites und deren Verwendung. ICE setzt auf branchenspezifische Glossarien, ist aber für sich anwendungsneutral. Nur die bidirektionale Verständigung über die Abläufe ist an XML gebunden.
Im ICE-Modell gibt es den Syndicator, der Inhalte bereitstellt und den Subscriber, der Content bezieht und seinerseits Kunden bedienen kann. Subscriber und Syndicator müssen ICE-basierte Programme einsetzen, entweder in ihrem Content Management System oder als eigenständige Applikation. Der Informationsfluss erfolgt bidirektional.
Das Subskriptions-Management deckt alle Schritte der Geschäftsbeziehung ab: Beginn, Ende, Häufigkeit, Liefermodus und URL. ICE sieht Copyright, Autorennennung, Nutzungsbeschränkungen, Dringlichkeit und weitere Meta-Informationen vor. So können bei Streaming-Inhalten Zeiten, zu denen der Subscriber Zugriff hat, exakt vorgegeben werden.

News ML
News ML wurde im Oktober 2000 von der IPTC (www.iptc.org) verabschiedet. In der Arbeitsgruppe saßen fast alle international wichtigen Content-Lieferanten, vor allem Nachrichtenagenturen. Es bietet den plattformunabhängigen Austausch von News. Kern sind News-Items, die verschiedene Medienformate enthalten können. Sie werden mit Metadaten versehen, die es ermöglichen sollen, definierte Beziehungen zwischen verschiedenen Items zu erkennen. Ein zentrales Merkmal ist die Versionskontrolle. Für die Präsentation kann der Benutzer zwischen verschiedenen Formaten einer Komponente wählen. Besonders in Hinblick auf zukünftige Ausgabegeräte ist das interessant, da mehrere Auflösungen und Dateiformate angeboten werden können. News ML kann auch den Ausschluss gewisser Formate für bestimmte Übertragungswege vorsehen, damit nicht etwa ein hoch aufgelöstes Bild auf einem PDA landet.

CMS: "Nix verstehen!"
Vor allem für Nutzer von Content-Management-Systemen (CMS) wäre es wünschenswert, die vom Content-Broker gelieferten Inhalte in eigene Datenbanken zu übernehmen und durchsuchbar zu machen. Hier ziehen die meisten CMS-Anbieter mit XML-Import und -Export ins Feld. Aber fast jedes CMS und jeder Content-Anbieter verwendet eine andere XML-Spezifikation. Und von Automatisierung der Geschäftsbeziehungen, also der Überwachung der Nutzungsrechte, Beginn und Ende et cetera kann da noch lange keine Rede sein. Auch für Formate wie News ML oder NITF bieten Content-Management-Systeme kaum passende Schnittstellen. Ältere Systeme unterstützen kein XML, oft muss auf ein Flat File Format zurückgegriffen werden.
Die CMS-Anbieter und deren Partner verdienen sich mit dem Programmieren von Speziallösungen für Content-Syndication ein gutes Zubrot. Eine Individuallösung ist aber nur dann sinnvoll, wenn man nur ein System an das eigene CMS anschließen will und geringfügige Änderungen der Formate erwartet werden. Wenn mehrere Systeme und unterschiedliche Formate mit dem eigenen CMS kommunizieren sollen, ist der Implementations- und Wartungsaufwand enorm und eine Speziallösung unrealistisch. Die CMS-Anbieter sollten auf letzteren Fall besser vorbereitet sein.



Standards für Content-Syndication

CMS-Anbieter Obtree schreibt selbst in einer Pressemeldung vom 3. Oktober 2001: "Bisher war die Zusammenführung von News eines Nachrichtenanbieters mit dem Web-Inhalt des Kunden nur über einen komplexen, teuren und zeitintensiven Integrationsprozess möglich." (www.obtree.com/de/index/archive/archive-headlines/pr-03102001.htm). Obtree kündigte damit an, Reuters News ML zu unterstützen, um Reuters News-Kanäle einzubinden. Stellt sich die Frage, was mit anderen News-Anbietern ist.

Schnittstellen oder nicht
Man könnte es als eine Art Henne-Ei-Problem betrachten: Wenn es noch keinen Standard für Content-Syndication gibt, warum sollen CMS Schnittstellen anbieten, oder wenn es keine entsprechenden Schnittstellen gibt und Inhalt auf anderen Wegen in ein CMS übertragen werden kann, warum einen Standard schaffen? Ersteres findet sich in Aussagen wie "Sobald der (oder ein ähnlicher) Standard vom W3C verabschiedet ist, wird Syndication voll unterstützt werden." Letzteres liest sich dann in den Beschreibungen der CMS-Anbieter etwa so: "Der ICE-Standard wird nicht direkt unterstützt, kann aber jederzeit implementiert werden, weil es sich um eine Anwendung von XML handelt" oder man versucht sich mit Umschreibungen wie "Interne Funktionen decken einen ICE-Standard ab" aus der Affäre zu ziehen. Leider stolperten wir bei unseren Recherchen auch über diese Aussage: "Nein, der Intelligent-Concept-Extraction-Standard wird nicht unterstützt."
Einige CMS-Anbieter unterstützen nach eigenen Angaben standardmäßig das ICE-Protokoll, andere bieten fertige Module, und eine Reihe Hersteller haben die Unterstützung für eine der nächsten Versionen angekündigt.
Auch an News ML-Schnittstellen wird gearbeitet. Es ist anzunehmen, dass vor allem die CMS mit News ML-Schnittstellen antreten werden, die traditionell in der Medien- und Verlagswelt vertreten sind. Da News ML ein XML-Format ist, lässt es sich prinzipiell an jedes XML-fähige CMS anschließen. Der Aufwand kann gering sein: Je nach Struktur des bestehenden XML kann News ML für den Import und Export einfach geparsed werden werden, oder das System wird einheitlich auf News ML umgestellt.
Auf Seiten der Content-Syndicatoren ist Contaire (www.contaire.de) hervorzuheben. Auf Anfrage bietet das Unternehmen eine fertige Lösung für den Einsatz in Content-Management-Systemen. Die gelieferten Feeds können Kunden direkt in den eigenen Datenbestand übernehmen oder mit einem beim Kunden installierten Content-Composer redaktionell bearbeiten.

Fertiggericht Content
Skeptiker sehen bei Content-Syndication das Problem, dass Inhalte nicht immer ohne weiteres eins zu eins übernommen werden können und sollen. Die Anpassung an das Site-Design ist recht einfach, Schriftarten, Textfarbe, Logos oder der Hintergrund lassen sich ändern, um die Inhalte nahtlos in die eigene Site einzufügen.
Was aber, wenn dem Site-Betreiber eine News nicht gefällt oder eine Nachricht für ihn so wichtig ist, dass sie eine Woche lang ganz oben stehen soll? Spezielle Filter sucht man bei Content-Syndication-Angeboten vergebens. Zwar funktioniert das Management der Content Provider und der Informationsnutzer so gut, dass seriöse Content-Provider nicht befürchten müssen, in unerwünschtem Kontext zu stehen. Umgedreht kann der Nutzer sicher sein, dass die Qualität stimmt. Dennoch wären Filterkonzepte, um Inhalte zu unterdrücken oder zu reduzieren, für manchen Nutzer wünschenswert. Dies wäre eine einfache Übung für CMS, wenn sie die gelieferten Daten verarbeiten könnten.
von Anja Weinstein