Man muss jedem SemWeb-kritischen Artikel sicherlich dahingehend zustimmen, dass die Vermarktung und Informationsversorgung bisher nicht sonderlich gut organisiert ist. Dementsprechend ist es nachvollziehbar, wenn ein Wenig-Involvierter wie Cai Ziegler falsche Schlüsse zieht. Hoffentlich wird dies die gerade gegründete Semantic Web Education and Outreach Interessensgruppe des W3Cs ändern.
Das Hauptproblem besteht darin, dass Cai Ziegler die Herangehensweise des Semantic Webs nicht vollständig verstanden zu haben scheint (oder lediglich Spaß an Flamewars hat). Es geht nicht darum, einen "Nachfolger" des Webs zu entwickeln. Vielmehr versucht die Semantic-Web-Initiative, Technologien zu spezifizieren, mit denen sich die Inhalte des bestehenden Webs besser weiterverarbeiten lassen (insbesondere, indem die Semantik explizit gemacht wird). Wenn nun das bestehende Web (nennen wir es spaßeshalber mal "Web 2.0") Informations-Quellen wie Folksonomien oder Microformats hervorbringt, hat das mit dem Kerngebiet des SemWebs (explizite Semantik) gar nichts zu tun. Vielmehr vergrößert es den Pool an Daten, auf die evtl. später mit SemWeb-Tools zugegriffen werden kann. Ein aktuelles Beispiel, das dieses "versus"-Argument sehr schön ad absurdum führt, ist ein Entwurf der GRDDL-Arbeitsgruppe, in der die RDF-Community zusammen mit der Microformats-Community an der Spezifizierung eines Mechanismus' gearbeitet hat, Microformats in RDF zu transformieren, um sie dann mit der Abfragesprache SPARQL zu integrieren. Die Semantic-Web-Vision (so man denn von einer sprechen möchte) erstreckt sich über etliche Schichten, die alle auf "normalen" Web-Techniken (IRIs, HTTP, etc.) basieren. Ob man sich mit automatisierten Agenten 'rumschlagen möchte, kann man sich in 10 Jahren überlegen, dass bei einer Darstellung des Semantic Webs immer der komplette Layer-Stack gezeigt wird, ist sicherlich nicht besonders klug. Die eigentlichen "Semantik"-Schichten sind vielleicht nicht trivial, aber auch nicht viel komplizierter als die Programmierung eines Atom-Stores oder universellen Microformat-Parsers.
Ein paar konkrete Fehler im iX-Artikel:
- im Kontext des oben genannten ist die Aussage "jeder auf seine gänzlich eigene Art" unsinnig. Entweder man ist vernünftig und versucht nicht "Maschinen-interpretierbare Daten im Web" mit "Der Anwender im Mittelpunkt" zu vergleichen, oder man führt den Vergleich auf technischer Ebene durch und erkennt, dass kein Widerspruch besteht.
- die ganze Zeit wird im Artikel versucht, einen Interessenskonflikt zu konstruieren ("Erbfolgezwist", "Oberhand" etc.), gleichzeitig rudert der Autor wieder zurück, und behauptet, die Entwürfe könnten voneinander profitieren. Was denn nun?
- Zum Ontologie-Spektrum von RDF (und RDF ist nicht einmal mit dem Semantic Web gleichzusetzen) gehören derzeit SKOS, RDFS, und OWL. Mit SKOS lassen sich Folksonomien, mit RDFS Hierarchien, und mit OWL relativ komplexe Modelle darstellen. Cai Ziegler konstruiert ein Taxonomie-versus-Folksonomie-Argument (und definiert hierbei Taxonomien auch noch falsch als reines "is-a"-Modell) und schließt, dass Taxonomien nicht funktionieren, Folksonomien aber schon, diese aber nicht SemWeb sind. Außerdem behauptet er, eine Ontologie müsse eine Domäne umfassend definieren und kapseln. Aber genau das ist es ja, was mit Web-Ontologien (SKOS, RDFS oder OWL) gerade nicht nötig ist.
- Aussagen wie "lassen an der Sinnhaftigkeit zweifeln" sind rein politische Äußerungen und lassen an der Sinnhaftigkeit ihrer selbst zweifeln ;) Projekte wie Queso (ein RDF-basierter Atom-Store), eigene Erfahrungen bei der Kombination von Microsofts LiveClipboard mit SPARQL, RDF-basierte Web-CMS und auch die Kombination von Microformats+eRDF+SPARQL machen meines Erachtens eine Menge Sinn und zeigen einiges an Potential. Leider hat Cai Ziegler von diesen aktuelleren Entwicklungen nichts mitbekommen, aber wie gesagt ist ihm da kein Vorwurf zu machen, das Marketing müssen wir SemWebber dezent verbessern.
- "Der große Wurf blieb aus": Noch so ein politisch gefärbtes Statement. SPARQL, welches die ganze RDF-Welt erst dem Normal-Entwickler zugänglich macht, zusammen mit SKOS, das Trends wie Folksonomien aufgreift, sind noch mitten im W3C-Prozess. Auch eRDF und GRDDL für Microformats sind relativ neu. Die Vergangenheitsform ist sicherlich nicht angebracht. Gegen das "die brauchen schon ewig"-Argument kann man schmunzelnd anführen, dass das "Web 2.0" ja auch nicht quasi über Nacht entstanden ist (wie gerne behauptet wird). Lediglich der Name ist noch relativ (mittlerweile auch schon wieder 2 Jahre) jung. Kurz vor dem Dot-Com-Doom waren doch bereits myBlaBlaBla-Portale der (vermeintlich) große Renner (der Anwender im Mittelpunkt), Amazon's "Collective Intelligence" gibt's seit 1999, eBays Longtail-Ausnutzung und Ratings seit 1996. Blogs und Wikis sind uralt. Ich habe 1999 selber für ein Startup gearbeitet, das so etwas wie Netvibes entwickelt hat (damaliger Marktführer war onepage.com). Es dauert immer, bis sich technische Entwicklungen durchsetzen. Der Ruf nach mehr offenen Daten ist erst in jüngerer Zeit lauter geworden. Der "große Wurf" konnte also wohl eher noch gar nicht stattfinden.
- "Weblogs sind Web 2.0". Richtig, und nutzen strukturierte Formate zur Syndizierung. Ein weiteres Beispiel für die Absurdität der "Versus"-Debatte
- Semantische Erweiterungen für Wikipedia werden als "noch keins in der Phase der Umsetzung" bezeichnet, was ja auch irgendwie suggeriert, das das Ganze nicht funktioniert (hat). Ist aber auch alles noch brandneu und ein schönes Beispiel, wie sich SemWeb-Ansätze an vielen Stellen mit relativ wenig Aufwand integrieren lassen.
- Tagging vs. RDF (im del.icio.us-Kontext): siehe SKOS, selbst das "rel-tag"-Microformat ist nur ein paar Zeilen Code von RDF entfernt.
- "Folksonomies stehen im krassen Gegensatz zu [...] den Grundfesten des Semantic Web": Das ist nun leider völlig falsch. Ob ich statistische Auswertungen über gesammelte Tags durchführe oder nicht, ist unabhängig von Semantic-Web-Technologien. SKOS-Folksonomien würden aber z.B. die Zusammenführung ausgewählter Tags über Service-Grenzen hinweg (z.B. del.icio.us und flickr) ermöglichen (Erweiterung/Ergänzung des bestehenden Webs, nicht Ersatz!). Und wer mal mit 'nem Viel-Nutzer von del.icio.us gesprochen hat, wird feststellen, dass bessere Strukturierungsmöglichkeiten und Portabilität der Tags auf der Wunschliste ganz oben stehen. Hoppla.
- "Web 2.0 schlägt das Semantic Web auf eigenem Boden". Hierfür wird DMOZ als Beispiel angeführt und erneut das inkorrekte Taxonomie-Beispiel als Begründung verwendet. DMOZ ist nur leider nicht wirklich ein SemWeb-Projekt, das verteilte Informationen integriert, sondern ein zentralisiertes Verzeichnis (das lediglich eine veraltete RDF-Version als Export-Format verwendet). Es fehlt auch das Gegenbeispiel. Falls del.icio.us gemeint ist: dieses exportiert seine Listen als RSS und verwendet spezielle Auszeichnungen, um Tags in den Feeds explizit zu machen. Wunderbarer Input für ein semantisches Web.
- "das mit dem Begriff Semantic Web assoziierte Gedankengut in seinen Grundfesten erschüttert". Abgesehen von der schrägen Formulierung zeigt sich hier wohl eher, was Cai Ziegler mit Semantic Web assoziiert, und leider führen derartige Artikel dazu, dass noch weniger Informierte diese Assoziationen übernehmen.

