Vermutlich ist sie nur Insidern der Advertising-Industrie bekannt: die IAB-Taxonomie. Die Taxonomie ist das Ergebnis einer langjährigen Standardisierungsarbeit des Internal Advertising Bureau. Das ist ein internationaler Wirtschaftsverband der Online-Werbeindustrie mit Sitz in New York, welcher sich u.a. für Vereinheitlichungen und Standardisierungen in dieser Branche einsetzt. Eine deutsche Unterorganisation ist der „Online Vermarkter Kreis OVK“. Die Taxonomie verfolgt das Ziel, Inhalte des WWW einheitlich verschiedenen Klassen (Segmenten) zuzuordnen.

Was ist überhaupt eine Taxonomie?

Darunter versteht man ein Klassifikationsschema, mit dem reale Objekte oder theoretische Begrifflichkeiten in bestimmte Klassen (Taxa) und Unterklassen eingeordnet werden können. Die meisten Taxonomien sind hierarchisch aufgebaut und werden als Baumstruktur mit individueller Verästelung dargestellt. Je tiefer man in den Baumverästelungen hinunter steigt, desto spezifischer wird die Information und desto besser ist das Objekt beschrieben.

Beim Erstellen eines Schemas besteht die Herausforderung darin, die notwendigen Haupt- und Unterklassen zu erkennen und dadurch möglichst maßgeschneidert die Gesamtmenge der Objekte oder Begrifflichkeiten und ihrer Abhängigkeiten untereinander zu erfassen. Ein weiterer Aufgabenpunkt ist das Finden von sprechenden Bezeichnern für alle Klassenstufen. Dies dient der Verständlichkeit im Navigieren sowie im Wiederfinden und Ablegen von Objekten.

Taxonomie-Beispiel: Ausschnitt für die Domäne „Business und Finanzen“

Grafik zur IAB-Taxonomie am Beispiel der Domain "Business und Finanzen"
Ausschnitt aus der Taxonomie für „Business und Finanzen“

Was ist der große Nutzen einer Taxonomie?

Aus einer ungeordneten Menge von vielfältigen Objekten (z.B. das World Wide Web mit seinen Seiten, Dokumenten, Bildern usw.) entsteht ein geordnetes, überschaubares und verständliches System, das Zusammenhänge und Abhängigkeiten abbildet sowie Sonderfälle berücksichtigt.

Für eine ungeordnete Objektmenge sind oft mehrere verschiedene Taxonomien denkbar. Zum Beispiel können Legosteine geordnet werden nach:

  • Farbe des Legosteins:
    Weiß, Grün – (Lindgrün, Medium-Grün, Hellgrün, Grasgrün), Transparent – (Blau, Gelb, Rot …), Fluoreszierend …
  • Zugehörigkeit zu einem Lego-Bausatz:
    Basic, Klassik – (Feuerwehr, Burg, Zug …), Creator – (Fahrzeuge – (Sattelschlepper, Autofähre …), Gebäude – (Leuchtturm, Ferienhaus …)), …

Die Einordnung von Objekten in eine Taxonomie ist häufig bereits bei einfachen Taxonomien alles andere als trivial. Insbesondere bei Dokumenten oder auch Webseiten ist die Zuordnung oft nicht eindeutig möglich. Ein Dokument kann verschiedenen Segmenten zugeteilt werden. Taxonomien, die mehrere Ebenen beinhalten, bedeuten noch einmal einen höheren Aufwand für den Klassifizierungsprozess. Dafür stellen sie aber für die Anwendung sehr viel mehr angereicherte Informationen zur Verfügung.

Worin liegt der Unterschied zwischen Taxonomie und Ontologie?

Eine Taxonomie ist klassischerweise hierarchisch angeordnet und beschreibt die Beziehung „ist Untermenge von“ bzw. „ist Obermenge von“.

Eine Ontologie wird als Netzwerk angesehen. Sie kann vielschichtige und verflochtene Datenmodelle abbilden und beliebige Querverbindungen anzeigen. Zudem können die Querverbindungen mit Integritätsregeln und Beziehungstypen hinterlegt werden.

Welche Form hat die IAB-Taxonomie?

IAB hat eine umfassende Taxonomie – also ein fertiges Klassifikationsschema – für Inhalte des World Wide Web erarbeitet und stellt sie im Excel-Format im Web zur freien Verfügung. Zwar erkennt man darin die Schwerpunkte der Werbebranche und die Sichtweisen des amerikanischen Way of Life darin, doch eignet sie sich hervorragend für die Content-Klassifizierungen verschiedenster Use Cases.

Die aktuelle, auch von MORESOPHY verwendete Taxonomie ist die IAB-Version 2.0. Kundenwünsche ändern sich über die Jahre hinweg, setzen andere Gewichtungen oder es entstehen ganz neue Trends und Produkte. Dies soll sich natürlich in der Taxonomie wiederspiegeln.

Version 2.0 vereint 29 Klasseneinteilungen, die sog. Marktsegmenten entsprechen. Die Tiefe des zugehörigen Taxonomiebaumes reicht bis zu vier Stufen weit hinunter, und die Anzahl der Blätter des Baumes, also die letzten und am meisten spezialisierten Elemente, liegt bei knapp 700. Die am ausführlichsten heruntergebrochenen Marktsegmente sind Business & Finance, Sports und Style & Fashion.

Welchen Wert hat die IAB-Taxonomie?

In Verbindung mit intelligenten Klassifikationsalgorithmen ist die Anwendung der IAB-Taxonomie nicht auf den Bereich der Werbung beschränkt. Als ein großer Vorteil in der Praxis hat sich ihre universelle Anwendbarkeit erwiesen. Im Bereich Human Resources kann beispielsweise auf das gelernte Wissen aus der Klasse Careers zurückgegriffen werden. Das Segment Personal Finance kommt zum Einsatz bei Lösungen im Bereich Banken und Versicherungen. Kombiniert man z.B. die Klasse „Sports – Fußball“ mit der Klasse „Style & Fashion – Herrenmode – Herrenbekleidung – Sportbekleidung“, so deckt man das Thema „Fußball spielende Männer“ ab.

Hinter der CONTEXTSUITE von MORESOPHY liegen komplexe Modelle der Künstlichen Intelligenz, mit denen beliebige Inhalte – aus dem Web wie Dokumente oder Emails im Unternehmen – automatisiert den Segmenten der IAB-Taxonomie zugeordnet werden können. Dabei lernt die Software immer besser, was genau die Inhalte in den verschiedenen Segmenten voneinander unterscheidet und was darin wirklich relevant ist. Die IAB- Taxonomie bietet eine stabile Basis, um das erlernte Wissen über viele Anwendungen und Use-Cases hinweg mit einem hohen Grad an Wiederverwendbarkeit und geringen Kosten zu nutzen.

Passend zum Thema: Ein Artikel über die Bedeutung von kundenspezifischen Daten für das maschinelle Lernen.