Alle Artikel

Auf dem Weg zum Graphen

Nein, die Outdooractive Plattform strebt keinen Adelstitel an. Gemeint ist, dass die Outdooractive Plattform an der nächsten Generation der Datenstruktur arbeitet.

Aber alles schön der Reihe nach. Buzzwords wie graph-basierte Datenbanken, Knowledge Graphen und Linked Open Data stehen bei Fachleuten des digitalen Tourismus immer mehr im Zentrum. Das zeigt, dass die Zeit jetzt reif ist, sich ernsthaft mit den Daten und Ihren Strukturen zu beschäftigen.

Was bedeuten die Begriffe denn nun? Die Fachleute auf dem Gebiet mögen es mir verzeihen, aber hier kommt eine Erklärung, die auch Nicht-Spezialisten verstehen können:

Es geht darum, dass eine Datenstruktur geschaffen wird, bei der alle Objekte im Tourismus miteinander verbunden (verlinkt) sind. Im Tourismus gibt es im Gegensatz zu anderen Branchen unglaublich viele und vielschichtige Informationen und viele Akteure, die diese Daten erzeugen. Daten werden in der Welt der zukunftsfähigen Datenbanken als Objekte abgebildet. Objekte sind zunächst einmal die verschiedenen Datentypen (z.B. Hotels, POIs, Veranstaltungen, Touren usw.). Beim Verknüpfen der Objekte werden beispielsweise Bilder einer Unterkunft zugeordnet, Einkehrmöglichkeiten einer Tour, die Veranstaltung einem Veranstaltungsort (POI), der buchbare Skipass einem Skigebiet, usw.

Innerhalb der einzelnen Objekttypen gibt es auch eine Struktur, die im Idealfall aus vielen einzelnen Dateneingabefeldern besteht (z.B. Titel, Kurzbeschreibung, Text, Anfahrtsbeschreibung, Georeferenz, usw.). Zunächst sind diese Eingabefelder einfach nur Teile des Datensatzes des Objektes. Aber durch die strukturierte Erfassung der einzelnen Teile eines Objektes, können diese auch wiederum in einzelne Objekte zerlegt werden und mit anderen Objekten verknüpft werden. So kann z.B. ein Bild, das zu einem POI zugeordnet wird, durch die Verknüpfung mit einem POI Informationen von diesem erben, z.B. die Georeferenz, dadurch entsteht dann ein georeferenziertes Bild. Aber auch der Titel des POIs (z.B. Goldener Hirsch) und die Kategorie (Gasthaus) können dem Bild weitergegeben werden. Damit hat das Bild auf einmal diese beiden Begriffe als Tags (Schlagworte) bekommen, und eine Suche nach „Gasthof Goldener Hirsch“ würde jetzt auch schon genau das Bild finden, ohne dass diese Begriffe bei dem Bild direkt eingegeben wurden. Das kann man dann endlos weiter ausdehnen, z.B. über die Georeferenz weiß der Gasthof auch, in welcher Gemeinde, in welcher touristischen Region, in welcher Berggruppe usw. er liegt und über die Eigenschaften des Gasthofes weiß das Bild auch, dass darauf ein Ausflugsziel zu sehen ist. Dann kann das Bild auch gefunden werden, wenn man eine Suche nach „Ausflugsziel im fränkischen Wald“ befragt.

Alle diese Objekte können aus unterschiedlichen Quellen stammen. Also das Bild stammt von jemand anderem, als der POI, und die Regionen mitsamt den Inhalten kommen wiederum von jemand anderem, usw. Das System setzt die Inhalte aus den verschiedenen Quellen zusammen zur bestmöglichen Information für den Benutzer. In dem Fall spricht man von einem Knowledge Graph.

Bei Google sind z.B. die Ergebnisseiten, die man bei einer Suchanfrage bekommt, aus verschiedenen Quellen zusammengesetzt (ohne die Quellen zu nennen). Oft treten diese zusammengesetzten Ergebnisse rechts in einer eigenen Spalte auf.

Technisch betrachtet ist ein Graph zunächst einmal ein Knoten-Kanten-Modell. Die einzelnen Elemente sind die Knoten und die Verbindungen dazwischen sind die Kanten. Am einfachsten kann man sich das beim Routing vorstellen. Die Wegekreuzungen sind die Knoten und die Stassen und Wege dazwischen nennt man Kanten. Auch die Kanten können neben der einfachen Verbindung zusätzliche Informationen enthalten, z.B. dass es sich bei der Verbindung zwischen zwei Objekten um eine asphaltierte Landstraße mit 6m Breite und wenig Verkehr handelt. Das kann aber auch eine geografische Beziehung (liegt in einem Naturschutzgebiet), eine Bedingung (für LKW gesperrt), eine Öffnungszeit (im Winter geschlossen), ein Status (jetzt geöffnet), oder einen Preis (8 € Mautgebühr) sein. So etwas nennt sich dann auch semantisches Datenmodell.

Wenn man in der Datenstruktur – in dem Fall über die Verbindung mit der Kategorie – auch noch klarstellt, dass z.B. der goldene Hirsch in diesem Fall nicht ein Tier ist, sondern ein Gasthof, dann ist die Basis geschaffen, dass bei allen Anzeigen und Daten-Weitergaben die Algorithmen das richtig interpretieren können. Dann spricht man auch vom Semantic Web.

Wer noch ein wenig tiefer in die Materie eintauchen möchte, dem sei der Einstieg über Wikipedia empfohlen: https://de.wikipedia.org/wiki/Graphdatenbank. Wikipedia selber ist auch ein prominentes Beispiel einer stark linkdurchsetzten Datenhaltung – allerdings mit relativ wenig logischer Struktur.

 

Ein großes Daten-Netzwerk

Die gesamthafte graph-basierte touristische Datenbank ist also am Ende ein immenses Netzwerk an Einzelobjekten mit intelligenten Beziehungen dazwischen. Ein Benutzer kann in einem solchen Datennetzwerk stundenlang immer weiter klicken, ohne das System verlassen zu müssen. Genau deswegen ist eine solche Datenstruktur auch geeignet als Grundlage aller Sprachassistenten. Man kann komplexe Fragen stellen und der Algorithmus eines künstlichen Assistenten kann anhand der logisch aufgebauten Datenstruktur eine Antwort daraus ziehen.

 

Wie funktioniert das bei Outdooractive?

Wir bei Outdooractive haben vor 15 Jahren damit begonnen, eine digitale Plattform zu bauen. Wir haben – getreu unserer Herkunft voll und ganz ingenieurmäßig – ganz unten angefangen, eine mandantenfähige Datenbank aufzubauen, an der alle Beteiligten im Tourismus teilhaben können. In der Zeit als alle anderen Firmen im Markt damit beschäftigt waren, Webseiten mit bunten Bildern und langen Texten zu bauen, haben wir uns hauptsächlich um die Datenverwaltung und die Datenstrukturen der Zukunft gekümmert. Wir haben alle im Tourismus vorkommenden Objekte mit allen ihren Eigenschaften ausmodelliert. Für die Herstellungen der intelligenten Beziehungen zwischen den Objekten haben wir dem Outdooractive Softwaresystem viele automatische Aktionen beigebracht.

Beim Speichern eines POIs werden z.B. 15 bis 20 verschiedene Beziehungen erstellt wie in welcher Region, in welchem Bundesland und in welchem Naturschutzgebiet oder an welchem Gewässer der Punkt liegt. Es gibt aber auch Beziehungen, die (noch) redaktionell hergestellt werden, wie die Auswahl der passenden Einkehrmöglichkeiten zu einer Tour. Doch auch diese manuelle Zuordnung wird bereits heute maschinell unterstützt und kann in Zukunft einmal ganz wegfallen, wenn das maschinelle Ergebnis eine gleichwertige Qualität erreicht hat.

Derzeit diskutieren die Innovatoren im touristischen Markt (Destinationen, Berater und Softwareunternehmen) allerseits über kollaborative Datenbanken, Knowledge Graphen und Linked (Open) Data Daher ist jetzt die Zeit gekommen, dass die Kunden von Outdooractive von der langjährigen Entwicklung profitieren. Insgesamt dürfen wir bei Outdooractive also bei aller Bescheidenheit sagen: Wir haben schon lange eine verlinkte Datenbank. Die Technologie bringt die Kunden von Outdooractive bei der durchgängigen Benutzung einen gewaltigen Schritt nach vorne. Was aber natürlich nicht bedeuten soll, dass wir mit unserer Entwicklung fertig sind. Im Gegenteil, das ist erst der Anfang. Bei Outdooractive sind wir permanent dabei, die Datenbanktechnologie weiter zu entwickeln, als nächstes in die Richtung eines Graphen, und was sonst noch so alles kommen mag in der Zukunft. Wir sind bei allen gerade beginnenden Diskussionen über die touristischen Datenbanken der Zukunft gerne mit dabei, leisten unseren Beitrag und nehmen daraus auch immer neue Aufgaben für unsere Entwicklung mit. Unser Anspruch an der Stelle ist ganz klar: Wir wollen unseren Kunden auch weiterhin das leistungsfähigste System zur Verfügung stellen und es gemeinsam mit ihnen weiterentwickeln.