Alle Artikel

Das Must-have für zukünftige Systeme: Datenqualität

Künstliche Intelligenz kann – wie jede Form von Intelligenz – nur so gut sein wie die Daten, auf deren Grundlage Antworten und Empfehlungen generiert werden. Beim Thema Machine Learning ist  Datenqualität wichtiger und gleichzeitig problematischer denn je: Schlechte Daten können nicht, wie bei der traditionellen Datenanalyse, einfach ausgetauscht oder gelöscht werden. Die relevanten Datenmengen werden zukünftig, wenn sie Relevanz für Alexa, Chatbots und Co. erhalten wollen, in Big Data organisiert. Der Ursprung der (möglicherweise falschen) Daten kann aufgrund der großen Datenmengen oft nicht identifiziert werden – eine nachträgliche Anpassung der Inhalte (welche oft von Dritten stammen) gestaltet sich daher oft schwer.

Klassisches Tourismus-Marketing, wie wir es heute kennen, wird sich in Zukunft stark verändern, denn die Gewohnheiten der Gäste wandeln sich durch neue Technologien grundlegend. Um langfristigen Erfolg zu generieren, müssen sich Destinationen auf diese Gewohnheiten einstellen und die Bedürfnisse der Gäste in den Mittelpunkt stellen. Damit die Geräte der Zukunft (intelligente Assistenten, Sprachassistenten und Chatbots) dem Gast die gestellten Fragen überhaupt richtig beantworten können, ist eine Bereitstellung qualitativ hochwertigen Contents unabdingbar. Die Schwierigkeit dabei ist der veränderte Datenbezug im Vergleich zu traditionellen Systemen. Zukünftige, intelligente Systeme beziehen ihre Daten aus riesigen Datencontainern, in welchen Content mit guter und schlechter Qualität abliegt. Intelligente Systeme lernen, wie der Name schon sagt, selbst. Sie suchen sich mit programmierten AI-Algorithmen Informationen aus den Containern. Die generierten Antworten der Maschinen sind dann natürlich nur so gut, wie die Daten, die dort hinterlegt sind.

In Anlehnung an: https://www.slideshare.net/mrjain/predictive-analytics-big-data-artificial-intelligence

Wichtige Kriterien für qualitativ hochwertige Daten:

Richtigkeit: Sind die Quellen, aus welchen Daten (z. B. Informationen, Content) generiert werden, zuverlässig und renommiert? Gerade bei touristischen Inhalten eignen sich Originalquellen am besten – zu schnell werden Angaben durch Dritte verfälscht oder durch persönliche Meinungen beeinflusst. Für eine hohe Datenqualität sollte man daher als erstes die touristischen Partner (z. B. Hotels, Museen etc.) direkt involvieren. Künstliche Intelligenz nimmt, im Gegensatz zum menschlichen Verständnis, alle Daten aus allen Quellen als richtig wahr. Deshalb müssen die Daten von Menschen auf ihre Richtigkeit überprüft werden, bevor sie automatisierten Systemen zur Verfügung gestellt werden.

Gültigkeit/Aktualität: Sind angegebene Daten zeitbezogen und haben somit nur eine begrenzte Gültigkeit, besteht die Gefahr, dass Angaben veralten. Ein ständiges Monitoring bzw. eine dauerhafte Aktualisierung aller zugänglichen Daten ist also unabdingbar.

Vollständigkeit: Enthalten die Daten alle Inhalte, die für die Zielgruppe wichtig sind? Sind die Informationen mit passenden Keywords versehen? Eine hohe Datenqualität wird nur erreicht, wenn alle Angaben detailliert und verständlich sind. Gerade touristische Daten sind nur dann für den Gast interessant, wenn sie wichtige Detailinformationen (z. B. Anbindung an öffentliche Verkehrsmittel, Öffnungszeiten von Sehenswürdigkeiten, benötigte Ausrüstung für eine Tour) enthalten.

Unvollständige Datenbasis

Vollständige Datenbasis

 

 

 

 

 

 

 

Datenqualität ist keinesfalls eine einmalige Maßnahme, es handelt sich um einen langfristigen Prozess. Die Daten müssen kontinuierlich analysiert, bereinigt und überwacht werden. Jedoch lohnt sich der dauerhafte Einsatz für eine hohe Datenqualität: Die Inhalte bleiben langfristig relevant und können für zukünftige Entwicklungen wiederverwertet werden.