SEMANTIC SEARCH FOR TRAVEL PLACE DOCUMENT

Dieses Projekt zielt auf die Entwicklung einer semantischen Suchmaschine, die nicht nur nach Keywords suchen kann, sondern auch die Absicht und den kontextuellen Sinn des eingegebenen Satzes erkennt. Anhand fortschrittlicher Technologien der künstlichen Intelligenz und einiger Modelle für die Verarbeitung natürlicher Sprache werden wir eine weitere Suchtechnologie namens semantische Suche vorstellen.

semantic search

EINFÜHRUNG

intro-1

Heutzutage gibt es zwar viele Suchmaschinen, die meisten verwenden jedoch die Keyword-Suche. Die Keyword-Suche sucht nach Begriffen, wo immer sie vorkommen, selbst wenn sie Teil eines größeren Ausdrucks sind oder in einem anderen Kontext verwendet werden. Sie findet Wörter an beliebiger Stelle im Datensatz. Die Keyword-Suche stößt jedoch auf die Einschränkung, dass Wörter oft mehrere Bedeutungen haben, so dass sie irrelevante Ergebnisse liefert.

intro-3

Im Gegensatz zur Keyword-Suche ist die semantische Suche eine Suche nach Bedeutung. Sie versucht, die Absicht und den Kontext der Begriffe und Ihrer Suchanfrage zu erfassen. Wir haben eine semantische Suchmaschine auf der Grundlage der Datenbank von https://wikitravel.org/en/Main_Page aufgebaut. Sie findet und zeigt Ihnen die besten k (Standard k=10) Artikel mit der besten Übereinstimmung im Sinne Ihrer Suchanfrage.

Ansatz

Daten

Wir haben alle existierenden Artikel von https://wikitravel.org/en/Main_Page gecrawlt. Nach der Reinigung und Vorverarbeitung der gecrawlten Daten, um nicht existierende Artikel, falsche und wiederholte Beiträge zu entfernen, beträgt die endgültige Anzahl der Artikel 31.249. Diese werden in einer CSV-Datei gespeichert und für die Suche verwendet.

Textähnlichkeitsmodell

Um den eingegebenen Satz anhand seiner semantischen Übereinstimmung mit der Artikeldatenbank zu suchen, haben wir ein Deep-Learning-Modell angewandt, um den Satz durch einen Embedding-Vektor zu repräsentieren. Anschließend berechnen wir die Ähnlichkeit des Satzes anhand dieser Embedding-Vektoren, um die besten Treffer zu finden.
semantic search-approach

ANWENDUNG

semantic search usage-1

Schritt 01

Zugriff auf die Seite für die semantische Suche nach Reiseorten: https://experiment.saigontechnology.vn/travel-search/. Alternativ können Sie die Hauptseite des Saigon Technology AI Research Lab hier aufrufen: https://experiment.saigontechnology.vn/, den Bereich "Semantische Suche nach Reiseorten" auswählen und auf die Schaltfläche "Try our demo" (Demo testen) klicken.

semantic search usage-2

Schritt 02

Auf der Seite "Semantische Suche nach Reiseorten" sehen Sie eine Benutzeroberfläche wie diese.

semantic search usage-3

Schritt 03

Geben Sie den Satz, den Sie suchen möchten, in das Texteingabefeld ein.

semantic search usage-4

Schritt 04

Klicken Sie dann auf die Schaltfläche "Suchen", um die Suche in der Wikitravel-Datenbank zu starten.

semantic search usage-5

Schritt 05

Die 10 besten Suchergebnisse werden wie folgt angezeigt:

Nächste Fallstudien

Das Natural Language Processing Toolkit (NLTK) ist eine Python-basierte Softwareanwendung, die eine Reihe von Werkzeugen zur Verarbeitung natürlicher Sprache anbietet.
Mithilfe von KI-basierten Computer-Vision-Techniken erkennt und kategorisiert das Produkterkennungssystem selbstständig Produkte in Bildern oder Videos.

Lass Uns Reden

Beginnen Sie die Konversation mit unseren Analysten und Entwicklern. Zusammen erheben wir die Bedürfnisse und skizzieren die neue Lösung