- 10:30 Uhr
- Marco Frodl
Webinar: Turbo RAG: AI-basierte Retriever-Auswahl mit Semantic Router
Retrieval Augmented Generation (RAG) verwendet Daten aus Retrieval-Systemen wie Vector-DBs, um die relevanten Informationen zur Beantwortung einer Benutzeranfrage zu finden. In Real-World-Szenarien geht es häufig um mehrere Quellen (Retriever) mit unterschiedlichen Datenarten.
Um den zu einer User-Frage passenden Retriever auszuwählen, können wir eine MultiRoute-Chain nutzen. Hierbei wählt das LLM dynamisch die semantisch am besten passende Datenquelle für die Suche. Allerdings verlängert dieser Ansatz die Antwortzeit unseres AI-Workflows und kostet Tokens - also Geld.
Geht das auch schneller und günstiger? Ja! Ein Semantic Router nutzt für die Quellenauswahl kein LLM sondern ein Embedding Modell. Dieser Ansatz liefert eine mit einem LLM vergleichbare Qualität bei der Quellenauswahl und ist dabei deterministisch - jedoch in Millisekunden und zu einem Bruchteil der Kosten.
Mit Live-Coding implementieren wir in einem Sample unter Verwendung des LangChain-Frameworks zuerst eine klassische MultiRoute-Chain und optimieren dann auf eine Variante mit der OpenSource-Library Semantic Router.
Letztendlich zeigen beide Ansätze, wie die Leistung von RAG bei der Beantwortung von Benutzeranfragen deutlich verbessert werden kann.
Moderation
Gøran Homberg
Gøran Homberg ist Consultant bei Thinktecture und arbeitet mit unseren Kunden bzgl. deren Anforderungen, Projektansätzen und zugehörigem Projekt-Management.
Agenda
- Vorstellung Open Source-Lib Semantic Router
- Was ist RAG?
- Implementierung Simple RAG
- Implementierung Dynamic Retriever Selection mit MultiRoute-Chain
- Verbesserung durch Einsatz Semantic Router
- Endergebnis: Verbesserte Performance und Kosten
Material & Video zu "Turbo RAG: AI-basierte Retriever-Auswahl mit Semantic Router"
Links aus dem Webinar:
Sie wünschen sich Unterstützung durch unsere Experten in Ihrem Projekt?
Slidedeck zu "Turbo RAG: AI-basierte Retriever-Auswahl mit Semantic Router"
Kommende Webinare: jetzt kostenlos anmelden
„Hallo, KI!?“ – Realtime-Interaktionen mit Language Models
Christian Liebel | 14.05.2025 | 10:30 Uhr
Aktuelle Webinar-Aufzeichnungen
Marco Frodl | 16.04.2025 | 10:30 Uhr
Daniel Sogl | 02.04.2025 | 10:30 Uhr
Max Marschall | 04.12.2024 | 10:30 Uhr
Weitere Artikel zu AI, Generative AI, LangChain

Die Llama 4-Revolution: Wie Metas neue KI-Familie den Open-Source-Markt neu definiert

AI-Funktionen zu Angular-Apps hinzufügen: lokal und offlinefähig
