12.03.2025 |

Webinar: Turbo RAG: AI-basierte Retriever-Auswahl mit Semantic Router

Retrieval Augmented Generation (RAG) verwendet Daten aus Retrieval-Systemen wie Vector-DBs, um die relevanten Informationen zur Beantwortung einer Benutzeranfrage zu finden. In Real-World-Szenarien geht es häufig um mehrere Quellen (Retriever) mit unterschiedlichen Datenarten.

Um den zu einer User-Frage passenden Retriever auszuwählen, können wir eine MultiRoute-Chain nutzen. Hierbei wählt das LLM dynamisch die semantisch am besten passende Datenquelle für die Suche. Allerdings verlängert dieser Ansatz die Antwortzeit unseres AI-Workflows und kostet Tokens - also Geld.

Geht das auch schneller und günstiger? Ja! Ein Semantic Router nutzt für die Quellenauswahl kein LLM sondern ein Embedding Modell. Dieser Ansatz liefert eine mit einem LLM vergleichbare Qualität bei der Quellenauswahl und ist dabei deterministisch - jedoch in Millisekunden und zu einem Bruchteil der Kosten.

Mit Live-Coding implementieren wir in einem Sample unter Verwendung des LangChain-Frameworks zuerst eine klassische MultiRoute-Chain und optimieren dann auf eine Variante mit der OpenSource-Library Semantic Router.

Letztendlich zeigen beide Ansätze, wie die Leistung von RAG bei der Beantwortung von Benutzeranfragen deutlich verbessert werden kann.

Mehr Beiträge zu AI, Generative AI, LangChain

Marco Frodl

Marco Frodl ist Consultant bei der Thinktecture AG und versteht sich als ein IT-Dolmetscher zwischen Developern und Anwendern.

Moderation

Gøran Homberg

Gøran Homberg ist Consultant bei Thinktecture und arbeitet mit unseren Kunden bzgl. deren Anforderungen, Projektansätzen und zugehörigem Projekt-Management.

Agenda

Vorstellung Open Source-Lib Semantic Router
Was ist RAG?
Implementierung Simple RAG
Implementierung Dynamic Retriever Selection mit MultiRoute-Chain
Verbesserung durch Einsatz Semantic Router
Endergebnis: Verbesserte Performance und Kosten

Material & Video zu
"Turbo RAG: AI-basierte Retriever-Auswahl mit Semantic Router"

Links aus dem Webinar:

Sie wünschen sich Unterstützung durch unsere Experten in Ihrem Projekt?

Slidedeck zu "Turbo RAG: AI-basierte Retriever-Auswahl mit Semantic Router"

Kommende Webinare: jetzt kostenlos anmelden

No results found.

Aktuelle Webinar-Aufzeichnungen

AI-Powered Development: Transformiere deinen Workflow mit Coding Tools und MCP Servern

Daniel Sogl | 30.07.2025 | 10:30 Uhr

zum Webinar >

„Hallo, KI!?“ – Realtime-Interaktionen mit Language Models

Christian Liebel | 14.05.2025 | 10:30 Uhr

zum Webinar >

Schneller entwickeln mit Angular, GitHub Copilot und ChatGPT

Daniel Sogl | 30.04.2025 | 10:30 Uhr

zum Webinar >

Weitere Artikel zu AI, Generative AI, LangChain

Die Llama 4-Revolution: Wie Metas neue KI-Familie den Open-Source-Markt neu definiert

Meta hat mit der Llama 4-Familie eine neue Generation von KI-Modellen vorgestellt, die durch zwei wesentliche Innovationen hervorsticht: ein 10-Millionen-Token-Kontextfenster und native Multimodalität. Die Familie besteht aus Scout (109 Milliarden Parameter), Maverick (400 Milliarden Parameter) und dem noch in Entwicklung befindlichen Behemoth (2 Billionen Parameter). Durch die Mixture-of-Experts-Architektur und Unterstützung für 200 Sprachen bieten diese Modelle europäischen Unternehmen eine attraktive Alternative zu proprietären Lösungen. Trotz hoher Hardware-Anforderungen und einiger Lizenzeinschränkungen ermöglichen sie eine souveräne KI-Strategie ohne Vendor Lock-in bei gleichzeitig wettbewerbsfähiger Leistung und Kosteneffizienz.

zum Artikel >

06.04.2025

| Marco Frodl

AI-Funktionen zu Angular-Apps hinzufügen: lokal und offlinefähig

Künstliche Intelligenz (KI) ist spätestens seit der Veröffentlichung von ChatGPT in aller Munde. Wit WebLLM können Sie einen KI-Chatbot in Ihre eigenen Angular-Anwendungen integrieren. Wie das funktioniert und welche Vor- und Nachteile WebLLM hat, lesen Sie hier.

zum Artikel >

26.02.2024

| Christian Liebel

Integrating AI Power into Your .NET Applications with the Semantic Kernel Toolkit – an Early View

With the rise of powerful AI models and services, questions come up on how to integrate those into our applications and make reasonable use of them. While other languages like Python already have popular and feature-rich libraries like LangChain, we are missing these in .NET and C#. But there is a new kid on the block that might change this situation. Welcome Semantic Kernel by Microsoft!

zum Artikel >

03.05.2023

| Thinktecture Team