Talk | 
Generation AI Meetup - November 2025
 | 12.11.2025

Vision, OCR, Bounding Boxen? – Was zu tun ist, wenn im PDF kein Text steht

Document AI kann der Schlüssel zur Erschließung wertvoller Informationen aus historischen und aktuellen Dokumentenbeständen sein. In diesem Vortrag zeigt Lukas Köhler praxisnahe Ansätze für die Verarbeitung von PDFs mit und ohne Text-Layer sowie die Generierung belastbarer Zitate mit präzisen Bounding-Boxen. Wichtige Konzepte wie Annotation-Workflows, der Einsatz spezialisierter Modelle wie Mistral Document AI und DeepSeek OCR sowie Matching-Strategien werden anhand eines Proof of Concept demonstriert. Entwickler und Architekten erhalten einen pragmatischen Überblick über die mögliche Implementierung nachvollziehbarer Datenextraktion in eigenen Projekten.

Lukas Köhler ist Generative AI Developer bei Thinktecture. Er versteht sich als Problemlöser für verschiedenste Unternehmensaufgaben mit generativer KI.

Event

Generation AI Meetup - November 2025
12.11.25  
- 12.11.25 
@ Karlsruhe
 (DE)

Links & Materialien

Slidedeck

Weitere Artikel zu AI, Document Intelligence, Generative AI, OCR

AI
mf

Die Llama 4-Revolution: Wie Metas neue KI-Familie den Open-Source-Markt neu definiert

Meta hat mit der Llama 4-Familie eine neue Generation von KI-Modellen vorgestellt, die durch zwei wesentliche Innovationen hervorsticht: ein 10-Millionen-Token-Kontextfenster und native Multimodalität. Die Familie besteht aus Scout (109 Milliarden Parameter), Maverick (400 Milliarden Parameter) und dem noch in Entwicklung befindlichen Behemoth (2 Billionen Parameter). Durch die Mixture-of-Experts-Architektur und Unterstützung für 200 Sprachen bieten diese Modelle europäischen Unternehmen eine attraktive Alternative zu proprietären Lösungen. Trotz hoher Hardware-Anforderungen und einiger Lizenzeinschränkungen ermöglichen sie eine souveräne KI-Strategie ohne Vendor Lock-in bei gleichzeitig wettbewerbsfähiger Leistung und Kosteneffizienz.
06.04.2025
Low-angle photography of metal structure
AI
cl-neu

AI-Funktionen zu Angular-Apps hinzufügen: lokal und offlinefähig

Künstliche Intelligenz (KI) ist spätestens seit der Veröffentlichung von ChatGPT in aller Munde. Wit WebLLM können Sie einen KI-Chatbot in Ihre eigenen Angular-Anwendungen integrieren. Wie das funktioniert und welche Vor- und Nachteile WebLLM hat, lesen Sie hier.
26.02.2024
AI
favicon

Integrating AI Power into Your .NET Applications with the Semantic Kernel Toolkit – an Early View

With the rise of powerful AI models and services, questions come up on how to integrate those into our applications and make reasonable use of them. While other languages like Python already have popular and feature-rich libraries like LangChain, we are missing these in .NET and C#. But there is a new kid on the block that might change this situation. Welcome Semantic Kernel by Microsoft!
03.05.2023

Unsere Webinare

Unsere Artikel

Mehr über uns