RAG richtig machen – Warum RAG-Qualität stark variiert und was ihr dagegen tun könnt
Ein RAG-System ist nur so gut wie seine Komponenten: Chunking-Strategien, Embedding-Auswahl, Reranking und Evaluierung entscheiden über die Antwortqualität. Diese Lektion zeigt, wie du jede Stufe der RAG-Pipeline gezielt optimierst. Die Grundlagen von RAG solltest du dafür bereits kennen.
⚠️ RAG ist kein Plug-and-Play. Für gute Ergebnisse braucht es Zeit, Know-how und kontinuierliche Optimierung.
📊 Woraus setzt sich RAG-Qualität zusammen?
📄
Datenqualität
40%
+
✂️
Chunking-Strategie
25%
+
🧠
Embedding-Modell
20%
+
🔍
Retrieval-Strategie
15%
📄 Datenqualität
40%
✂️ Chunking-Strategie
25%
🧠 Embedding-Modell
20%
🔍 Retrieval-Strategie
15%
👆 Klicke auf einen Faktor oben, um Details zu sehen
✂️ Chunking = Wie Dokumente in durchsuchbare Abschnitte geteilt werden. Die richtige Strategie hängt vom Dokumenttyp ab.
📏
Feste Größe
Einfach
Text wird nach X Zeichen/Wörtern geteilt
📝
Satz-basiert
Einfach
Text wird an Satzgrenzen geteilt
📄
Absatz-basiert
Mittel
Text wird an Absätzen/Überschriften geteilt
🧠
Semantisch
Fortgeschritten
KI erkennt thematische Grenzen im Text
🏗️
Hierarchisch
Fortgeschritten
Mehrere Ebenen: Dokument → Kapitel → Abschnitt → Satz
🔗
Mit Überlappung
Mittel
Chunks überlappen sich am Rand
👈
Strategie auswählen
Klicke links auf eine Chunking-Strategie, um Details, Vor- und Nachteile zu sehen.
🗄️ Nicht jede Suche ist gleich. Je nach Anwendungsfall eignen sich unterschiedliche Datenbank-Typen.
📊
Vektor-Datenbank
Speichert Text als Zahlenreihen (Vektoren) und findet ähnliche Bedeutungen
🗺️ Wie eine Landkarte: Ähnliche Begriffe liegen nahe beieinander
🔤
Keyword/Volltext-Suche
Klassische Suche nach exakten Wörtern und Phrasen
📚 Wie ein Buchindex: Findet genau die Seiten mit dem Stichwort
🕸️
Graph-Datenbank
Speichert Beziehungen zwischen Entitäten (Personen, Produkte, Konzepte)
👥 Wie ein Familienstammbaum: Zeigt wer mit wem verbunden ist
🔀
Hybrid-Ansatz
Kombiniert mehrere Suchverfahren für beste Ergebnisse
🎯 Wie ein erfahrener Bibliothekar: Nutzt Index UND versteht was du meinst
👈
Datenbank-Typ auswählen
Klicke links auf einen Datenbank-Typ, um Details und Anwendungsfälle zu sehen.
📋 Empfehlungen nach Dokumenttyp
Dokumenttyp
Struktur
Empfohlenes Chunking
Datenbank
❓FAQ / Q&A
Frage-Antwort-Paare
Jede Q&A als eigener Chunk, Satz-basiert
📊 Vektor
📖Handbücher
Kapitel → Abschnitte → Text
Hierarchisch oder Absatz-basiert mit Overlap
📊 Vektor
📜Verträge
Paragraphen, Klauseln, Referenzen
Semantisch, Paragraph-basiert, mit Metadaten
🔀 Hybrid
🛒Produktkataloge
Strukturierte Daten, Beziehungen
Graph für Beziehungen + Vektor für Beschreibungen
🔀 Hybrid
📧E-Mails / Tickets
Threads, Konversationen
Pro Nachricht + Thread-Kontext als Metadaten
📊 Vektor
💻Code-Dokumentation
Funktionen, Klassen, Beispiele
Pro Funktion/Klasse, mit Code-Beispielen
📊 Vektor
🎯 Die wichtigsten Erkenntnisse
📄
Datenqualität ist #1
Die beste Technik hilft nicht bei schlechten Dokumenten. Investiert zuerst in saubere, aktuelle, strukturierte Inhalte.
🔬
Kennt eure Daten
Analysiert eure Dokumente: Wie sind sie strukturiert? Welche Fragen stellen Nutzende? Welche Infos werden gesucht?
⚗️
Experimentiert
Es gibt keine Universallösung. Testet verschiedene Chunking-Größen, Overlap-Werte und Retrieval-Parameter.
📊
Messt die Qualität
Definiert Testfragen und prüft regelmäßig: Werden die richtigen Dokumente gefunden? Sind die Antworten korrekt?
🔄
Iteriert kontinuierlich
RAG ist kein einmaliges Projekt. Neue Dokumente, Feedback und bessere Modelle erfordern Anpassungen.
🤝
Holt Fachleute
Für produktive Systeme braucht ihr Know-how in NLP, Datenbanken und ML. Das ist keine Schande – RAG ist komplex.
⏱️ Realistischer Aufwand
Quick Prototype
⏱️ 1-2 Tage📊 50-60%
Standard-Einstellungen, schneller Test
Gutes MVP
⏱️ 2-4 Wochen📊 70-80%
Angepasstes Chunking, Grundoptimierung
Produktionsreif
⏱️ 2-3 Monate📊 85-95%
Feintuning, Monitoring, Edge Cases
Schulungsmaterial · RAG-Optimierung·KI-Wissen Team·Aktualisiert: 22. Februar 2026