KI-Wissen Logo
Start/⚙️ KI-Systeme/RAG-Optimierung
Fortgeschritten · RAG-Optimierung

RAG-Systeme optimieren: Chunking, Reranking

RAG richtig machen – Warum RAG-Qualität stark variiert und was ihr dagegen tun könnt

Ein RAG-System ist nur so gut wie seine Komponenten: Chunking-Strategien, Embedding-Auswahl, Reranking und Evaluierung entscheiden über die Antwortqualität. Diese Lektion zeigt, wie du jede Stufe der RAG-Pipeline gezielt optimierst. Die Grundlagen von RAG solltest du dafür bereits kennen.

⚠️ RAG ist kein Plug-and-Play. Für gute Ergebnisse braucht es Zeit, Know-how und kontinuierliche Optimierung.

📊 Woraus setzt sich RAG-Qualität zusammen?

📄
Datenqualität
40%
+
✂️
Chunking-Strategie
25%
+
🧠
Embedding-Modell
20%
+
🔍
Retrieval-Strategie
15%
📄 Datenqualität
40%
✂️ Chunking-Strategie
25%
🧠 Embedding-Modell
20%
🔍 Retrieval-Strategie
15%
👆 Klicke auf einen Faktor oben, um Details zu sehen
✂️ Chunking = Wie Dokumente in durchsuchbare Abschnitte geteilt werden. Die richtige Strategie hängt vom Dokumenttyp ab.
📏
Feste Größe
Einfach

Text wird nach X Zeichen/Wörtern geteilt

📝
Satz-basiert
Einfach

Text wird an Satzgrenzen geteilt

📄
Absatz-basiert
Mittel

Text wird an Absätzen/Überschriften geteilt

🧠
Semantisch
Fortgeschritten

KI erkennt thematische Grenzen im Text

🏗️
Hierarchisch
Fortgeschritten

Mehrere Ebenen: Dokument → Kapitel → Abschnitt → Satz

🔗
Mit Überlappung
Mittel

Chunks überlappen sich am Rand

👈
Strategie auswählen
Klicke links auf eine Chunking-Strategie, um Details, Vor- und Nachteile zu sehen.
🗄️ Nicht jede Suche ist gleich. Je nach Anwendungsfall eignen sich unterschiedliche Datenbank-Typen.
📊
Vektor-Datenbank

Speichert Text als Zahlenreihen (Vektoren) und findet ähnliche Bedeutungen

🗺️ Wie eine Landkarte: Ähnliche Begriffe liegen nahe beieinander
🔤
Keyword/Volltext-Suche

Klassische Suche nach exakten Wörtern und Phrasen

📚 Wie ein Buchindex: Findet genau die Seiten mit dem Stichwort
🕸️
Graph-Datenbank

Speichert Beziehungen zwischen Entitäten (Personen, Produkte, Konzepte)

👥 Wie ein Familienstammbaum: Zeigt wer mit wem verbunden ist
🔀
Hybrid-Ansatz

Kombiniert mehrere Suchverfahren für beste Ergebnisse

🎯 Wie ein erfahrener Bibliothekar: Nutzt Index UND versteht was du meinst
👈
Datenbank-Typ auswählen
Klicke links auf einen Datenbank-Typ, um Details und Anwendungsfälle zu sehen.

📋 Empfehlungen nach Dokumenttyp

DokumenttypStrukturEmpfohlenes ChunkingDatenbank
FAQ / Q&AFrage-Antwort-PaareJede Q&A als eigener Chunk, Satz-basiert📊 Vektor
📖HandbücherKapitel → Abschnitte → TextHierarchisch oder Absatz-basiert mit Overlap📊 Vektor
📜VerträgeParagraphen, Klauseln, ReferenzenSemantisch, Paragraph-basiert, mit Metadaten🔀 Hybrid
🛒ProduktkatalogeStrukturierte Daten, BeziehungenGraph für Beziehungen + Vektor für Beschreibungen🔀 Hybrid
📧E-Mails / TicketsThreads, KonversationenPro Nachricht + Thread-Kontext als Metadaten📊 Vektor
💻Code-DokumentationFunktionen, Klassen, BeispielePro Funktion/Klasse, mit Code-Beispielen📊 Vektor

🎯 Die wichtigsten Erkenntnisse

📄
Datenqualität ist #1
Die beste Technik hilft nicht bei schlechten Dokumenten. Investiert zuerst in saubere, aktuelle, strukturierte Inhalte.
🔬
Kennt eure Daten
Analysiert eure Dokumente: Wie sind sie strukturiert? Welche Fragen stellen Nutzende? Welche Infos werden gesucht?
⚗️
Experimentiert
Es gibt keine Universallösung. Testet verschiedene Chunking-Größen, Overlap-Werte und Retrieval-Parameter.
📊
Messt die Qualität
Definiert Testfragen und prüft regelmäßig: Werden die richtigen Dokumente gefunden? Sind die Antworten korrekt?
🔄
Iteriert kontinuierlich
RAG ist kein einmaliges Projekt. Neue Dokumente, Feedback und bessere Modelle erfordern Anpassungen.
🤝
Holt Fachleute
Für produktive Systeme braucht ihr Know-how in NLP, Datenbanken und ML. Das ist keine Schande – RAG ist komplex.

⏱️ Realistischer Aufwand

Quick Prototype
⏱️ 1-2 Tage📊 50-60%
Standard-Einstellungen, schneller Test
Gutes MVP
⏱️ 2-4 Wochen📊 70-80%
Angepasstes Chunking, Grundoptimierung
Produktionsreif
⏱️ 2-3 Monate📊 85-95%
Feintuning, Monitoring, Edge Cases
Schulungsmaterial · RAG-Optimierung·KI-Wissen Team·Aktualisiert: 22. Februar 2026
Zurück
RAG erklärt
Weiter
Fortgeschrittene KI-Systeme