KI-Wissen Logo
Konzept · RAG

RAG erklärt – KI mit eigenen Daten verbinden

RAG einfach erklärt – Wie KI auf euer Firmenwissen zugreifen kann

Retrieval Augmented Generation (RAG) verbindet KI-Modelle mit deinen eigenen Unternehmensdaten. Diese Lektion erklärt, wie RAG funktioniert – vom Embedding über die Vektorsuche bis zur kontextangereicherten Antwort. RAG löst gezielt das Problem von KI-Halluzinationen und nutzt Embeddings, um Text in durchsuchbare Vektoren umzuwandeln.

🧠 Das Problem mit LLMs

📅
Wissen ist eingefroren

Ein LLM weiß nur, was bis zum Trainingsende passiert ist. Alles danach? Unbekannt.

🏢
Kennt eure Firma nicht

Eure Prozesse, Produkte, Preise, Policies? Das LLM hat davon nie gehört.

👻
Erfindet bei Wissenslücken

Wenn es etwas nicht weiß, erfindet es eine plausibel klingende Antwort – "Halluzination".

💬 Ein Beispiel

Was ist unsere Kündigungsfrist für Enterprise-Verträge?
👤
🤖
Ohne RAG:
"Enterprise-Verträge haben typischerweise eine Kündigungsfrist von 30-90 Tagen, je nach Branche und Vereinbarung..."
❌ Generische Antwort – kennt eure Verträge nicht!
🤖
Mit RAG:
"Enterprise-Verträge haben eine Kündigungsfrist von 90 Tagen zum Quartalsende. Bei Verträgen vor 2023 gilt noch die alte Frist von 60 Tagen. (Quelle: AGB §12.3)"
✅ Exakte Antwort aus euren AGB mit Quelle!
📚 + 🧠 = 💡

RAG = Retrieval Augmented Generation

"Durch Abruf erweitertes Generieren"

Die Idee: Bevor das LLM antwortet, suchen wir in euren Dokumenten nach relevanten Informationen und geben sie dem LLM als Kontext mit.

🎓 Die Analogie: Open-Book-Prüfung

😰
Ohne RAG = Closed-Book

Der Student muss alles aus dem Gedächtnis wissen. Was er nicht gelernt hat, kann er nur raten.

😊
Mit RAG = Open-Book

Der Student darf in seinen Unterlagen nachschlagen. Er findet die richtigen Infos und formuliert die Antwort.

📊 Der Unterschied

Aspekt❌ Ohne RAG✅ Mit RAG
📚WissenNur Trainingsdaten (veraltet)Aktuelles Firmenwissen
📅AktualitätStand: TrainingsendeImmer aktuell
🔗QuellenKeine Angabe möglichKann Dokumente zitieren
👻HalluzinationenErfindet bei WissenslückenAntwortet aus Dokumenten
🏢FirmenspezifischKennt eure Firma nichtKennt eure Dokumente
🔒VertraulichkeitNur öffentliches WissenAuch interne Dokumente

📊 RAG besteht aus zwei Phasen

Erst werden die Dokumente vorbereitet (einmalig), dann kann gesucht werden (bei jeder Frage)

📥
Phase 1: Indexierung
Einmalig / Bei Änderungen

Dokumente werden gesammelt, in Stücke geteilt, in Vektoren umgewandelt und in einer speziellen Datenbank gespeichert.

📁 Sammeln✂️ Aufteilen🔢 Vektorisieren🗄️ Speichern
🔍
Phase 2: Retrieval & Generierung
Bei jeder Anfrage

Die Frage wird vektorisiert, ähnliche Dokumente werden gefunden, und das LLM generiert eine Antwort basierend auf den Ergebnissen.

❓ Frage🧠 Verstehen🔍 Suchen📎 Anreichern💬 Antworten

📥 Phase 1: Indexierung im Detail

📁
Sammeln
✂️
Aufteilen
🔢
Vektorisieren
🗄️
Speichern
📁
Schritt 1: Sammeln
Dokumente werden gesammelt
PDFs, Word-Dokumente, Wiki-Seiten, Confluence, Notion...
💡 Alle relevanten Dokumente werden aus verschiedenen Quellen zusammengetragen.

🧮 Was sind Vektoren/Embeddings?

Embeddings verwandeln Text in Zahlen – so dass Computer "Ähnlichkeit" verstehen können

👑
"König"
[0.9, 0.1, 0.8, ...]
👸
"Königin"
[0.85, 0.1, 0.75, ...]
🐕
"Hund"
[0.1, 0.9, 0.2, ...]
🐈
"Katze"
[0.15, 0.85, 0.25, ...]

💡 König und Königin haben ähnliche Zahlen → Sie sind semantisch ähnlich
Hund und Katze auch – aber anders als die Royals!

💡 Praxisbeispiele

👥
HR-Assistent
Klicken für Details
🖥️
IT-Support
Klicken für Details
💼
Vertriebs-Assistent
Klicken für Details
📖
Produkt-Dokumentation
Klicken für Details
👈
Beispiel auswählen
Klicke links auf ein Praxisbeispiel, um zu sehen wie RAG in der Praxis funktioniert.

✅ Tipps für gutes RAG

📄
Gute Dokumente
RAG ist nur so gut wie eure Dokumente. Aktuelle, gut strukturierte Inhalte = bessere Antworten.
✂️
Richtig chunken
Dokumente in sinnvolle Abschnitte teilen – nicht zu groß (ungenau), nicht zu klein (Kontext verloren).
🎯
Relevanz prüfen
Nicht jedes gefundene Dokument ist relevant. Schwellenwerte für Ähnlichkeit setzen.
🔄
Aktuell halten
Regelmäßig neue Dokumente indexieren. Veraltete Infos führen zu falschen Antworten.
📎
Quellen zeigen
Immer die Quelle mitliefern. So können Nutzende die Antwort verifizieren.
🧪
Testen, testen
Mit echten Fragen testen. Findet das System die richtigen Dokumente?
Schulungsmaterial · RAG erklärt·KI-Wissen Team·Aktualisiert: 22. Februar 2026
Zurück
Agenten & Skills
Weiter
RAG-Optimierung