RAG einfach erklärt – Wie KI auf euer Firmenwissen zugreifen kann
Retrieval Augmented Generation (RAG) verbindet KI-Modelle mit deinen eigenen Unternehmensdaten. Diese Lektion erklärt, wie RAG funktioniert – vom Embedding über die Vektorsuche bis zur kontextangereicherten Antwort. RAG löst gezielt das Problem von KI-Halluzinationen und nutzt Embeddings, um Text in durchsuchbare Vektoren umzuwandeln.
🧠 Das Problem mit LLMs
📅
Wissen ist eingefroren
Ein LLM weiß nur, was bis zum Trainingsende passiert ist. Alles danach? Unbekannt.
🏢
Kennt eure Firma nicht
Eure Prozesse, Produkte, Preise, Policies? Das LLM hat davon nie gehört.
👻
Erfindet bei Wissenslücken
Wenn es etwas nicht weiß, erfindet es eine plausibel klingende Antwort – "Halluzination".
💬 Ein Beispiel
Was ist unsere Kündigungsfrist für Enterprise-Verträge?
👤
🤖
Ohne RAG:
"Enterprise-Verträge haben typischerweise eine Kündigungsfrist von 30-90 Tagen, je nach Branche und Vereinbarung..."
❌ Generische Antwort – kennt eure Verträge nicht!
🤖
Mit RAG:
"Enterprise-Verträge haben eine Kündigungsfrist von 90 Tagen zum Quartalsende. Bei Verträgen vor 2023 gilt noch die alte Frist von 60 Tagen. (Quelle: AGB §12.3)"
✅ Exakte Antwort aus euren AGB mit Quelle!
📚 + 🧠 = 💡
RAG = Retrieval Augmented Generation
"Durch Abruf erweitertes Generieren"
Die Idee: Bevor das LLM antwortet, suchen wir in euren Dokumenten nach relevanten Informationen und geben sie dem LLM als Kontext mit.
🎓 Die Analogie: Open-Book-Prüfung
😰
Ohne RAG = Closed-Book
Der Student muss alles aus dem Gedächtnis wissen. Was er nicht gelernt hat, kann er nur raten.
😊
Mit RAG = Open-Book
Der Student darf in seinen Unterlagen nachschlagen. Er findet die richtigen Infos und formuliert die Antwort.
📊 Der Unterschied
Aspekt
❌ Ohne RAG
✅ Mit RAG
📚Wissen
Nur Trainingsdaten (veraltet)
Aktuelles Firmenwissen
📅Aktualität
Stand: Trainingsende
Immer aktuell
🔗Quellen
Keine Angabe möglich
Kann Dokumente zitieren
👻Halluzinationen
Erfindet bei Wissenslücken
Antwortet aus Dokumenten
🏢Firmenspezifisch
Kennt eure Firma nicht
Kennt eure Dokumente
🔒Vertraulichkeit
Nur öffentliches Wissen
Auch interne Dokumente
📊 RAG besteht aus zwei Phasen
Erst werden die Dokumente vorbereitet (einmalig), dann kann gesucht werden (bei jeder Frage)
📥
Phase 1: Indexierung
Einmalig / Bei Änderungen
Dokumente werden gesammelt, in Stücke geteilt, in Vektoren umgewandelt und in einer speziellen Datenbank gespeichert.
📁 Sammeln✂️ Aufteilen🔢 Vektorisieren🗄️ Speichern
🔍
Phase 2: Retrieval & Generierung
Bei jeder Anfrage
Die Frage wird vektorisiert, ähnliche Dokumente werden gefunden, und das LLM generiert eine Antwort basierend auf den Ergebnissen.