Wie funktioniert ein LLM? Einfach erklärt

Wie funktioniert ein Sprachmodell? Von der Wortvorhersage auf dem Handy zu ChatGPT – einfach erklärt

Ein Large Language Model (LLM) wie GPT oder Claude erzeugt Text, indem es Wort für Wort das wahrscheinlichste nächste Token vorhersagt. Diese Lektion erklärt den Weg vom Tokenizer über die Transformer-Architektur bis zur fertigen Antwort – verständlich und ohne Fachjargon.

📖 Wichtige Begriffe – kurz erklärt

LLM (Large Language Model)

Ein "Großes Sprachmodell" – die Technologie hinter ChatGPT, Claude & Co.

Token

Die Bausteine, in denen das Modell "denkt" – meist Wörter oder Wortteile.

Prompt

Deine Eingabe bzw. Frage an das Sprachmodell.

📱

Kennst du das von deinem Handy?

Wenn du eine Nachricht tippst, schlägt dein Handy das nächste Wort vor:"Ich bin gleich..." → da? fertig? zuhause?

ChatGPT und Claude funktionieren im Kern genauso – nur millionenfach leistungsfähiger. Sie sagen immer nur das nächste Wort vorher, und dann das nächste, und das nächste...

Das Grundprinzip: Wort für Wort vorhersagen

Ein Sprachmodell generiert Text, indem es immer nur das nächste wahrscheinlichste Wort berechnet

PROMPT

"Warum ist der Himmel blau?"

→

🧠

Sprachmodell

"Welches Wort
passt am besten?"

→

RESPONSE

"Die blaue Färbung des Himmels..."

🔄 So läuft es Schritt für Schritt

📥

Deine Frage lesen

Das Modell nimmt deinen Text entgegen

🔍

Bisheriges betrachten

Was wurde schon geschrieben?

📊

Optionen abwägen

Welche Wörter könnten als nächstes kommen?

🎯

Bestes Wort wählen

Das wahrscheinlichste Wort wird ausgegeben

🔁

Wiederholen

Bis die Antwort vollständig ist

💡

Warum ist das wichtig zu wissen?

Das Sprachmodell "plant" seine Antwort nicht im Voraus. Es fragt sich nur immer wieder: "Welches Wort passt jetzt am besten?" – hunderte Male hintereinander. Deshalb können manchmal inhaltlich falsche, aber sprachlich "passende" Aussagen entstehen (sogenannte Halluzinationen).