GLOSSAR-EINTRAG

Context Window

Maximale Anzahl Tokens, die ein LLM in einem Schritt verarbeiten kann.

Das Kontextfenster begrenzt, wie viel Text ein Modell pro Anfrage gleichzeitig „sehen" kann. Stand 2026: GPT-4 Turbo 128k, Claude Sonnet 4.6 200k bis 1M, Gemini 1.5 Pro 2M. Größere Fenster ermöglichen längere Dokumente, ändern aber nichts an der „Lost in the Middle"-Problematik: Modelle gewichten Anfang und Ende stärker als die Mitte.

VERWANDTE BEGRIFFE

LLM →

KI-Sprachmodell mit Milliarden Parametern, das Text versteht und generiert. Beispiele: GPT-4, Claude, Gemini.…

Token →

Kleinste Verarbeitungseinheit eines LLMs. 1.000 Tokens ≈ 750 Wörter Deutsch.…

RAG →

Architektur, bei der ein LLM vor der Antwort gezielt externe Dokumente abruft. Reduziert Halluzinationen.…

← Alle Begriffe Schreib mir →