GLOSSAR-EINTRAG

LLM — Large Language Model

KI-Sprachmodell mit Milliarden Parametern, das Text versteht und generiert. Beispiele: GPT-4, Claude, Gemini.

Ein Large Language Model ist ein neuronales Netzwerk auf Transformer-Basis, das auf riesigen Textmengen vortrainiert wurde und dadurch Sprache versteht, generiert und transformiert. Aktuelle Modelle haben zwischen 70 Milliarden und über einer Billion Parameter — wobei die Parametergröße allein nicht über Qualität entscheidet. Die führenden Modelle 2026 sind Claude Sonnet/Opus 4.6 (Anthropic), GPT-4 Turbo/o-Serie (OpenAI), Gemini 2.0 (Google) und Llama-Varianten (Meta). LLMs sind die Basis von ChatGPT, Claude, Gemini, Perplexity, GitHub Copilot und unzähligen weiteren KI-Produkten. Im operativen Betrieb relevant sind vier Eigenschaften. Erstens Kontextlänge: Wie viele Tokens kann das Modell pro Anfrage verarbeiten? Claude Sonnet 4.6 schafft 200k bis 1M Tokens, GPT-4 Turbo 128k, Gemini 1.5 Pro 2M. Zweitens Token-Kosten: API-Calls werden pro 1.000 Input- und 1.000 Output-Tokens abgerechnet — die Spannweite reicht von unter einem Cent (Haiku, GPT-4o-mini) bis zu mehreren Dollar pro 1M Tokens (Opus, GPT-4 Turbo). Drittens Inferenzgeschwindigkeit: Wie schnell antwortet das Modell? Für Echtzeit-Use-Cases (Chat) ist Latenz entscheidend, für Batch-Aufgaben weniger. Viertens Reasoning-Fähigkeiten: spezialisierte Modelle wie o3 oder Claude Opus mit „Extended Thinking" lösen komplexere Aufgaben besser, sind aber langsamer und teurer. LLMs haben auch klare Grenzen. Sie halluzinieren (geben falsche Informationen mit hoher Selbstsicherheit), haben einen Wissens-Cutoff (Stand der Trainingsdaten), kennen interne Unternehmensdaten nicht und können keine echte Mathematik. Diese Schwächen adressiert man mit RAG (für aktuelle Daten), Function Calling (für Tools und Berechnungen) und striktem Output-Schema (für strukturierte Daten). Bei SUMAX kombinieren wir je nach Use Case mehrere Modelle über einen LLM-Router: Haiku für Klassifikation, Sonnet für Long-Form, Opus oder o3 für strategische Reasoning-Aufgaben.

VERWANDTE BEGRIFFE

Token →

Kleinste Verarbeitungseinheit eines LLMs. 1.000 Tokens ≈ 750 Wörter Deutsch.…

Context Window →

Maximale Anzahl Tokens, die ein LLM in einem Schritt verarbeiten kann.…

Halluzination →

Wenn ein LLM faktisch falsche Informationen mit hoher Selbstsicherheit ausgibt.…

← Alle Begriffe Schreib mir →