Ohne Klarheit hier bleibt alles Darüberliegende unscharf. Diese zehn Begriffe sind das Fundament jeder strategischen Einordnung von KI.
LLM — Large Language Model
Neuronales Netz, trainiert auf massiven Textmengen zur Vorhersage wahrscheinlicher Fortsetzungen. Erzeugt statistisch kohärente Sprache — keine Welterkenntnis. Basis aller aktuellen KI-Sprachsysteme.
Transformer
Die 2017 von Google eingeführte neuronale Architektur, auf der praktisch alle modernen LLMs basieren. Self-Attention-Mechanismus erlaubt paralleles Lernen langer Sprachkontexte. Ohne Transformer kein GPT, kein Claude, kein Gemini.
Foundation Model
Großes, vortrainiertes Modell als Basis für nachgelagerte Anwendungen. Trainiert auf breiten Datensätzen, adaptierbar durch Fine-Tuning oder Prompt-Steuerung. Die Infrastrukturschicht moderner KI-Produkte.
Frontier Models
Die jeweils leistungsstärksten Modelle des aktuellen Entwicklungsstands — Claude, GPT-4o, Gemini Ultra, Llama. Definieren den Capability-Horizont und setzen den Benchmark für alle nachgelagerten Anwendungen.
Inference (Inferenz)
Der Prozess, bei dem ein trainiertes Modell eine Anfrage verarbeitet und eine Ausgabe erzeugt. Skalierungskritisch, latenzabhängig und bestimmt die laufenden Betriebskosten jeder KI-Lösung.
Tokenization & Tokens
Modelle verarbeiten Text als Tokens — subword-Einheiten von ca. 3–4 Zeichen. Jeder API-Call wird in Tokens abgerechnet. Context-Window-Limits und Token-Kosten sind direkte Folge dieser Einheit.
Context Window
Die Menge an Informationen, die ein Modell in einer Sitzung gleichzeitig verarbeiten kann. Bestimmt die Komplexitätsgrenze eines Workflows. Aktuelle Frontier-Modelle: 200.000 bis 2 Millionen Tokens.
Embeddings
Numerische Vektor-Repräsentation von Text, Bildern oder Audio, in der semantische Nähe mathematisch messbar wird. Grundlage jeder Vektordatenbank, RAG-Pipeline und Ähnlichkeitssuche.
Multimodale Modelle
KI-Systeme, die verschiedene Informationstypen gleichzeitig verarbeiten und erzeugen: Text, Bild, Audio, Video, Code. Erweiterung des Anwendungsraums weit über reine Sprachverarbeitung hinaus.
World Models
KI-Systeme, die ein internes Modell kausaler Zusammenhänge aufbauen — nicht nur Sprachmuster. Voraussetzung für robuste Robotik, autonomes Fahren und KI-Systeme, die sicher in physischen Umgebungen handeln.
Das strategisch wichtigste Konzept-Cluster 2026: Wie Modelle denken — und warum eine neue Modellklasse den Paradigmenwechsel einleitet.
Reasoning Models
Eine neue Modellklasse (o3, DeepSeek R1, Claude 3.7 Sonnet), die vor der Ausgabe einen verlängerten internen Denkprozess durchläuft. Ermöglicht qualitativ überlegenes Schlussfolgern in Mathematik, Logik, Code und strategischen Analysen. Denktiefe schlägt rohe Modellgröße.
Inference-Time Compute
Mehr Rechenleistung zur Laufzeit statt ausschließlich beim Training. Modelle denken länger, anstatt einfach größer zu sein. Verändert GPU-Einsatz, Kostenstruktur und Capability-Trajektorie fundamental. Auch: Test-Time Scaling.
Chain-of-Thought (CoT)
Prinzip, bei dem ein Modell durch explizite Zwischenschritte zu strukturierterem Schlussfolgern geführt wird. Konzeptionelle Grundlage moderner Reasoning-Architekturen. Reduziert Halluzinationsrate bei analytischen Aufgaben signifikant.
Fine-Tuning
Anpassung eines vortrainierten Modells auf domänenspezifische Daten. Relevant für Unternehmen mit spezifischen Fachsprachen, Prozessstandards oder Compliance-Anforderungen. Aufwändiger als Prompt-Steuerung, aber präziser.
Distillation
Übertragung der Fähigkeiten eines großen Modells in ein kleineres, effizienteres. Ermöglicht kostengünstigere und latenzoptimierte Deployments — auch on-premise oder auf Edge-Devices. DeepSeek R1 ist ein prominentes Beispiel.
»2025 übertrafen Reasoning-Fähigkeiten erstmals menschliche Expertenurteile in definierten Domänen — nicht durch größere Modelle, sondern durch tieferes Denken.«
KI wechselt von Assistenz zu autonomem Handeln. Agentic AI ist kein Feature — es ist ein Architekturparadigma, das Prozessverantwortung und Governance neu definiert.
Agentic AI
KI-Systeme, die autonom planen, Werkzeuge einsetzen und mehrstufige Aufgaben über längere Zeithorizonte verfolgen. Markiert den Übergang: von Assistenz zu Automation. Verändert Prozessverantwortung strukturell.
AI Agents
Autonome KI-Systeme mit Werkzeugzugang — APIs, Browser, Code-Interpreter, Datenbanken — die zielorientiert handeln. Bausteine agentischer Architekturen; können eigenständig oder als Teil größerer Systeme operieren.
Multi-Agent Systems
Orchestrierung mehrerer spezialisierter Agenten, die arbeitsteilig zusammenwirken. Ein Orchestrator-Agent koordiniert Subagenten für Recherche, Analyse und Ausführung. Ermöglicht Komplexität, die kein Einzelmodell leisten kann.
MCP — Model Context Protocol
Offenes Protokoll (Anthropic, 2024), das KI-Agenten standardisierten Zugriff auf externe Systeme, Datenquellen und Unternehmens-Tools ermöglicht. Integrationsschicht zwischen Agenten-Logik und bestehender IT-Infrastruktur.
Function Calling & Structured Outputs
Fähigkeit moderner Modelle, strukturierte Ausgaben (JSON, Funktionsaufrufe) zu erzeugen. Grundvoraussetzung jeder zuverlässigen Agent-Architektur — deterministisches Parsing statt Freitext-Heuristik.
Autonomy Levels (L1–L5)
Spektrum zunehmender KI-Autonomie: L1 Vorschlag — L2 Entwurf — L3 Assistent — L4 Teilautonomie — L5 Vollautonom. Hilft Governance-Verantwortlichen, Mandat und Risiko pro Use-Case zu kalibrieren.
Human-in-the-Loop (HITL)
Architekturprinzip: Mensch bleibt an definierten Entscheidungspunkten im KI-Prozess eingebunden. Kritisch für Hochrisiko-Anwendungen, regulatorische Compliance und Fälle, in denen autonome Fehler nicht tolerierbar sind.
»Agentic AI verschiebt Ausführungsarbeit — und damit die Frage, wer für Entscheidungen in automatisierten Prozessen haftet.«
Wer KI steuert, braucht kein Studium — aber ein präzises Verständnis der Steuerungsmechanismen. Context Engineering ist die Disziplin, die Modellqualität mehr bestimmt als die Modellwahl selbst.
Context Engineering
Die Disziplin, die gesamte Informationsarchitektur zu gestalten, die ein Modell zur Laufzeit erhält: Systemanweisung, Nutzerdaten, Retrieval-Ergebnisse, Tool-Outputs, Gesprächshistorie. Weiterentwicklung von Prompt Engineering.
RAG — Retrieval-Augmented Generation
Standardarchitektur für Enterprise-KI: Das Modell greift bei der Inference auf eine externe Wissensbasis zu, statt alle Information im Training zu verankern. Ermöglicht aktuelle, quellengebundene und unternehmensspezifische Antworten.
Vektordatenbank
Spezialisierter Datenspeicher für Embeddings (Pinecone, Weaviate, Milvus, pgvector). Rückgrat jeder RAG-Architektur. Ermöglicht semantische Suche auf Millionen Dokumenten in Millisekunden.
Prompt Engineering
Die methodische Gestaltung von Instruktionen an KI-Systeme zur Steuerung von Qualität, Format und Konsistenz der Ausgaben. Entwickelt sich zu Context Engineering weiter: nicht mehr nur Formulierung, sondern Steuerungsarchitektur.
In-Context Learning
Die Fähigkeit eines Modells, während einer Sitzung aus Beispielen im aktuellen Kontext zu lernen — ohne Neutraining. Ermöglicht Ad-hoc-Anpassung des Modellverhaltens allein durch Instruktion und Beispielgebung.
Zero-Shot / Few-Shot
Zero-Shot: Modell löst Aufgaben ohne Beispiele. Few-Shot: Modell erhält wenige exemplarische Fälle im Prompt. Entscheidungsrelevant für die Frage, ob Instruktion oder Demonstration das effizientere Steuerungsinstrument ist.
Was Governance-Verantwortliche 2026 konkret adressieren müssen. Der EU AI Act macht Governance zur Rechtspflicht — mit Sanktionen bis 30 Mio. Euro oder 6 % des weltweiten Jahresumsatzes.
Halluzination
KI generiert faktisch falsche Aussagen mit scheinbarer Überzeugung. Ursache: Sprachmodelle optimieren auf statistische Kohärenz, nicht auf faktische Korrektheit. In unternehmenskritischen Prozessen ein nicht delegierbares Governance-Risiko.
Prompt Injection
Angriffsmethode auf KI-Agenten: Bösartig formulierte Inhalte in verarbeiteten Dokumenten veranlassen den Agenten zu unautorisierten Aktionen. Mit wachsender Agentic-AI-Adoption eines der drängendsten operativen Sicherheitsrisiken.
Red-Teaming & Jailbreaks
Systematisches Testen von Sicherheitsgrenzen durch spezialisierte Teams. Pflicht-Baustein jeder produktiven Enterprise-KI — ohne Red-Teaming keine belastbare Risikoeinschätzung.
Guardrails
Steuerungsmechanismen, die das Verhalten von KI-Systemen innerhalb definierter Grenzen halten. Technisch: Output-Filter, Classifiers. Prozessual: Human-in-the-Loop, Approval Gates. Kernbestandteil jeder verantwortungsvollen Enterprise-Einführung.
RLHF & Constitutional AI
Reinforcement Learning from Human Feedback — passt Modelle an menschliche Präferenzen an. Constitutional AI (Anthropic) erweitert das Prinzip um regelbasierte Selbstkorrektur. Grundmechanismus jeder Sicherheits-Alignment-Strategie.
AI Governance
Systematische Steuerung des KI-Einsatzes durch Richtlinien, Risikorahmen und Compliance-Strukturen. Der EU AI Act (in Kraft seit August 2024) macht Governance zur Rechtspflicht — mit Hochrisiko-Klassifikationen und harten Sanktionen.
AI-gestützte Einflussnahme
KI-Systeme, die gezielt auf Überzeugung und Verhaltensänderung ausgelegt sind: Deepfakes, synthetische Desinformation, personalisierte Manipulation. Unter dem EU AI Act als Hochrisiko- oder Verbotskategorie eingestuft.
Evals (Evaluations)
Systematische Verfahren zur Messung der Leistung von KI-Modellen auf definierten Aufgabensets. Unverzichtbar für Modellauswahl und Deployment-Entscheidungen. Grundsatz: Kein produktiver Einsatz ohne definierte Evals.
»Wer 2026 KI als Werkzeugentscheidung behandelt, unterschreibt operative Risiken, die strategisch gehören.«
Die ökonomische Logik hinter AI ist nicht neutral. Hyperscaler, Compute-Knappheit und Sovereign AI verschieben sich 2026 von Randthemen zu Standortlogik.
Hyperscaler
Betreiber massiver Cloud-Infrastrukturen (AWS, Azure, Google Cloud, Oracle), die KI-Compute im industriellen Maßstab bereitstellen. Kontrollieren GPU-Kapazität, Modell-APIs und Unternehmens-KI-Zugang — und damit die Infrastrukturschicht der gesamten KI-Wirtschaft.
Scaling Laws
Empirische Zusammenhänge zwischen Modellgröße, Trainingsdaten, Rechenleistung und Leistung. Seit 2020 ökonomische Grundlage jeder KI-Investitionsentscheidung. 2025 verschoben von reinem Pre-Training zu Test-Time-Scaling.
AI Unit Economics
Kosten- und Wertrechnung für KI-Systeme: Cost per Inference, Token-Kosten, Total Cost of Ownership, ROI-Modelle. Entscheidend für Business-Case-Bewertung, Skalierungsplanung und Modellklassenwahl.
Sovereign AI & Compute Governance
Staatliche Souveränität über KI-Infrastruktur, Modelle und Daten. US-Exportkontrollen (H100/Blackwell), EU Gigafactories, nationale KI-Strategien. Für Konzerne mit Cross-Border-Geschäft kein Randthema mehr — sondern Standortlogik.
Grounding / Verifiable AI
Die Fähigkeit eines KI-Systems, Ausgaben an belegbare Quellen zu binden und Nachvollziehbarkeit herzustellen. Gegenprinzip zur unkontrollierten Halluzination; kritisch für Compliance- und Auditanforderungen.
Wer 2026 KI als Werkzeugentscheidung behandelt, unterschreibt operative Risiken, die strategisch gehören. Reasoning-Modelle verschieben Denkarbeit, Agentic AI verschiebt Ausführungsarbeit, Context Engineering verschiebt Qualitätskontrolle — und der EU AI Act verschiebt Haftung.
Die Frage ist nicht, welches Modell. Die Frage ist: Welche Entscheidungen delegiere ich, welche behält die Führung — und wie stelle ich sicher, dass die Grenze belastbar bleibt.