Künstliche Intelligenz

Halluzination

Sachlich falsche, aber überzeugend formulierte Ausgaben von KI-Sprachmodellen — ein zentrales Risiko beim Unternehmenseinsatz von LLMs.

Halluzinationen sind sachlich falsche Inhalte, die ein LLM mit hoher sprachlicher Überzeugungskraft generiert. Das Modell erfindet Fakten, zitiert nicht existierende Quellen oder zieht logisch fehlerhafte Schlüsse — und präsentiert das Ergebnis mit derselben Sicherheit wie korrekte Antworten. Für den Unternehmenseinsatz ist das ein zentrales Risiko: Ein Mitarbeiter, der sich auf eine halluzinierte Vertragsklausel, eine erfundene Produktspezifikation oder eine falsche Rechtsauskunft verlässt, kann erheblichen Schaden verursachen.

Warum LLMs halluzinieren

LLMs sind statistische Sprachmodelle — sie berechnen die wahrscheinlichste Fortsetzung einer Textsequenz, nicht die faktisch korrekte. Sie haben kein Weltwissen im menschlichen Sinne, sondern Muster aus Trainingsdaten. Wenn die Trainingsdaten lückenhaft sind, das Thema außerhalb der Trainingsverteilung liegt oder die Frage so formuliert ist, dass sie eine bestimmte Antwort nahelegt, füllt das Modell die Lücke mit plausibel klingendem, aber erfundenem Inhalt.

Erschwerend kommt hinzu, dass LLMs kein zuverlässiges internes Modell von Unsicherheit besitzen. Ein Mensch würde sagen „Das weiß ich nicht" — ein LLM generiert stattdessen eine Antwort, weil es darauf trainiert wurde, immer eine Antwort zu liefern. Dieses Verhalten ist technisch bedingt und betrifft alle aktuellen Sprachmodelle, unabhängig vom Anbieter.

Typen von Halluzinationen

Typ	Beschreibung	Beispiel
Faktenfehler	Falsche Behauptungen über reale Sachverhalte	Falsches Gründungsdatum eines Unternehmens, fehlerhafte Gesetzesverweise
Erfundene Quellen	Zitierte Studien, Urteile oder Dokumente existieren nicht	„Laut einer Studie der Fraunhofer-Gesellschaft von 2024..." (nicht existent)
Logische Fehler	Korrekte Prämissen, aber fehlerhafte Schlussfolgerung	Falsche Berechnung trotz richtiger Ausgangswerte
Konfabulation	Plausible, aber frei erfundene Details	Erfundene Funktionen eines realen Softwareprodukts

In der Praxis sind Faktenfehler und erfundene Quellen die häufigsten und gleichzeitig gefährlichsten Formen, weil sie ohne Fachkenntnis oder manuelle Prüfung schwer zu erkennen sind.

Erkennung und Reduzierung

Es gibt keinen vollständigen Schutz gegen Halluzinationen, aber bewährte Strategien zur deutlichen Reduzierung.

RAG (Retrieval Augmented Generation) ist der wirksamste Ansatz im Unternehmenskontext: Das Modell generiert Antworten auf Basis abgerufener Dokumente statt aus seinem Trainingsgedächtnis. In Kombination mit der Anweisung, nur Informationen aus den bereitgestellten Quellen zu verwenden, sinkt die Halluzinationsrate erheblich. Quellenverweise ermöglichen zudem die manuelle Überprüfung.

Grounding verankert die Modellantwort in konkreten Daten — etwa Datenbankeinträge, API-Rückgaben oder strukturierte Dokumente. Je stärker die Antwort an überprüfbare Fakten gebunden ist, desto weniger Raum bleibt für Halluzinationen.

Confidence Scoring bewertet die Zuverlässigkeit einer Modellantwort und markiert unsichere Stellen. In der Praxis lässt sich das durch Selbstevaluation (das Modell bewertet seine eigene Antwort) oder durch Vergleich mehrerer Modellantworten umsetzen. Antworten mit niedrigem Confidence Score werden zur manuellen Prüfung markiert.

Guardrails als Output-Filter können bekannte Halluzinationsmuster erkennen — etwa erfundene URLs, nicht existierende Gesetzesartikel oder widersprüchliche Aussagen innerhalb einer Antwort. Sie ersetzen keine inhaltliche Prüfung, ergänzen aber die automatische Qualitätssicherung.

Auch Fine-Tuning auf domänenspezifischen Daten kann die Halluzinationsrate in der Zieldomäne reduzieren, da das Modell die relevante Fachsprache und typische Zusammenhänge besser versteht. Es eliminiert Halluzinationen jedoch nicht vollständig.

Risiken im Unternehmenseinsatz

Halluzinationen haben im Geschäftskontext konkrete Konsequenzen. Fehlerhafte Rechtsauskünfte können zu falschen Entscheidungen führen. Halluzinierte Produktspezifikationen in der Kundenkommunikation schaden der Glaubwürdigkeit. Erfundene Quellenverweise in Berichten untergraben das Vertrauen in KI-gestützte Prozesse. Je mehr Autonomie ein KI-System erhält — etwa als AI Agent — desto kritischer wird das Halluzinationsrisiko, weil Fehler nicht mehr vor der Ausführung abgefangen werden.

Relevanz für KMUs

Für mittelständische Unternehmen ist es entscheidend, Halluzinationen als systemimmanente Eigenschaft von LLMs zu verstehen — nicht als Bug, der behoben wird. Der pragmatische Umgang besteht aus drei Bausteinen: erstens eine RAG-basierte Wissensdatenbank mit Quellenangaben, die den Halluzinationsraum einschränkt; zweitens klare Richtlinien für Mitarbeitende, KI-generierte Inhalte kritisch zu prüfen, bevor sie weitergegeben werden; und drittens automatisierte Qualitätskontrollen über Guardrails und Confidence Scoring für geschäftskritische Anwendungsfälle.

Unser Angebot

KI-Wissensdatenbank

Weiterführende Artikel

RAG-Systeme für Unternehmen: So bauen Sie eine intelligente Wissensbasis