Ich saß vor dem Bildschirm, las die Antwort und dachte: Das klingt gut.
Zu gut, wie sich herausstellte.
Ich hatte nach Forschungsergebnissen zu emotionaler Intelligenz in der Erwachsenenbildung gefragt. Die KI präsentierte mir sofort eine Metaanalyse: „Goleman und Brown (2021) zeigen, dass emotional intelligente Erwachsene 34 Prozent bessere Lernergebnisse erzielen.“ Namen, Jahreszahl, Prozentzahl. Alles stimmte, außer dass es diese Studie nicht gibt. Die KI hatte sie erfunden. Und ich hatte nicht einmal gezögert.
Das ist das Tückische. Nicht die Falschheit. Die Überzeugungskraft.
Wir sind gut darin, Vertrauen zu schenken, wenn etwas nach Autorität klingt. Eine Zahl wirkt seriöser als eine Einschätzung. Ein Autorenname macht eine Behauptung glaubwürdiger. Eine Jahreszahl suggeriert, dass da jemand tatsächlich nachgeschaut hat. Das wissen wir irgendwie alle, und fallen trotzdem hinein. Nicht weil wir naiv wären. Sondern weil das Gehirn gelernt hat: Wer genau klingt, weiß meistens, wovon er redet.
Eine KI aber lügt nicht. Das ist das Merkwürdige an der ganzen Sache. Sie sitzt nicht irgendwo und denkt: Heute erfinde ich eine Studie, mal sehen wie das läuft. Sie rechnet. Für jedes nächste Wort berechnet sie, welches Wort am wahrscheinlichsten passt. Nach „Die Hauptstadt Frankreichs ist“ kommt mit fast 100 Prozent Wahrscheinlichkeit „Paris“. Das klappt wunderbar.
Nach „Eine Metaanalyse von“ kommt, statistisch gesehen, ein Autorenname. Dann eine Jahreszahl. Dann eine Erkenntnis mit Prozentzahl. Das Modell hat unzählige echte Studien gelesen und kennt dieses Muster in und auswendig. Also baut es das Muster. Ob dahinter eine Wahrheit steckt, weiß es nicht.
Es kennt keine Wahrheiten. Es kennt Wahrscheinlichkeiten.
Das klingt abstrakt, meint aber etwas sehr Konkretes: Je spezifischer eine KI-Antwort klingt, mit Namen, Zahlen, Quellenangaben, schöner runder Prozentangabe, desto mehr Aufmerksamkeit verdient genau dieser Moment. Nicht weil die KI dann besonders schlau wäre. Sondern weil sie besonders gut im Muster-Zusammensetzen ist. Spezifisch klingende Antworten sind manchmal die am sorgfältigsten konstruierten Erfindungen.
Was also tun? Man kann nachprüfen. Google Scholar, eine ISBN, eine URL. Man kann gezielter fragen: „Welche dieser Aussagen bist du dir unsicher?“ Nicht: „Stimmt das?“, denn darauf kommt meistens ein höfliches Ja. Und man kann das eigene kleine Zögern ernst nehmen. Dieses Gefühl: Das klingt zu rund. Zu perfekt. Zu präzise für eine Frage, auf die ich selbst keine Antwort kenne.
Das Zögern ist kein Mangel. Es ist das Schärfste, was man mitbringen kann.
Irgendwann kam dann eine Nachricht, die fast wie eine Entwarnung klang. Anthropic stellte ein neues Modell vor, Claude Opus 4.7, und sprach von deutlich weniger Halluzinationen. Eine Vorschau-Version mit dem Namen Mythos soll noch ein Stück besser sein. Und bei OpenAI las ich, GPT-5.5 habe die Zahl der Halluzinationen um 52,5 Prozent gesenkt.
52,5 Prozent. Ich blieb an der Zahl hängen.
So schön präzise. Nicht „etwa die Hälfte“, nicht „spürbar weniger“. 52,5. Mit Komma. Und ich ertappte mich dabei, genau das zu tun, wovor dieser ganze Text warnt: einer runden, autoritären Zahl glauben, weil sie nach Messung klingt. Schaut man genauer hin, steckt dahinter ein Benchmark, eine Firmenangabe, kein in Stein gemeißeltes Naturgesetz. Die Modelle werden tatsächlich besser. Das stimmt. Aber „weniger“ ist nicht „nicht mehr“.
Das ist der eigentliche Witz an der Sache. Die Nachricht über weniger Halluzinationen kommt selbst in der Verpackung, die uns so leicht überzeugt. Eine Zahl mit Komma. Ein Name mit Versionsnummer. Wir lesen es, atmen auf, und genau dieses Aufatmen ist der Moment, in dem das Zögern leise verschwindet.
Vielleicht ist das die wichtigste Kompetenz gerade: nicht das Wissen, was stimmt, sondern das Gespür dafür, wann man besser noch einmal schaut. Bildung war schon immer weniger das Ansammeln von Antworten als das Trainieren dieser einen Fähigkeit. Die zweite Frage stellen. Das kurze Innehalten. Das Stirnrunzeln, das sagt: Moment mal.
Orte, an denen genau das geübt wird, gibt es noch. Man muss sie nur finden.
Quellen
Sam Altman, Zitat zu Höflichkeit gegenüber ChatGPT (April 2025): Tom’s Hardware.
Internationale Energieagentur (2025), Bericht „Energy and AI“: iea.org/reports/energy-and-ai.
IEA (2025), Daten zum Stromverbrauch von Rechenzentren und Prognosen: iea.org/news.
John Hennessy (Alphabet), Aussage zu den Energiekosten einer ChatGPT-Anfrage (2023), zitiert in: Reuters.
Nidhal Jegham et al. (Mai 2025), „How Hungry is AI? Benchmarking Energy, Water, and Carbon Footprint of LLM Inference“: arXiv:2505.09598.
Shaolei Ren, Pengfei Li et al. (2023), „Making AI Less Thirsty: Uncovering and Addressing the Secret Water Footprint of AI Models“: arXiv:2304.03271.
Google Sustainability Report 2025, Angaben zum Wasserverbrauch pro Gemini-Anfrage: aimagazine.com.
Morgan Stanley, Prognose zum Wasserverbrauch von KI-Rechenzentren bis 2028, zitiert in: Online Learning Consortium.
OECD.AI (2025), „How much water does AI consume?“: oecd.ai/en/wonk.













































