Es gibt Bücher, die den Zeitgeist bedienen. Und es gibt Bücher, die ihn korrigieren.
„Die KI-Effizienz-Lüge“ ist unser Versuch, genau das zu tun — in einer Phase, in der KI-Begeisterung und KI-Panik sich gegenseitig in der Lautstärke überbieten, was schon für sich genommen eine Herausforderung ist.

Denn das eigentlich Seltene an diesem Buch ist nicht die Kritik an künstlicher Intelligenz. Kritik gibt es reichlich. Das Seltene ist die Ebene, auf der diese Kritik stattfindet: nicht emotional, nicht ideologisch, nicht von der Art, die sich damit begnügt, auf Risiken hinzuweisen, ohne die strukturellen Mechanismen dahinter zu verstehen.
Wir rechnen nach. Konsequent. Ohne die Ergebnisse vorher festzulegen.
Und wer der Rechnung folgt, wird am Ende ein anderes Verhältnis zu den Effizienzversprechen haben, mit denen KI-Anbieter, Unternehmensberater und Technologiejournalisten derzeit um die Wette werfen.
Das Versprechen, das jeder kennt
Beginnen wir dort, wo wir auch im Buch beginnen: bei der alltäglichen Erfahrung.
Wer heute mit generativer KI arbeitet, erlebt eine echte Beschleunigung. Texte entstehen schneller. Recherchen, die früher Stunden kosteten, sind in Minuten erledigt. Code wird generiert, Präsentationen strukturiert, Protokolle zusammengefasst, E-Mails formuliert. Die Produktivität steigt messbar — zumindest an der Oberfläche.
Dieser Teil ist real. Er ist kein Marketingmythos.
Das Problem liegt nicht in der Beschleunigung selbst. Das Problem liegt darin, was hinter dieser Beschleunigung passiert — und was dabei zuverlässig aus der Kostenrechnung herausfällt.
Organisationen, die KI-Systeme einführen, messen typischerweise einen Parameter: die Zeit, die für die Erstellung eines Outputs benötigt wird. Ein Bericht, der früher vier Stunden dauerte, entsteht jetzt in zwanzig Minuten. Eine Analyse, die eine Woche in Anspruch nahm, liegt nach einem Nachmittag vor. Gemessen wird der Gewinn. Nicht gemessen wird alles andere.
Und dieses „alles andere“ ist der Kern unseres Buches.
Das Effizienz-Paradoxon: Wenn der Engpass wandert
Die zentrale These, die wir entwickeln, lässt sich als strukturelles Paradoxon beschreiben.
Generative KI beschleunigt die Erzeugung von Inhalten radikal. Was sich nicht im gleichen Maß beschleunigt, ist die Bewertung dieser Inhalte. Diese Bewertung — die kritische Prüfung, ob das Erzeugte inhaltlich korrekt, kontextuell angemessen, rechtlich belastbar und strategisch sinnvoll ist — bleibt an menschliche Urteilskraft gebunden.
Das klingt zunächst trivial. Es hat jedoch nicht-triviale Konsequenzen.
In traditionellen Arbeitsprozessen war die Erstellung von Inhalten der Engpass. Wer schneller schreiben, recherchieren oder analysieren konnte, hatte einen Vorteil. Mit KI entfällt dieser Engpass weitgehend. Der neue Engpass ist die Kapazität, Outputs zu überprüfen, einzuordnen und weiterzuverarbeiten.
Und dieser neue Engpass skaliert nicht.
Je mehr Output erzeugt wird, desto mehr Prüfkapazität wird benötigt. Aber Prüfkapazität ist an erfahrene Menschen gebunden — an Fachleute, die beurteilen können, ob das, was die KI produziert hat, stimmt. Diese Menschen sind nicht beliebig vermehrbar. Ihre Urteilskraft ist das Ergebnis von Berufserfahrung, die sich über Jahre aufgebaut hat. Sie lässt sich nicht automatisieren, ohne genau jene Qualität zu zerstören, die den Prüfprozess wertvoll macht.
Das Ergebnis: Organisationen, die KI einführen, ohne diese Verlagerung des Engpasses einzuplanen, erzeugen systematisch mehr Output, als sie seriös prüfen können. Was zunächst wie eine Effizienzsteigerung aussieht, ist in Wahrheit eine Risikoakkumulation — in Zeitlupe, unsichtbar, bis sie sich in konkreten Fehlern materialisiert.
Die plausible Illusion: Warum gut klingende Fehler teurer sind als offensichtliche
Zu den intellektuell unbequemsten Kapiteln unseres Buches gehört die Analyse dessen, was wir die „plausible Illusion“ nennen.
Generative Sprachmodelle sind, vereinfacht gesagt, sehr gut darin, sprachlich überzeugend zu klingen. Sie haben auf enormen Textmengen trainiert, die von Menschen als qualitativ hochwertig eingestuft wurden — was unter anderem bedeutet: souverän formuliert, strukturiert, kohärent, fachlich klingend.
Das Problem ist, dass sprachliche Souveränität und inhaltliche Korrektheit zwei verschiedene Dinge sind. Ein Sprachmodell kann eine falsche Aussage mit derselben rhetorischen Überzeugungskraft formulieren wie eine richtige. Es hat keine interne Instanz, die zwischen beidem unterscheidet — es optimiert auf sprachliche Plausibilität, nicht auf Wahrheit.
Für den Prüfprozess hat das gravierende Konsequenzen.
Ein offensichtlicher Fehler ist billig zu erkennen. Er fällt auf. Er stört den Lesefluss. Er löst automatisch kritisches Nachdenken aus. Ein plausibler Fehler hingegen — einer, der fachlich korrekt klingt, in den richtigen Kontext eingebettet ist und keine sprachlichen Stolpersteine aufweist — erfordert aktive fachliche Gegenlektüre. Er erfordert jemanden, der nicht nur den Text liest, sondern die Aussage inhaltlich überprüft, gegen externe Quellen abgleicht und aus eigenem Fachwissen heraus beurteilt, ob sie stimmt.
Das ist teuer. Und es wird teurer, je mehr Output erzeugt wird.
Hinzu kommt ein psychologischer Effekt, den die Kognitionsforschung als Automation Bias beschreibt: die Tendenz, automatisch erzeugten Ergebnissen stärker zu vertrauen als manuell erstellten. Dieser Effekt ist gut dokumentiert und tritt auch bei Menschen auf, die sich explizit vornehmen, kritisch zu bleiben. Er senkt die Prüftiefe systematisch — was bedeutet, dass plausible Fehler in KI-unterstützten Prozessen mit höherer Wahrscheinlichkeit durchrutschen als in rein manuellen Prozessen.
Die Ironie ist bemerkenswert: Je besser generative KI in der sprachlichen Qualität wird, desto teurer werden die Fehler, die sie macht — weil sie schwerer zu erkennen sind.
Die organisatorische Bleiweste
Ein zweiter zentraler Begriff unseres Buches verdient besondere Aufmerksamkeit: die organisatorische Bleiweste.
KI-Implementierungen werden in Organisationspräsentationen häufig als Projekte dargestellt. Man führt ein System ein, schult die Mitarbeitenden, passt Prozesse an — und dann ist es implementiert. Die Bleiweste beschreibt, was danach kommt.
Denn KI-Infrastruktur ist kein statisches System. Sie verändert sich kontinuierlich: Anbieter aktualisieren Modelle, was bedeutet, dass ein Prompt, der heute zuverlässig funktioniert, nach dem nächsten Modell-Update anders reagiert. Kontexte ändern sich, was bedeutet, dass einmal definierte Ausgabeformate regelmäßig überprüft und angepasst werden müssen. Fehlerquellen tauchen auf, die beim ersten Einsatz nicht sichtbar waren. Datenschutz- und Compliance-Anforderungen entwickeln sich weiter.
Das alles erzeugt eine technische Dauerlast, die in der initialen Kosten-Nutzen-Rechnung systematisch unterschätzt wird.
Dazu kommt die Integrationssteuer: der Aufwand, der entsteht, weil KI-generierter Output in bestehende Prozesse eingebettet werden muss. Fachbereiche müssen abgestimmt werden. Rechtliche Abteilungen müssen Output freigeben. IT-Systeme müssen angebunden werden. Jeder dieser Abstimmungsprozesse kostet Zeit — und dieser Aufwand wächst nicht linear mit dem Volumen des erzeugten Outputs, sondern überproportional, weil mehr Output mehr Schnittstellen aktiviert.
Ab Dezember 2026 kommt ein weiterer Faktor hinzu, den wir im Buch explizit adressieren: die regulatorische Unterkante durch EU AI Act und die neue Produkthaftungsrichtlinie. Organisationen, die KI-Output in Produkte, Dienstleistungen oder Entscheidungen einfließen lassen, werden nachweisen müssen, dass sie Sorgfaltspflichten eingehalten haben. Das bedeutet: Dokumentation, Audit-Trails, überprüfbare Prüfprozesse.
Wer diese Anforderungen heute nicht in seine Prozessarchitektur einbaut, baut morgen nach — unter erheblichem Zeitdruck und mit entsprechenden Kosten.
Die Bleiweste ist nicht metaphorisch. Sie ist eine reale organisatorische Last, die auf jeder KI-Implementierung liegt — unabhängig davon, ob sie in der Planung berücksichtigt wurde oder nicht. Der Unterschied liegt lediglich darin, ob man sie kennt und managt, oder ob man von ihr überrascht wird.
Der Senioritäts-Engpass: Das leiseste Risiko
Eines der Kapitel, das im ersten Durchgang am unscheinbarsten wirkt und im Rückblick am nachhaltigsten beschäftigt, behandelt den Senioritäts-Engpass.
Die Logik der meisten KI-Implementierungen folgt einem impliziten Modell: Einfachere, repetitivere Aufgaben werden an KI delegiert. Komplexe, urteilsintensive Aufgaben bleiben bei Menschen. Das klingt sinnvoll — und ist es in gewissem Maß auch.
Das Problem liegt im Lernpfad.
Expertise entsteht nicht dadurch, dass man von Anfang an komplexe Aufgaben löst. Sie entsteht dadurch, dass man einfache Aufgaben in großer Zahl löst, dabei Muster erkennt, Fehler macht, diese korrigiert, und über diesen Prozess ein belastbares Fundament aufbaut, auf dem komplexere Urteilskraft später entstehen kann.
Wenn einfache Aufgaben vollständig an KI delegiert werden, entfallen diese Lernpfade. Junioren werden zunehmend zu Reviewern von KI-Output — einer Tätigkeit, die ein grundlegend anderes Kompetenzprofil erfordert als das eigenständige Erstellen von Inhalten. Sie üben nicht mehr das Handwerk. Sie prüfen das Ergebnis eines Werkzeugs.
Das mag kurzfristig effizient erscheinen. Mittelfristig bedeutet es, dass die nächste Generation von Seniors nicht mehr den Erfahrungshintergrund mitbringt, der notwendig wäre, um KI-Output seriös zu beurteilen — weil sie nie die Fehler gemacht hat, die dieses Urteilsvermögen aufgebaut hätten.
Hinzu kommt, was wir als Creativity Decay beschreiben: die schleichende Erosion schöpferischer Eigenleistung. Wer kontinuierlich KI-Output überarbeitet statt eigene Lösungen zu entwickeln, verliert über Zeit die Praxis des eigenständigen Denkens in bestimmten Domänen. Nicht dramatisch. Nicht plötzlich. Sondern so allmählich, dass es lange unsichtbar bleibt — bis eine Situation entsteht, in der KI nicht verfügbar oder nicht geeignet ist, und die eigene Kompetenz fehlt, die Lücke zu füllen.
Skill Decay und Creativity Decay sind keine futuristischen Szenarien. Sie sind beschreibbare, messbare organisatorische Risiken, die in realen Kompetenzlücken enden — typischerweise genau dann, wenn sie am teuersten sind.
Die ehrliche Nettonutzen-Gleichung
An diesem Punkt tun wir etwas, das in der KI-Debatte selten ist: Wir rechnen.
Die Nettonutzen-Gleichung, die wir entwickeln, ist konzeptionell einfach und operativ unbequem. Sie lautet sinngemäß: Der tatsächliche Nutzen einer KI-Implementierung ergibt sich aus dem Zeitgewinn durch beschleunigte Erzeugung — abzüglich aller tatsächlichen Zusatzaufwände.
Diese Zusatzaufwände umfassen: den Vorbereitungsaufwand für Prompts, Kontexte und Systeminstruktionen; den Kontrollaufwand für die Prüfung des erzeugten Outputs; den Integrationsaufwand für die Abstimmung zwischen Abteilungen, Systemen und Prozessen; den Korrekturaufwand für Fehler, die den Prüfprozess passiert haben; die Opportunitätskosten der gebundenen Seniorkapazitäten im Review-Prozess; und die Fehlerfolgekosten, die entstehen, wenn fehlerhafter Output in Entscheidungen, Produkte oder Kommunikation eingeflossen ist.
Wer diese Gleichung vollständig aufstellt, kommt zu einem ernüchternden Befund: In vielen aktuellen KI-Implementierungen ist die Differenz deutlich kleiner als erwartet — manchmal negativ, in Fällen mit hoher Compliance-Relevanz oder komplexer Integration häufig erheblich negativ.
Das bedeutet nicht, dass KI grundsätzlich unrentabel ist. Es bedeutet, dass Rentabilität von Faktoren abhängt, die im Implementierungsenthusiasmus systematisch übersehen werden: von der Komplexität des Anwendungsfalls, von der verfügbaren Prüfkapazität, von der Fehlertoleranz des Kontexts, von der regulatorischen Belastung, von der Stabilität der Modell-Updates und von der organisatorischen Bereitschaft, die Bleiweste zu tragen.
Rentabilität ist keine Eigenschaft von KI. Sie ist eine Eigenschaft des Zusammenspiels zwischen KI und Organisation — und dieses Zusammenspiel muss ehrlich analysiert werden, bevor Investitionsentscheidungen getroffen werden.
Der 5-Phasen-Blueprint: Souveränität als Methode
Für alle, die nach der kritischen Analyse eine konstruktive Handlungsperspektive suchen, entwickeln wir im Buch einen strukturierten Ansatz: den 5-Phasen-Blueprint für eine souveräne KI-Steuerung.
Die erste Phase beginnt nicht mit Technologie, sondern mit Messung. Bevor eine Organisation entscheidet, wo KI eingesetzt werden soll, muss sie verstehen, wie ihre Prozesse tatsächlich funktionieren — einschließlich der unsichtbaren Arbeit, die in keiner offiziellen Prozessdokumentation auftaucht: informelle Abstimmungen, implizite Qualitätsprüfungen, Wissenstransfer zwischen Personen, kompensatorische Tätigkeiten, die existierende Systemschwächen ausgleichen. Diese unsichtbare Arbeit ist häufig genau jener Teil, der durch KI-Implementierungen zuerst wegfällt — und dann als unerwarteter Mehraufwand woanders auftaucht.
Die zweite Phase ist Risikobewertung. Wir entwickeln hierfür das Konzept der KI-FMEA — eine Fehler-Möglichkeits- und Einfluss-Analyse, adaptiert für KI-Kontexte. Sie fragt: Wo entstehen Fehler? Wie wahrscheinlich sind sie? Wie gravierend sind die Folgekosten? Und wie erkennbar sind sie, bevor sie Schaden anrichten? Diese Analyse definiert, welche Anwendungsfälle für KI geeignet sind — und welche nicht.
Die dritte Phase ist der Aufbau einer Prüfarchitektur. Wir unterscheiden drei Prüfebenen: die formale Ebene, die prüft, ob Output den formalen Anforderungen entspricht; die systemische Ebene, die prüft, ob Output intern konsistent ist und keine logischen Widersprüche enthält; und die kontextuelle Ebene, die prüft, ob Output im Lichte des spezifischen fachlichen und organisatorischen Kontexts korrekt und angemessen ist. Nur die letzte Ebene erfordert echte Fachexpertise — und nur diese Ebene lässt sich nicht automatisieren.
Die vierte Phase koppelt den KI-Output konsequent an verfügbare Review-Kapazitäten. Das klingt trivial, ist es aber nicht. Es bedeutet: Wenn die Prüfkapazität nicht wächst, darf der KI-Output nicht wachsen. Eine Organisation, die mehr produziert als sie prüfen kann, akkumuliert Risiken — unabhängig davon, wie gut die einzelnen Outputs im Durchschnitt sind.
Die fünfte Phase schützt aktiv die Kompetenz der Menschen im System. Das umfasst KI-freie Kontrollräume — definierte Bereiche oder Aufgaben, in denen bewusst ohne KI-Unterstützung gearbeitet wird, um Lernpfade offen zu halten und Urteilskraft zu erhalten. Es umfasst Mentoring-Strukturen, die sicherstellen, dass Seniorwissen nicht verloren geht. Und es umfasst eine Unternehmenskultur, die kritisches Hinterfragen von KI-Output explizit wertschätzt statt implizit sanktioniert.
Die strategische Null-Option
Der vielleicht wichtigste Begriff unseres gesamten Buches ist der, der am wenigsten nach technologischer Avantgarde klingt: die strategische Null-Option.
Gemeint ist damit die bewusste, methodisch begründete Entscheidung, KI in bestimmten Kontexten nicht einzusetzen.
Das mag banal klingen. In der gegenwärtigen Unternehmenskultur ist es es nicht. In einer Phase, in der KI-Einsatz von vielen Organisationen als Signal für Innovation und Zukunftsorientierung interpretiert wird, erfordert der begründete Verzicht eine Klarheit über den eigenen Wertschöpfungsprozess, die nicht selbstverständlich ist.
Die Null-Option ist nicht das Gegenteil von Digitalkompetenz. Sie ist ihr Ausdruck. Eine Organisation, die weiß, wann KI nicht sinnvoll ist, versteht KI besser als eine Organisation, die KI überall einsetzt, weil es sich modern anfühlt.
Souveränität bedeutet, die Entscheidung zu treffen — nicht, sie dem Werkzeug zu überlassen.
Gesellschaftliche Resonanz: Warum dieses Buch über Organisationen hinausweist
Was „Die KI-Effizienz-Lüge“ von einem reinen Managementbuch unterscheidet, ist seine gesellschaftliche Einbettung — und das war uns von Anfang an wichtig.
Wir beschreiben das Effizienz-Paradoxon nicht nur als betriebswirtschaftliches Problem, sondern als Symptom einer größeren strukturellen Spannung: der Diskrepanz zwischen technologischer Beschleunigung und gesellschaftlicher Verarbeitungskapazität.
Technologie entwickelt sich exponentiell. Gesellschaftliche Strukturen — Organisationen, Institutionen, Regulierungen, Bildungssysteme — entwickeln sich linear. Diese Diskrepanz erzeugt Reibung. Und je größer sie wird, desto mehr Energie wird verbraucht, um sie zu überbrücken — Energie, die an anderer Stelle fehlt.
Gleichzeitig macht KI etwas sichtbar, was vorher unsichtbar war: die tatsächliche Effizienz — oder Ineffizienz — bestehender Systeme. Prozesse, die jahrzehntelang als „normal“ galten, werden plötzlich vergleichbar. Entscheidungswege, die nie hinterfragt wurden, erscheinen in einem anderen Licht, wenn ein Algorithmus dieselbe Aufgabe in Sekunden erledigt.
Das erzeugt institutionellen Stress. Nicht weil die Maschinen besser sind — sondern weil ihre Geschwindigkeit zeigt, wie viel gesellschaftlicher Aufwand in Wahrheit organisierte Ineffizienz ist.
In diesem Sinne ist unser Buch auch eine Zustandsbeschreibung: der Versuch, einen historischen Moment zu erfassen, in dem die Werkzeuge ihrer Umgebung entwachsen sind — und in dem die Frage, was mit diesem Missverhältnis gemacht wird, noch offen ist.
Für wen wir dieses Buch geschrieben haben
Eine letzte Frage, die sich stellt: An wen richtet sich dieses Werk?
Die oberflächliche Antwort lautet: an Entscheider in Organisationen, die KI einsetzen oder einsetzen wollen. Das stimmt — aber es greift zu kurz.
Wir haben dieses Buch für alle geschrieben, die KI-Systeme nicht nur nutzen, sondern verstehen wollen. Für Menschen, die das Unbehagen hinter dem Effizienz-Versprechen schon gespürt haben, ohne es bisher präzise benennen zu können. Für Fachleute, die den Automation Bias in ihrer täglichen Arbeit beobachten und wissen, dass etwas nicht stimmt, aber keinen konzeptuellen Rahmen haben, um es zu artikulieren. Für Führungskräfte, die Governance-Strukturen aufbauen müssen und mehr brauchen als allgemeine Risikohinweise. Für alle, die in der Lage sein wollen, KI-Entscheidungen zu treffen, die nicht auf halbfertigen Rechnungen beruhen.
Kurz: für alle, die sich nicht damit abfinden wollen, dass die Komplexität einer Technologie als Ausrede dient, um ihre tatsächlichen Kosten nicht zu analysieren.
Eine abschließende Beobachtung
Bücher über KI gibt es viele. Bücher, die KI euphorisch feiern, gibt es noch mehr. Bücher, die KI pauschal ablehnen, gibt es ebenfalls in ausreichender Zahl.
„Die KI-Effizienz-Lüge“ macht etwas anderes. Wir nehmen die Technologie ernst genug, um sie kritisch zu analysieren. Wir respektieren unsere Leserinnen und Leser genug, um ihnen eine vollständige Rechnung vorzulegen statt einer bequemen.
Und wir stellen am Ende eine Forderung, die so simpel ist, dass sie in der gegenwärtigen Debatte fast radikal wirkt: Entscheidet nicht auf der Grundlage von Halbwahrheiten. Messt vollständig. Rechnet ehrlich. Und behaltet die Souveränität über eure eigenen Werkzeuge.
Das ist keine Ablehnung von KI.
Es ist die Voraussetzung dafür, sie sinnvoll zu nutzen.
Die Artikelreihe rund um KI-Effizienz, aus der dieses Buch entstanden ist, findet sich unter: https://42thinking.de/?s=KI-Effizienz
