Führungsentscheidungen zur Implementierung von KI-Tools basieren oft auf Geschwindigkeit, Machbarkeit oder ROI. Aber das sind nicht die richtigen Ausgangspunkte. Wichtig ist zuerst Verantwortung, Verantwortlichkeit und die Verantwortung für das Vertrauen, das die Menschen in uns setzen. KI sollte nicht die Standardlösung für jedes Problem sein. Die Anwendung ohne Verständnis der zugrunde liegenden Implikationen kann mehr Risiko als Wert einführen, besonders wenn KI-generierte Ergebnisse reale Konsequenzen für die Zukunft der Menschen haben. In diesen Kontexten geht es bei Führung nicht darum, KI abzulehnen, noch darum, ohne Zögern Ja zu sagen. Es geht darum, ein klares, kontrolliertes Ja zu definieren, das im großen Maßstab Bestand haben kann.
Der Vertrauenstest
Der Druck auf jeden Führungskraft besteht derzeit darin, schnell zu handeln. Schick das Modell. Starte den Agenten. Personalisiere alles. Aber die Öffentlichkeit schenkt der Aufmerksamkeit und steht nicht auf der Seite der Geschwindigkeit, egal zu welchem Preis. Eine Studie von KPMG und der Universität Melbourne aus dem Jahr 2025, die mehr als 48.000 Menschen in 47 Ländern befragte, ergab, dass der KI-Einsatz zwar steigt, Vertrauen aber das zentrale Problem ist und die Öffentlichkeit stärkere Regierungsführung wünscht. Eine YouGov-Umfrage vom Dezember 2025 brachte es deutlicher auf den Punkt: 68 % der Amerikaner sagen, sie würden ein KI-System nicht ohne spezifische menschliche Zustimmung handeln lassen.
Und in der Bildungsbewertung, in der ETS stattfindet, kann eine einzige Punktzahl bei einem Test mit hohen Einsätzen die gesamte Karriere eines Lernenden prägen. In unserem Bereich werden die Kosten, KI falsch zu machen, nicht in Nutzerbeschwerden gemessen, sondern in verpassten Chancen.
Es wäre leicht zu schließen, dass der richtige Schritt darin besteht, langsamer zu machen, dass Führung in diesem Moment darin besteht, KI-getriebene Innovation abzulehnen. Ich bin anderer Meinung. Unsere Aufgabe als Führungskräfte ist es, zu definieren, wo KI einen Mehrwert schafft, die Bedingungen für ihren verantwortungsvollen Einsatz zu schaffen und schneller und selbstbewusst voranzugehen, nicht auf Kosten des Vertrauens.
Wie KI-Führung in der Praxis aussieht
Bei ETS kommt unser Selbstvertrauen, KI zuzustimmen, von den Leitplanken, die wir um sie herum errichtet haben. Wir nutzen seit den frühen 2000er Jahren KI und natürliche Sprachverarbeitung, beginnend mit Anwendungen wie der Bewertung von Aufsätzen und gesprochenen Antworten. Bis zum Jahresende werden fast 90 % der Testaufgaben von unserer internen KI-Engine generiert. Doch jeder dieser Gegenstände hat einen menschlichen Kontrollpunkt, den wir niemals entfernen werden. Und wenn sich ein KI-Wert und ein menschlicher Wert sinnvoll voneinander entfernen, gewinnt der Mensch und treibt weitere Überprüfungen und Verbesserungen der Modelle für die Zukunft voran.
Bevor eine Testfrage den Lernenden erreicht, durchläuft sie eine Überprüfung der Fairness und Barrierefreiheit. Nach der Lieferung führen wir ein psychometrisches Programmaudit für jedes wichtige Produkt durch, um systematische Unterschiede zwischen Untergruppen zu erkennen. Wir verwenden ein Ensemble von KI-Modellen, nicht das Tool eines einzelnen Anbieters, damit keine blinden Flecken eines einzelnen Systems zu unseren werden. Und wir behandeln unsere proprietären, international vielfältigen Daten, einschließlich TOEFL-Sprachproben von Testteilnehmern weltweit, als Kontrolle gegen die Engstirnigkeit von Standardmodellen.
ETS hat buchstäblich das Buch über faire Bewertungsstandards geschrieben, und das Aufkommen von KI senkt die Messlatte nicht. Das erhöht sie deutlich. Während wir früher alle drei Jahre ein großes Programm auditierten, überprüfen wir jetzt häufiger, wenn KI im Loop ist. Früher gingen wir davon aus, dass ausgebildete menschliche Gutachter unsere Standards korrekt anwenden, bauen wir jetzt explizite Kontrollen in die Mitte des Prozesses ein und nicht nur am Ende. In einigen Bereichen schreiben wir komplett neue Normen, weil die von KI aufgeworfenen Fragen noch vor einem Jahrzehnt noch nicht existierten.
Ein Vorteil der Arbeit in einem Unternehmen mit tiefgreifender Fachkompetenz ist, dass wir diese von Anfang an einsetzen. Seit Jahrzehnten müssen wir unsere Arbeit streng auf Voreingenommenheit, Urheberrecht, Fairness, sachliche Genauigkeit und mehr überprüfen. Unsere KI-Fähigkeit bei ETS basiert auf 77 Jahren Erfahrung und verifiziertem geistigem Eigentum. In Kombination mit KI-Modellen treibt diese Grundlage unsere neuen Angebote an und stärkt das Vertrauen, das wir mit den Kunden teilen.
Die bevorstehende Herausforderung
Grundsätzlich ist das größte Missverständnis über KI im Geschäftsleben derzeit, dass das Ziel darin besteht, Menschen zu ersetzen. Es sollte wirklich darum gehen, Menschen zu ergänzen und ihnen zu helfen, mehr zu tun. Die eigentliche Chance besteht darin, neuen Wert zu schaffen, Menschen freizumachen, um schwierigere Probleme zu lösen, und das Vertrauen zu gewinnen, um im Laufe der Zeit mehr zu tun. Dieser Weg ist langsamer, und es ist der einzige, der den Kontakt mit der Realität überlebt.
Das ist die Arbeit. Je leistungsfähiger KI-Modelle werden, desto wichtiger ist es, sie mit der Disziplin, Messwissenschaft und menschlichem Urteilsvermögen anzuwenden, die in hochriskanten Umgebungen erforderlich sind. Wenn stärkere Modelle mit stärkeren Standards für Fairness, Validität und Konsistenz kombiniert werden, tun wir mehr als nur schneller. Wir erweitern das Mögliche, vertiefen das Vertrauen in die Systeme, auf die Menschen angewiesen sind, und steigern exponentiell die positive Wirkung unserer Mission weltweit.