Zum Hauptinhalt wechseln
Skip to footer

TOEFL-FORSCHUNG

Bewertung der englischen Sprachqualifikationen: Wie TOEFL iBT® den wichtigsten englischen Bewertungsstandards entspricht

18. Mai 2026

Validität durch Design

Im Vereinigten Königreich sind BUILA (die British Universities' International Liaison Association) und BALEAP (die British Association of Lecturers in English for Academic Purpose) zwei Berufsverbände, die bei Fragen der internationalen Studierendenwerbung und der Verwendung von Englisch in akademischen Kontexten zusammenarbeiten.

Kürzlich haben sich BUILA, das die internationalen Büros britischer Universitäten vertritt, und BALEAP, eine Gruppe zur Unterstützung von Lehrkräften und Forschern, zusammengeschlossen, um eine Reihe von Empfehlungen zur Messung der Wirksamkeit eines Tests im akademischen Englisch anzubieten.

Diese Veröffentlichung, English Language Good Practices Guide: Testing Qualifications and English for Academic Purposes in Higher Education, bietet praktische Anleitungen für Universitäten, die sicherstellen möchten, dass internationale Studierende ausreichende akademische Englischkenntnisse besitzen, um in modernen Klassenzimmern erfolgreich zu sein.

Abschnitt 1 des Leitfadens "Bewertung der Englischsprache-Qualifikationen" wirft einige wichtige Fragen zur Gesamtqualität der Tests auf, die Hochschulen vor der Annahme eines Englischtests berücksichtigen sollten. In diesem Artikel zeigen wir, wie TOEFL iBT jede Schlüsselfrage beantwortet, die durch diese wertvolle BUILA-BALEAP-Richtlinie aufgeworfen wird.

Spiegelt der Test- oder Qualifikationsinhalt die sprachlichen und kommunikativen Anforderungen akademischer oder beruflicher Kontexte wider, statt allgemeines oder alltägliches Englisch?

TOEFL iBT greift auf mehr als sechs Jahrzehnte Forschung zur Englischbewertung zurück, um die Kernkommunikationsfähigkeiten zu messen, die Schüler in den heutigen akademischen Umgebungen einsetzen müssen. Beispiele dafür, wie der Inhalt von TOEFL die sprachlichen und kommunikativen Anforderungen moderner akademischer und beruflicher Kontexte widerspiegelt, sind: 

  • Lesen von Texten, die in akademischen Kontexten relevant sind, wie Lehrbücher, Zeitungen und Zeitschriften
  • Eine Auswahl von Website-Artikeln und Social-Media-Beiträgen, die einen relevanten Rahmen bieten, um das Verständnis von implizierten Bedeutungen, Meinungen und anderen pragmatischen Aspekten der Kommunikation zu testen, die in heutigen Klassenzimmern von großer Bedeutung sind
  • Akademische Vorträge und Vorträge (monologischer Input) sowie Gruppeninteraktionen (dialogischer Input), die in dynamischen Klassenzimmerumgebungen und erfahrungsbasierten Lernumgebungen relevant sind
  • Schriftliche Antworten auf häufige Situationen wie das Schreiben einer E-Mail an einen Professor oder Kollegen sowie das Schreiben für eine akademische Online-Diskussion (wobei die Synthese von Beiträgen sowohl von Professor als auch von Kommilitonen erforderlich ist)
  • Ein Interview mit einem simulierten Gesprächspartner – im Kontext einer akademischen Interaktion
Sind die Aufgaben repräsentativ für die reale akademische oder berufliche Kommunikation, der die Studierenden begegnen werden?

Jede einzelne Aufgabe im TOEFL iBT arbeitet mit den anderen Aufgaben in jedem Abschnitt zusammen, um eine Vielzahl relevanter Fähigkeiten zu adressieren, sodass wir in jedem Testabschnitt eine präzise und nützliche Messung der Lese-, Hör-, Schreib- und Sprechfähigkeiten erhalten können.

Unabhängige Forschung hat gezeigt, um ein Beispiel zu nennen, dass die Sprechaufgaben auf TOEFL iBT sehr gute Leistungsindikatoren bei typischen akademischen Sprechformen sind. Dies bleibt natürlich das Kernziel einer hochrisikoreichen Englischprüfung wie TOEFL.

Ein weiteres Beispiel für diesen ganzheitlichen Messansatz: In unserem Abschnitt "Zuhören" erfüllen verschiedene Aufgabentypen unterschiedliche Aufgaben und weisen unterschiedliche Arten (und Längen) von Eingaben auf. Diese Aufgaben ermöglichen die Messung vieler Fähigkeiten (z. B. Fähigkeit, implizite Bedeutungen zu verstehen), Kontexte (z. B. berufliche und akademische Interaktion) und Genres (z. B. Gespräche; Vorträge).

Ein genauerer Blick auf einzelne Aufgabentypen zeigt jedoch auch ihre repräsentative akademische Kommunikation, die Schüler in realen Umgebungen begegnen werden. Weitere Beispiele werden unten genannt.

  • Im Abschnitt "Lesen" gibt "Lies einen akademischen Text" Einblick in die Fähigkeit eines Schülers, Informationen zu gewinnen und die Bedeutung komplexer Texte zu verstehen, wie es im akademischen Studium üblicherweise erwartet wird.
  • Im Schreibabschnitt "Write for an Academic Discussion", der im Kontext einer von einem Dozenten angeregten Kursdiskussion stattfindet, wird der Schüler gebeten, seine eigenen Ansichten zu äußern, unterstützt durch relevante Begründungen, Wissen oder Erfahrung. Von den Studierenden wird außerdem erwartet, auf die Beiträge von Kommilitonen zu reagieren.
  • Take an Interview, eine der beiden Sprechaufgaben, fordert die Schüler auf, an einem simulierten Gespräch mit einem vorab aufgezeichneten Interviewer teilzunehmen. Das Interview findet in verschiedenen akademischen Situationen statt, etwa bei der Teilnahme an einer Forschungsstudie. Die ersten Fragen konzentrieren sich auf Fakten und persönliche Erfahrungen; Spätere Fragen bitten die Schüler, Meinungen zu umfassenderen Themen zu äußern und zu unterstützen.
  • Im Abschnitt Zuhören misst unsere Aufgabe Academic Talk die Fähigkeit eines Schülers, eine monologische Vorlesung zu verstehen. Diese Aufgabe wird zusammen mit Aufgaben wie Gespräch hören eingesetzt, um die Fähigkeit eines Schülers zu messen, in modernen Klassenzimmerumgebungen erfolgreich zu sein, in denen die aktive Teilnahme an Gruppendiskussionen oft genauso wichtig ist wie das Einseitige Zuhören in einem Hörsaal.
Gibt es eine ausreichende Bandbreite an kognitiven Prozessen über die Aufgaben hinweg, nicht nur oberflächliches Verständnis oder Erinnern? Und erfordern die Aufgaben die Arten kognitiver Operationen (z. B. Analyse, Synthese, kritisches Denken), wie sie in britischen akademischen Umgebungen erwartet werden?

Die Einbindung einer breiten Palette kognitiver Prozesse – nicht nur oberflächliches Verständnis oder Erinnern – bleibt im Zentrum des TOEFL-Designs. Die Aufgaben von TOEFL iBT testen auch kognitive Operationen wie Analyse, Synthese und kritisches Denken, die in anspruchsvollen akademischen Umgebungen – weltweit und im Vereinigten Königreich – erwartet werden.

Zu Beginn beschäftigen die Schreibaufgaben im heutigen TOEFL eine Vielzahl kognitiver Prozesse, darunter Mikroplanung, Makroplanung, Überwachung und Informationssynthese.

Die Leseaufgaben von TOEFL messen kognitive Prozesse wie das Verständnis akademischer Vokabeln, das Einbinden von Textinformationen über Sätze hinweg, das Erschließen der in einem Text angedeuteten Situationen, das Verständnis der Standpunkte des Autors und das Erleiten der Bedeutung der bildlichen Sprache.

TOEFL Das Zuhören prüft die Fähigkeit eines Schülers, Hauptideen und unterstützende Details zu erkennen, Zusammenhänge zwischen Ideen abzuleiten, Schlussfolgerungen zu ziehen, den Zweck und die Einstellung eines Sprechers zu verstehen sowie erweiterte Sprach- und Organisationstechniken zu verarbeiten. Die Schüler müssen außerdem phonologische Informationen, lexikalische und grammatikalische Bedeutung sowie pragmatische Informationen nutzen.

Und TOEFL Sprechen misst die Fähigkeit, gesprochene Sprache schnell zu verarbeiten und zu produzieren, eine gesprochene Antwort zu planen und zu organisieren, eine Meinung zu bewerten und zu bilden sowie ein strukturiertes Argument zu erstellen. Es erfordert auch metakognitive Strategien (wie das Überwachen der Aussprache beim Sprechen) und Diskursmanagement (Steuerung von Tempo und Intonation; Nutzung von Übergängen).

Bewertet der Test alle vier Fähigkeiten (Hören, Sprechen, Lesen, Schreiben) entweder als separate Komponenten oder in integrierten Aufgaben?

Ja, der Test bewertet die vier Sprachfähigkeiten Lesen, Hören, Schreiben und Sprechen als separate Komponenten. Gleichzeitig erfordern die Testaufgaben von den Prüflingen, mehrere englischsprachige Fähigkeiten wie Hören oder Lesen zu kombinieren, um mündliche oder schriftliche Antworten auf Testfragen effektiv zu liefern. 

Eine solche Integration über Sprachkenntnisse hinweg macht diese Testaufgaben zu wichtigen Werkzeugen, um die Englischkenntnisse der Testteilnehmer zu messen.

Gibt es unabhängige, transparente Belege dafür, dass der Test oder die Qualifikation die Sprachkompetenz auf CEFR B2-Niveau oder höher zuverlässig bewertet?

Von der Entwicklung von Aufgaben und Aufgaben bis hin zur Entwicklung und Bewertung von Punkten ist der TOEFL iBT-Test eng auf jedes der CEFR-Stufen abgestimmt. Erstens sind die CEFR-Niveaus integraler Bestandteil der gezielten Entwicklung und Ausrichtung der Aufgaben als Beweis für die Behauptungen und Machbarkeitserklärungen, wie sie in den Testspezifikationen formuliert sind.

Die Entwicklung der Banded-Score-Skala (1-6) spiegelt ebenfalls jedes der sechs CEFR-Stufen (A1-C2) wider. Die Skala hat den zusätzlichen Vorteil der Konsistenz und Leichtigkeit der Interpretation, da die gleichen Ergebnisse über die vier Testabschnitte verteilt werden sowie die Gesamtpunktzahl (die der gerundete Durchschnitt der Abschnittswerte ist). Zum Beispiel entspricht eine Punktzahl von 4 dem CEFR-Level B2 für Lesen, Hören, Schreiben, Sprechen sowie der Gesamtpunktzahl.

Die Skalierungsentwicklung war vielschichtig und umfasste Kartierungsmethoden, darunter vertikale Verlinkung, Inhaltsbewertung und Ausrichtung zwischen Aufgaben und CEFR-Deskriptoren sowie Standardsetzung. Da die Aufgabentypen und die Anzahl der verfügbaren Aufgaben in jedem Testabschnitt variieren, variierte auch die Methodik zur Zuordnung der Testergebnisse auf die CEFR-Stufen bei Testabschnitten, die rezeptive Sprachfähigkeiten bewerten, und Testabschnitten, die produktive Sprachfähigkeiten bewerten.

Diese Methoden werden in einer Forschungsarbeit beschrieben, die weiter dokumentiert, wie der TOEFL iBT-Test die mit der Englischkompetenz verbundenen Fähigkeiten in den CEFR-Niveaus von A1 bis C2 widerspiegelt. Unabhängige Forschungen zur Unterstützung dieser Bemühungen für die neueste Ausgabe des TOEFL iBT sind geplant und werden von operativen Daten als Verifikationsnachweis profitieren.

Facebook Twitter LinkedIn
URL auf die Zwischenablage kopieren

Verwandte Themen

toefl speaking research
TOEFL Research
Connecting TOEFL Speaking to Speaking at University

Learn how the TOEFL iBT® Speaking tasks, Listen & Repeat and Take an Interview, serve as strong indicators of how well students perform on actual academic speaking tasks.

May 10, 2026
Validity by design
TOEFL Research
Inside the TOEFL iBT Updates: Validity by Design

The TOEFL iBT team discusses the design principles underpinning the latest updates to the globally recognized English exam.

April 23, 2026
The “Forgotten” English Skill: A Deep Dive on Listening With Spiros Papageorgiou
TOEFL Research
The “Forgotten” English Skill: A Deep Dive on Listening With Spiros Papageorgiou

Spiros Papageorgiou shares how TOEFL balances the need to create authentic Listening tasks while adhering to key measurement principles.

April 6, 2026
Building a Fair Measure of English Writing Skills: A Conversation With Larry Davis
TOEFL Research
Building a Fair Measure of English Writing Skills: A Conversation With Larry Davis

Larry Davis offers insights into how TOEFL has refined its measurement of English writing skills.

March 30, 2026