skip to main content skip to footer

 

ETS-Nachrichten & Einblicke

 

Man looking at computer

Die psychometrische Grundlage des TOEFL-Essentials-Tests®

 

8. Dezember 2021

Der TOEFL® Essentials-Test™ wurde entwickelt, um valide und zuverlässige Informationen über die Englischkenntnisse eines Testteilnehmers zu liefern, mit einem Design, das auf sein Kompetenzniveau zugeschnitten ist, mit einem freundlichen und ansprechenden Format, das eine kurze Testzeit erfordert. Die psychometrische Grundlage und der Ansatz, der zur Messung der Englischkompetenz der Testteilnehmer verwendet wird, sind entscheidend, um eine genaue Messung der Englischkenntnisse eines Testteilnehmers sicherzustellen. Eine umfassendere Diskussion der Psychometrie, die dem TOEFL Essentials-Test zugrunde liegt, findet sich im Design Framework für den TOEFL® Essentials Test 2021.

Verwendung eines mehrstufigen adaptiven Messansatzes

Um eine hochwertige, präzise und effiziente Messung über ein breites Spektrum von Sprachkompetenzniveaus hinweg zu ermöglichen, sind die Abschnitte Hören, Lesen und Schreiben des TOEFL Essentials-Tests als mehrstufige adaptive Tests (MSTs) konzipiert. Das heißt, jeder Test besteht aus zwei Teilen (Stufen), wobei die Leistung des ersten Teils an die Aufgaben des zweiten teils angepasst ist.  Ein wesentlicher Vorteil des MST-Ansatzes ist, dass er eine gezielte Zusammenstellung von Testinhalten ermöglicht, kombiniert mit rigoroser psychometrischer und fachkundiger Überprüfung aller Abschnitte durch Experten vor der Abwicklung. Darüber hinaus erleichtert dieser Ansatz die effiziente Integration des aufgabenbasierten Designs, wie es in allen Tests der TOEFL-Bewertungsfamilie® zu finden ist, wobei die Testaufgaben die Testteilnehmer widerspiegeln, die bei der Verwendung von Englisch in akademischen und alltäglichen Kontexten wahrscheinlich begegnen.

MSTs Anwendung im TOEFL Essentials-Test

Der MST für jeden Abschnitt des TOEFL Essentials-Tests, mit Ausnahme des Sprechen-Teils, besteht aus zwei Teilen. Der erste Teil oder die Phase, die den Testteilnehmern vorgelegt wird, besteht aus Aufgaben, die als durchschnittlich schwierig gelten, während der zweite Teil Aufgaben enthält, die auf einem Schwierigkeitsgrad sind, der sich entsprechend der Leistung des ersten Teils "anpasst". Wenn ein Testteilnehmer beispielsweise im ersten Teil des Listening-Abschnitts sehr gut abschneidet, ist der zweite Teil des Listening-Abschnitts, der dem Testteilnehmern vorgelegt wird, auf einem höheren Schwierigkeitsgrad.

Der Inhalt der zweiten Stufe der Hör- und Leseabschnitte ist in drei Schwierigkeitsstufen eingeteilt (niedrig, mittel und hoch). Für den Abschnitt Schreiben ist die zweite Stufe in zwei Schwierigkeitsstufen (niedrig und mittel/hoch) unterteilt, wobei die Testaufgaben in der zweiten Stufe mittler/hoher Schwierigkeit so gestaltet sind, dass sie für Personen über ein breites Spektrum an Kompetenz- und Bewertungskriterien zugänglich sind, die zwischen mittlerem und hohem Niveau unterscheiden.

Im Gegensatz zu den Teilen Hören, Lesen und Schreiben verfolgt der Sprechbereich einen nicht-adaptiven oder linearen Ansatz, bei dem alle Testteilnehmer für die gesamte Prüfung dieselben Testfragen erhalten, wobei die Aufgaben so gestaltet sind, dass sie über ein breites Kompetenzspektrum hinweg zugänglich sind und viele Möglichkeiten bieten, ihre Sprechfähigkeiten zu demonstrieren. Ein Schwierigkeitsgrad in Kombination mit mehreren Messmöglichkeiten ermöglicht es, das gesamte Sprachspektrum abzudecken, ohne separate Stufen zu benötigen.

Einsatz innovativer psychometrischer und statistischer Methoden

Für jeden Testabschnitt werden sowohl etablierte als auch innovative psychometrische und statistische Methoden eingesetzt, um die Konsistenz der Testschwierigkeit und die Vergleichbarkeit der Ergebnisse zwischen Testversionen sicherzustellen. In jedem der vier Testabschnitte können die Testteilnehmer Ergebnisse zwischen 1 und 12 erhalten. Die Bewertung für die Abschnitte Hören, Lesen und Schreiben berücksichtigt die Leistung in beiden Teilen sowie das Schwierigkeitsgrad. Die Punktzahlen für den Abschnitt Sprechen basieren auf der Gesamtleistung aller Aufgaben.

Es ist wichtig zu beachten, dass alle Aspekte dieser TOEFL Essentials-Testdesigns vom reichen Erbe der ETS-Forschung und -Entwicklung im Bereich der Psychometrie und Sprachtests geleitet werden, einschließlich Innovationen bei der Gestaltung und Implementierung von MST für groß angelegte Assessments. Wie bei allen ETS-Bewertungen informierten die ETS-Standards für Qualität und Fairness sowie umfangreiche Pilottests mit einer vielfältigen Palette von Testteilnehmern die Details und Umsetzung des endgültigen Designs, um bestmöglich den Bedürfnissen der Testteilnehmer und Score-Nutzer gerecht zu werden, während die psychometrische Integrität der Testergebnisse gewahrt wurde. Statistische Überwachungs- und Forschungsstudien werden nach dem Start fortgesetzt, um die fortgesetzte Validität und Zuverlässigkeit der Testergebnisse zu unterstützen.

Um mehr über den TOEFL Essentials-Test zu erfahren, besuchen Sie https://www.ets.org/toefl/score-users/essentials.html

Venessa Manna ist Geschäftsführerin für Psychometrische Analyse und Forschung (PAR) bei ETS.