Bildung
Chaos um Abschlussprüfungen erschüttert das britische Schulsystem

Ein Algorithmus, der die Abschlussnoten von Schülern berechnete, sorgte für Aufsehen im britischen Bildungssystem.
Auch vor dem Wahlkreisbüro von Bildungsminister Gavin Williamson gab es wütende Proteste.
Auch vor dem Wahlkreisbüro von Bildungsminister Gavin Williamson gab es wütende Proteste. © picture alliance / empics | Jacob King  

In einer der bekanntesten Szenen aus Douglas Adams‘ Science-Fiction-Klassiker „Per Anhalter durch die Galaxis“ wurde ein Supercomputer mit der „ultimativen Frage nach dem Leben, dem Universum und dem ganzen Rest“ konfrontiert. Das von ihm errechnete Ergebnis war bekanntlich ernüchternd: nach mehreren Millionen Jahren Rechenzeit lautet die Antwort schlicht: 42. Vergleichbares spielt sich zurzeit in Adams‘ Heimat ab. Im Frühjahr wurden die Abschlussprüfungen für Schülerinnen und Schüler in England, Wales, Schottland und Nordirland abgesagt. Stattdessen wurden in den einzelnen Ländern die für die Standardisierung von Bildungsabschlüssen zuständigen Behörden angewiesen, Algorithmen zu entwickeln, die aufbauend auf den Notenvorhersagen der Lehrkräfte die Abschlussnoten von mehreren hunderttausend Schülerinnen und Schülern errechnen sollten. Die Reaktionen fielen enttäuscht bis empört aus. Der britische Bildungsminister Gavin Williamson wurde zu einem peinlichen „U-turn“ gezwungen und musste die Pläne wieder zurücknehmen.

Aus liberaler Sicht ist der Fall aus drei Gründen bemerkenswert: Zum einen ist er ein guter Grund, um sich noch einmal die heftigen Diskussionen um Abschlussprüfungen anzuschauen, die auch in Deutschland im Corona-Frühjahr geführt worden sind. Zweitens bietet sich hier aber auch eine Gelegenheit, die Rolle von Algorithmen bei der politischen Entscheidungsfindung zu reflektieren. Drittens, und in der Debatte bisher nur am Rande thematisiert, stellt sich hier auch die grundsätzliche Frage nach der Bedeutung von Noten für das Schulsystem.

1. Deutschland ist mit den Abschlussprüfungen in der Corona-Krise nochmal davongekommen

Die Eule der Minerva beginnt erst mit der einbrechenden Dämmerung ihren Flug – oder auch: hinterher ist man immer schlauer. Die rasant steigenden Infektionszahlen Anfang März stellten die Bildungspolitik in allen Ländern vor ungeahnte Herausforderungen. Statt über Lehrpläne und Notenvergaberichtlinien zu entscheiden, ging es plötzlich um die Auswirkungen von Schulöffnungen auf die Gesundheit der Schülerinnen und Schüler, der Lehrkräfte und der Angehörigen. Die Entscheidung war schwierig und es wäre unangebracht, nun im Nachhinein so zu tun, als hätte es eine perfekte Lösung in einer unmöglichen Situation gegeben. Dennoch lohnt es sich, die Debatte noch einmal Revue passieren zu lassen. Der Hashtag „Schulboykott“ trendete auf Twitter. In einem Video, das mittlerweile fast zwei Millionen mal geklickt worden ist, „erklärte“ der YouTuber Rezo, „wie Politiker momentan auf Schüler scheißen“ würden. Gute Gründe für das Durchführen der Abschlussprüfungen sah er keine und verwies dabei unter anderem auf Großbritannien, wo die Prüfungen abgesagt worden waren. Deutsche Politikerinnen und Politiker, darunter die nordrhein-westfälische Bildungsministerin Yvonne Gebauer, sahen sich teils harscher Kritik und sogar Demonstrationen gegenüber, besonnene Stimmen wie die der FAZ-Bildungsjournalistin Heike Schmoll gingen dabei fast unter.

Demonstrationen finden nun in London und Edinburgh statt, während die Prüfungen in Deutschland (glücklicherweise) weitestgehend reibungslos – und vor allem infektionslos – vonstattengegangen sind. Wohlfeiler Triumphalismus ist allerdings fehl am Platz, schließlich wusste man im März wirklich nicht, welcher Weg der beste sei. Deutlich geworden sind allerdings die Tücken des britischen Weges, auf Abschlussprüfungen zu verzichten und damit das, ohnehin höchst komplizierte Verfahren des Hochschulzugangs seiner Grundlage zu berauben. Britische Bildungspolitiker, insbesondere die für die Notenvergabe zuständigen Behörden wie das englische Ofsted oder die Scottish Qualifications Authority sahen sich also vor der Herausforderung, Noten ohne Abschlussklausuren zu vergeben. Nach der Verkündigung der Noten vor einigen Tagen kam es dann zum Eklat, denn Behörden wie Ofsted hatten diese Aufgabe im Großen und Ganzen im Prinzip gut gelöst. Wie im Roman von Adams war die Frage schlicht nicht gut gestellt gewesen.

Noten im britischen Bildungssystem

Im Vereinigten Königreich werden die Abschlussklausuren zentral bewertet. Die für die einzelnen Schülerinnen und Schüler zuständigen Lehrkräfte können lediglich Vorhersagen machen, wie die Noten ausfallen werden. Diese Vorhersagen sind allerdings wichtig, wenn es um die Bewerbung um Studienplätze geht. Denn die meisten Absolventinnen und Absolventen bewerben sich bereits vor den Klausuren um einen Platz und geben dabei diese „predicted grades“ an. Zusagen für Studienplätze sind dann meist „conditional“ – die Schülerinnen und Schüler müssen also eine bestimmte Note erreichen, um den Platz auch wahrnehmen zu können. Wie auch aus dem Flugreisesegment bekannt, vergeben die Universitäten mehr „offers“ als Plätze vorhanden sind. Zum einen springen manche „Ersties“ doch noch ab, zum anderen erreichen manche aber auch nicht die erforderlichen Noten, da die Lehrkräfte in der Regel zu optimistische Vorhersagen machen. In der Vergangenheit war daher nur etwa die Hälfte aller Vorhersagen akkurat. Hinzu kommt, dass die prestigeträchtigen (und teuren) Privatschulen, die traditionell vor allem die begehrten Studienplätze an den Spitzenuniversitäten im Blick haben, tendenziell besonders positive Aussagen über ihre Schülerinnen und Schüler treffen, während manche Schulen einen derartigen Bildungsweg für ihre eigenen Absolventinnen und Absolventen fast von vorneherein ausschließen.

2. Der Algorithmus kann widersprüchliche Erwartungen nicht erfüllen

Angesichts der Tatsache, dass die „predicted grades“ tendenziell in mehr als 30% aller Fälle zu gut ausfielen, war die Aufgabe klar definiert gewesen: um Noteninflation zu vermeiden und die Vergleichbarkeit der Abschlüsse verschiedener Jahrgänge sicherzustellen, musste der Algorithmus in den meisten aller Fälle die Note senken. Um den Algorithmus entsprechend auszugestalten hatte beispielsweise Ofsted kaum eine Mühe gescheut. Es gab öffentlichen Konsultationen und ein 319-seitiger Bericht schlüsselte die Überlegungen auf, die hinter dem Algorithmus steckten. Die Probleme zeigten sich dann von selbst. Zum einen musste die Zielgebung, dass Noten vor allem nach unten korrigiert werden sollten, dazu führen, dass sich Schülerinnen und Schüler ungerecht behandelt fühlen würden – wer akzeptiert schon, wenn einem ein Computer sagt, man wäre schlechter, als die eigene Lehrkraft einen einschätzt. Zum anderen lag das Problem in den Daten. Da im britischen Bildungssystem nur die Abschlussklausuren stehen, gab es lediglich ein paar Probeklausuren, die in die Notenvergabe hätten einfließen können – und auch das wäre ungerecht gewesen. Also blieben nur die überaus optimistischen Vorhersagen der Lehrkräfte – und die Leistungen der Schule sowie der Schulklassen. Und genau daran stieß sich die britische Öffentlichkeit: denn da der Algorithmus vor allen Dingen das Ziel hatte, die Noten im Vergleich zu den vorhergegangenen Jahren zu „standardisieren“ bedeutete dies, dass die traditionell sowieso schon starken Privatschulen einen Bonus erhielten, während schlechtere „Gesamtschulen“ (comprehensives) in der Regel schlechter abschnitten. Hinzu kam, dass auch die Leistung des Kurses bewertet wurde, wobei bei zu kleinen Kursen – wie sie zumeist an Privatschulen zu finden sind – wieder auf die optimistische Notenvorhersage rekurriert wurde. Auch wenn dieses Verfahren unterm Strich eher für Noten sorgte, die über dem Schnitt der letzten Jahre lagen, so wurden die unterprivilegierten Schulen tendenziell eher herabgestuft. Besonders problematisch war die Anwendung des Algorithmus in den Fällen, wo eine besonders begabte Schülerin oder ein besonders begabter Schüler einer traditionell schlechteren Schule außergewöhnliche Leistungen erbracht hat – denn hier griff der Algorithmus ein und korrigierte das Ergebnis, mit Blick auf die ansonsten „üblichen“ Noten an der jeweiligen Schule, nach unten. Der Aufschrei war, wenig überraschend, riesig. Dass der ehemalige Chef von Ofsted, Sir Michael Wilshaw, darauf hinwies, dass genau das auch zu erwarten gewesen sei, half - wenig überraschend - nicht.

3. Ein Desaster für Studierende und Universitäten

Selbst wenn der Staat die Möglichkeit hat, durch zusätzliche Finanzspritzen die Zahl der Studienplätze zu erhöhen, so bleiben diese dennoch eine knappe Ressource. Der Spielraum der Universitäten, die ihre Studienplätze im üblichen „Fluglinienverfahren“ vergeben hatten, war gering. Wie beispielsweise der Vice-Chancellor der Universität von Cambridge, Stephen J. Toope, ausführte, würde man den Absolventinnen und Absolventen zwar mit  „Flexibilität und Mitgefühl“ begegnen, letztendlich seien die Möglichkeiten allerdings begrenzt. Nicht zuletzt die Erfordernisse des „social distancing“, aber auch schlicht die begrenzte Zahl der Plätze, bedeuteten, dass man die Ergebnisse des Algorithmus nicht ignorieren konnte – denn schließlich hatte man – übrigens noch vor dem Ausbruch der Coronakrise – mehr Angebote ausgesprochen, als Plätze vorhanden seien. Würde man nun eine überproportionale Zahl an Studienanfängerinnen und Studienanfängern zulassen, hätte dies gravierende Auswirkungen auf die zukünftigen Kohorten, die ja ebenfalls unter dem Schatten Coronas an ihren Schulabschlüssen arbeiteten. Auch in Fächern wie Medizin, wo die Studiengebühren die tatsächlichen Kosten nicht decken, würde ein entsprechendes Wachstum erhebliche Probleme erzeugen.

Angesichts der Schärfe der Proteste – nicht nur in England, sondern beispielsweise auch in Schottland – sah sich der Bildungsminister Williamson allerdings dazu gezwungen, eine plötzliche Kehrtwende zu machen: der Algorithmus wird nun ignoriert, die Schuld bei den Behörden wie Ofsted abgeladen und die Notenvergabe ausschließlich an den Vorhersagen der Lehrkräfte gekoppelt – für viele Schülerinnen und Schüler geht damit eine lange Phase des Bangens vorbei, für die Universitäten beginnen die Schwierigkeiten nun freilich erst.

Mit Blick auf die hitzigen Diskussionen des Frühjahrs zeigt sich hier, dass es womöglich doch gute Gründe gab, die Abschlussprüfungen auch unter erschwerten Bedingungen und unter strengen Hygienemaßnahmen durchzuführen. Wichtiger sind aber noch zwei weitere Punkte. Wie das Ada Lovelace Institute herausgearbeitet hat, zeigt sich hier die Gefahr von Algorithmen, die in intransparenter Weise und ohne die notwendige Vorsicht in politische Entscheidungsprozesse eingebracht werden. Gerade wenn „historische Datensätze“ eingebaut werden, steigt die Gefahr, dass die Vorurteile und Ungerechtigkeiten der Vergangenheit in vermeintlich neutrale Ergebnisse umgewandelt werden. Wie nicht zuletzt das Desaster um die britischen Abschlussnoten gezeigt hat, geraten vor allem Minderheiten leicht unter die Räder. Gleichzeitig zeigt sich, dass es transparente Beschwerdeverfahren geben muss. Vor allem aber dürfen Algorithmen nicht verwendet werden, um politische und pädagogische Verantwortung auf Silizium und Leiterbahnen abzuwälzen.

4. Der Sinn von Schulnoten

Ein weiterer Faktor ist in der britischen Diskussion allerdings kaum berücksichtigt worden – und das ist die Frage, welche Rolle Noten überhaupt im Bildungssystem spielen sollten. Aus liberaler Sicht haben Noten freilich eine wichtige Aufgabe: sie zeigen, dass sich Leistung lohnt und können als Ansporn für Schülerinnen und Schüler dienen, sich anzustrengen. Wer seine Vokabeln nicht gelernt hat, fällt im Lateintest durch, strengt er sich dagegen an, lässt sich dies in der Regel auch messen.

Die Gefahr in der Notenvergabe liegt freilich in ihrer Fetischisierung. Der Wert der Lateinvokabeln liegt nicht in guten Klausurnoten, sondern darin, dass sie den Lernenden befähigen, sich zentrale Kulturgüter der Menschheit in der Originalsprache anzueignen – Bildung ist also Selbstzweck. Nur weil diese Einsicht der Schülerin oder der Schüler meist erst viel später als im Klassenzimmer kommt, dienen Noten als Surrogat. Auch die Prüfungserfahrung als solche erfüllt einen wichtigen Bildungszweck, kommt es doch auch später im Leben immer wieder zu Stresssituationen. Wie ungerecht die Notenvergabe auch ohne den Einsatz von Supercomputern sein kann, muss man dagegen kaum jemandem erklären. Viele Fähigkeiten – vom unternehmerischen Denken bis hin zu eher ungewöhnlichen Fremdsprachen – werden zudem in der Schule überhaupt nicht abgefragt. Zu glauben, Noten könnten das Potenzial eines jungen Menschen adäquat abbilden, ist also mehr als vermessen. Angesichts knapper Ressourcen braucht es natürlich dennoch Differenzierungsmöglichkeiten – und hier sind Noten durchaus gerechter als beispielsweise besondere Praktika oder Auslandserfahrungen, die noch viel stärker vom sozioökonomischen Hintergrund der Eltern abhängen. Allerdings könnten ausdifferenzierte Auswahlverfahren – zum Beispiel durch Assessment Center oder Bewerbungsgespräche – den Universitäten mehr Möglichkeiten bieten, die Bewerberin oder den Bewerber auch jenseits der kalten Zahlen besser kennenzulernen.

Die wichtigste Lehre aus Chaos um die Abschlussprüfungen bleibt also: statt sich auf immer stärker standardisierte Prüfungen zu fokussieren, muss ein ganzheitliches Bildungsverständnis bewahrt bleiben, zu dem – eine wichtige liberale Forderung – auch praktische Erfahrungen und Einblicke in die Wirtschaftswelt gehören. Noten bleiben ein wichtiges pädagogisches Werkzeug und dienen selbstverständlich auch Universitäten und potenziellen Arbeitgebern als Orientierung. Werden sie in ihrer Bedeutung überhöht und – beispielsweise durch einen Algorithmus – aus dem unmittelbaren pädagogischen Kontext herausgerissen, konterkarieren sie dagegen die Idee von Bildung, welche vor allem von der Kommunikation zwischen Lehrendem und Lernendem lebt.