Die Lehramtsstudierenden meines Seminars an der Universität Oldenburg (10.11.606 ‘Lerndesign und KI in Theorie und Praxis’, Sommersemester 2023) verfolgten in der vergangenen Woche zwei Forschungsfragen:
(1) Was sind die Möglichkeiten und Grenzen der Generierung von Unterrichtsmethoden, die zugleich zielgruppenorientiert, kreativ und umsetzbar sind, und
(2) Wie hilfreich ist ein Modell wie GPT für die logische Strukturierung von Lernaktivitätssequenzen, die in unserem Fall mit dem ABC-Workshop-Modell formalisiert wurden?
Das erstaunliche kreative Potenzial einer KI zeigte sich in einem meiner ersten Prompts. Er lautete: ‘Erstelle eine Unterrichtseinheit für zwei Stunden für Kinder in der Grundschule zum Lernziel ‘Aggregatzustände verstehen‘. Die erste Antwort war ziemlich langweilig und verwendete leblose Besprechungen und Arbeitsblätter. Zum Gähnen.
Ich bat um einen kreativeren Ansatz und bekam ihn: ‘Eine kreative Methode, um das Verständnis der Schülerinnen und Schüler für die Aggregatzustände zu vertiefen, ist die Herstellung von Schleim. Diese Aktivität ist besonders ansprechend für Kinder und ermöglicht es ihnen, praktisch zu lernen (…)’
Der Vorschlag war gefolgt von einer detaillierten Beschreibung der chemischen Zutaten sowie möglicher kooperativer Durchführungen in Kleingruppen. Schleim. Großartig. Noch besser: viele Arten von Schleim. Das macht nicht nur Kindern Spaß.
Die Idee war ebenso genial wie praktisch. Und es ging sehr schnell, da GPT vorhergehende Antworten, anders als Suchmaschinen, im Gedächtnis behält. Meine Studierenden fanden schnell heraus, dass sich längere Texteingaben ebenso durch Stichworte ersetzen lassen, beispielsweise ‚Kreative Methode, Unterricht, Englisch, 4. Klasse, 20 Schüler, “Steckbrief”, kein Vorwissen zu Vokabeln notwendig, 90 Minuten.‘
“Steckbrief” ist übrigens der erwünschte ‚exact match‘, das erwünschte Resultat. Je spezifischer der Prompt, also der Eingabebefehl, desto nutzbarer sind im allgemeinen die Antworten. Zum Beispiel hilft die Angabe von Präferenzen (etwa der Fokus auf handelndes Lernen), ebenso wie Angaben, was explizit nicht erwünscht ist (wie bspw. Aufgabenblätter oder Multiple Choice Aufgaben).
Unten: Die ersten Prompts waren noch lang. Später fand eine Gruppe heraus (orange), dass es mit Schlüsselbegriffen wesentlich schneller geht.

Sobald die Eingabebefehle zu lang werden, verliert ein auf Wahrscheinlichkeitsberechnung basierendes LLM den Fokus bzw. sucht sich einen eigenen Fokus, was weder erwünscht noch hilfreich ist. Eine Halluzination bzw.-ein Abschweifen der KI ist quasi vorprogrammiert. Andere Ansätze funktionieren dagegen sehr gut, z.B. Methoden bereits im Prompt mit Lernzielen zu verknüpfen oder formative und summative Evaluationsmethoden einer Methode gleich mitzuliefern.
25 Lehramt Studierende hatten den Output der Methodensuche von GPT mit Ergebnissen einer manuellen, konventionellen Suche im Internet verglichen. Dabei zeigten sich drastische Unterschiede. Da die Ergebnisse der Internetrecherche meist auf Datenbanken von Schulträgern und akademischen Institutionen beruhen, sind diese in der Regel sehr anwendbar, ‘tried and tested’, auf der anderen Seite nicht selten etwas veraltet. Im Gegensatz dazu waren die Ergebnisse der GPT schneller und kreativer. Oft stellte sich jedoch die Frage der praktischen Umsetzbarkeit und Anwendbarkeit. Da es sich bei einem Modell des maschinellen Lernens um eine Black Box handelt, sind weder die Quelle, noch die Zusammensetzung des Vorschlags, noch die unterliegenden Begründungszusammenhänge empirisch – und damit wissenschaftlich – verifizierbar. Eine Wildcard.
Die Metakompetenz in der KI-unterstützten Unterrichtsgestaltung: Massive Transfer- und Kontextualisierungsfähigkeiten (can do!)
Learning Designer bzw. Bildungsgestalter:innen erlernen, falls sie sich doch für eine KI-Wundertüte entscheiden sollten, neue Kompetenzen. Die wichtigste Kompetenz besteht darin, ein KI-Modell niemals für bare Münze zu nehmen. Da der Output stochastisch generiert wird und nicht menschlichen Denkmustern folgt, muss dieser in einem zweiten Schritt, quasi als Übersetzungs- und Transferleistung, aus menschlicher Perspektive neu definiert und für die praktische Anwendung kontextualisiert werden.
Die Frage, was besser ist, der Vorschlag einer KI oder die klassische Internetsuche, lässt sich beim heutigen Stand der Technik zuversichtlich beantworten. Am gewinnbringendsten ist eine Kombination aus beiden Ansätzen: Bewährte Methoden aus traditionellen Datenbanken für die Machbarkeit, Vorschläge der KI für frischen, kreativen Input. Zukünftige Lehrkräfte müssen zwischen diesen beiden Modellen interpolieren und abwägen können, was eine hohe Medienkompetenz voraussetzt.
Kann KI Lernprozesse designen?
Aber wie sehen die Ergebnisse bei der Darstellung von Lernprozessen aus? Ist ein LLM in der Lage, Lernaktivitäten zu einer sinnvollen pädagogischen Sequenz zu verbinden, wie z.B. im ABC-Workshop-Modell?
Die Ergebnisse waren ernüchternd, zumal wir auf dem wissenschaftlich-fundierten ‘Conversational Framework’ von Laurillard aufbauen konnten: Eine KI Lernprozesse kann keine zusammenhängenden Lernprozesse im menschlichen Sinne verstehen. Es konnten daher keine aufeinander-aufbauenden, logischen Lernprozess-Folgen generiert werden. Menschliche Lernprozesse sind, zumindest nach heutigem Stand der Technik, mit einem LLM nicht abbildbar. Sie sind schlichtweg zu komplex, Qualia-basiert und vieldeutig. Alle Versuche Kausalzusammenhänge zu modellieren, selbst mit dem sehr einfachen und formalisierten ABC-Modell, das auf dem Conversational Framework aufbaut, sind gescheitert.
Unten: Unterrichtseinheiten von Studierenden, nach dem modularen ABC Workshop: Out of reach for AI.

Unser Fazit
KI kann sehr schnell originelle und kreative Methodenvorschläge generieren. Das kann sie nur, weil irgendwann einmal kluge Nutzer diese Methoden in eine Datenbank eingegeben haben, mit der die KI trainiert wurde. Ideal wäre daher die Entwicklung einer Edu-KI, die mit erprobten Methoden trainiert wurde. Das grundlegende Problem der Nicht-Nachvollziehbarkeit des Outputs müsste für den Bildungsbereich gelöst werden. Schließlich möchten wir mit den Autorinnen und Autoren eines guten Lerndesigns in Verbindung treten können.
Darüber hinaus möchten wir Vorschläge besser kontextualisieren können. Ein reiner KI-Output ist derzeit eine großartige Inspiration, muss jedoch durch aufwendige menschliche Rekonstruktion und Anpassung vervollständigt werden. Lehrkräfte müssen somit nicht befürchten durch eine KI ersetzt zu werden. Im Gegenteil: Eine KI-erfahrene Lehrkraft kann in kürzester Zeit, insbesondere unter hohem Zeitdruck, mehr und kreativere Methoden generieren als eine Lehrkraft, die ihre Methoden aus herkömmlichen Internet-Methodenkoffern bzw. OER-Portalen bezieht.
Was wir nicht aus dem Blick verlieren dürfen, bei allem Output-Enthusiasmus, ist unser ethischer Anspruch die Selbstbestimmung, Bedürfnisse und Wünsche von Lernenden ins Zentrum aller Planung zu stellen. Diese haben vermutlich ihre eigenen Ideen und Vorstellungen – jenseits von KI.
AI-Art Credit: Google DeepMind