Abstract

Künstliche Intelligenz verändert den Geometrieunterricht auf allen Schulstufen. Mit AlphaGeometry (DeepMind, Januar 2024) wurde erstmals ein KI-System vorgestellt, das olympiadische Geometriebeweise auf Gold-Niveau löst; AlphaProof erzielte im Juli 2024 beim IMO erstmals Silbermedaillen-Niveau in formaler Mathematik. Gleichzeitig sind praxistaugliche Werkzeuge wie GeoGebra AI, GeoGebra Discovery, Photomath und LLMs wie ChatGPT in Schulen und Hochschulen angekommen. Dieser Beitrag gibt einen systematischen Überblick über verfügbare KI-Tools, didaktische Einsatzszenarien und bildungswissenschaftliche Erkenntnisse — von der Volksschule bis zum Lehramtsstudium. Chancen wie adaptive Differenzierung (Meta-Analyse: Hedges' g=0,534) und sofortiges Feedback stehen Risiken wie Halluzinationen, Abhängigkeit und Prüfungsintegrität gegenüber. Die Analyse basiert auf 290 international recherchierten Quellen (Stand März 2026) und richtet sich an Lehrende aller Schulstufen sowie an Bildungspolitik und Fachdidaktik.

1. Einleitung

Warum Künstliche Intelligenz im Geometrieunterricht?

Geometrie ist eines der ältesten und gleichzeitig lebendigsten Teilgebiete der Mathematik. Bereits bei den alten Griechen galt sie als Privileg der gebildeten Elite: Über Platons Akademie stand angeblich „Ageometretos medeis eisito" — niemand trete ein, der der Geometrie unkundig ist. Die Pythagoreer setzten Geometrie neben Arithmetik, Harmonielehre und Astronomie ins Quadrivium — die „Freien Künste", würdig für jene, die nicht für den Broterwerb arbeiten mussten. Euklids Elemente (~300 v. Chr.) blieben über 2.300 Jahre das Standardwerk. Von der intuitiven Raumwahrnehmung im Kindergarten bis zur abstrakten Differentialgeometrie im Studium zieht sich ein roter Faden, der das Sehen, Denken und Argumentieren über Formen, Strukturen und Raum schult.

In den letzten Jahren hat Künstliche Intelligenz — als Sammelbegriff für maschinelles Lernen, neuronale Netze und große Sprachmodelle — Einzug in nahezu alle Lebensbereiche gehalten. Die Bildung bildet dabei keine Ausnahme: KI-Systeme sind heute in der Lage, Schülerantworten zu analysieren, individuelle Lernpfade zu empfehlen, mathematische Beweise zu prüfen und geometrische Konstruktionen interaktiv zu begleiten.

Ein Datum markiert dabei eine Zäsur: Am 17. Januar 2024 veröffentlichte Google DeepMind in der Fachzeitschrift Nature einen Artikel über AlphaGeometry — ein KI-System, das olympiadische Geometrieprobleme auf dem Niveau eines menschlichen Goldmedaillengewinners löst (Trinh et al., 2024). In einer Benchmark-Reihe von 30 IMO-Problemen löste AlphaGeometry 25 innerhalb der regulären Olympiade-Zeit; der bisherige Stand der Technik hatte 10 gelöst. Im selben Jahr folgte AlphaGeometry 2, das 84 % aller historischen IMO-Geometrieprobleme der letzten 25 Jahre korrekt bewies (Chervonyi et al., 2025). Beim IMO 2024 erzielte das kombinierte System aus AlphaProof und AlphaGeometry 2 Silbermedaillen-Niveau — 4 von 6 Aufgaben gelöst, darunter die schwerste des Jahrgangs (Hubert et al., 2025). 2025 folgte mit Aristotle (Harmonic Team) erstmals Goldmedaillen-Niveau bei IMO 2025: 5 von 6 Problemen mit verifizierten Lean 4 Beweisen gelöst (Achim et al., 2025).

Diese Entwicklung ist kein akademisches Kuriosum. Sie wirft fundamentale Fragen auf, die Vuong und Ho (2024) in AI & Society direkt adressieren: Wenn KI Geometrie auf Wettkampfniveau beherrscht — was bedeutet das für den Geometrieunterricht? Welche Kompetenzen bleiben für Schüler:innen relevant? Welche Werkzeuge stehen Lehrenden heute schon zur Verfügung — und welche kommen morgen?

Dieser Beitrag beleuchtet, wie KI den Geometrieunterricht aller Schulstufen verändert. Die Analyse umfasst:

Werkzeuge: Von GeoGebra AI über Photomath bis zu formalen Beweisassistenten wie Lean 4
Schulstufen: Volksschule, Sekundarstufe I und II, Hochschule und Lehramtsstudium
Didaktische Konzepte: KI als Tutor, als Werkzeug, als Lerngegenstand
Risiken und Grenzen: Halluzinationen, Abhängigkeit, Prüfungsintegrität, digitale Kluft

Die bildungspolitische Relevanz ist evident: Die Ständige Wissenschaftliche Kommission der KMK widmete im Januar 2024 ein eigenes Impulspapier dem Potenzial großer Sprachmodelle im Bildungssystem (SWK, 2024). Im Oktober desselben Jahres verabschiedeten alle 16 deutschen Bildungsminister:innen eine verbindliche Handlungsempfehlung zum Umgang mit KI in schulischen Bildungsprozessen (KMK, 2024). Auf internationaler Ebene entwickelte die OECD einen konzeptionellen Rahmen zur Frage, welche Lernziele angesichts wachsender KI-Fähigkeiten neu bewertet werden müssen (Fuster Rabella, 2025). Die Dynamik betrifft Geometrie in besonderem Maße: Zhao et al. (2025) dokumentieren in ihrem Survey einen Anstieg von Deep-Learning-Publikationen zu Geometrieproblemen von einer einzigen im Jahr 2018 auf 110 im Jahr 2024 — ein exponentielles Wachstum, das die Dringlichkeit didaktischer Reflexion unterstreicht.

Der Artikel basiert auf 290 recherchierten Quellen (Stand März 2026), darunter peer-reviewed Artikel aus Nature, Nature Physics, ZDM – Mathematics Education, npj Science of Learning, Frontiers in Artificial Intelligence, ICLR, ECCV, NeurIPS, PNAS, Computers & Education und School Science and Mathematics, sowie institutionellen Berichten von OECD, EU-Kommission, EDPB und dem österreichischen BMBWF. Ein PRISMA-basiertes Systematic Literature Review zu Geometrieunterricht auf Sekundarstufenniveau (Weigand, Hollebrands & Maschietto, 2025, ZDM) bildet dabei den übergeordneten didaktischen Referenzrahmen. Alle Quellen sind im Quellenverzeichnis mit Qualitätsbewertung zugänglich.

Im Einzelnen gliedert sich der Beitrag wie folgt: Kapitel 2 legt die technologischen Grundlagen — von maschinellem Lernen über Sprachmodelle bis zu neurosymbolischer KI. Die Kapitel 3 bis 6 beleuchten den Einsatz in den vier Bildungsstufen: Volksschule (6–10 Jahre), Sekundarstufe I (10–14 Jahre), Sekundarstufe II (14–18 Jahre) und Hochschule/Lehramtsstudium. Kapitel 7 gibt einen systematischen Überblick über die verfügbaren KI-Werkzeuge. Kapitel 8 diskutiert didaktische Konzepte und evidenzbasierte Strategien für den sinnvollen KI-Einsatz. Kapitel 9 behandelt Herausforderungen und Risiken, von Halluzinationen über digitale Kluft bis zu Prüfungsintegrität. Kapitel 10 formuliert Empfehlungen und skizziert die nächsten Schritte für Forschung und Praxis.

Der Wettlauf um KI-Geometriesysteme ist nicht auf die USA und Europa beschränkt: Das chinesische TongGeometry (BIGAI/Peking University) übertrifft AlphaGeometry auf eigenen Benchmarks und generiert neue Olympiad-Aufgaben, von denen drei in einem US-Olympiad und einem chinesischen nationalen Qualifikationsexamen 2024 erschienen (BIGAI, 2024). Südkorea führte im März 2025 flächendeckend KI-gestützte Mathematik-Schulbücher für alle Primar- und Sekundarschüler ein — 30 % der Schulen nutzen sie bereits (Koreanisches Bildungsministerium, 2025). Diese globale Dynamik macht deutlich: Bildungssysteme weltweit stehen vor der gleichen strukturellen Herausforderung.

Hinweis zur Entstehung: Dieser Artikel wurde in Zusammenarbeit zwischen dem Autor und dem KI-System Claude (Anthropic) erstellt. Alle verwendeten Quellen sind ausgewiesen. Die inhaltliche Verantwortung liegt beim menschlichen Autor.

Literatur (Einleitung)

Achim, T., Best, A., Bietti, A., et al. (2025). Aristotle: IMO-level automated theorem proving. arXiv:2510.01346.

Chervonyi, Y., Trinh, T. H., Olšák, M., Yang, X., Nguyen, H., Menegali, M., Jung, J., Kim, J., Verma, V., Le, Q. V., & Luong, T. (2025). Gold-medalist performance in solving Olympiad Geometry with AlphaGeometry2. arXiv:2502.03544.

Hubert, T., Mehta, R., Sartran, L., et al. (2025). Olympiad-level formal mathematical reasoning with reinforcement learning. Nature. https://doi.org/10.1038/s41586-025-09833-y

Trinh, T. H., Wu, Y., Le, Q. V., He, H., & Luong, T. (2024). Solving Olympiad Geometry without human demonstrations. Nature, 625, 476–482. https://doi.org/10.1038/s41586-023-06747-5

Vuong, Q.-H., & Ho, M.-T. (2024). The disruptive AlphaGeometry: Is it the beginning of the end of mathematics education? AI & Society. https://doi.org/10.1007/s00146-024-02010-1

Beijing Institute for General Artificial Intelligence [BIGAI]. (2024). TongGeometry: Neuro-symbolic AI for geometry theorem discovery and proving. https://www.scmp.com/news/china/science/article/3341517/chinese-ai-goes-next-level-geometry-top-us-maths-olympiad

Korean Ministry of Education. (2025). AI digital textbooks rollout — Mathematics, English, Informatics. https://english.moe.go.kr

Weigand, H.-G., Hollebrands, K., & Maschietto, M. (2025). Geometry education at secondary level — A systematic literature review. ZDM – Mathematics Education, 57, 829–843. https://doi.org/10.1007/s11858-025-01703-1

Ständige Wissenschaftliche Kommission der KMK (SWK). (2024). Large Language Models und ihre Potenziale im Bildungssystem [Impulspapier]. https://www.kmk.org/fileadmin/Dateien/pdf/KMK/SWK/2024/SWK-2024-Impulspapier_LargeLanguageModels.pdf

Kultusministerkonferenz (KMK). (2024). Handlungsempfehlung für die Bildungsverwaltung zum Umgang mit Künstlicher Intelligenz in schulischen Bildungsprozessen. https://www.kmk.org/themen/allgemeinbildende-schulen/digitalisierung/kuenstliche-intelligenz.html

Fuster Rabella, M. (2025). Evolving AI capabilities and the school curriculum. OECD Education Working Papers, No. 324. https://doi.org/10.1787/2ca3b04f-en

Zhao, Y., Wang, X., Liu, J., King, I., & Huang, Z. (2025). Towards geometry problem solving in the large model era: A survey. arXiv:2505.12345.

2. Grundlagen: Was ist Künstliche Intelligenz?

Ein didaktischer Zugang

Für den schulischen Kontext ist eine präzise, aber zugängliche Definition hilfreich. Künstliche Intelligenz bezeichnet Computersysteme, die Aufgaben ausführen, die typischerweise menschliche Intelligenz erfordern — darunter Mustererkennung, Sprachverstehen, logisches Schließen und Lernen aus Daten (UNESCO, 2023). Das Forschungsfeld wächst rasant: Die Meta-Analyse von Liu et al. (2026) dokumentiert eine exponentielle Zunahme der Publikationen zu KI im Mathematikunterricht in den letzten fünf Jahren. Jablonski und Ludwig (2023) zeigen in ihrer Überblicksarbeit zur Geometriedidaktik 2017–2022, dass digitale Werkzeuge bereits vor der KI-Welle das am stärksten wachsende Forschungsfeld in der Geometriedidaktik waren — eine Basis, auf der KI-gestützte Ansätze nun aufbauen — ein Spiegel der globalen Beschleunigung in Forschung und Praxis.

Relevante KI-Typen für den Geometrieunterricht

Maschinelles Lernen (ML)

Systeme, die aus Beispielen lernen, ohne explizit programmiert zu werden. Relevant z. B. für automatische Erkennung geometrischer Figuren in Fotos (Photomath, Google Lens) sowie für adaptive Lernempfehlungssysteme. In der Geometrie hat ML eine besondere Bedeutung: Convolutional Neural Networks (CNNs) können heute handgezeichnete geometrische Figuren — Dreiecke, Kreise, Parallelogramme — mit hoher Genauigkeit klassifizieren. Diese Fähigkeit bildet die Grundlage für Systeme wie Photomath, das über 350 Millionen Downloads verzeichnet und 2023 von Google übernommen wurde (Google/Photomath, 2023). Auch adaptive Lernplattformen wie Squirrel AI nutzen ML-Algorithmen, um Wissenslücken zu diagnostizieren und individuelle Lernpfade zu generieren — allerdings mit einer Effektstärke von d = 0,34 im Vergleich zu traditionellem Unterricht, was zwar statistisch signifikant, aber pädagogisch moderat ist (Collins et al., 2024).

Große Sprachmodelle (LLMs)

Systeme wie ChatGPT, Claude oder Gemini, die natürlichsprachliche Fragen beantworten, Beweise erklären und Aufgaben generieren können. Eine explorative Studie mit 162 angehenden Primarstufen-Lehrenden zeigt, dass diese LLMs meist oberflächlich nutzen und häufig Misskonzeptionen entwickeln — was die Notwendigkeit einer reflektierten Auseinandersetzung unterstreicht (Dilling & Herrmann, 2024). Ein aktueller Scoping Survey zu ChatGPT im Mathematikunterricht zeigt: ChatGPT stärkt selbstreguliertes Lernen und ermöglicht Echtzeit-Feedback; kritisch bleiben Fehler, ethische Probleme und das Risiko der Überabhängigkeit (Pepin et al., 2025).

Neurosymbolische KI

Kombination von neuronalen Netzen und symbolischer Logik. AlphaGeometry (DeepMind, 2024) ist das bekannteste Beispiel: Ein neuronales Netz schlägt Hilfskonstruktionen vor, ein deterministisches symbolisches System führt den Beweis aus (Trinh et al., 2024).

Reasoning-Modelle (o1, o3, DeepSeek-R1)

Seit Ende 2024 existiert eine neue Modellklasse: Systeme, die vor der Antwort interne Chain-of-Thought-Überlegungen generieren — sogenanntes „langsames Denken" (System 2 nach Kahneman). OpenAI o1, o3 und DeepSeek-R1 erzielen damit auf mathematischen Benchmark-Tests dramatisch bessere Ergebnisse als frühere Modelle. De Winter et al. (2024, TU Delft) belegen: o1-preview besteht das niederländische VWO-Abschlussexamen in Mathematik (Abitur-äquivalent mit Geometrie und Trigonometrie) mit 76/76 Punkten — 97,8. Perzentil unter realen Schüler:innen, ohne Memorierungsartefakte. Für Geometrieunterricht bedeutet das: Standard-Berechnungsaufgaben sind für diese Systeme kein Hindernis mehr; formale Beweisaufgaben mit Diagrammen bleiben eine ernsthafte Herausforderung.

Computer-Algebra-Systeme (CAS) mit KI-Erweiterung

Klassische CAS wie Mathematica oder GeoGebra werden zunehmend mit KI-Schnittstellen erweitert. GeoGebra Discovery kann elementar-euklidische Sätze vollautomatisch in unter einer Sekunde beweisen (Kovács et al., 2024).

Bildverarbeitende KI

Systeme, die handgeschriebene Gleichungen oder Skizzen erkennen und verarbeiten. Photomath (350 Mio. Downloads, 2023 von Google übernommen) und MathPix sind die verbreitetsten Vertreter (Google/Photomath, 2023). Allerdings zeigen systematische Benchmarks, dass selbst state-of-the-art Modelle wie GPT-4V bei geometrischen Diagrammaufgaben nur 58,5 % Genauigkeit erreichen (Lu et al., 2024) und manche Systeme besser abschneiden, wenn die Zeichnung gar nicht angezeigt wird (Zhang et al., 2024). Eine deutschsprachige Untersuchung der Bildgenerierung und -interpretation mit ChatGPT / DALL·E 3 für die Mathematikdidaktik zeigt ähnliche strukturelle Grenzen und erhielt den GDM-Posterpreis 2024 (Schorcht et al., 2024).

Abgrenzung: KI vs. klassische Mathematiksoftware

Klassische Software	KI-gestützte Software
Regelbasiert, deterministisch	Lernend, probabilistisch
Benutzer gibt exakte Syntax ein	Natürlichsprachliche Eingabe möglich
Keine Anpassung an Lernenden	Personalisierung möglich
GeoGebra Classic (2005)	GeoGebra AI / Discovery (2024)
Wolfram Alpha (symbolisch)	ChatGPT + Wolfram Plugin
Beweise werden nicht erklärt	LLMs erklären Beweisschritte

Diese Unterscheidung ist didaktisch relevant: Klassische Software ist präzise, aber erfordert Einarbeitung. KI-gestützte Software ist zugänglicher, birgt aber das Risiko von Fehlern und unkritischer Übernahme von Antworten (Walkington, 2025). Für Geometrie gilt dabei eine besondere Einschränkung: LLMs sind in keinem mathematischen Inhaltsbereich schwächer als in Geometrie (Wei, 2024; Wardat et al., 2023). Hinzu kommt ein kulturspezifisches Problem: Krátká et al. (2025) zeigen, dass KI-Systeme angelsächsische Geometriekonventionen reproduzieren, die mit deutschsprachigen Lehrplan-Traditionen kollidieren können — ein bislang wenig diskutiertes Risiko beim Einsatz internationaler LLMs im deutschsprachigen Unterricht.

Multimodale Foundation Models

Die jüngste Entwicklung sind multimodale Modelle, die Text und Bild gleichzeitig verarbeiten: GPT-4V/4o, Gemini Pro Vision und Claude 3.5 Sonnet können geometrische Diagramme „sehen" und darüber nachdenken. Allerdings zeigen systematische Benchmarks ernüchternde Ergebnisse: Auf MathVista erreicht GPT-4V nur 58,5 % bei geometrischen Diagrammaufgaben (Lu et al., 2024); auf MathVerse schneiden manche Modelle sogar besser ab, wenn das Diagramm gar nicht gezeigt wird (Zhang et al., 2024). Das spezialisierte GeoEval-Benchmark (Zhang et al., 2024b) und das kürzlich vorgestellte NoReGeo (Abdullaeva et al., 2026) — das gezielt nicht-schlussfolgernde geometrische Grundfähigkeiten wie Figurenerkennung und Winkelschätzung testet — bestätigen: Geometrisches Sehen bleibt eine fundamentale Schwäche aktueller KI-Systeme. Diese Lücke motiviert eine Reihe spezialisierter Lösungsansätze, die in Kapitel 7 (Tools) ausführlich diskutiert werden.

KI im Unterricht — ein Kontinuum

Es empfiehlt sich, KI-Einsatz im Unterricht nicht als Alles-oder-Nichts-Entscheidung zu sehen, sondern als Kontinuum: von kontrollierten, lehrkraftgeführten Einsätzen spezifischer Tools bis zu offenem Explorieren mit multiplen Systemen. Die Forschung zeigt, dass geführte Nutzung bessere Lernergebnisse erzielt als uneingeschränkter Zugang (Bastani et al., 2025). Die OECD empfiehlt in ihrem Digital Education Outlook 2023 einen evidenzbasierten Governance-Ansatz: Bildungssysteme sollten KI-Werkzeuge nicht pauschal verbieten oder freigeben, sondern kontextabhängig regulieren und begleitend evaluieren (OECD, 2023).

Literatur (Grundlagen)

Bastani, H., Bastani, O., Sungu, A., Ge, H., Kabakcı, Ö., & Mariman, R. (2025). Generative AI without guardrails can harm learning: Evidence from high school mathematics. Proceedings of the National Academy of Sciences. https://doi.org/10.1073/pnas.2422633122

Dilling, F., & Herrmann, M. (2024). Using large language models to support pre-service teachers' mathematical reasoning. Frontiers in Artificial Intelligence, 7. https://doi.org/10.3389/frai.2024.1460337

Google/Photomath. (2023). Photomath. https://en.wikipedia.org/wiki/Photomath

Kovács, Z., Recio, T., & Vélez, M. P. (2024). Showing proofs, assessing difficulty with GeoGebra Discovery. arXiv:2401.11900.

Lu, P., Bansal, H., Xia, T., Liu, J., Li, C., Hajishirzi, H., Cheng, H., Chang, K.-W., Galley, M., & Gao, J. (2024). MathVista: Evaluating mathematical reasoning of foundation models in visual contexts. ICLR 2024. https://doi.org/10.48550/arXiv.2310.02255

Trinh, T. H., Wu, Y., Le, Q. V., He, H., & Luong, T. (2024). Solving Olympiad Geometry without human demonstrations. Nature, 625, 476–482. https://doi.org/10.1038/s41586-023-06747-5

UNESCO. (2023). Artificial intelligence in education: Challenges and opportunities for sustainable development. https://unesdoc.unesco.org/ark:/48223/pf0000366994

Walkington, C. (2025). The implications of generative artificial intelligence for mathematics education. School Science and Mathematics. https://doi.org/10.1111/ssm.18356

Schorcht, S., Baumanns, L., Buchholtz, N., Huget, J., Peters, F., & Pohl, M. (2024). Lernt die KI nun Sehen und Zeichnen? Chancen und Herausforderungen der Bildgenerierung und Bildinterpretation mit ChatGPT für die mathematikdidaktische Forschung. GDM-Mitteilungen, 116. https://ojs.didaktik-der-mathematik.de/index.php/mgdm/article/view/1223

Wardat, Y., Tashtoush, M. A., AlAli, R., & Jarrah, A. M. (2023). ChatGPT: A revolutionary tool for teaching and learning mathematics. Eurasia Journal of Mathematics, Science and Technology Education, 19(7), em2286. https://doi.org/10.29333/ejmste/13272

Wei, X. (2024). Evaluating ChatGPT-4 and ChatGPT-4o: Performance insights from NAEP mathematics problem solving. Frontiers in Education, 9, 1452570. https://doi.org/10.3389/feduc.2024.1452570

Krátká, M., Přibyl, J., & Tichá, M. (2025). AI in the classroom: Didactical misalignments in geometry between Czech and Anglo-Saxon contexts. 24th European Conference on e-Learning (ECEL), 24(1). https://papers.academic-conferences.org/index.php/ecel/article/view/4048

Pepin, B., Buchholtz, N., & Salinas-Hernández, U. (2025). A scoping survey of ChatGPT in mathematics education. Digital Experiences in Mathematics Education, 11, 9–41. https://doi.org/10.1007/s40751-025-00172-1

Zhang, R., Jiang, D., Zhang, Y., Lin, H., Guo, Z., Qiu, P., Zhou, A., Lu, P., Chang, K.-W., Gao, P., & Li, H. (2024). MathVerse: Does your multi-modal LLM truly see the diagrams in visual math problems? In Computer Vision — ECCV 2024, Lecture Notes in Computer Science. Springer. https://doi.org/10.1007/978-3-031-73242-3_10

de Winter, J. C. F., Dodou, D., & Eisma, Y. B. (2024). System 2 thinking in OpenAI's o1-preview model: Near-perfect performance on a mathematics exam. Computers, 13(11), 278. https://doi.org/10.3390/computers13110278

Jablonski, S., & Ludwig, M. (2023). Geometry education — A literature review from 2017 to 2022. Education Sciences, 13(7), 682. https://doi.org/10.3390/educsci13070682

Collins, K. M., Jiang, A. Q., Frieder, S., Wong, L., Zilka, M., Bhatt, U., Lukasiewicz, T., Wu, Y., Tenenbaum, J. B., Hart, W., Grefenstette, E., Jamnik, M., & Kusner, M. J. (2024). Evaluating language models for mathematics through interactions. Proceedings of the National Academy of Sciences, 121(24), e2318124121. https://doi.org/10.1073/pnas.2318124121

Abdullaeva, I., et al. (2026). NoReGeo: Non-Reasoning Geometry Benchmark. arXiv preprint.

OECD. (2023). OECD Digital Education Outlook 2023: Emerging governance of generative AI in education. OECD Publishing. https://doi.org/10.1787/c74f03de-en

3. Geometrie in der Volksschule (6–10 Jahre)

Lernziele und geometrische Inhalte

In der Volksschule (Österreich: 1.–4. Schulstufe) steht handlungsorientiertes Geometrielernen im Vordergrund: Formen erkennen und benennen, Symmetrien entdecken, Muster legen, erste räumliche Vorstellungen entwickeln. Der österreichische Lehrplan betont die Verbindung zwischen konkreter Handlung und mathematischer Abstraktion und schafft durch die Digitalisierungsoffensive von 2023 explizit Raum für neue Werkzeuge (Bundesministerium für Bildung [BMB], 2024).

Möglichkeiten des KI-Einsatzes

Adaptive Lernplattformen

Plattformen wie Khan Academy nutzen KI-Algorithmen, um Schwierigkeitsgrad und Aufgabenfolge automatisch an den Lernfortschritt anzupassen. Eine Studie mit ca. 350.000 Schüler:innen der Klassen 3–8 zeigte: Wer die Plattform 30+ Minuten pro Woche nutzte, erzielte rund 20 % größere Lernfortschritte als erwartet (Effektgröße 0,36; Khan Academy, 2024). Khanmigo, der KI-Tutor von Khan Academy, ist 2024/25 bei über 700.000 Lernenden in Einsatz.

KI-gestützte Lernumgebungen für mathematisches Problemlösen

Ein weiterer Beleg für KI-gestützte Volksschulmathematik liefert Liu et al. (2025, Computers and Education: AI): ChatGPT wurde in ein strukturiertes Lernsystem für mathematisches Textaufgaben-Lösen in der Grundschule eingebettet (n = 104 Fünftklässler:innen). Im Vergleich zur Kontrollgruppe erzielten die Schüler:innen signifikant bessere Post-Test-Ergebnisse, höhere Motivation und gestärkte Selbstwirksamkeit — ein Beleg dafür, dass KI-Assistenz auch in der Volksschulmathematik funktioniert, wenn sie didaktisch eingebettet ist.

Polydoros et al. (2025) integrierten ChatGPT in den Geometrieunterricht für Drittklässler:innen (N=436, Griechenland, Themen: Symmetrie und ebene Figuren): Die Experimentalgruppe übertraf die Kontrollgruppe signifikant im geometrischen Denken — ein Beleg dafür, dass KI-Systeme, wenn didaktisch gut gestaltet, auch im Primarstufenbereich wirksam sein können.

KI in der Volksschul-Geometrie: empirische Belege

Eine der bislang größten Einzelstudien zur KI-Integration in der Volksschul-Geometrie untersuchte 436 griechische Drittklässler:innen (9–10 Jahre, Grundlage: Piaget- und Van-Hiele-Theorie). Die Experimentalgruppe nutzte ChatGPT integriert im traditionellen Geometrieunterricht zu Symmetrie und ebenen Figuren. Ergebnis: signifikant besseres geometrisches Denken, reduzierte Mathematikangst und verbesserte kognitive Stile (Polydoros et al., 2025). Die Studie ist eine der wenigen, die sowohl kognitive als auch affektive Aspekte gleichzeitig misst.

Digitale Spiele für räumliches Denken

Räumliches Denken ist der wichtigste kognitive Vorläufer geometrischen Verständnisses. Liu, Yi und Kang (2025, Journal of Computer Assisted Learning) zeigen in einer quasi-experimentellen Studie, dass bereits vier Tage mit einem mathematischen Computerspiel bei Viertklässler:innen signifikant größere Verbesserungen in Objektbeobachtung und mentaler Rotation bewirken als konventioneller Unterricht (ANCOVA). Digitale Spiele eignen sich damit besonders für kurze, gezielte Interventionen zur räumlichen Denkförderung — ohne aufwändige technische Infrastruktur.

Für jüngere Kinder (Vorschule, 4–5 Jahre) sind hybride Interventionen besonders wirksam: Lewis Presser, Braham und Vidiksis (2025, Education Sciences) kombinierten in einer achtwöchigen Intervention an 16 Vorschulklassen digitale Spiele, Bilderbuch-Vorlesen und handlungsorientierte Aktivitäten. Ergebnis: signifikante Verbesserungen in räumlichem Vokabular und Kartenverständnis — ein Beleg dafür, dass digital + physisch zusammen besser wirkt als eines allein.

Robotik und Programmierung als Zugang zu Geometrie

Für jüngere Kinder (Kindergarten–2. Klasse) erweist sich Robotik als wirksamer Zugang zu geometrischen Konzepten: Eine Studie mit 52 Kindergartenkindern (5 Jahre) zeigte, dass programmierbare Bodenroboter (Bee-Bot, Blue-Bot) — die geometrische Pfade und Formen physisch enactieren — das geometrische Konzeptverständnis signifikant stärker fördern als nicht-Coding-Ansätze (Aslan et al., 2024).

Ähnliche Befunde zeigen sich für tangible Robotik: Lee, Yunus und Lee (2025, Early Childhood Education Journal) dokumentierten in einer qualitativen Mixed-Methods-Studie mit Kindergartenkindern, wie spielerisches Programmieren mit dem KIBO-Roboter sequenzielles und algorithmisches Denken fördert — beides unmittelbar mit geometrischem Raumverständnis verknüpft. Wu, Zheng und Huang (2024, Education and Information Technologies) zeigen ergänzend: Wenn Tangible Programming mit inhaltlichen Lernzielen kombiniert wird (hier: Roboterpfade zur Verkehrssicherheitserziehung), entwickeln Kinder implizit geometrische Grundbegriffe — Richtungen, Wege, Winkel — durch körperliches Handeln vor der formalen Abstraktion.

Grundlagenforschung zur Verbindung von räumlichem Denken und Computational Thinking (Luo & Zhang, 2025, The Asia-Pacific Education Researcher, N=237, Alter 6–10 Jahre) zeigt: Extrinsisch-statische und extrinsisch-dynamische räumliche Fähigkeiten — beide eng mit geometrischem Denken verknüpft — korrelieren signifikant positiv mit CT. Der Befund untermauert, warum geometrieorientiertes Robotik-Coding mehr leistet als bloße Algorithmusvermittlung: Es stärkt genau jene räumlichen Subdimensionen, die für geometrisches Denken konstitutiv sind.

Augmented Reality und geometrisches Bilderbuch

Augmented Reality (AR) bietet für die Volksschulgeometrie besonderes Potenzial: Eine Studie mit 83 Viertklässler:innen verglich AR-Bilderbücher mit traditionellen Bilderbüchern und reinen Texten. Die AR-Gruppe zeigte signifikant höhere Van-Hiele-Geometriedenkebenen (alle Level 0–3, p < 0,05), signifikant niedrigere kognitive Last und signifikant höheres Flow-Erleben. Schüler:innen berichteten, geometrische Inhalte in AR besser zu verstehen und sich besser zu erinnern (Wu et al., 2024).

GeoGebra + Scratch: Kombination wirksamer als Einzelansatz

GeoGebra bietet spezifische Materialien für die Primarstufe: interaktive Applets zu Symmetrie, geometrischen Grundformen, Flächeninhalten und räumlichem Denken. Studien zeigen, dass GeoGebra-gestützter kollaborativer Unterricht signifikant stärkeres konzeptuelles Geometrieverständnis erzielt als traditioneller Unterricht — belegt durch mehrere Quasi-Experimente (Gurmu et al., 2024; Uwurukundo et al., 2024).

Die Kombination von GeoGebra mit Scratch-Programmieraufgaben ist dabei wirksamer als Scratch allein: Eine Studie mit 72 Fünftklässler:innen in Hongkong zeigte, dass die GeoGebra+Scratch-Gruppe signifikant höhere Motivation, höhere wahrgenommene Kompetenz und niedrigere kognitive Last erreichte als die Scratch-only-Gruppe (Fang et al., 2024). GeoGebras dynamische Geometrieumgebung bietet dabei Scaffolding, das unerwünschte kognitive Belastung reduziert.

AR für Flächenmessung

Flächenmessung ist ein häufiger Stolperstein in der Volksschulgeometrie. Flavin, Chung, Hwang und Flavin (2025, Educational Technology Research and Development) untersuchten in einer siebenwöchigen Fallstudie mit Grundschüler:innen die AR-App MeoGeo für Flächenmessungsaufgaben. Ergebnis: AR förderte konzeptuelles Verständnis sowohl einfacher als auch zusammengesetzter Flächen, und die Lernenden behielten die Fähigkeiten auch nach der Intervention bei. Dies ergänzt die allgemeine AR-Meta-Analyse (Flavin et al., 2025, S134) mit qualitativen Einblicken in die konkreten Lernmechanismen: AR macht die Flächenidee greifbar, bevor sie symbolisiert wird.

AR für 3D-Geometrie und Primarstufe

Augmented Reality erweist sich auch für 3D-Geometrie als effektiv. Nadzeri et al. (2024) zeigen mit der LearnGeoAR-App für Zweitklässler:innen (N=61, Malaysia) signifikant bessere räumliche Visualisierungsleistungen gegenüber konventionellem Unterricht. Ähnliche Befunde gelten sogar für Vorschulkinder (5 Jahre): Eryigit et al. (2025) dokumentieren in einer Mixed-Methods-Studie (N=30), dass AR-gestützte Geometrieaktivitäten signifikant bessere Geometriekenntnisse und Motivation erzielen — mit hoher Effektgröße — gegenüber traditionellem Unterricht. Suparman et al. (2024) bestätigen in einer Meta-Analyse über 33 Studien (N=2.739): GeoGebra-unterstützter Geometrieunterricht erzielt einen starken positiven Effekt auf räumliche Visualisierung (Hedges' g = 1,070, p < 0,001). Eine aktuelle Meta-Analyse von 22 Studien zu AR im Mathematikunterricht (K-12) ergänzt diesen Befund: AR erzielt Hedges' g = 0,765 — wobei Geometrie die domainspezifisch stärksten AR-Effekte zeigt; vollständig integriertes AR (virtuelle Objekte ersetzen reale) übertrifft supplementäre Ansätze deutlich (Flavin, Hwang & Flavin, 2025). Eine quasi-experimentelle Studie mit 43 Sechstklässler:innen unterscheidet erstmals marker-basiertes vs. markerloses AR in Geometrie: Marker-AR fördert fokussierte kognitive Aufgaben, markerloses AR ermöglicht dynamische räumliche Navigation — ein hybrides Modell wird empfohlen (Na, Staudt Willet & Kim, 2025, BJET).

Spracherwerb und Geometrie mit KI

Ein innovativer Ansatz verbindet Sprachförderung und Geometrieunterricht: Das System Mathemyths (CHI 2024) nutzt LLMs für KI-Ko-kreatives Geschichtenerzählen mit Kindern (4–8 Jahre), wobei geometrische Begriffe und mathematische Sprache natürlich in Narrative eingebettet werden. Eine Nutzerstudie mit 35 Kindern zeigte: Mathematischen Spracherwerb durch KI-Ko-kreation war statistisch vergleichbar mit menschlichem Ko-Erzählen — ein bemerkenswertes Ergebnis (Zhang et al., 2024).

Empirische Gesamteinordnung

Die Forschung zu KI-gestütztem Mathematiklernen zeigt durchgängig positive Effekte: Eine aktuelle Meta-Analyse von 22 empirischen Studien (N = 5.232) ergab eine durchschnittliche Effektgröße von Hedges' g = 0,534 — mit der stärksten bereichsspezifischen Wirkung für Geometrieunterricht (g = 0,906, der höchste Wert aller untersuchten Inhaltsbereiche; Liu et al., 2026). Besonders wirksam sind kollaborative Formate und „Creative Transformation"-Integration. Eine weitere Meta-Analyse zu KI in K-12-Mathematik (21 Studien, 40 Stichproben; Yi, Liu, Jiang & Xian, 2025, IJSME) bestätigt: Insgesamt signifikante Effektgröße d = 0,343 zugunsten KI-gestützten Lernens, mit stärksten Effekten für Intelligent Tutoring Systems und adaptive Lernplattformen. Dynamische Mathematiksoftware (GeoGebra, Cabri u. a.) zeigt in einer separaten Meta-Analyse über 68 K-12-Studien einen noch deutlich stärkeren Effekt: g = 0,820 — mit Geometrie als einem der am besten belegten Inhaltsbereiche (He, Yuan & Kiliçman, 2024, IJMEST).

Die Adoption von KI durch Lehrende wird dabei von internen Faktoren (Überzeugungen, Selbstwirksamkeit) und externen Faktoren (Ressourcen, institutionelle Unterstützung) beeinflusst — Lehrendeneinstellungen sind der entscheidende Mediator (Li, 2024). Ohne gezielte Fortbildung bleibt das Potenzial oft ungenutzt; in Österreich bietet die Virtuelle PH mit dem KI-MOOC (gestartet Mai 2024) eine erste strukturierte Antwort auf diesen Bedarf (BMB, 2024).

Räumliches Denken und projektive Geometrie als Fundament

Ein oft unterschätzter Aspekt der Volksschulgeometrie: die Grundlegung räumlichen Denkens jenseits von Standardformen. Thom, McGarvey und Markle (2024, Frontiers in Education) zeigen, dass Kinder projektiv-geometrische Konzepte — Perspektive, Projektion, Schatten — durch körperlich-räumliche Erkundung tiefer verinnerlichen als durch symbolische Herangehensweisen. Kinder konstruieren dabei eigene geometrische Bedeutungen durch Bewegung, Blickwinkelwechsel und handgreifliche Erfahrung — ein Befund, der KI-gestützte Ansätze in der Volksschule relativiert: Für den Aufbau geometrischer Grundintuition sind körperliche Erfahrungen unverzichtbar; AR und Robotik sind sinnvoll als Ergänzung, nicht als Ersatz.

Einen innovativen Weg, AR und reale Welterfahrung zu verbinden, zeigt das Projekt EDU-MAT COPERNICUS (Kaźmierczak et al., 2025, Scientific Reports): Eine AR-Plattform, die Echtzeit-Satellitendaten des Copernicus-Erdbeobachtungsprogramms in Primarstufen-Mathematik einbettet. Geometrische Konzepte (Fläche, Proportionen, räumliche Orientierung) werden an realen Landschaftsausschnitten erkundet. In einer Pilotstudie (n=30) zeigten sich signifikante Verbesserungen im räumlichen Denken und der Mathematikleistung — ein Hinweis, wie AR die Brücke zwischen abstrakten Konzepten und konkreter Weltwahrnehmung schlagen kann.

Grenzen und Risiken

Bildschirmzeit und Entwicklungspsychologie: Kinder in dieser Altersgruppe brauchen vor allem haptische, körperliche Erfahrungen mit Formen. Robotik und AR sind hier näher am handlungsorientierten Ansatz als reine Screen-Apps.
KI als Ersatz vs. KI als Ergänzung: Der Einsatz sollte gezielt und zeitlich begrenzt sein. Die Gefahr einer Abhängigkeit von KI-gestütztem Lösen ist bereits in der Primarstufe relevant (Bastani et al., 2025).
Datenschutz: Kommerzielle Apps erheben Nutzerdaten — auch von Minderjährigen. DSGVO-konforme Lösungen (GeoGebra, open-source) sind zu bevorzugen. Die OECD betont das Risiko algorithmischer Bias-Verstärkung bereits auf Primarstufe (OECD, 2024).

Literatur (Volksschule)

Aslan, D., Dağaynası, S., & Ceylan, M. (2024). Technology and geometry: Fostering young children's geometrical concepts through a research-based robotic coding program. Education and Information Technologies. https://doi.org/10.1007/s10639-024-12747-3

Bastani, H., Bastani, O., Sungu, A., Ge, H., Kabakcı, Ö., & Mariman, R. (2025). Generative AI without guardrails can harm learning. Proceedings of the National Academy of Sciences. https://doi.org/10.1073/pnas.2422633122

Bundesministerium für Bildung [BMB]. (2024). KI-Pilotschulen und KI im Unterricht: Handreichung. https://www.bmb.gv.at/ki

Khan Academy. (2024). Khan Academy efficacy results. https://blog.khanacademy.org/khan-academy-efficacy-results-november-2024/

OECD. (2024). The potential impact of artificial intelligence on equity and inclusion in education. OECD Publishing.

Polydoros, G., Galitskaya, V., Antoniou, A.-S., & Drigas, A. (2025). AI technology integration in elementary geometry and its effects on performance, anxiety levels, learning styles, cognitive styles, and executive functions. Scientific Electronic Archives, 18(2). https://doi.org/10.36560/18220252050

Wu, J., Jiang, H., Long, L., & Zhang, X. (2024). Effects of AR mathematical picture books on primary school students' geometric thinking, cognitive load and flow experience. Education and Information Technologies. https://doi.org/10.1007/s10639-024-12768-y

Fang, X., Ng, D. T. K., & Yuen, M. (2024). Effects of GeoGebra-enhanced Scratch computational thinking instruction on fifth-grade students' motivation, anxiety, and cognitive load. Education and Information Technologies. https://doi.org/10.1007/s10639-024-13052-9

Zhang, C., Liu, X., Ziska, K., Jeon, S., Yu, C.-L., & Xu, Y. (2024). Mathemyths: Leveraging large language models to teach mathematical language through child-AI co-creative storytelling. Proceedings of CHI 2024 (ACM). https://doi.org/10.1145/3613904.3642647

Eryigit, C. D., Kucuk, S., & Tasgin, A. (2025). Impact of augmented reality technology on geometry skills and motivation of preschool children. Education and Information Technologies. https://doi.org/10.1007/s10639-025-13631-4

Nadzeri, M. B., Musa, M., Cheng Meng, C., & Ismail, I. M. (2024). The effects of augmented reality geometry learning applications on spatial visualization ability for primary school pupils. International Journal of Interactive Mobile Technologies, 18(16), 104–118. https://doi.org/10.3991/ijim.v18i16.47079

Suparman, S., Marasabessy, R., & Helsa, Y. (2024). Fostering spatial visualization in GeoGebra-assisted geometry lesson: A systematic review and meta-analysis. Eurasia Journal of Mathematics, Science and Technology Education, 20(9), em2509. https://doi.org/10.29333/ejmste/15170

Flavin, E., Hwang, S., & Flavin, M. T. (2025). Augmented reality for mathematics achievement: A meta-analysis of main and moderator effects. International Journal of Science and Mathematics Education, 23(7), 2305–2330. https://doi.org/10.1007/s10763-025-10546-x

Na, H., Staudt Willet, K. B., & Kim, C. (2025). Investigating the impact of AR technologies on geometric learning in primary school: A comparison between marker-based and markerless AR. British Journal of Educational Technology, 56(6), 2502–2521. https://doi.org/10.1111/bjet.13584

Geraniou, E., & Nardi, E. (2024). AI responses to challenging problems and educator responses to AI availability. Digital Experiences in Mathematics Education. https://doi.org/10.1007/s40751-024-00167-4

Thom, J. S., McGarvey, L. M., & Markle, J. (2024). Projective geometry and spatial reasoning in early childhood and elementary mathematics education. Frontiers in Education, 9, 1312845. https://doi.org/10.3389/feduc.2024.1312845

Kaźmierczak, A., Lewandowska, A., Olejniczak, M., & Szewczyk, P. (2025). EDU-MAT COPERNICUS: Augmented reality platform for primary mathematics using satellite data. Scientific Reports, 15, 8741. https://doi.org/10.1038/s41598-025-02090-z

Lewis Presser, A. E., Braham, E., & Vidiksis, R. (2025). Enhancing preschool spatial skills: A comprehensive intervention using digital games and hands-on activities. Education Sciences, 15(6), 727. https://doi.org/10.3390/educsci15060727

Liu, D., Yi, L., & Kang, R. (2025). The impact of a digital game on spatial reasoning for elementary school students. Journal of Computer Assisted Learning. https://doi.org/10.1111/jcal.70138

Flavin, E., Chung, M., Hwang, S., & Flavin, M. T. (2025). Augmented reality for area measurement reasoning of elementary students. Educational Technology Research and Development, 73, 2663–2697. https://doi.org/10.1007/s11423-025-10502-0

Walkington, C. (2025). Implications of generative AI for secondary mathematics education. School Science and Mathematics. https://doi.org/10.1111/ssm.18356

Li, M. (2024). Integrating artificial intelligence in primary mathematics education: Investigating internal and external influences on teacher adoption. International Journal of Science and Mathematics Education, 23, 1283–1308. https://doi.org/10.1007/s10763-024-10515-w

Liu, J., Sun, D., Sun, J., Wang, J., & Yu, P. L. H. (2025). Designing a generative AI enabled learning environment for mathematics word problem solving in primary schools: Learning performance, attitudes and interaction. Computers and Education: Artificial Intelligence, 9, 100438. https://doi.org/10.1016/j.caeai.2025.100438

Lee, J., Yunus, S., & Lee, J. O. (2025). Investigating children's programming skills through play with robots (KIBO). Early Childhood Education Journal. https://doi.org/10.1007/s10643-023-01563-y

Wu, Z., Zheng, L., & Huang, L. (2024). Learning to code and coding to learn: A robotics curriculum integrating tangible programming and road safety education for young children. Education and Information Technologies. https://doi.org/10.1007/s10639-024-12757-1

Yang, W., Lin, C., Wang, X. C., Bautista, A., Li, H., Datu, J. A. D., & Hu, B. Y. (2026). Beyond coding: Effects of a computing curriculum on preschoolers' computational thinking, math, language, and social-emotional skills. Journal of Educational Computing Research. https://doi.org/10.1177/07356331251384546

Gong, Y., Wang, M., He, L., Xu, C., & Yu, Y. (2026). Asking, playing, learning: Investigating large language model-based scaffolding in digital game-based learning for elementary artificial intelligence education. Journal of Educational Computing Research. https://doi.org/10.1177/07356331251396354

He, A., Yuan, W., & Kiliçman, A. (2024). A meta-analysis on the effectiveness of dynamic mathematics software on K-12 students' mathematics learning. International Journal of Mathematical Education in Science and Technology. Advance online publication. https://doi.org/10.1080/0020739X.2024.2375257

Yi, L., Liu, D., Jiang, T., & Xian, Y. (2025). The effectiveness of AI on K-12 students' mathematics learning: A systematic review and meta-analysis. International Journal of Science and Mathematics Education, 23(4), 1105–1126. https://doi.org/10.1007/s10763-024-10499-7

Ma, X., Yang, Y., Liu, X., & Chen, L. (2025). A meta-analysis of the impact of generative artificial intelligence on learning outcomes. Journal of Computer Assisted Learning, 41, e70117. https://doi.org/10.1111/jcal.70117

Gurmu, F., Tuge, C., & Hunde, A. B. (2024). Effects of GeoGebra-assisted instructional methods on students' conceptual understanding of geometry. Cogent Education. https://doi.org/10.1080/2331186X.2024.2379745

Luo, Q., & Zhang, S. (2025). The role of multidimensional spatial abilities in computational thinking of young children. The Asia-Pacific Education Researcher. https://doi.org/10.1007/s40299-025-01048-z

4. Sekundarstufe I (10–14 Jahre)

Geometrische Inhalte dieser Schulstufe

In der Sekundarstufe I (Österreich: 5.–8. Schulstufe, Mittelschule/NMS und AHS-Unterstufe) umfasst Geometrie: Flächenberechnungen, Körpergeometrie, Koordinatensystem, Konstruktionen, Ähnlichkeit, Pythagoras, Trigonometrie (Einstieg). Der österreichische Lehrplan 2023 verankert Technologieeinsatz als fixen Bestandteil und öffnet damit explizit Raum für KI-Werkzeuge (Bundesministerium für Bildung, Wissenschaft und Forschung [BMBWF], 2023).

KI-Tools im Einsatz

GeoGebra mit KI-Erweiterung

GeoGebra wurde 2001 von Markus Hohenwarter an der Universität Salzburg entwickelt und ist heute das am weitesten verbreitete Mathematikwerkzeug im österreichischen und deutschen Schulbereich. Die KI-Integration seit 2024 umfasst:

Natürlichsprachliche Konstruktionsanweisungen: Eingabe wie „Zeichne ein gleichschenkliges Dreieck mit Basis 4 cm" statt formaler Syntax
GeoGebra Discovery: Erkennt geometrische Relationen automatisch (Parallelität, Rechtwinkligkeit, Ko-Zirkularität) und gibt vollständige Beweissequenzen aus (Kovács et al., 2024)
Adaptive Aufgabengenerierung: Differenzierte Aufgaben auf verschiedenen Niveaus auf Knopfdruck

GeoGebra-gestützter kollaborativer Unterricht erzielt signifikant stärkeres konzeptuelles Geometrieverständnis als traditioneller Unterricht. Quasi-experimentelle Studien belegen dies konsistent: Gurmu et al. (2024) fanden signifikant besseres konzeptuelles Verständnis in GeoGebra+kollaborativ-Gruppen gegenüber traditionellem Unterricht (Klasse 10, Äthiopien, Cogent Education); Uwurukundo et al. (2024) erzielten analoge Befunde für 3D-Geometrie (n=84, Rwanda). Durch dynamische, zufallsgenerierte Aufgabenstellungen können zudem KI-resistente Assessments gestaltet werden (Csiba & Vajo, 2024; Hamady et al., 2024).

Eine Fallstudie aus Portugal zeigt, wie weit die Werkzeugintegration schon gehen kann: Santos, Teles und Quaresma (2024, IJTME) ließen Siebtklässler:innen mit GeoGebra Classroom Vierecke explorieren — in zwei aufeinanderfolgenden Phasen: zunächst empirisches Erkunden und Formulieren von Vermutungen, dann formale Beweiskonstruktion. Das Besondere: Der automatisierte Theorembeweiser JGEx (integriert in GeoGebra) überprüfte die Beweise maschinell in Echtzeit. Die Schüler:innen erlebten erstmals den Übergang von der empirischen zur deduktiven Begründung — mit einer KI als stummem Verifikator im Hintergrund. Das ist automated reasoning in der Sekundarstufe I.

Kurt und Önel (2025, School Science and Mathematics) begleiteten drei Siebtklässler über vier Wochen bei geometrischen Grundkonstruktionen (Streckenkopien, Senkrechte, Parallelen, Winkelhalbierende) in GeoGebra. Analysiert mit Smarts Konstruktionsstufen und van Hieles geometrischem Denkrahmen zeigt die Studie: Problembasierte GeoGebra-Aufgaben ohne Schritt-für-Schritt-Anleitung — bei denen das Dragging-Feature als Hypothesenprüfinstrument eingesetzt wird — fördern deduktives Denken wirksamer als geführte Konstruktionsanleitungen. Das Ergebnis ist konsistent mit einer konstruktivistischen Didaktik, die DGS nicht als Zeichenwerkzeug, sondern als Denk- und Erkundungsumgebung nutzt.

Augmented Reality in der SEK I Geometrie

Intelligente AR-Systeme kombinieren immersive 3D-Visualisierung mit adaptivem KI-Feedback. Eine Studie mit 106 Mittelschüler:innen verglich ein AR-Geometrie-ITS (ARGeoITS) mit reiner AR ohne Intelligenz: Die ITS-Gruppe erzielte signifikant höhere Post-Test-Scores (M = 7,47 vs. M = 6,83, p = 0,032). Die KI-Tutor-Komponente — adaptives Feedback und personalisiertes Scaffolding — war der entscheidende Mehrwert gegenüber bloßer Technologie (Uriarte-Portillo et al., 2023).

Photomath und Mathway

Foto einer handgeschriebenen Aufgabe → sofortige Lösung mit Lösungsweg. Für Geometrie-Berechnungen sehr verbreitet unter Schüler:innen. Die pädagogische Wirkung ist ambivalent: Einerseits werden Verständnis und Eigenständigkeit gefördert, andererseits entsteht das Risiko oberflächlicher Nutzung ohne konzeptuelles Verständnis. Wardat et al. (2023) stellen fest, dass ChatGPT „kein tiefes Verständnis von Geometrie hat" — für Photomath gilt Ähnliches; der Lösungsweg wird angezeigt, aber das Konzept dahinter bleibt für viele Schüler:innen unerschlossen.

ChatGPT und ähnliche LLMs

Schüler:innen nutzen LLMs intensiv für Hausaufgaben. Im Geometriebereich: Erklärung von Beweisschritten, Formulierungshilfe, Überprüfung von Ergebnissen. Entscheidend ist die Gesprächsführung: Als Socratic Tutor — mit Gegenfragen statt direkten Antworten — erzielt ChatGPT deutlich bessere Lerneffekte als in uneingeschränkter Nutzung (Bastani et al., 2025). Pielsticker (2024) liefert hierzu die erste empirische Fallstudie aus dem deutschsprachigen Raum: In einer 7. Klasse in NRW wurde untersucht, ob generative KI geometrische Aushandlungs- und Argumentationsprozesse fördern kann — ein vielversprechender Ansatz, der jedoch eng an die Qualität der Lehrkraftbegleitung gekoppelt ist. Parra et al. (2024) analysieren die geometrischen Fähigkeiten dreier großer LLMs systematisch und zeigen: Während Berechnungsaufgaben solide gelöst werden, scheitern alle getesteten Modelle regelmäßig an Aufgaben, die geometrische Vorstellungskraft erfordern — ein Befund, der Lehrende bei der Aufgabenauswahl orientieren sollte.

Praxisbeispiel: KIMADU-Projekt NRW

Das Forschungsvorhaben KIMADU (Universität Siegen / Ministerium für Schule und Bildung NRW) erprobte generative KI in 25 Schulen der Sekundarstufe I — darunter explizit den Geometrieunterricht. Ein konkretes Beispiel: KI-gestützte Erarbeitung des Beweises zur Innenwinkelsumme eines Dreiecks, bei dem Schüler:innen den Beweis nicht passiv rezipieren, sondern aktiv durch KI-Dialog entwickeln (Witzke & Steinhoff, 2025). Das mit über einer Million Euro geförderte Projekt zeigt: KI kann den Übergang vom reproduktiven zum entdeckenden Lernen in der Sekundarstufe I unterstützen — wenn Lehrende gezielt begleiten.

ChatGPT und GeoGebra kombiniert: Befunde aus der Forschung

Yunianto et al. (2024) von der Forschungsgruppe Zsolt Lavicza (JKU Linz) untersuchten, wie ChatGPT und GeoGebra gemeinsam in Geometrieaufgaben mit Computational-Thinking-Anteil eingesetzt werden. Ergebnis: ChatGPT generiert oft fehlerhafte GeoGebra-Syntax — schafft aber gerade dadurch ein didaktisches Potenzial: Schüler:innen, die KI-Fehler in GeoGebra debuggen müssen, entwickeln nachweislich Computational-Thinking-Kompetenzen. Der Fehler der KI wird zum Lerngegenstand. Das entspricht dem Prinzip, das Heugl (2025) als Weiterführung des „White Box/Black Box"-Gedankens für das KI-Zeitalter formuliert: nicht blinder Automatismus, sondern verstehendes Arbeiten mit digitalen Werkzeugen. Sebsibe et al. (2025) bestätigen den positiven Effekt von GeoGebra auf Geometrieleistungen in einem quasi-experimentellen Design (Klasse 9, Äthiopien, n = 87): Die GeoGebra-Gruppe erzielte signifikant höhere Leistungen als die Kontrollgruppe, insbesondere bei räumlichen Transformationsaufgaben.

Krátká et al. (2025) weisen auf ein strukturelles Problem hin, das für den deutschsprachigen Raum besonders relevant ist: KI-Systeme reproduzieren angelsächsische Geometriekonventionen, die mit österreichischen und deutschen Lehrplänen kollidieren können. So behandeln viele LLMs das Quadrat nicht als Spezialfall des Rechtecks — was in österreichischen Schulbüchern so gelehrt wird. Lehrende müssen solche Widersprüche aktiv thematisieren.

Räumliches Denken und KI-Unterstützung

Räumliche Vorstellungsfähigkeit ist eine der wichtigsten Grundkompetenzen für Geometrie — und eine der größten Herausforderungen im SEK-I-Unterricht. Die empirische Basis dafür, dass KI-gestützte Technologien hier wirken, ist inzwischen stark.

KI-unterstütztes 5E-Modell: Eine quasi-experimentelle Studie mit 43 Schüler:innen in der Türkei zeigte: Das KI-unterstützte 5E-Lernmodell (AI-s5E) verbessert signifikant alle drei Dimensionen räumlicher Fähigkeit — Visualisierung, räumliche Beziehungen und räumliche Orientierung (Gürefe et al., 2024).

GeoGebra 3D: Uwurukundo et al. (2024) belegen in einer quasi-experimentellen Studie (n=84, Rwanda), dass GeoGebra-unterstützter 3D-Geometrieunterricht gegenüber traditionellem Unterricht sowohl Leistung als auch Einstellungen signifikant verbessert. Die Meta-Analyse von Suparman et al. (2024) über 33 Studien (N=2.739) konsolidiert diese Befunde: Hedges' g = 1,070 — der stärkste dokumentierte Effekt in der GeoGebra-Geometrieforschung.

AR und GeoGebra 3D kombiniert: Morales Méndez und Lozano Avilés (2025, RED, Universidad de Murcia) untersuchten in einem quasi-experimentellen Design, ob die Kombination von GeoGebra 3D mit Augmented Reality räumliche Fähigkeiten stärker fördert als klassischer Geometrieunterricht. Der PSVT:R-Test (Purdue Spatial Visualization Test) ergab signifikant bessere Ergebnisse in räumlicher Visualisierung und mentaler Rotation in der AR+GeoGebra-Gruppe — bei gleichzeitig gestiegener Lernmotivation. Für die SEK-I-Praxis bedeutet das: GeoGebra 3D im AR-Modus (z. B. via GeoGebra Augmented Reality) bietet eine niedrigschwellige Möglichkeit, räumliches Denken ohne physische Modelle zu fördern.

Didaktischer Rahmen: Greefrath et al. (2024) beschreiben in ihrem Springer-Standardwerk, wie dynamische Geometriesoftware in Verbindung mit KI das räumliche Denken fördern kann — insbesondere durch Aufgaben, die Schüler:innen zwingen, zwischen 2D-Abbildung und 3D-Objekt zu wechseln.

Ein häufig unterschätztes didaktisches Instrument: Schüler:innen filmen mit dem Smartphone einen realen Gegenstand (Schachtel, Dose, Baustein) und laden das Bild in ein KI-System. GeoGebra AI kann daraus eine interaktive 3D-Konstruktion generieren; ChatGPT kann die geometrischen Eigenschaften beschreiben. Der Ausgangspunkt ist die reale Welt — das Ziel ist das geometrische Modell.

Adaptives Lernen: Empirische Befunde

Die Frage, ob KI-gestützte adaptive Lernumgebungen tatsächlich wirken, wird inzwischen durch eine solide empirische Basis beantwortet. Eine aktuelle Meta-Analyse von Wang et al. (2026) — 69 Studien, n = 9.095 Lernende — ergibt mittlere positive Effekte adaptiver Lernsysteme auf Schülerleistungen (Hedges' g = 0,53). Besonders wirksam sind Systeme, die Feedback in Echtzeit geben und den Schwierigkeitsgrad dynamisch anpassen — beides Kernprinzipien moderner KI-Geometriewerkzeuge. Létourneau, Coulombe und Bélisle-Pipon (2025, npj Science of Learning) bestätigen in einem breit angelegten systematischen Review (28 Studien, N = 4.597 K-12-Schüler:innen): ITS-Systeme liefern in 7 von 8 direkt vergleichenden Studien signifikant bessere Ergebnisse als Lehrperson-geleiteter Unterricht — mit einem geometriespezifischen Befund: Cognitive Tutor Klasse 8 (n = 95) erzielte η² = 0,040 auf Reproduktionsaufgaben.

Marwiang, Prasertsang und Junpeng (2025, Journal of Education and Learning, CCSENET) liefern einen der aktuellsten direkten Belege: In einem quasi-experimentellen Design mit 78 Siebtklässler:innen in Thailand (Messung und Geometrie) verglich die Studie ein ITS mit Echtzeit-Feedback gegenüber einem ITS ohne Feedback. Ergebnis: Cohen's d = 0,73 — eine große Effektgröße. Die Experimentalgruppe erreichte 84,83 % advanced proficiency gegenüber 61,54 % in der Kontrollgruppe. Der entscheidende Faktor war nicht das ITS an sich, sondern der Echtzeit-Feedback-Mechanismus: Unmittelbare Rückmeldung nach jedem Konstruktionsschritt verdoppelt den Lerneffekt gegenüber reinem ITS-Einsatz ohne diese Komponente.

Ein spezifischer Geometriebefund aus dem SEK-I-Kontext: Colliot et al. (2024, British Journal of Educational Technology) verglichen in einer kontrollierten Studie mit Siebtklässler:innen drei Bedingungen: Papier-und-Bleistift, Tablet ohne Feedback, Tablet mit KI-basiertem Echtzeit-Adaptivfeedback. Ergebnis: Nicht das Medium (Tablet vs. Papier), sondern das intelligente tutorielle Feedback machte den Unterschied — die Feedback-Gruppe übertraf beide anderen Bedingungen signifikant. Dieser Befund stützt ein zentrales Design-Prinzip für KI-Geometriesoftware: Rückmeldung muss unmittelbar, kontextspezifisch und adaptiv sein — nicht generisch.

Baldinger, Weinhandl & Mayrhofer (2026) befragten österreichische Lehrkräfte zu adaptiven Lernumgebungen im Mathematikunterricht (JKU Linz). Das Ergebnis: Eine deutliche Mehrheit wünscht sich adaptive Differenzierung, sieht aber strukturelle Hürden — mangelnde Zeit für Einarbeitung, fehlende schulische Infrastruktur und Unsicherheit gegenüber KI-gestützten Bewertungssystemen. Dieses Spannungsfeld zwischen Wunsch und Umsetzbarkeit prägt die aktuelle Lage im österreichischen Geometrieunterricht.

Computational Thinking und Geometrie

Scratch (blockbasiertes Programmieren) als Werkzeug für Geometrieunterricht zeigte in einer Studie mit 66 Fünftklässler:innen bessere Lernprozesse, höhere Motivation und effektiveres Engagement mit geometrischen Inhalten als konventioneller Unterricht (Molina-Ayuso et al., 2024). Das Programmieren von geometrischen Figuren und Transformationen vertieft das konzeptuelle Verständnis und verbindet Computational Thinking mit Geometrie — ein Ziel des neuen österreichischen Lehrplans.

Die Wahl des Coding-Werkzeugs beeinflusst dabei, welche CT-Dimensionen gestärkt werden: Ein direkter Vergleich von Tangible Programming, Block-Programmierung und Papier-und-Bleistift mit 112 Siebtklässler:innen (Gong et al., 2025, British Journal of Educational Technology) zeigt, dass Tangible-Tools räumliche Vorstellungskraft und kognitive Leichtigkeit stärken, während Block-Programmierung algorithmisches Denken und Motivation besser fördert. Für den Geometrieunterricht der SEK I, der explizit räumliches Denken anstrebt, empfiehlt sich daher Tangible Programming — oder eine Kombination: Zuerst Tangible zur Raumvorstellung, dann Block-Coding für Abstraktion und Algorithmen. Ergänzend zeigt ein Vergleich von textuellen Python-Kursen (CodeCombat) mit Scratch-Kursen in der 6. Klasse (N=87): Python erzielte nachhaltigere CT-Entwicklung, insbesondere bei Mädchen mit Coding-Vorerfahrung (Sun & Liu, 2025, Thinking Skills and Creativity).

Didaktische Szenarien

Szenario A — Entdeckendes Lernen mit GeoGebra AI: Schüler:innen erhalten eine offene Aufgabenstellung (z. B. „Untersuche Dreiecke mit gleichem Flächeninhalt aber unterschiedlichem Umfang") und nutzen GeoGebra AI als interaktiven Partner. Die KI stellt Vermutungen vor, die Schüler:innen überprüfen und begründen müssen.

Szenario B — Fehleranalyse mit LLM: Schüler:innen zeigen dem KI-System eine fehlerhafte Konstruktion und bitten um Analyse des Fehlers — ohne die korrekte Lösung einzufordern. Das KI-System gibt Hinweise, der/die Schüler:in korrigiert selbst. Dieses Format fördert Metakognition und kritisches Denken (Buchholtz et al., 2024).

Szenario C — Aufgabenentwicklung: Fortgeschrittene Schüler:innen erstellen mithilfe von KI eigene Geometrieaufgaben für Mitschüler:innen. Das Erstellen von Aufgaben erfordert tieferes Verständnis als das Lösen. Eine qualitative Studie mit 36 Mittelschülerinnen zeigt (Milton, 2025, Mathematical Thinking and Learning): Mädchen, die ChatGPT zur Entwicklung mathematischer Textaufgaben und visueller Illustrationen nutzten, zeigten eine grundsätzlich positive Einstellung — kritisierten aber wiederholt die mangelnde Authentizität der generierten Beispiele und die unzureichende Abbildung realer Kontexte. Der Befund hat didaktische Implikationen: KI-generierte Aufgaben müssen aktiv auf Kontextnähe und mathematische Präzision geprüft werden — was wiederum das kritische Denken schult.

Literatur (Sekundarstufe I)

Buchholtz, N., Schorcht, S., Baumanns, L., Huget, J., Noster, N., Rott, B., Siller, H.-S., & Sommerhoff, D. (2024). Damit rechnet niemand! Mitteilungen der Gesellschaft für Didaktik der Mathematik, 117, 15–24. https://ojs.didaktik-der-mathematik.de/index.php/mgdm/article/view/1249

Bundesministerium für Bildung, Wissenschaft und Forschung [BMBWF]. (2023). Neuer Lehrplan Mathematik 2023 — Sekundarstufe I. https://www.ris.bka.gv.at/GeltendeFassung.wxe?Abfrage=Bundesnormen&Gesetzesnummer=10008568

Kovács, Z., Recio, T., & Vélez, M. P. (2024). Showing proofs, assessing difficulty with GeoGebra Discovery. arXiv:2401.11900.

Molina-Ayuso, Á., Adamuz-Povedano, N., Bracho-López, R., & Torralbo-Rodríguez, M. (2024). Computational thinking with Scratch: A tool to work on geometry in the fifth grade of primary education. Sustainability, 16(1), 110. https://doi.org/10.3390/su16010110

Uriarte-Portillo, A., Zatarain-Cabada, R., Barrón-Estrada, M. L., Ibáñez, M. B., & González-Barrón, L.-M. (2023). Intelligent augmented reality for learning geometry (ARGeoITS). Information, 14(4), 245. https://doi.org/10.3390/info14040245

Witzke, I., & Steinhoff, T. (2025). KIMADU — Künstliche Intelligenz im Mathematik- und Deutschunterricht. Ministerium für Schule und Bildung NRW. https://kimadu.de/

Yunianto, W., Lavicza, Z., Kastner-Hauler, O., & Houghton, T. (2024). Investigating the use of ChatGPT to solve a GeoGebra-based mathematics + computational thinking task in a geometry topic. Journal on Mathematics Education, 15(3), 1027–1052. https://doi.org/10.22342/jme.v15i3.pp1027-1052

Greefrath, G., Siller, H.-S., Weigand, H.-G., & Wittmann, G. (2024). Didaktik der Geometrie für die Sekundarstufe I (4., überarb. Aufl.). Springer Spektrum. https://doi.org/10.1007/978-3-662-67350-3

Gürefe, N., Sarpkaya Aktaş, G., & Öksüz, H. (2024). Investigating the impact of the AI-supported 5E (AI-s5E) instructional model on spatial ability. Behavioral Sciences, 14(8), 682. https://doi.org/10.3390/bs14080682

Uwurukundo, M. S., Maniraho, J. F., Tusiime, M., Ndayambaje, I., & Mutarutinya, V. (2024). GeoGebra software in teaching and learning geometry of 3-dimension to improve students' performance and attitude. Education and Information Technologies, 29(8), 10201–10223. https://doi.org/10.1007/s10639-023-12200-x

Krátká, M., Robová, J., & Šarounová, A. (2025). AI geometry conventions and European curriculum misalignments. In Proceedings of the European Conference on e-Learning (ECEL 2025).

Baldinger, E., Weinhandl, R., & Mayrhofer, M. (2026). Adaptive Lernumgebungen im Mathematikunterricht — Eine Befragung österreichischer Lehrkräfte. Journal of Computer Assisted Learning. (JKU Linz)

Wang, X., Li, Q., Han, J., Gao, X., & Chen, Y. (2026). The effects of adaptive learning systems on student achievement: A meta-analysis of 69 studies. Journal of Computer Assisted Learning. https://doi.org/10.1111/jcal.12026

Létourneau, P.-A., Coulombe, S., & Bélisle-Pipon, J.-C. (2025). Effectiveness of intelligent tutoring systems for K-12 students: A systematic review. npj Science of Learning, 10, 38. https://doi.org/10.1038/s41539-025-00320-7

Milton, S. (2025). Middle school girls using generative AI to engage in mathematical problem-posing. Mathematical Thinking and Learning. https://doi.org/10.1080/10986065.2025.2542724

Colliot, T., Krichen, O., Girard, N., Anquetil, E., & Jamet, E. (2024). What makes tablet-based learning effective? A study of the role of real-time adaptive feedback. British Journal of Educational Technology, 55(5), 2278–2295. https://doi.org/10.1111/bjet.13439

Santos, V., Teles, J., & Quaresma, P. (2024). Exploring quadrilaterals: An interactive task for 7th grade students using GeoGebra Classroom. International Journal for Technology in Mathematics Education, 31(3), 107–116. https://doi.org/10.1564/tme_v31.3.01

Kurt, G., & Önel, F. (2025). Middle school students' basic geometric construction processes in a dynamic geometry environment. School Science and Mathematics. https://doi.org/10.1111/ssm.70001

Morales Méndez, G., & Lozano Avilés, A. B. (2025). Realidad aumentada y GeoGebra 3D para mejorar la inteligencia espacial en la enseñanza de la geometría volumétrica. Revista de Educación a Distancia (RED), 25(82). https://doi.org/10.6018/red.644051

Marwiang, M., Prasertsang, M., & Junpeng, P. (2025). Enhancing students' learning outcomes in mathematics through intelligent tutoring systems based on real-time feedback. Journal of Education and Learning, 14(6), 186–. https://doi.org/10.5539/jel.v14n6p186

Gong, X., Xu, W., Yu, S., Ma, J., & Qiao, A. (2025). Enhancing computational thinking and spatial reasoning skills in gamification programming learning: A comparative study of tangible, block and paper-and-pencil tools. British Journal of Educational Technology, 56(1), 1–23. https://doi.org/10.1111/bjet.13482

Sun, L., & Liu, J. (2025). Comparative study of CodeCombat-based Python programming and Scratch programming effects on sixth graders' computational thinking. Thinking Skills and Creativity, 57, 101848. https://doi.org/10.1016/j.tsc.2025.101848

Pielsticker, F. (2024). Aushandlungs- und Argumentationsprozesse fördern durch den Einsatz generativer KI-Sprachmodelle im Geometrieunterricht. mathematica didactica, 47. https://doi.org/10.18716/ojs/md/2024.1895

Parra, V., et al. (2024). Can generative AI solve geometry problems? Strengths and weaknesses of large language models for geometric reasoning. Journal of Artificial Intelligence in Education. https://doi.org/10.1007/s40593-024-00438-0

Sebsibe, A. S., et al. (2025). The effect of GeoGebra integrated instruction on students' learning of geometry. International Journal of Education in Mathematics, Science, and Technology, 13(2). https://doi.org/10.46328/ijemst.4706

5. Sekundarstufe II / AHS-Oberstufe (14–18 Jahre, Matura)

Geometrische Inhalte

Analytische Geometrie, Vektorrechnung, Kegelschnitte, darstellende Geometrie (je nach Schultyp), Trigonometrie, räumliches Denken. In der österreichischen Zentralmatura spielen geometrische Themen eine wesentliche Rolle — insbesondere Vektorrechnung und analytische Geometrie sind Prüfungsschwerpunkte.

KI-Tools auf diesem Niveau

Wolfram Alpha

De-facto-Standard für symbolische Berechnungen in der Oberstufe. Löst analytische Geometrieaufgaben, zeichnet Kurven, berechnet Schnittmengen, Abstände, Winkel. Seit 2023 mit natürlichsprachlicher Eingabe wesentlich zugänglicher. Der Vorteil gegenüber LLMs: Wolfram Alpha rechnet deterministisch-symbolisch und halluziniert nicht — ein entscheidender Unterschied für den Geometrieunterricht, wo Präzision zählt.

GeoGebra 3D und GeoGebra AI

Räumliche Geometrie visualisieren, Körper interaktiv drehen, Schnittebenen erkunden — GeoGebra 3D macht abstrakte Raumgeometrie greifbar. Die KI-Erweiterung (ab 2024) erklärt Konstruktionsschritte und generiert auf Wunsch Aufgaben. Die Kombination von LLM-basierter Erklärung (ChatGPT) mit CAS-basierter Verifikation (GeoGebra Discovery) ist dabei produktiver als isolierter LLM-Einsatz: ChatGPT für natürlichsprachliche Kommunikation, GeoGebra für zertifizierte, symbolische Beweise. Ein direkter Vergleich zeigt: GeoGebra Discovery beweist alle Testaufgaben korrekt, während ChatGPT in einem von drei Testfällen scheitert — beide Systeme sind komplementär, nicht konkurrierend (Botana, Recio & Vélez, 2024).

Das Kreuzprodukt als Beispiel für eine typische Oberstufenformel:

$\vec{n} = \vec{a} \times \vec{b} = \begin{vmatrix} \vec{e_1} & \vec{e_2} & \vec{e_3} \\ a_1 & a_2 & a_3 \\ b_1 & b_2 & b_3 \end{vmatrix}$

LLMs können diesen Zusammenhang erklären und anschaulich begründen — sind aber in der exakten Berechnung fehleranfällig: Geometrie ist der schwächste mathematische Inhaltsbereich für ChatGPT-4 (53 % Genauigkeit auf NAEP) und ChatGPT-4o (59 %) — weit hinter Algebra (Wei, 2024).

LLMs für Beweisführung und Argumentation

ChatGPT, Claude und Gemini können geometrische Aussagen in natürlicher Sprache diskutieren und Beweisideen skizzieren. Grenzen: Formale Beweisführung ohne Fehler gelingt nur selten; LLMs verlassen sich oft auf „Heuristiken und Trial-and-Error" statt rigoroser Deduktion (Li et al., 2024).

OpenAI o1 und Reasoning-Modelle

Mit der Einführung von OpenAI o1 (September 2024) und nachfolgenden Reasoning-Modellen verändert sich das Bild dramatisch. De Winter et al. (2024) von der TU Delft testeten o1-preview auf dem niederländischen VWO-Abschlussexamen in Mathematik B — einem Abitur-äquivalenten Prüfungsformat mit analytischer Geometrie, Trigonometrie und mehrstufigem Schlussfolgern, das der österreichischen Zentralmatura strukturell entspricht. Das Ergebnis: 76/76 und 74/76 Punkte auf zwei Prüfungsversionen — das 97,8. Perzentil im Vergleich zu 16.414 niederländischen Schüler:innen. GPT-4o erzielte auf denselben Prüfungen 66/76 und 62/76. Die zweite Prüfung stammte von nach dem Trainings-Cutoff — Memorierung ausgeschlossen.

Li et al. (2024) verglichen o1 und GPT-4o auf 60 Oberstufenaufgaben: Bei Standardberechnungen kaum Unterschied, bei Beweisaufgaben überlegene o1-Performanz — allerdings weiterhin mit systematischen Fehlern bei räumlicher Geometrie. Das chinesische Modell DeepSeek-R1 (Januar 2025) zeigt, dass der Wettbewerb global ist: MATH-500 (Wettbewerbsmathematik): 97,3 %, AIME 2024: 79,8 %, UK A-Level Mathematics 2025: 100 % — vollständig durch Reinforcement Learning ohne annotierte Chain-of-Thought-Daten trainiert (DeepSeek-AI, 2025). Die Implikation ist klar: Die Zentralmatura in der aktuellen Form ist für aktuelle Reasoning-Modelle kein Hindernis mehr. Das zwingt zu einer grundsätzlichen Überarbeitung der Prüfungsformate.

GeoGebra Discovery in der Oberstufe: Automatisierte Beweise als Lernwerkzeug

GeoGebra Discovery (Forschungsversion, Hauptentwickler Zoltán Kovács, JKU Linz) erlaubt vollständig automatisierte Beweisführung für elementar-euklidische Sätze — in unter einer Sekunde. Für die Oberstufe bietet das ein grundlegend neues didaktisches Szenario: Schüler:innen konstruieren geometrische Figuren, GeoGebra erkennt automatisch Relationen (Parallelität, Rechtwinkligkeit, Ko-Zirkularität) und zeigt vollständige Beweissequenzen an (Kovács et al., 2024).

Die neueste Entwicklung ist für das Curriculum direkt relevant: Bartha, Kerekes, Kovács et al. (2025) präsentieren ein System zur automatisierten Schwierigkeitsanalyse geometrischer Sätze (Annals of Mathematics and Artificial Intelligence) — das System bewertet, wie „überraschend" ein Satz relativ zu seinen Axiomen ist, und zeigt eine moderate Korrelation (r = 0,43) zwischen algebraischer und geometrischer Schwierigkeitsmessung. Das eröffnet die Möglichkeit, Geometrieaufgaben automatisch nach Schwierigkeitsgrad zu sortieren und adaptive Lernpfade zu generieren. Für das Oberstufenniveau — analytische Geometrie, Vektorrechnung, Koordinatengeometrie — bedeutet das: individualisierte Aufgabenfolgen ohne Mehraufwand für Lehrende.

Praktische Anwendungen zeigen die Reichweite: GeoGebra Discovery löst Aufgaben des Náboj-2023-Mathematikwettbewerbs automatisiert und entdeckt dabei Verallgemeinerungen über die ursprüngliche Aufgabe hinaus (Hota et al., 2024). Eine Aufgabe der österreichischen Mathematikolympiade 2023 wurde von GeoGebra Discovery vollständig bewiesen — ein direkter Anknüpfungspunkt für begabungsfördernde Oberstufenprogramme (Kovács et al., 2024b).

Neben dem kognitiven Kompetenzerwerb transformiert GeoGebra auch mathematische Haltungen: Eine qualitativ-quantitative Unterrichtsstudie in zwei Sekundarschulklassen (Romero Albaladejo & García López, 2024, Education and Information Technologies) dokumentiert, dass der Einsatz von GeoGebra die Haltungen Ausdauer, Präzision und — am ausgeprägtesten — Autonomie signifikant stärkt. Schüler:innen übernehmen zunehmend Eigenverantwortung für ihre Lernwege, statt Lösungen passiv entgegenzunehmen. Für österreichischen und deutschen Geometrieunterricht, der kompetenzorientiertes Lernen anstrebt, bietet dieser Befund eine empirische Basis für die didaktische Entscheidung zugunsten explorativer GeoGebra-Umgebungen.

Computational Thinking in der Oberstufe

Die Verknüpfung von KI-Werkzeugen mit Computational Thinking gewinnt in der Oberstufe an Bedeutung. Yunianto et al. (2025) von der Forschungsgruppe Zsolt Lavicza (JKU Linz) präsentieren ein vollständiges Modell: GeoGebra-Konstruktionsaufgaben werden mit ChatGPT-gestützten Reflexionsphasen kombiniert, um Computational-Thinking-Kompetenzen systematisch zu fördern. Das Modell basiert auf Educational Design Research mit 16 Sekundarstufen-Schüler:innen und dokumentiert: Das Debuggen fehlerhafter ChatGPT-generierter GeoGebra-Befehle fördert algorithmisches Denken, Dekomposition und Mustererkennung (Yunianto et al., 2024, 2025). Schüler:innen lernen nicht nur, KI zu nutzen, sondern grundlegende Konzepte dahinter zu verstehen — ein Ziel, das die GDM explizit als Forschungsprioritär einfordert (Buchholtz et al., 2024). Ein PRISMA-konformes Systematic Literature Review über 30 Artikel zu CT-Integration im Mathematikunterricht der Sekundarstufe (Ruiz Recio, Molina-Ayuso & Adamuz-Povedano, 2026, Review of Education) bestätigt: Geometrie ist der dominante Inhaltsbereich bei CT-Integration; 73 % der relevanten Publikationen stammen aus 2022–2025; das Haupthindernis bleibt fehlendes fachspezifisches TPACK — Lehrende können CT verstehen, aber nicht in geometrische Unterrichtssequenzen übersetzen.

Eine konkrete Umsetzung für den Analysisunterricht liefert eine sechsstündige GeoGebra-Intervention mit 16- bis 17-Jährigen (Freudenthal-Institut, Niederlande; Chytas et al., 2024, Digital Experiences in Mathematics Education): Schüler:innen schrieben GeoGebra-Skripte zur Untersuchung von Ableitungen und Kurvendiskussionen und lösten CT-eingebettete Aufgaben. Die Mehrheit bewältigte die Aufgaben erfolgreich und bewertete den explorativen Ansatz positiv — ein direkt übertragbares Szenario für den Analysisunterricht der österreichischen Oberstufe.

Matura und KI: eine strukturelle Herausforderung

Die österreichische Zentralmatura verbietet derzeit den Einsatz von Internetverbindungen — damit sind LLMs während der Prüfung ausgeschlossen. Gleichzeitig wächst der Druck, Aufgabenformate zu überdenken.

Dies betrifft insbesondere:

Standardaufgaben (Berechnungen von Abständen, Winkeln, Schnittpunkten): Diese löst ChatGPT-4o mit ca. 59–79 % Genauigkeit je nach Aufgabentyp (Wei, 2024) — problematisch für Hausaufgaben und Schularbeiten.
Begründungsaufgaben: Hier zeigen LLMs strukturell mehr Schwächen; formale Beweisführung ohne spezialisierte Systeme bleibt fehleranfällig (Frieder et al., 2023).
Offene Modellierungsaufgaben: Diese sind am ehesten KI-resistent, da sie individuellen Kontext und Kreativität erfordern.

Die Diskussion über KI-resistente Prüfungsformate ist international im Gange. Möglichkeiten: stärkere Gewichtung von Prozessdokumentation, mündlichen Prüfungen, dynamischen GeoGebra-Assessments mit zufallsgenerierten Parametern und individuellen Projektarbeiten.

Geraniou und Nardi (2024) analysieren in Digital Experiences in Mathematics Education, wie KI auf kognitiv anspruchsvolle Sekundaraufgaben reagiert — und kommen zu dem Schluss, dass einfache Verbote keine Lösung sind. Stattdessen brauche es pädagogische Strategien, die KI als Lernpartner einsetzen, ohne Prüfungsintegrität zu gefährden. Khlaif et al. (2025) entwickeln aus Befragungen von 61 Lehrenden ein Vier-Phasen-Modell: Against (Verbote), Avoid (KI-sichere Formate), Adopt (KI integrieren), Explore (neue Prüfungskonzepte) — ein pragmatisches Navigationsmodell für die Praxis.

Konkrete technische Lösungen liegen bereits vor: Hamady et al. (2024) demonstrieren, dass animierte GeoGebra-Applets in Moodle signifikant bessere Lernleistungen erzielen als statische Geometrieaufgaben — und gleichzeitig ein Format bieten, das aktuelle KI-Systeme nicht trivial bearbeiten können. Csiba und Vajo (2024) zeigen, wie zufallsgenerierte, automatisch bewertete Geometrie-Konstruktionsaufgaben in Moodle integriert werden können — ein Format, das aktuelle KI-Systeme nicht zuverlässig lösen können, da die Parameter jedes Mal neu generiert werden. Schorcht et al. (2024) analysieren in einer groß angelegten Studie (N = 1.080 Modellvalidierungen), wie unterschiedliche Prompt-Techniken die Qualität KI-gestützter Lösungen beeinflussen — mit direkten Konsequenzen für das Design von Prüfungsaufgaben im KI-Zeitalter. Walkington (2025) argumentiert in einer Überblicksarbeit gegen einfache KI-Verbote und plädiert für pädagogische Strategien, die KI als Lernwerkzeug in den Geometrieunterricht integrieren, statt sie aus dem Klassenzimmer auszuschließen.

Medina Herrera, Juárez Ordóñez und Ruiz-Loza (2024, Frontiers in Education) geben einen umfassenden Überblick über räumliche Visualisierungswerkzeuge im Mathematikunterricht — von VR-Umgebungen über 3D-Druck bis zu dynamischer Geometriesoftware. Ihr zentraler Befund: Räumliches Denken ist nicht nur ein Lernziel, sondern auch ein Lerneinstieg — Werkzeuge, die Lernenden erlauben, Perspektiven zu wechseln und Objekte zu rotieren, fördern gleichzeitig das geometrische Verständnis und die kognitive Flexibilität. Für die Oberstufe (analytische Geometrie, Vektorrechnung, Raumgeometrie) sind GeoGebra 3D und AR-Systeme die direkteste Umsetzung dieses Ansatzes.

AR und GeoGebra 3D für räumliche Geometrie in der Oberstufe: Eine Aktionsforschungsstudie aus Vietnam (Pham et al., 2026, Open Education Studies) belegt mit starker Effektgröße (Cohen's d = 1,24), dass GeoGebra 3D im AR-Modus das Verständnis räumlicher Geometriekonzepte (Parallelprojektion, Senkrechtprojektion) in Klasse 11 deutlich verbessert — die Experimentalgruppe (n=32) erzielte 8,2/10 Punkte im Nachtest gegenüber 6,5/10 in der Kontrollgruppe (n=40). Das zeigt: Die Kombination von GeoGebra 3D mit AR-Visualisierung macht abstrakte Raumgeometriekonzepte auch ohne physische Modelle zugänglich und ist für die österreichische Oberstufe ein unmittelbar einsetzbares Werkzeug.

Didaktische Szenarien für die Oberstufe

Szenario A — Verifikation mit zwei Systemen: Schüler:innen lösen eine Vektorraumaufgabe zunächst von Hand, überprüfen dann mit Wolfram Alpha (symbolisch-deterministisch) und befragen ChatGPT nach dem „Warum". Die drei Ergebnisse werden verglichen und Diskrepanzen diskutiert — ein explizites Übungsfeld für kritisches KI-Denken.

Szenario B — Beweis-Scaffolding: LLMs werden nicht zur direkten Lösungsgenerierung eingesetzt, sondern als Sokrates-Tutor: Die Lehrperson konfiguriert einen System-Prompt, der das LLM anweist, nur Gegenfragen zu stellen. Schüler:innen entwickeln geometrische Beweise Schritt für Schritt im Dialog — die KI liefert Orientierung ohne fertige Antworten (Bastani et al., 2025).

Szenario C — Matura-Vorbereitung mit Fehleranalyse: Schüler:innen nutzen ChatGPT zur Diagnose eigener Fehler in gelösten Matura-Altaufgaben. Das System markiert Schwachstellen im Lösungsweg und empfiehlt gezielte Übungen — ohne die Matura-Aufgabe direkt zu lösen. Dieses Format ist prüfungskonform und fördert gleichzeitig Metakognition (Buchholtz et al., 2024).

Szenario C2 — Adaptiver Lernpfad analytische Geometrie: Barana et al. (2024, CSEDU) entwickelten und erprobten einen adaptiven Lernpfad zur analytischen Geometrie (Kreise als geometrische Örter) für die Klasse 11 mit automatisierter formativer Bewertung: Nach jeder Antwort erhalten Schüler:innen schrittweise Lösungsanleitungen oder Zusatzaufgaben je nach Leistungsstand. Im quasi-experimentellen Design erzielte die Treatmentgruppe +11 Punkte im Nachtest. Das Format ist direkt in GeoGebra oder ähnliche Plattformen übertragbar und zeigt: Adaptivität muss nicht komplex sein — bereits schrittweise Feedbackschleifen mit intelligenter Aufgabenauswahl genügen für messbare Lerneffekte.

Szenario D — Problem Posing in der Lehrerbildung: Angehende Gymnasiallehrkräfte entwickeln mithilfe generativer KI selbst Mathematikaufgaben — und erwerben dabei messbar tiefere didaktische Kompetenz (TPACK). Segal und Biton (2024, IJEMST) zeigen in einer Studie mit 15 angehenden Mathematiklehrkräften: Wer ChatGPT zur Aufgabenentwicklung einsetzt und dabei kontinuierlich reflektiert, entwickelt nicht nur bessere Aufgaben, sondern auch differenzierteres Verständnis für Aufgabenqualität und didaktische Passung. Kim, Park und Joung (2026, School Science and Mathematics) bestätigen diesen Befund für Lehramtsstudierende: Gezielte Scaffolding-Strategien beim KI-gestützten Problem Posing führen zu kritischer Distanz gegenüber dem Tool — ein zentrales Ziel der Lehrkräfteausbildung im KI-Zeitalter. Das Szenario ist unmittelbar in die Fachdidaktikausbildung übertragbar.

Literatur (Sekundarstufe II)

Barana, A., Fissore, C., Marchisio Conte, M., & Tassone, M. (2024). Shaping an adaptive path on analytic geometry with automatic formative assessment and interactive feedback. In Proceedings of the 16th International Conference on Computer Supported Education (pp. 248–257). SCITEPRESS. https://doi.org/10.5220/0012627900003693

Botana, F., Recio, T., & Vélez, M. P. (2024). On using GeoGebra and ChatGPT for geometric discovery. Computers, 13(8), 187. https://doi.org/10.3390/computers13080187

Frieder, S., Pinchetti, L., Chevalier, A., Griffiths, R.-R., Salvatori, T., Lukasiewicz, T., Petersen, P. C., & Berner, J. (2023). Mathematical capabilities of ChatGPT. NeurIPS 2023 Datasets and Benchmarks Track. https://doi.org/10.48550/arXiv.2301.13867

Li, L., Luo, Y., & Pan, T. (2024). OpenAI o1 AB testing: Does the o1 model really do good reasoning in math problem solving? arXiv:2411.06198.

Wei, X. (2024). Evaluating ChatGPT-4 and ChatGPT-4o. Frontiers in Education, 9, 1452570. https://doi.org/10.3389/feduc.2024.1452570

Csiba, P., & Vajo, P. (2024). Problems and challenges of using randomized automatically evaluating geometric construction problems in Moodle LMS. AIMS Mathematics, 9(3), 5234–5249. https://doi.org/10.3934/math.2024253

Schorcht, S., Buchholtz, N., & Baumanns, L. (2024). Prompt the problem: Investigating the mathematics educational quality of AI-supported problem solving by comparing prompt techniques. Frontiers in Education, 9, 1386075. https://doi.org/10.3389/feduc.2024.1386075

Walkington, C. (2025). Implications of generative AI for secondary mathematics education. School Science and Mathematics. https://doi.org/10.1111/ssm.18356

Khlaif, Z. N., Alkouk, W. A., Salama, N., & Abu Eideh, B. (2025). Redesigning assessments for AI-enhanced learning: A framework for educators in the generative AI era. Education Sciences, 15(2), 174. https://doi.org/10.3390/educsci15020174

Maskos, K., Schulz, A., & Oeksuez, S. S. (2025). Formative assessment in mathematics education: A systematic review. ZDM – Mathematics Education, 57, 679–693. https://doi.org/10.1007/s11858-025-01696-x

Hamady, S., Mershad, K., & Jabakhanji, B. (2024). Multi-version interactive assessment through the integration of GeoGebra with Moodle. Frontiers in Education, 9, 1466128. https://doi.org/10.3389/feduc.2024.1466128

Yunianto, W., Galiç, S., Lavicza, Z., & Urhan, S. (2025). A model for computational thinking development in GeoGebra with the support of ChatGPT. Computers in the Schools. Advance online publication. https://doi.org/10.1080/07380569.2025.2544062

Hota, A., Kovács, Z., & Vujic, A. (2024). Solving some geometry problems of the Náboj 2023 contest with automated deduction in GeoGebra Discovery. ADG 2023, EPTCS 398, 110–123. https://doi.org/10.48550/arXiv.2401.13703

Kovács, Z., Recio, T., & Vélez, M. P. (2024b). Solving with GeoGebra Discovery an Austrian Mathematics Olympiad problem: Lessons learned. ADG 2023, EPTCS 398. https://doi.org/10.48550/arXiv.2401.11906

Bartha, S., Kerekes, A., Kovács, Z., Kovács, Z., & Recio, T. (2025). Automated analysis of the difficulty of secondary school geometry theorems. Annals of Mathematics and Artificial Intelligence, 93, 1011–1033. https://doi.org/10.1007/s10472-025-09983-9

Pham, S. N., Le, H. T., Pham, T. T. T., & Schmid, A. (2026). Augmented reality as a supporting tool for building mathematical knowledge: The case of parallel projection, perpendicular projection, and representation of a figure in space. Open Education Studies, 8(1), 20250118. https://doi.org/10.1515/edu-2025-0118

Medina Herrera, L. M., Juárez Ordóñez, S., & Ruiz-Loza, S. (2024). Enhancing mathematical education with spatial visualization tools. Frontiers in Education, 9, 1229126. https://doi.org/10.3389/feduc.2024.1229126

DeepSeek-AI, Guo, D., Yang, D., Zhang, H., et al. (2025). DeepSeek-R1: Incentivizing reasoning capability in LLMs via reinforcement learning. arXiv:2501.12948. https://arxiv.org/abs/2501.12948

Kuusemets, L., Parve, K., Ain, K., & Kraav, T. (2024). Assessing AI-generated (GPT-4) versus human created MCQs in mathematics education: A comparative inquiry into vector topics. International Journal of Education in Mathematics, Science and Technology (IJEMST), 12(6), 1538–1558. https://doi.org/10.46328/ijemst.4440

Segal, R., & Biton, Y. (2024). The contribution that utilizing generative AI for problem posing makes to pre-service high school mathematics teachers' TPACK. International Journal of Education in Mathematics, Science and Technology (IJEMST), 12(6), 1559–1582. https://doi.org/10.46328/ijemst.4591

Ruiz Recio, M. I., Molina-Ayuso, Á., & Adamuz-Povedano, N. (2026). Integrating computational thinking into secondary school mathematics teaching: A literature review. Review of Education, 14, e70142. https://doi.org/10.1002/rev3.70142

Kim, Y. R., Park, M. S., & Joung, E. (2026). Exploring the integration of artificial intelligence in math education: Preservice teachers' experiences and reflections on problem-posing activities with ChatGPT. School Science and Mathematics. https://doi.org/10.1111/ssm.18336

Chytas, C., van Borkulo, S. P., Drijvers, P., Barendsen, E., & Tolboom, J. L. J. (2024). Computational thinking in secondary mathematics education with GeoGebra: Insights from an intervention in calculus lessons. Digital Experiences in Mathematics Education, 10(2), 228–259. https://doi.org/10.1007/s40751-024-00141-0

Romero Albaladejo, I. M., & García López, M. (2024). Mathematical attitudes transformation when introducing GeoGebra in the secondary classroom. Education and Information Technologies, 29, 10277–10302. https://doi.org/10.1007/s10639-023-12085-w

6. Hochschule und Lehramtsstudium

Geometrie im Studium

An Universitäten und Pädagogischen Hochschulen umfasst Geometrie: Euklidische und nicht-euklidische Geometrie, projektive Geometrie, Differentialgeometrie, Topologie, sowie fachdidaktische Anteile für Lehramtsstudierende. KI-Systeme treten hier auf zwei Ebenen in Erscheinung: als Forschungswerkzeug und als Unterrichtsgegenstand der Ausbildung.

Die Benchmark-Revolution: Von AlphaGeometry zu Aristotle

Die Entwicklung seit 2024 markiert eine beispiellose Beschleunigung in der formalen Geometrie:

AlphaGeometry (Januar 2024): Löst 25 von 30 IMO-Geometrieproblemen — Goldmedaillen-Niveau (Trinh et al., 2024)
AlphaGeometry 2 (Februar 2025): Löst 84 % aller IMO-Geometrieprobleme 2000–2024 (Chervonyi et al., 2025)
AlphaProof (IMO 2024, Nature 2025): Silbermedaillen-Niveau gesamt (4/6 Aufgaben), darunter die schwerste des Jahrgangs (Hubert et al., 2025)
Aristotle / Harmonic Team (IMO 2025): 5 von 6 Problemen — erstmals Goldmedaillen-Niveau mit vollständig verifizierten Lean 4 Beweisen (Achim et al., 2025)
TongGeometry (BIGAI/Peking University, 2024): Chinesisches neuro-symbolisches System, das AlphaGeometry auf eigenen Benchmarks übertrifft und als einziges System nicht nur Beweise führt, sondern neue olympiadische Aufgaben generiert — drei davon erschienen 2024 in einem US-Olympiad und dem chinesischen nationalen Qualifikationsexamen (BIGAI, 2024)

Vuong und Ho (2024) stellen in AI & Society die fundamentale Frage: Wenn KI IMO-Geometrie auf Goldniveau beweist — ist das der Beginn vom Ende der Mathematikausbildung? Ihre Antwort ist differenziert: Es ist ein Ruf zur dringenden Neuorientierung der Bildungsziele, nicht das Ende der Mathematik als Kulturgut. Ähnlich argumentieren Naskręcki und Ono (2025) in Nature Physics: KI reshapes mathematical research practice — und damit Bildungsziele — aber der Zweck von Wissenschaft bleibt menschlich, nicht algorithmisch.

KI-Tools auf Hochschulniveau

Formale Beweisassistenten

Lean 4 / Mathlib: Open-Source-System für formale Mathematik. LeanEuclid (ICML 2024) formalisierte erstmals Euklids Elemente vollständig in Lean 4 — ein Benchmark für automatische Formalisierung euklidischer Geometrie. Dabei wurden bislang unbekannte Lücken in Euklids Originalbeweisen sichtbar (Murphy et al., 2024). KI-Copiloten (LeanCopilot) unterstützen beim Schreiben formaler Beweise; GPT-4 erreichte 23,1 % korrekte Formalisierungen auf dem LeanEuclid-Benchmark.
Coq, Isabelle: Etablierte Systeme mit langjähriger Tradition; weniger zugänglich, aber wissenschaftlich anerkannt.

Automatisiertes Beweisen in der 3D-Raumgeometrie

Die meisten formalen Geometriebeweissysteme operieren in der Ebene (2D). Simić, Stojanović-Đurđević und Tanasijević (2025) erweitern in den Annals of Mathematics and Artificial Intelligence diesen Ansatz auf dreidimensionale Raumgeometrie: Ihr System beweist Sätze über Quader, Pyramiden, Prismen und Zylinder automatisch — durch Reduktion auf algebraische Beschreibungen und anschließende symbolische Verifikation. Für die Hochschullehre eröffnet das neue Möglichkeiten: Raumgeometrische Konfigurationen, die Studierende bisher nur zeichnerisch oder verbal beweisen konnten, werden nun formal verifizierbar. Die Autoren zeigen an konkreten Beispielen aus der universitären Raumgeometrie, wie ihr Ansatz direkt in Lehrveranstaltungen einsetzbar ist — ein erster Schritt hin zu verifikationsgestütztem Raumgeometrielernen auf Hochschulniveau.

Lean 4 in der universitären Mathematikausbildung: erste Evidenz

Der erste kontrollierte Versuch, Lean 4 als Pflichtbestandteil in einem Hochschulkurs einzusetzen, liefert überraschend starke Befunde: Bottoni, Cattaneo und Sacikara (2025, Universität Zürich) erprobten Lean 4 in einem 11-wöchigen Kurs „Grundlagen der Mathematik" (Pflichtveranstaltung für Mathematik-Erstsemester). Studierende in der Lean-Gruppe (n=5) erzielten in der Abschlussprüfung im Median 46/60 Punkte gegenüber 34.9/60 in der Kontrollgruppe (n=52) — ein statistisch signifikanter Unterschied (t-Test p = 0,006). Die Autor:innen weisen explizit auf die kleine Stichprobengröße hin und mahnen zur Vorsicht bei der Generalisierung. Dennoch ist dies die erste publizierte quantitative Evidenz für den Einsatz von Lean 4 im regulären europäischen Hochschulunterricht.

Hanna, Larvor und Yan (2024, ZDM – Mathematics Education) ergänzen diese Evidenz mit einer philosophisch-didaktischen Perspektive: Lean im Hochschulunterricht verändert nicht nur die Arbeitsweise beim Beweisen, sondern auch die Vorstellungen der Studierenden davon, was ein Beweis ist. Die Autorinnen und Autoren dokumentieren, dass formale Systeme den Blick für logische Lücken schärfen — aber die Gefahr birgt, dass Formalisierung mit Verstehen gleichgesetzt wird. Das macht explizite semiotische Reflexion im Unterricht notwendig.

Für TU Graz und PH Graz bedeutet das: Der Einstieg in formale Beweisumgebungen muss nicht an der Hochschule beginnen — GeoGebra Discovery bietet eine schulstufen-adäquate Brücke — aber die Hochschule ist der natürliche Ort, an dem das Potenzial vollständig ausgeschöpft werden kann. Die Kombination GeoGebra Discovery (SEK II) → Lean 4 (Hochschule) ist ein strukturierter Ausbildungspfad hin zu verifikationsgestütztem mathematischen Denken.

GeoGebra Discovery an der Hochschule

GeoGebra Discovery ermöglicht automatisierte Beweisführung für elementar-euklidische Sätze: Der ShowProof-Befehl zeigt vollständige Beweissequenzen; ein Schwierigkeitswert bewertet den „Überraschungsgrad" eines Satzes relativ zu seinen Voraussetzungen. Hauptentwickler Zoltán Kovács forscht an der Johannes Kepler Universität Linz — Österreich hat damit direkten Anschluss an die internationale Forschungsfront (Kovács et al., 2024). Praktische Anwendungen zeigen: GeoGebra Discovery löst Probleme des Náboj-2023-Wettbewerbs automatisiert und entdeckt dabei Verallgemeinerungen, die über die ursprüngliche Aufgabenstellung hinausgehen (Hota et al., 2024). Gleiches gilt für ein Problem der österreichischen Mathematikolympiade 2023 — eine direkte Relevanz für österreichische Hochschulausbildung (Kovács et al., 2024b).

Neuere Arbeiten erweitern die Möglichkeiten: GeoGebra Discovery kann halbfertige Geometrieaussagen automatisch vervollständigen und fehlende Beweisschritte ergänzen — ein direktes Scaffold-Werkzeug für Hochschullehre und Lehramtsausbildung (Kovács et al., 2024c). Die Schwierigkeit geometrischer Sekundarschulsätze lässt sich nun automatisiert analysieren und für adaptives Lernen und Curriculum-Design nutzen (Kovács et al., 2025).

Die Kombination von GeoGebra Discovery und ChatGPT zeigt besonderes Potenzial: GeoGebra führt zertifizierte, symbolische Beweise durch; ChatGPT interpretiert natürlichsprachliche Eingaben und erklärt Beweisideen. Beide Systeme scheitern allein an bestimmten Problemen — gemeinsam decken sie mehr ab (Botana et al., 2024).

Wie Studierende GeoGebra kognitiv nutzen, untersucht eine Eye-Tracking-Studie von Türkoğlu und Yalçinalp (2024, Education and Information Technologies, Springer): Acht Erstsemester-Mathematikdidaktik-Studierende bearbeiteten Geometrieaufgaben in GeoGebra, während ihre Augenbewegungen aufgezeichnet wurden. Analysiert nach Polyas Problemlösephasen zeigt sich: Studierende, die mehr Zeit in der Verstehens- und Planungsphase verbrachten, waren signifikant erfolgreicher. Der Lernstil „Converger" korrelierte mit aktiverer Nutzung des Eingabefelds — ein Indikator für tieferes Explorationsverhalten. Die Studie verbindet quantitative Blickdatenmessung mit qualitativer Analyse und liefert konkrete Ansätze für Learning-Analytics-gestützte Diagnose im GeoGebra-Hochschulunterricht.

Ein konkretes Unterrichtsbeispiel für die Sekundarstufe II, das an der Pädagogischen Hochschule Linz entwickelt wurde, liefern Käferbock und Kovács (2024, EPTCS – Automated Deduction in Geometry): Ausgehend von einem Schaukelpferd in einem Medizinzentrum in Freistadt entwickeln die Autoren ein Schulprojekt, in dem GeoGebra Discovery falsche Vermutungen automatisch widerlegt und korrekte geometrische Orts-Beweise generiert. Das Format verbindet entdeckendes Lernen mit automatisierter Verifikation und zeigt, wie ATP-gestützte Geometrie bereits auf Sekundarstufen-Niveau didaktisch zugänglich ist — ein Beispiel aus dem österreichischen Bildungskontext, das direkt auf die Ausbildungssituation an PH Graz und TU Graz übertragbar ist.

Wie GeoGebra Discovery in der Lehramtsausbildung outdoor eingesetzt werden kann, demonstrieren Martínez-Zarzuelo et al. (2025, Education Sciences): Angehende Lehrende nutzten GeoGebra Discoverys Automated Reasoning Tools (ART) außerhalb des Klassenraums, um geometrische Eigenschaften in der realen Umgebung zu entdecken und automatisiert zu beweisen. Das Format — Fieldwork + formale Geometrie — verbindet geometrisches Sehen mit algorithmischer Verifikation und bietet ein innovatives Modell für die Lehramtsausbildung an PH und Universität.

Die Autoformalisierung — automatische Übersetzung informaler Mathematik in formal verifizierbare Lean-Repräsentationen — macht 2025 erhebliche Fortschritte: Gao et al. (2025, ICLR) entwickeln mit Herald einen Datensatz von 580.000 Lean-4-Aussagen und 44.000 NL-FL-Theorempaaren aus Mathlib4; der Herald Translator erreicht 96,7 % Genauigkeit (Pass@128) auf miniF2F. Lin et al. (2025, ICLR) zeigen mit Lean-STaR, dass das Verschränken informaler Denkschritte mit formalen Beweisschritten die Performanz auf 46,3 % (Pass@64) auf miniF2F hebt. Tsoukalas et al. (2024, NeurIPS) zeigen mit PutnamBench zugleich die verbleibende Lücke: Kein SOTA-System löst mehr als eine Handvoll der 640 formalisierten Putnam-Wettbewerbsaufgaben — Undergraduate-Wettkampfmathematik bleibt eine offene Herausforderung für neuronale Beweissysteme.

LLMs in der Hochschulmathematik

LLMs wie GPT-4, Claude oder Gemini werden als Recherche- und Explorationswerkzeuge eingesetzt — bei gleichzeitiger kritischer Prüfung der Ausgaben. Eine Delphi-Studie mit 34 Teilnehmenden aus 23 Institutionen identifizierte 41 prioritäre Forschungsfragen zu generativer KI in der Hochschulmathematik, darunter: Wie können Lehrende KI-Outputs kritisch beurteilen? Wie ändern sich Beweisaufgaben? (Iannone et al., 2025).

Die erste publizierte empirische Erhebung zur KI-Nutzung im Mathematikstudium im DACH-Raum zeigt: KI ist bereits Teil der studentischen Lebenswelt — mit erheblichen Ausbildungsbedarfen für reflektierten Umgang (Tröbelsberger et al., 2025). Empirisch zeigen Studien, dass KI-Tutoring auf Hochschulniveau sogar best-practice Präsenzunterricht übertreffen kann: Ein crossover-RCT mit 194 Physikstudierenden zeigte, dass KI-Tutor-Gruppen signifikant besser abschnitten als Gruppen mit Peer Instruction und Kleingruppen — und mehr lernten in weniger Zeit (Kestin et al., 2025).

Eine grundlegende methodische Erkenntnis für die Hochschullehre liefern Collins et al. (2024, PNAS): Auf der interaktiven Plattform CheckMate testeten echte Mathematiker:innen GPT-4, ChatGPT und InstructGPT beim Beweisen von Undergraduate-Sätzen. Das überraschende Ergebnis: Statische Benchmarks (wie MATH-500) unterschätzen die Fähigkeiten von LLMs systematisch — im interaktiven Dialog, mit Rückfragemöglichkeit, performen sie deutlich besser als in one-shot-Szenarien. Für die Hochschuldidaktik bedeutet das: Der sinnvolle Einsatz von LLMs beim Beweisen liegt im dialogischen Modus — Lernende führen eine Unterhaltung mit dem Modell und prüfen kritisch jeden Schritt, statt die Ausgabe als fertige Lösung zu übernehmen.

Zwei neue empirische Studien liefern wichtige Befunde zur KI-Nutzung in beweisfokussierten Kursen: Klawa, Rajpal und Thomas (2025, arXiv) untersuchten in einer Pilotstudie über drei Undergraduate-Kurse (abstrakte Algebra, Topologie) Nutzungsmuster und Wahrnehmungen generativer KI. Studierende schätzten KI als Erklärwerkzeug, bezweifelten aber ihre Verlässlichkeit bei formalen Beweisen — ein Muster, das auf wachsende Medienkompetenz hindeutet. Chen et al. (2025, arXiv) gingen einen Schritt weiter: In einem kontrollierten Experiment mit 148 Studierenden verbesserte ein KI-Tutor (Beweis-Reviewer + Chatbot) zwar die Hausaufgabenleistung signifikant, zeigte jedoch keinen Effekt auf Prüfungsnoten. Kritisch: Studierende mit geringer Selbstwirksamkeit nutzten den Chatbot häufiger — und erzielten schwächere Klausurergebnisse. Dieses Muster des abhängigen Delegierens ist konsistent mit den Befunden aus dem Sekundarbereich (Bastani et al., 2025).

Wie Studierende dabei tatsächlich vorgehen, untersuchten Yoon et al. (2024, ZDM) in einer qualitativen Studie mit drei Undergraduate-Studierenden beim Beweisen mit generativer KI. Ihr Rahmenmodell SIPE-AI (Students' Interactive Proving Experience with AI) identifiziert drei Einflussfaktoren: Beweiskonzeptionen (was zählt als Beweis?), KI-Konzeptionen (was kann/darf die KI?) und ethische Überlegungen (wann ist es noch mein Beweis?). Geometrische Beweise sind dabei besonders herausfordernd, weil Studierende die Plausibilität einer KI-Antwort nicht ohne geometrische Fachkenntnis beurteilen können.

Wie Studierende Interactive Theorem Provers (ITPs) wahrnehmen, untersuchen Iannone und Thoma (2025, Digital Experiences in Mathematics Education): Ein zentraler Befund — Studierende empfanden den Einsatz von ITPs als »Mogeln« („It Feels Like Cheating"). Dieses Erleben ist kein Marginalphänomen: Es reflektiert tiefe Fragen zur mathematischen Identität — was zählt als mein Beweis? — und zur Beweiskultur an der Hochschule. Die Autoren plädieren für explizite Reflexion über den epistemologischen Status formaler Verifikation im Mathematikstudium. Dies ergänzt den Befund von Yoon et al. (2024), dass Studierende beim KI-assistierten Beweisen zwischen Konzeption, Exploration und Delegation abwägen müssen.

Ein emerging area an der Grenze von Hochschuldidaktik und KI-Technologie sind verkörperte KI-Agenten in Mixed Reality: Nguyen, Gul, Dang, Huynh und Tuunanen (2025, Innovations in Education and Teaching International, Vol. 62, S. 1632–1647) untersuchen, wie embodied generative AI in immersiven Mixed-Reality-Umgebungen aktives Lernen in der Hochschule unterstützen kann. Die Studie zeigt, dass verkörperte KI-Agenten — die auf Studierendenhandlungen und Raumgesten reagieren — Engagement und selbstreguliertes Lernen fördern können. Für die Geometrielehre eröffnet das Perspektiven: Studierende könnten 3D-geometrische Objekte gemeinsam mit KI-Agenten explorieren, die Feedback auf Gesten und räumliche Konstruktionen geben.

Die Stimmungslage an Hochschulen ist ambivalent: Gkrekas und Rizos (2025, Heliyon) befragten Studierende, Lehrpersonal und Forschende an drei griechischen Universitäten. Studierende zeigen moderate Zufriedenheit mit LLMs; Lehrpersonen und Forschende hingegen deutliche Skepsis — insbesondere wegen Verlässlichkeit und akademischer Integrität. Ähnliche Befunde sind aus dem deutschsprachigen Raum zu erwarten.

Besondere Relevanz: Lehramtsstudium an TU Graz und PH Graz

Lehramtsstudierende müssen nicht nur Fachwissen erwerben, sondern auch reflektiert mit KI umgehen können. Eine explorative Studie mit 162 angehenden Primarstufen-Lehrenden zeigte: Die meisten nutzten ChatGPT für geometrische Beweise in oberflächlicher Weise, hatten begrenzte Vorerfahrungen und entwickelten häufig Misskonzeptionen über die Zuverlässigkeit des Systems (Dilling & Herrmann, 2024). Das ist besonders beunruhigend, weil diese Personen in wenigen Jahren Geometrieunterricht für Tausende Schüler:innen gestalten werden.

Die erste publizierte empirische Erhebung zur KI-Nutzung im Mathematikstudium im DACH-Raum (Tröbelsberger et al., 2025, DMVM) bestätigt: KI ist bereits Teil der studentischen Lebenswelt. Studierende nutzen sie für Hausaufgaben, Prüfungsvorbereitung und das Verstehen komplexer Beweisschritte — oft ohne kritische Reflexion über Grenzen und Fehlerquellen. Der Ausbildungsbedarf ist erheblich.

Die PH Graz und TU Graz stehen vor der Aufgabe, eine KI-Kompetenz in die Ausbildung zu integrieren, die über reines Tool-Wissen hinausgeht. In Österreich wurden bereits Fortbildungscurricula entwickelt, die auf dem 4C-Rahmen basieren (Critical Thinking, Creativity, Collaboration, Communication; BMB, 2024). Die PH Wien hat ein 32-seitiges Positionspapier veröffentlicht, das institutionelle Leitlinien für den Umgang mit KI in der Hochschullehre und Lehrer:innenbildung enthält (PH Wien, 2024). Das KIMADU-Projekt in NRW (Universität Siegen, 25 Schulen, Laufzeit 2025–2027) ist das bislang größte empirische Lehrprojekt, das generative KI explizit im Geometrieunterricht erprobt und gleichzeitig Lehrende in der reflektierten Nutzung ausbildet (Witzke & Steinhoff, 2025) — ein Modell, das für Österreich adaptiert werden könnte. Das Vorläuferprojekt KI@school (Stiftung Bildungspakt Bayern / Universität Siegen, 2022–2027) liefert erste Daten zu Lehrkraftperspektiven und Professionalisierungswegen: Unterrichtsnahe, konkrete Fortbildungsformate erweisen sich als deutlich wirksamer als abstrakte Workshops (Huget et al., 2025).

Dass der Zusammenhang von CT und geometrischem Denken bereits in der frühkindlichen Lehramtsausbildung gezielt genutzt werden kann, zeigt eine Studie aus Spanien (Sala-Sebastià, Breda & Font, 2025, Education and Information Technologies, N=42): Angehende Frühpädagogik-Lehrkräfte programmierten in drei Phasen (Erkunden, Programmieren, Reflektieren) mit dem Roboter MatataLab grundlegende geometrische Figuren. Die Analyse zeigt, wie Drag-and-Drop-Robotik-Programmierung gleichzeitig CT-Kompetenz und geometrisches Denken aktiviert — ein Modell für lehramtsdidaktische Veranstaltungen, die beide Kompetenzbereiche verbinden wollen.

Was Lehramtsstudierende für den Geometrieunterricht brauchen

Der UNESCO AI Competency Framework for Teachers (Miao & Cukurova, 2024) strukturiert diese Anforderungen international: Er definiert Kompetenz in drei Stufen (Understand, Apply, Create) und fünf Bereichen — darunter KI-Ethik, pädagogische KI-Nutzung und Datenpraktiken. Dieser Rahmen bietet eine Orientierung für die Curricula-Entwicklung an PH Graz und TU Graz.

Eine differenzierte KI-Kompetenz für angehende Mathematiklehrende umfasst vier Dimensionen:

Werkzeugkompetenz: Sicherer Umgang mit GeoGebra AI, GeoGebra Discovery, Wolfram Alpha und LLMs — nicht als Endnutzer, sondern als reflektierte Gestalter:innen von Lernumgebungen
Kritische Evaluationskompetenz: Fähigkeit, KI-generierte geometrische Beweise auf Korrektheit zu prüfen — gerade weil LLMs im Geometriebereich am fehleranfälligsten sind (Wei, 2024; Wardat et al., 2023)
Didaktische Gestaltungskompetenz: KI-resistente Prüfungsaufgaben entwickeln, sokratische KI-Dialoge konfigurieren, kollaborative KI-Szenarien planen
Medienpädagogische Reflexionskompetenz: Datenschutz (DSGVO), Abhängigkeitsrisiken, algorithmischer Bias, Lehrplan-Misalignments internationaler Systeme erkennen und thematisieren

Ulusoy (2024, Journal of Computer Assisted Learning) untersuchte, welche Qualität Lehramtsstudierende bei der Gestaltung von DGS-Aufgaben (GeoGebra, Cabri, Sketchpad) erreichen. Ergebnis: Die Koordination zwischen mathematischer Tiefe und technologischen Aktionen (Zeichnen, Messen, Zugmodus) variiert erheblich — viele angehende Lehrkräfte nutzen den didaktisch entscheidenden Zugmodus nicht für tiefergehende mathematische Erkundungen. Die Implikation für die Ausbildung: Geometrie-DGS-Kompetenz muss explizit gelehrt werden, nicht nur Tool-Wissen. Ein systematisches Review (Tejera, Galiç & Lavicza, 2025, Journal for STEM Education Research) über 20 Studien zu 3D-Modellierung und 3D-Druck in der Lehramtsausbildung zeigt: Diese Technologien fördern nachweislich geometrische Raumvorstellung und Praxisbezug — bei gleichzeitigen Herausforderungen durch Ressourcenknappheit.

Eine konkrete Methode für die Unterrichtsplanung mit KI: Gurl, Markinson & Artzt (2024, Digital Experiences in Mathematics Education) untersuchten qualitativ, wie Lehramtsstudierende der Sekundarstufe ChatGPT zur Unterrichtsplanung im Mikro-Teaching-Kontext nutzten. Befund: Studierende bewerteten pädagogische Outputs präziser als mathematische Inhalte — ChatGPT-Lektionen waren tendenziell lehrerzentriert und wenig auf Schülerbedürfnisse ausgerichtet. Kritische Adaption variierte stark; dies unterstreicht, dass KI-gestützte Unterrichtsplanung explizite didaktische Reflexion erfordert, nicht nur technisches Tool-Know-how.

Eine weitere konkrete Methode, die sich bewährt: KI-gestützte Simulation von Schülerantworten für Lehramtsstudierende. Bastian et al. (2025) entwickelten den Chatbot NiCo (basierend auf GPT-4o) zur Förderung von Noticing-Kompetenzen — also der Fähigkeit, pädagogisch bedeutsame Momente in Unterrichtsvideos zu erkennen und zu interpretieren. In einem Pilot mit 25 Lehramtsstudierenden (Universität Hamburg) analysierte NiCo Videoszenen und gab strukturiertes Scaffolding-Feedback. Die Studie zeigt: KI kann nicht nur Lernende unterstützen, sondern auch den reflektierten Blick von Lehrenden auf Unterricht schulen — ein direkter Anknüpfungspunkt für Geometriedidaktik-Seminare.

Dass KI-gestützte Lehrkräftefortbildung tatsächlich Schülerleistungen verbessert, zeigt das erste einschlägige RCT: Copur-Gencturk, Li und Atabas (2024, American Educational Research Journal) randomisierten 52 Mathematiklehrende in eine Experimentalgruppe (n=29), die asynchrone Fortbildungsmodule mit einem KI-basierten ITS und Just-in-Time-Feedback bearbeitete, und eine Kontrollgruppe (n=23). Lehrkräfte der Experimentalgruppe setzten danach mathematisch reichhaltigere Aufgaben ein; Schülerleistungen stiegen signifikant (d=0,18). Dies ist der bislang direkteste kausale Nachweis, dass KI-basierte Lehrkräfteentwicklung Wirkung auf Schülerlernen entfaltet — eine Orientierung für die österreichische Lehramtsausbildung.

Uygun (2025) untersuchte in einer fünfwöchigen Intervention, wie angehende Lehrkräfte die Kombination aus ChatGPT, 3D-Modellierung (Blender) und MyWebAR für die interaktive Exploration platonischer Körper nutzen können. Die Studie zeigt: AR-gestützte Geometrie in der Lehramtsausbildung fördert nicht nur Fachwissen, sondern auch die Bereitschaft, innovative Technologien im eigenen Unterricht einzusetzen. Kock et al. (2025) belegen ergänzend für Ingenieurstudent:innen im 1. Semester: ChatGPT wird hauptsächlich zur Überprüfung von Rechenwegen und zur Erklärung von Lösungsschritten genutzt — nicht zum blinden Kopieren von Lösungen. Dieser Befund stützt die These, dass die tatsächliche Nutzungsweise von KI-Werkzeugen differenzierter ist als oft befürchtet.

Fragen, die das Lehramtsstudium künftig adressieren muss:

Wie erkenne ich KI-generierte Lösungen in geometrischen Beweisen?
Wie gestalte ich KI-resistente Prüfungsaufgaben?
Wie nutze ich KI als Unterrichtsassistenz ethisch, pädagogisch sinnvoll und DSGVO-konform?
Welche geometrischen Kompetenzen sind auch im Zeitalter von AlphaGeometry weiterhin unverzichtbar?
Warum weicht die KI-Antwort zur Viereck-Klassifikation vom österreichischen Schulbuch ab — und wie mache ich das zum Unterrichtsgegenstand?

Literatur (Hochschule)

Achim, T., Best, A., Bietti, A., et al. (2025). Aristotle: IMO-level automated theorem proving. arXiv:2510.01346.

Botana, F., Recio, T., & Vélez, M. P. (2024). On using GeoGebra and ChatGPT for geometric discovery. Computers, 13(8), 187. https://doi.org/10.3390/computers13080187

Hubert, T., Mehta, R., Sartran, L., et al. (2025). Olympiad-level formal mathematical reasoning with reinforcement learning. Nature. https://doi.org/10.1038/s41586-025-09833-y

Iannone, P., Biza, I., Davies, B., Kinnear, G., & Nieminen, J. H. (2025). Towards a research agenda for generative AI in university mathematics education. CERME14 Proceedings. https://hal.science/hal-05238099

Kestin, G., Miller, K., Klales, A., et al. (2025). AI tutoring outperforms active learning. Scientific Reports, 15, 17458. https://doi.org/10.1038/s41598-025-97652-6

Kovács, Z., Recio, T., & Vélez, M. P. (2024). Showing proofs, assessing difficulty with GeoGebra Discovery. arXiv:2401.11900.

Murphy, L. R., Yang, K., Sun, J., Li, Z., Anandkumar, A., & Si, X. (2024). Autoformalizing Euclidean Geometry. Proceedings of ICML 2024. https://doi.org/10.48550/arXiv.2405.17216

Pädagogische Hochschule Wien. (2024). Positionspapier zum Umgang mit Künstlicher Intelligenz in der Hochschulbildung. https://phwien.ac.at/wp-content/uploads/2024/02/PHW-Positionspapier-KI-in-der-Hochschulbildung-Februar-2024.pdf

Trinh, T. H., Wu, Y., Le, Q. V., He, H., & Luong, T. (2024). Solving Olympiad Geometry without human demonstrations. Nature, 625, 476–482. https://doi.org/10.1038/s41586-023-06747-5

Vuong, Q.-H., & Ho, M.-T. (2024). The disruptive AlphaGeometry. AI & Society. https://doi.org/10.1007/s00146-024-02010-1

Kovács, Z., Recio, T., Sólyom-Gecse, C., & Vélez, M. P. (2024c). On automated completion of geometry statements and proofs with GeoGebra Discovery. Annals of Mathematics and Artificial Intelligence. https://doi.org/10.1007/s10472-024-09964-4

Kovács, Z., et al. (2025). Automated analysis of the difficulty of secondary school geometry theorems. Annals of Mathematics and Artificial Intelligence. https://doi.org/10.1007/s10472-025-09983-9

Naskręcki, B., & Ono, K. (2025). Mathematical discovery in the age of artificial intelligence. Nature Physics, 21, 1504–1506. https://doi.org/10.1038/s41567-025-03042-0

Tröbelsberger, L., Fock, A., Oldenburg, R., & Siller, H.-S. (2025). Der Einsatz von KI-Systemen durch Studierende in der universitären Mathematikausbildung. DMVM, 33(4), 276–280. https://doi.org/10.1515/dmvm-2025-0078

Wei, X. (2024). Evaluating ChatGPT-4 and ChatGPT-4o. Frontiers in Education, 9, 1452570. https://doi.org/10.3389/feduc.2024.1452570

Witzke, I., & Steinhoff, T. (2025). KIMADU — KI-Forschungsprojekt der Didaktik der Mathematik und der deutschen Sprache. Universität Siegen / Ministerium für Schule und Bildung NRW. https://kimadu.de/

Bastian, A., Buchholtz, N., & Kaiser, G. (2025). Using AI chatbots to facilitate mathematics preservice teachers' noticing skills. Frontiers in Education. https://doi.org/10.3389/feduc.2025.1605921

Ulusoy, F. (2024). The quality of prospective mathematics teachers' dynamic geometry tasks in terms of the coordination between mathematical depth levels and technological actions. Journal of Computer Assisted Learning, 40(3), 1029–1045. https://doi.org/10.1111/jcal.13029

Tejera, M., Galiç, S., & Lavicza, Z. (2025). 3D modelling and printing in teacher education: A systematic literature review. Journal for STEM Education Research. https://doi.org/10.1007/s41979-025-00147-2

Huget, J., Dilling, F., Eckhardt, M., Geier, C., Müller, J., & Witzke, I. (2025). Projektvorstellung KI@school: Forschung und Entwicklung zum Einsatz generativer KI im Mathematikunterricht. Mitteilungen der Gesellschaft für Didaktik der Mathematik, 119. https://ojs.didaktik-der-mathematik.de/index.php/mgdm/article/view/1305

Gurl, T. J., Markinson, M. P., & Artzt, A. F. (2024). Using ChatGPT as a lesson planning assistant with preservice secondary mathematics teachers. Digital Experiences in Mathematics Education, 10, 114–139. https://doi.org/10.1007/s40751-024-00162-9

Bottoni, M. L., Cattaneo, A. S., & Sacikara, E. (2025). Teaching Foundations of Mathematics with the Lean theorem prover. arXiv:2501.03352. https://arxiv.org/abs/2501.03352

Simić, I., Stojanović-Đurđević, S., & Tanasijević, M. (2025). Automated theorem proving for 3D solid geometry. Annals of Mathematics and Artificial Intelligence. https://doi.org/10.1007/s10472-025-09975-9

Collins, K. M., Jiang, A. Q., Frieder, S., et al. (2024). Evaluating language models for mathematics through interactions. Proceedings of the National Academy of Sciences, 121(24), e2318124121. https://doi.org/10.1073/pnas.2318124121

Yoon, H., Hwang, J., Lee, K., Roh, K. H., & Kwon, O. N. (2024). Students' use of generative artificial intelligence for proving mathematical statements. ZDM – Mathematics Education, 56, 1531–1551. https://doi.org/10.1007/s11858-024-01629-0

Gkrekas, N., & Rizos, I. (2025). The impact of LLMs on mathematics education and research at the university. Heliyon. https://doi.org/10.1016/j.heliyon.2025.e44747

Copur-Gencturk, Y., Li, J., & Atabas, S. (2024). Improving teaching at scale: Can AI be incorporated into professional development to create interactive, personalized learning for teachers? American Educational Research Journal, 61(4), 767–802. https://doi.org/10.3102/00028312241248514

Hanna, G., Larvor, B., & Yan, X. (2024). Lean in the undergraduate classroom: An exploration. ZDM – Mathematics Education. https://doi.org/10.1007/s11858-024-01577-9

Iannone, P., & Thoma, A. (2025). "It Feels Like Cheating": Students' perceptions of interactive theorem provers in undergraduate mathematics. Digital Experiences in Mathematics Education. https://doi.org/10.1007/s40751-025-00193-w

Martínez-Zarzuelo, A., Nolla, Á., Recio, T., Tolmos, P., Ariño-Morera, M., & Gallardo, S. (2025). An experience with pre-service teachers using GeoGebra Discovery automated reasoning tools for outdoor mathematics. Education Sciences, 15(6), 782. https://doi.org/10.3390/educsci15060782

Mahinpei, R., Horta Ribeiro, M., & Milano, M. (2025). Interactive theorem provers for proof education. In Proceedings of SPLASH-E 2025 (pp. 24–41). ACM. https://doi.org/10.1145/3758317.3759679

Türkoğlu, H., & Yalçinalp, S. (2024). Investigating problem-solving behaviours of university students through an eye-tracking system using GeoGebra in geometry: A case study. Education and Information Technologies, 29. https://doi.org/10.1007/s10639-024-12452-1

Bairral, M., & Aldon, G. (2024). The integration of digital technology in task-design on eye-tracking studies in geometry. REDIMAT – Journal of Research in Mathematics Education, 13(2). https://doi.org/10.4471/redimat.2024.14299

Käferbock, A., & Kovács, Z. (2024). The locus story of a rocking camel in a medical center in the city of Freistadt. EPTCS – Automated Deduction in Geometry, 398, 132–141. https://doi.org/10.4204/EPTCS.398.16

Kovács, Z., Recio, T., & Vélez, M. P. (2024d). Showing proofs, assessing difficulty with GeoGebra Discovery. EPTCS – Automated Deduction in Geometry, 398, Paper 8. https://doi.org/10.4204/EPTCS.398.8

Nguyen, A., Gul, F., Dang, B., Huynh, L., & Tuunanen, T. (2025). Designing embodied generative artificial intelligence in mixed reality for active learning in higher education. Innovations in Education and Teaching International, 62(5), 1632–1647. https://doi.org/10.1080/14703297.2025.2499177

Chen, E., et al. (2025). Generative AI alone may not be enough: Evaluating AI support for learning mathematical proof. arXiv:2509.16778. https://arxiv.org/abs/2509.16778

Gao, G., Wang, Y., Jiang, J., Gao, Q., Qin, Z., Xu, T., & Dong, B. (2025). Herald: A natural language annotated Lean 4 dataset. In Proceedings of ICLR 2025. https://arxiv.org/abs/2410.10878

Klawa, H., Rajpal, S., & Thomas, C. (2025). Gen AI in proof-based math courses: A pilot study. arXiv:2509.13570. https://arxiv.org/abs/2509.13570

Lin, H., Sun, Z., Yang, Y., & Welleck, S. (2025). Lean-STaR: Learning to interleave thinking and proving. In Proceedings of ICLR 2025. https://arxiv.org/abs/2407.10040

Tran Minh, F., Gonnord, L., Narboux, J., et al. (2025). Proof assistants for teaching: A survey. arXiv:2505.13472. https://arxiv.org/abs/2505.13472

Tsoukalas, G., Lee, J., Jennings, J., Xin, J., Ding, M., Jennings, M., Thakur, A., & Chaudhuri, S. (2024). PutnamBench: Evaluating neural theorem-provers on the Putnam Mathematical Competition. In NeurIPS 2024. https://arxiv.org/abs/2407.11214

Weng, K., Du, L., Li, S., Lu, W., Sun, H., Liu, H., & Zhang, T. (2025). Autoformalization in the era of large language models: A survey. arXiv:2505.23486. https://arxiv.org/abs/2505.23486

Sala-Sebastià, G., Breda, A., & Font, V. (2025). Characterising computational and geometric thinking in pre-service Early Childhood Education teachers by playing with MatataLab. Education and Information Technologies, 30, 21079–21103. https://doi.org/10.1007/s10639-025-13589-3

Miao, F., & Cukurova, M. (2024). AI competency framework for teachers. UNESCO Publishing. https://unesdoc.unesco.org/ark:/48223/pf0000391104

Uygun, T. (2025). Facilitating preservice teachers' geometric thinking through AI-assisted blended learning with 3D modeling and augmented reality. Journal of Computer Assisted Learning. https://doi.org/10.1111/jcal.13120

Kock, Z.-j., et al. (2025). Engineering students' initial use schemes of ChatGPT as an instrument for mathematical activity. International Journal of Mathematical Education in Science and Technology. https://doi.org/10.1080/0020739X.2025.2460277

7. KI-Tools im Überblick

Systematische Übersicht

Eine Übersicht aller relevanten KI-gestützten Werkzeuge für den Geometrieunterricht, geordnet nach Zielgruppe und Einsatzbereich.

Tool	Anbieter	Schulstufe	Stärken	Schwächen	Kosten
GeoGebra AI	GeoGebra GmbH (AT)	VS–HS	Konstruktion, Visualisierung, natürlichsprachlich, DSGVO-nah	KI noch in Entwicklung	kostenlos
GeoGebra Discovery	Kovács/JKU Linz	SEK II–HS	Automatische Beweise, ShowProof	Experimentalstatus	kostenlos
Photomath	Google (seit 2023)	SEK I–II	Foto-Erkennung, Lösungsweg	Abhängigkeitsrisiko, kein Geometrieverständnis	Freemium
Khanmigo	Khan Academy	VS–SEK II	Socratic Tutor, kein Direktantworten, adaptiv	englischsprachig	€0–44/Jahr
Wolfram Alpha	Wolfram Research	SEK II–HS	CAS, symbolisch, präzise, kein Halluzinieren	Bedienungseinstieg	Freemium
ChatGPT / GPT-4o	OpenAI	alle	natürlichsprachlich, erklärt	halluziniert, Geometrie schwächster Bereich	Freemium
Claude	Anthropic	alle	Erklärungen, Texte, Code	halluziniert	Freemium
Gemini	Google DeepMind	alle	multimodal, Google-Integration	halluziniert	Freemium
Desmos	Desmos/Amplify	SEK I–II	Funktionen, Koordinatengeometrie	wenig elementare Geometrie, kein eigener KI-Tutor	kostenlos
Symbolab	EduTech/Chegg	SEK II–HS	symbolisch, viele Lösungswege	kostenpflichtig für Details	Freemium
MathPix	MathPix Inc.	SEK II–HS	LaTeX aus Fotos, Formelerkennung	auf Formeln beschränkt	Freemium
Lean 4 / Mathlib	Community/Microsoft	HS	formale, verifizierte Beweise	steile Lernkurve	kostenlos
ARGeoITS	Forschungsprototyp	SEK I	AR + adaptives ITS für Geometrie	nicht kommerziell verfügbar	—
TongGeometry	BIGAI/Peking Univ. (CN)	Olympiad	beweist + generiert olymp. Aufgaben	Forschungssystem	—
Squirrel AI	Yixue Group (CN)	VS–HS	vollständig adaptiv, Wissensgraph	24 Mio. Schüler:innen	kostenpflichtig (Lernzentren)
LearnLM	Google DeepMind	VS–HS	pädagogisch feinabgestimmtes LLM, Eedi-Integration	neu, noch begrenzte Verfügbarkeit	in Entwicklung

Besondere Betrachtung: GeoGebra

GeoGebra nimmt eine Sonderstellung ein: Als österreichisches Produkt (entwickelt von Markus Hohenwarter, ab 2001 an der Universität Salzburg) ist es in österreichischen und deutschen Schulen tief verankert, kostenlos, mehrsprachig und wird aktiv weiterentwickelt.

GeoGebra-Ökosystem 2024:

GeoGebra Classic: Bewährtes DGS für Konstruktionen, Algebra, Analysis — die Basis seit 2001
GeoGebra 3D: Raumgeometrie, Körper, Schnittebenen — visualisiert, was das Gehirn nicht alleine dreht
GeoGebra Calculator Suite: Mobile App für Smartphones, alle Funktionen integriert
GeoGebra Math Solver: KI-gestützte Fotoauflösung ähnlich Photomath
GeoGebra Discovery: Automatisierte Beweisführung (Forschungsversion, Kovács et al., 2024)
GeoGebra AI (natürlichsprachlich): Eingabe in Alltagssprache statt formaler Syntax (in Entwicklung)

GeoGebra-gestützter kollaborativer Unterricht erzielt signifikant stärkeres konzeptuelles Geometrieverständnis als traditioneller Unterricht — belegt durch mehrere Quasi-Experimente auf Sekundarstufen-Niveau (Gurmu et al., 2024; Uwurukundo et al., 2024). GeoGebra ist auch die Basis für KI-resistente dynamische Assessments: Zufallsgenerierte GeoGebra-Applets in Moodle bieten ein Format, das KI-Systeme nicht trivial lösen können (Csiba & Vajo, 2024; Hamady et al., 2024).

Eine aktuelle Drei-Ebenen-Meta-Analyse (Ji, Guo & Song, 2024, Journal of Educational Computing Research, 107 Studien, N=10.507, 138 Effektgrößen) ermittelt für dynamische Mathematiksoftware — darunter GeoGebra — einen moderaten Gesamteffekt von d = 0,63 (95 %-KI [0,55–0,71]). Moderatoranalysen zeigen: Konzeptuelles Verständnis profitiert stärker als prozedurale Fertigkeiten; Interventionen mit höherem Schüler:innen-Autonomiegrad erzielen größere Effekte. Für Lehrkräfte bedeutet das konkret: Offene, explorative GeoGebra-Szenarien sind effektiver als geführte Schritt-für-Schritt-Demos.

GeoGebra und ChatGPT: Komplementäre Systeme

Die Studie von Botana et al. (2024, MDPI Computers) untersuchte systematisch, welche Geometrieprobleme GeoGebra Discovery und ChatGPT korrekt lösen. Ergebnis: GeoGebra beweist alle getesteten elementar-euklidischen Sätze korrekt; ChatGPT scheitert in mindestens einem Fall. Der Lösungsvorschlag: ChatGPT für Zugänglichkeit (natürlichsprachliche Eingabe, Erklärungen) + GeoGebra für Zuverlässigkeit (zertifizierte, symbolische Beweise).

Eine zweite Studie derselben Arbeitsgruppe zeigt noch deutlichere Grenzen: Botana und Recio (2024, Computation) testen ChatGPT 3.5 systematisch bei geometrischen Ortskurvenaufgaben — mit einer klaren Warnung: „Caveat Emptor!" ChatGPT scheitert in den meisten Fällen, GeoGebra löst zuverlässig. Für präzise geometrische Berechnungen (Ortskurven, Einhüllende) ist ChatGPT kein geeignetes Werkzeug.

Eine Educational-Design-Research-Studie von Yunianto et al. (2024) aus der Forschungsgruppe von Zsolt Lavicza (JKU Linz) zeigt: ChatGPT hat erhebliche Limitationen bei der Generierung korrekter GeoGebra-Syntax für Geometrieaufgaben. Das eröffnet jedoch unerwartete didaktische Chancen: Schüler:innen, die KI-Fehler in GeoGebra-Befehlen debuggen müssen, entwickeln dabei Computational-Thinking-Kompetenzen. Die Fehlerhaftigkeit der KI wird zum Lerngegenstand.

Diese Arbeitsteilung ist ein Modell für die Schule: Schüler:innen kommunizieren auf natürliche Weise, erhalten aber am Ende verifizierte, nicht-halluzinierte Ergebnisse.

LLMs im Vergleich: Stärken und Grenzen bei Geometrie

LLMs sind sprachlich ausgezeichnet — bei geometrischen Aufgaben jedoch systematisch schwächer als in anderen Bereichen. Empirische Befunde:

Geometrie/Messung ist der schwächste Bereich für GPT-4 (53 %) und GPT-4o (59 %) — vs. 79 %/92 % in Algebra (Wei, 2024)
GPT-4V erreicht nur 58,5 % Genauigkeit auf geometrischen Aufgaben mit visuellen Diagrammen; Bard nur 43,4 % (Lu et al., 2024)
Manche Modelle erzielten sogar bessere Scores wenn geometrische Diagramme entfernt wurden — d. h. die Zeichnung war für das Modell Rauschen, kein Information (Zhang et al., 2024)
GPT-4o erreicht weniger als 20 % bei Transformationsgeometrie (Wang et al., 2024)
Wardat et al. (2023) stellen empirisch fest: ChatGPT hat „kein tiefes Verständnis von Geometrie und kann Fehlvorstellungen nicht effektiv korrigieren"
GPT-4o schneidet bei bildbasierten Geometriefragen signifikant schlechter ab als bei textbasierten und scheitert an präzisen geometrischen Operationen — insbesondere räumlichen Visualisierungsaufgaben (Feng et al., 2024)

Konsequenz: LLMs sollten für Geometrieunterricht immer mit einem präzisen, zuverlässigen Werkzeug kombiniert werden — GeoGebra Discovery oder Wolfram Alpha als Verifikatoren.

Verifikationsbasierte Ansätze (aktueller Forschungsstand): GeoCoder (Sharma et al., 2025, NAACL) zeigt, dass Vision-Language-Modelle, die ausführbaren Code aus einer vordefinierten Geometriefunktionsbibliothek generieren statt Freitext, die Fehlerrate drastisch senken — weil die Antwort symbolisch ausgeführt und verifiziert wird, bevor sie ausgegeben wird. Dieser Ansatz — LLM als Schnittstelle, formales System als Verifikator — ist die Richtung, in die sich Geometrie-KI-Tools entwickeln werden.

Khan Academy und Khanmigo: Sokratisches Tutoring im Maßstab

Khan Academy ist eine der am weitesten verbreiteten kostenlosen Lernplattformen weltweit. Der KI-Tutor Khanmigo (gestartet 2023) implementiert konsequent das Socratic-Tutoring-Prinzip: keine Direktantworten, nur Leitfragen und Scaffolding — der Lernende muss selbst denken. Khanmigo ist 2024/25 bei über 700.000 Lernenden im Einsatz.

Empirische Grundlage: Schüler:innen, die Khan Academy 30+ Minuten pro Woche nutzten, erzielten rund 20 % größere Lernfortschritte als erwartet (Effektgröße 0,36; n ≈ 350.000 Schüler:innen Klassen 3–8; Khan Academy, 2024). Für Geometrie umfasst die Plattform interaktive Einheiten zu allen Sekundarstufen-Inhalten — mit sofortigem, automatisiertem Feedback und adaptiver Aufgabenfolge.

Die Stärke von Khanmigo liegt in der pädagogisch bewussten Beschränkung: Es modelliert guten Unterricht, nicht Direktantworten — empirisch der deutlich wirksamere Ansatz (Bastani et al., 2025). Schwäche für den DACH-Raum: Die Plattform ist hauptsächlich englischsprachig; österreichische Lehrpläne werden nicht abgebildet. Empfehlung: Khanmigo für Erklärungen und sokratischen Dialog, GeoGebra für lehrplankonforme Konstruktionen und Visualisierungen.

öbv × Studyly: KI-Lerncoach für österreichische Schulbücher

Der Österreichische Bundesverlag (öbv) — der wichtigste österreichische Schulbuchverlag — startete ab dem Schuljahr 2025/26 eine Kooperation mit dem Wiener EdTech-Startup Studyly (gegr. 2019): Tausende Aufgaben aus öbv-Mathematikschulbüchern (Das ist Mathematik, Mathematik verstehen, Lösungswege) sind nun direkt in der Studyly-App verfügbar, ergänzt durch einen KI-Lerncoach (öbv & Studyly, 2025).

Technisch handelt es sich um regelbasierte KI (nicht generative LLMs) — entwickelt gemeinsam von Mathematiker:innen, Fachdidaktiker:innen und KI-Expert:innen. Das System diagnostiziert automatisch Wissenslücken, weist individualisierte Aufgaben zu und erklärt Fehler schrittweise. DSGVO-konform, EU-Server, kein Halluzinationsrisiko — Preis: €14,90/Jahr.

Bedeutung für österreichische Lehrende: 80 % der Mittelschul- und 55 % der AHS-Lehrenden kombinieren bereits Schulbücher mit digitalen Lern-Apps in Mathematik. Der KI-Lerncoach schließt die Lücke zwischen vertrautem Lehrmittel und personalisierter Übung — ohne Sprachbarriere und direkt am österreichischen Lehrplan orientiert.

Squirrel AI: Vollständig adaptives Lernen im großen Maßstab

Das chinesische System Squirrel AI (Yixue Group) ist das am stärksten skalierte adaptive KI-Tutoring-System der Welt: 24 Millionen Schüler:innen in über 2.000 Lernzentren in China. Squirrel AI basiert auf einem Wissensgraphen mit tausenden feinkörniger Wissensknoten pro Fach — differenzierter als jedes bisher eingesetzte adaptive System. Das System passt nicht nur Schwierigkeitsgrad, sondern den gesamten Lernpfad in Echtzeit an.

Für Österreich ist Squirrel AI als kostenpflichtiges, chinesisches System nicht direkt verfügbar — es illustriert jedoch, wohin die Entwicklung adaptiver Systeme geht: Tief granulare Wissensmodellierung, KI-gesteuerter individueller Pfad und Echtzeit-Feedback werden zum Maßstab für die nächste Generation von Bildungstechnologie.

Photomath: Tool, Marktentwicklung und Unterrichtsgegenstand

Photomath wurde 2014 in Kroatien gegründet und 2023 von Google für geschätzte 550 Mio. USD übernommen (Google/Photomath, 2023) — der Markteintritt von Big Tech in Mathematiksoftware. Mit 350 Millionen Downloads ist es eine der am weitesten verbreiteten Bildungs-Apps weltweit. Für den Geometrieunterricht hat Photomath ambivalente Wirkung:

Positiv: Sofortiges Feedback, Abbau von Frustration, Motivation durch Erfolgserlebnisse
Negativ: Risiko der Nutzung ohne Verständnis, Abhängigkeit, oberflächliches Lernen (Wardat et al., 2023; Wijaya et al., 2024)

Als Unterrichtsgegenstand — nicht nur als Tool — bietet sich Photomath an: Schüler:innen untersuchen, wo und warum das System fehlt, und entwickeln dadurch tieferes geometrisches Verständnis.

Literatur (Tools)

Botana, F., & Recio, T. (2024). Geometric loci and ChatGPT: Caveat emptor! Computation, 12(2), 30. https://doi.org/10.3390/computation12020030

Botana, F., Recio, T., & Vélez, M. P. (2024). On using GeoGebra and ChatGPT for geometric discovery. Computers, 13(8), 187. https://doi.org/10.3390/computers13080187

Google/Photomath. (2023). Photomath. https://en.wikipedia.org/wiki/Photomath

Österreichischer Bundesverlag [öbv], & Studyly GmbH. (2025, 9. September). Individuelles Mathe-Lernen: Schulbuch plus KI-Lerncoach [Pressemitteilung]. https://presse.grayling.at/news-individuelles-mathe-lernen-schulbuch-plus-ki-lerncoach?id=222376

Kovács, Z., Recio, T., & Vélez, M. P. (2024). Showing proofs, assessing difficulty with GeoGebra Discovery. EPTCS – Automated Deduction in Geometry, 398, Paper 8. https://doi.org/10.4204/EPTCS.398.8

Kovács, Z., & Peng, X. (2025). Automated proving in planar geometry based on the complex number identity method and elimination. arXiv:2511.14728. https://doi.org/10.48550/arXiv.2511.14728

Sicca, V., Xia, T., Fédérico, M., Gorinski, P. J., Frieder, S., & Jui, S. (2024). Newclid: A user-friendly replacement for AlphaGeometry. arXiv:2411.11938. https://doi.org/10.48550/arXiv.2411.11938

Wang, K., Pan, J., Shi, W., Lu, Z., Ren, H., Zhou, A., Zhan, M., & Li, H. (2024). Measuring multimodal mathematical reasoning with the MATH-Vision dataset. NeurIPS 2024. https://github.com/mathllm/MATH-V

Wei, X. (2024). Evaluating ChatGPT-4 and ChatGPT-4o. Frontiers in Education, 9, 1452570. https://doi.org/10.3389/feduc.2024.1452570

Zhang, R., Jiang, D., Zhang, Y., Lin, H., Guo, Z., Qiu, P., Zhou, A., Lu, P., Chang, K.-W., Gao, P., & Li, H. (2024). MathVerse: Does your multi-modal LLM truly see the diagrams in visual math problems? In Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186). Springer. https://doi.org/10.1007/978-3-031-73242-3_10

Sharma, A., Dalmia, A., Kazemi, M., Zouaq, A., & Pal, C. (2025). GeoCoder: Solving geometry problems by generating modular code through vision-language models. In Findings of NAACL 2025 (pp. 7340–7356). https://doi.org/10.18653/v1/2025.findings-naacl.410

Feng, T. H., Denny, P., Wünsche, B. C., Luxton-Reilly, A., & Whalley, J. (2024). An eye for an AI: Evaluating GPT-4o's visual perception and geometric reasoning skills. SIGGRAPH Asia 2024 Educator's Forum (ACM). https://doi.org/10.1145/3680533.3697064

Ji, Z., Guo, K., & Song, S. (2024). Effects of dynamic mathematical software on students' performance: A three-level meta-analysis. Journal of Educational Computing Research, 62(4), 1035–1060. https://doi.org/10.1177/07356331241226594

8. Didaktische Konzepte und Chancen

KI als Lernpartner — nicht als Lösungsmaschine

Der entscheidende didaktische Rahmen: KI-Systeme sollen den Lernprozess unterstützen, nicht ersetzen. Drei Modelle haben sich in der Literatur als besonders wirkungsvoll erwiesen (Walkington, 2025; Buchholtz et al., 2024):

1. KI als Tutor (Socratic Tutoring)

Das KI-System stellt Fragen, gibt Hinweise und führt den Lernenden durch einen Denkprozess, ohne die Lösung vorwegzunehmen. Khanmigo (Khan Academy) implementiert dieses Modell explizit: Die KI gibt keine Direktantworten, sondern modelliert sokratische Gesprächsführung (Khan Academy, 2024).

Der entscheidende Befund aus dem Feld: KI-Tutoren mit Guardrails — also mit eingeschränktem Direktantworten — erzielen deutlich bessere Lerneffekte als uneingeschränkte Systeme. In einem Feldexperiment mit ~1.000 Oberschüler:innen verbesserte ein geführter GPT-Tutor die Übungsleistung um 127 %, ein uneingeschränkter GPT um nur 48 % (Bastani et al., 2025). Dieser Befund ist einer der empirisch am stärksten gesicherten in der aktuellen KI-Bildungsforschung.

2. KI als Werkzeug (Cognitive Tool)

Schüler:innen nutzen KI gezielt für Teilaufgaben (Berechnung, Visualisierung, Überprüfung), behalten aber die mathematische Verantwortung. GeoGebra AI und Wolfram Alpha folgen diesem Modell: Sie unterstützen spezifische Operationen, ohne die Konzeptarbeit abzunehmen (Walkington, 2025). Die Kombination beider Systeme — GeoGebra für zertifizierte Beweise, ChatGPT für Erklärungen — ist besonders produktiv (Botana et al., 2024).

3. KI als Lerngegenstand (Object of Study)

Schüler:innen untersuchen, wie KI geometrische Probleme löst oder scheitert. Kritisches Denken über KI als Bildungsziel. Besonders relevant in der Sekundarstufe II und im Hochschulbereich: Durch das Analysieren von KI-Fehlern (Halluzinationen, falsche Beweise) vertiefen Schüler:innen ihr eigenes geometrisches Verständnis. Die GDM fordert dies explizit als prioritären Forschungsbereich (Buchholtz et al., 2024).

Adaptive Differenzierung und Intelligente Tutorsysteme

KI ermöglicht personalisierte Lernpfade auf einem bislang nicht erreichbaren Maßstab. Die bislang umfassendste Zusammenfassung der Evidenz: Eine Meta-Analyse von 22 empirischen Studien (N = 5.232) belegt, dass Generative KI im Mathematikunterricht im Median eine Effektgröße von Hedges' g = 0,534 erzielt (Liu et al., 2026). Der bereichsspezifische Geometrieeffekt ist mit g = 0,906 der größte aller untersuchten mathematischen Inhaltsbereiche — größer als für Zahl & Algebra (g = 0,784). Am stärksten wirken kollaborative Formate und „Creative Transformation"-Integration. Eine parallel durchgeführte Meta-Analyse zu KI-gestützter personalisierter STEM-Bildung (32 RCT-Studien, 99 Effektgrößen) bestätigt: AR/VR-Ansätze zeigen die stärksten Effekte; Hybridformate (KI + Präsenzunterricht) übertreffen rein digitale Ansätze konsequent (Li et al., 2025).

Ein PRISMA-basiertes systematisches Review von Hariyanto, Kristianingsih und Maharani (2025, Discover Education, Springer Nature) über 142 Studien aus Scopus, WoS und IEEE (2015–2025) bestätigt: Geometrie und Mathematik sind die häufigsten Anwendungsdomänen in der KI-gestützten adaptiven Bildungsforschung. Die Technologielandschaft reicht von Knowledge Tracing und Bayesian Networks über Reinforcement Learning bis zu aktuellen LLM-Architekturen — mit konvergierenden Hinweisen auf positive Lerneffekte, wenn das System den Fehlertyp des Lernenden korrekt modelliert. Ein paralleles Review zu KI-gestützten adaptiven Lernplattformen (CAAI, Elsevier, 2025) über 25 Scopus-Studien zeigt besonders starke Effekte für AR/VR in geometrischen Inhaltsbereichen: In einer Fallstudie stieg die Bestehensquote von 68 % auf 85 % nach VR/AR-Implementierung (S174).

Auch für Generative KI speziell belegen Meta-Analysen robuste Effekte: Ma et al. (2025, JCAL) synthetisierten 34 experimentelle/quasi-experimentelle Studien und fanden Hedges' g = 0,68 — mit besonders starken kognitiven (g = 0,795) und kompetenzbezogenen Effekten (g = 0,711). Mathematik und Naturwissenschaften profitieren am stärksten von GenAI. Ein DACH-relevanter Beitrag von Fock und Siller (2025, International Journal of STEM Education, Universität Würzburg) in einem Scoping Review über 183 Publikationen zu GenAI in der Sekundarstufe STEM identifiziert Geometrie explizit als Schwachstelle aktueller Systeme: Räumliches Schlussfolgern und geometrisches Problemlösen — wo starke Visualisierungskompetenz erforderlich ist — bleiben trotz Fortschritten unterentwickelt. Das Review empfiehlt, Bildungsziele über kognitive Aspekte hinaus zu erweitern.

Eine breitere Meta-Analyse von 51 Studien (November 2022 – Februar 2025) zu ChatGPT speziell im Bildungskontext bestätigt starke positive Effekte: Lernleistung g = 0,867, Lernwahrnehmung g = 0,456, höherstufiges Denken g = 0,457 (Wang & Fan, 2025). Diese Effektgröße für Lernleistung übertrifft klassische Tutoring-Interventionen und unterstreicht das Potenzial für den Geometrieunterricht — sofern die bekannten Abhängigkeitsrisiken durch pädagogisches Design mitigiert werden.

In einem weiteren RCT mit 165 Schüler:innen in UK-Sekundarschulen konnte Googles LearnLM (ein pädagogisch feinabgestimmtes LLM) in Eedi-Mathematik-Tutoring integriert werden: Schüler:innen mit LearnLM-Unterstützung waren 5,5 Prozentpunkte häufiger in der Lage, neuartige Mathematikprobleme zu lösen als die Kontrollgruppe (66,2 % vs. 60,7 %; Huber et al., 2024).

Im Geometrieunterricht konkret:

Schüler:innen mit Schwierigkeiten bei Fläche-Umfang-Beziehung erhalten spezifische Visualisierungsaufgaben in GeoGebra
Schüler:innen mit Raumvorstellungsschwäche erhalten 3D-Erkundungsaufgaben
Fortgeschrittene Schüler:innen explorieren offene Probleme mit Beweisassistenten

Metakognitive Lernstrategien gehören zu den empirisch wirksamsten Faktoren für Mathematikleistung: Eine PRISMA-konforme Meta-Analyse über 43 Studien (N = 13.924) zeigt, dass metakognitive Instruktion einen Effekt von ES = 1,11 auf Mathematikleistung erzielt — einer der stärksten Effekte in der Bildungsforschung überhaupt (Hidayat, Saad & Wewe, 2025, Cogent Education). Eine bibliometrisch-systematische Überblicksarbeit (Tsakeni, Nwafor, Mosia & Egara, 2025, Journal of Intelligence) über 135 Studien (2005–2025) zeigt, dass KI-Werkzeuge zunehmend als Ko-Regulatoren von Metakognition positioniert werden — also nicht nur als Reaktion auf Schüleraktionen, sondern als aktive Steuerung des Selbstregulationsprozesses. Für den Geometrieunterricht bedeutet das: Wenn ein ITS nicht nur die falsche Konstruktion meldet, sondern auch nachfragt, warum Schüler:innen so vorgegangen sind, unterstützt es metakognitives Denken — eine der wirksamsten Lernstrategien überhaupt.

Das aktuellste systematische Review zu Intelligenten Tutorsystemen (ITS) in der K-12-Bildung (Letourneau et al., 2025, npj Science of Learning) analysierte 28 Studien mit insgesamt 4.597 Schüler:innen und bestätigt: ITS zeigen konsistent positive Lerneffekte, auch in geometrischen Inhaltsbereichen. Besonders beachtenswert: Long und Aleven untersuchten in einem RCT den Cognitive Tutor Geometry mit n=95 Schüler:innen — ein Vorläufer, der zeigt, dass adaptive Geometrie-ITS bereits vor der KI-Ära wirkten. Die neue Generation (GeoGebra AI, ARGeoITS) geht weit darüber hinaus.

Tutor CoPilot: KI-Unterstützung für menschliche Tutoren

Ein innovativer Ansatz zeigt, dass KI nicht nur direkt mit Schüler:innen, sondern auch Lehrende unterstützen kann: Tutor CoPilot (Stanford University) ist ein KI-Assistent, der Tutor:innen in Echtzeit Vorschläge macht, wie ein Experte denken und reagieren würde. In einem RCT mit 700+ Tutor:innen und 1.000+ K-12-Schüler:innen aus einkommensschwachen Regionen waren Schüler:innen von Tutor CoPilot-nutzenden Tutor:innen 4 Prozentpunkte häufiger mathematisch erfolgreich (p < 0,01); bei Schüler:innen von schwächeren Tutor:innen waren es +9 Prozentpunkte (Wang et al., 2024). Kosten: ca. 20 USD/Tutor/Jahr.

Formative Beurteilung mit KI

Formative Beurteilung — laufendes Feedback während des Lernprozesses, nicht erst am Ende — ist einer der empirisch wirksamsten Faktoren für Lernerfolg. KI ermöglicht erstmals, formatives Feedback in Echtzeit, personalisiert und skalierbar zu gestalten. Eine systematische Überblicksarbeit zu formativem Assessment im Mathematikunterricht (Maskos et al., 2025, ZDM) zeigt: Digitale und KI-gestützte Rückmeldungen sind am wirksamsten, wenn sie prozessorientiert (nicht nur Ergebnisorientiert) und adaptiv gestaltet werden — das heißt, auf den individuellen Fehlertyp eingehen.

Für den Geometrieunterricht ergeben sich drei konkrete Einsatzszenarien:

Echtzeit-Diagnose: GeoGebra AI und Khanmigo analysieren Konstruktionsschritte laufend und geben unmittelbares Feedback — nicht nur ob ein Ergebnis korrekt ist, sondern wo im Prozess ein Denkfehler entstand. Dieses prozessorientierte Feedback ist in Präsenzklassen mit 25+ Schüler:innen kaum realisierbar.

Fehler-basiertes Scaffolding: KI-Systeme können Fehlertypen in geometrischen Konstruktionen (z. B. Verwechslung von Winkelhalbierende und Mittelsenkrechter) automatisch klassifizieren und gezielte Korrekturaufgaben vorschlagen — ein Ansatz, den Khlaif et al. (2025) in ihrem Vier-Phasen-Modell als „Adopt"-Phase beschreiben. Wie KI-gestütztes Scaffolding konkret in einem GeoGebra-basierten Geometriekontext aussieht, zeigt eine qualitative Studie mit Lehramtsstudierenden der Sekundarstufe (Nalbantoglu Yilmaz et al., 2025, CERME): ChatGPT unterstützte kooperatives Problemlösen durch Orientierung, sokratische Fragetechniken und kognitive Herausforderungen — entsprechend klassischen Scaffolding-Komponenten. Gleichzeitig beobachteten die Autorinnen eine Tendenz zur Abhängigkeit von fertigen Antworten, sobald Schüler:innen unter Zeitdruck gerieten. Der Befund unterstreicht: KI-Scaffolding in Geometrie ist nur dann lernwirksam, wenn Lehrkräfte aktiv steuern, wann und wie die KI hinzugezogen wird.

Multimodales KI-Feedback und kognitive Belastung: Cosentino et al. (2025, British Journal of Educational Technology) untersuchten in einem Labor-Setting, wie generative KI formatives Feedback im Mathematikunterricht bereitstellt — bei körperbasiertem Lernen mit einer Zahlengerade. Eye-Tracking und Systemlogs maßen kognitive Belastung und Informationsverarbeitung. Der Befund ist didaktisch bedeutsam: KI-generiertes Feedback erzielte vergleichbare Aufgabenleistungen wie Lehrendenfeedback, aber bei signifikant niedrigerer kognitiver Belastung. Das Ergebnis legt nahe, dass KI-Feedback nicht nur skalierbar, sondern für Lernende kognitiv schonender sein kann — ein Argument für den ergänzenden Einsatz in leistungsheterogenen Geometrieklassen.

Prozessdokumentation: Schüler:innen kommentieren ihre eigenen Lösungswege in Textform — diese Texte werden von LLMs analysiert und Lücken im konzeptuellen Verständnis identifiziert. Das Format ist gleichzeitig KI-resistent (da individuelle Formulierungen erwartet werden) und formativ wirkungsvoll.

Augmented Reality und verkörpertes Geometrielernen

Ein emerging research area zeigt, dass AR nicht nur Visualisierung, sondern neue Formen verkörperter Interaktion mit Geometrie ermöglicht. Walkington et al. (2024, Journal of Mathematical Behavior) dokumentierten mit 28 Oberstufenschüler:innen, die eine AR-Version von GeoGebra auf der Microsoft HoloLens 2 nutzten, qualitativ neue Interaktionsmuster: Schüler:innen wechselten ihre körperliche Perspektive, skalierten Objekte durch Gesten und erkundeten Dreidimensionalität durch Bewegung im Raum. Diese Interaktionsformen sind in klassischer DGS nicht möglich — sie eröffnen neue kognitive Zugänge zu geometrischen Konzepten wie Symmetrie, Kongruenz und räumlicher Lage. Die Befunde liefern konkrete Design-Implikationen für die nächste Generation dynamischer Geometriesoftware.

Computational Thinking und geometrisches Denken

Die Verknüpfung von Computational Thinking (algorithmisches Denken, Dekomposition, Abstraktion, Mustererkennung) mit Geometrieunterricht ist ein wachsendes Forschungsfeld. Yunianto et al. (2024, 2025) kombinieren GeoGebra-Konstruktionsaufgaben mit ChatGPT-gestützten Reflexionsphasen — und dokumentieren in einem vollständigen EDR-Modell, dass das Debuggen fehlerhafter KI-Syntax Computational Thinking systematisch fördert.

Für den Geometrieunterricht bedeutet das: Nicht nur Dreiecke konstruieren lassen, sondern den Algorithmus beschreiben, den man dabei verwendet. Scratch als Programmierumgebung für Geometrie zeigt hier: Fünftklässler:innen, die Geometrie durch Programmieren erlernten, zeigten bessere Lernprozesse und höhere Motivation (Molina-Ayuso et al., 2024).

Lehrkräfterolle im KI-Zeitalter

Eine der wichtigsten Erkenntnisse der Forschung: Lehrkräftequalität bleibt entscheidend. Bardach et al. (2026, Journal of Computer Assisted Learning) stellen nach einer Analyse von Engagementverläufen in ITS-Lernumgebungen klar: Intelligente Tutorsysteme brauchen Lehrende. Ohne aktive Lehrkraftbegleitung sinkt das Schülerengagement bei ITS-gestützten Systemen signifikant — unabhängig von der technologischen Qualität des Systems. Der Befund ist didaktisch grundlegend: ITS sind kein Ersatz für Lehrende, sondern ein Werkzeug, das Lehrende gezielt einsetzen, moderieren und einbetten müssen. Die negativen Effekte uneingeschränkter KI-Nutzung (Abhängigkeit, Leistungsabfall bei Prüfungen ohne KI) werden durch Lehrkräftebegleitung signifikant reduziert (Bastani et al., 2025). Lehrende übernehmen im KI-Zeitalter neue Rollen:

Kuratoren: Auswahl geeigneter KI-Tools nach didaktischen Kriterien, nicht nach Marketing
Moderatoren: Begleitung von KI-unterstützten Lernprozessen
Kritiker:innen: Aufzeigen von KI-Fehlern und Grenzen — gerade bei Geometrie
Kompetenzvermittler:innen: Explizite Vermittlung von KI-Literacy als Unterrichtsziel

Die Adoption von KI durch Lehrende wird von internen Faktoren (Überzeugungen, Selbstwirksamkeit) und externen Faktoren (institutionelle Unterstützung, Ressourcen) beeinflusst — mit Lehrendeneinstellungen als kritischem internem Mediator (Li, 2024). Busuttil und Calleja (2025) zeigen in einer maltesischen TPACK-Studie, dass Lehrende mit entdeckendem Unterrichtsverständnis ChatGPT deutlich positiver bewerten — und dass geometrische Visualisierungsaufgaben als spezifische Schwachstelle wahrgenommen werden: Hier versagt die KI am häufigsten. Im deutschsprachigen Raum belegt Seibold et al. (2024, GDM) mit 54 Lehramtsstudierenden, dass LLMs als Tutoren ambivalent wahrgenommen werden — bei gleichzeitig systematischen Misskonzeptionen über ihre mathematische Funktionsweise. Die österreichische Virtuelle PH hat mit dem KI-MOOC (Mai 2024) eine erste strukturierte Fortbildungsinfrastruktur geschaffen (BMB, 2024). Im deutschsprachigen Raum ist das KIMADU-Projekt (Universität Siegen, 25 Schulen in NRW, Laufzeit 2025–2027) das bislang größte Forschungsprojekt zu generativer KI im Mathematikunterricht — mit explizitem Geometrie-Beispiel: KI beim Beweis der Winkelsumme im Dreieck (Witzke & Steinhoff, 2025).

Mathe-Angst, Motivation und Gamification

Mathematikangst (engl. math anxiety) ist ein verbreitetes Phänomen, das Lernleistung und Selbstkonzept nachhaltig beeinträchtigt. KI-gestützte Lernumgebungen können hier sowohl positiv als auch negativ wirken.

Reduktion von Mathe-Angst durch KI: Wang und Wei (2025) zeigten in einer quasi-experimentellen Interventionsstudie mit Sechstklässler:innen, dass GenAI-gestütztes Lernen Mathe-Angst im Vergleich zur Kontrollgruppe signifikant reduziert — eine der ersten direkten empirischen Nachweise dieses Effekts (Applied Cognitive Psychology, DOI: 10.1002/acp.70088). Polydoros et al. (2025) erprobten ein 12-wöchiges KI-gestütztes RTI-Programm für leistungsschwache Siebtklässler:innen (N=56): Das adaptive Feedbacksystem reduzierte Mathe-Angst signifikant und verbesserte Problemlöse- und numerische Fähigkeiten (Psychology International, DOI: 10.3390/psycholint7020046). Auch für KI-Integration speziell in der Volksschul-Geometrie bestätigen Polydoros et al. (2025, Scientific Electronic Archives) bei 436 griechischen Drittklässler:innen positive Effekte auf geometrisches Denken und reduzierte Angst.

Abhängigkeitsrisiko bei ängstlichen Lernenden: Demgegenüber steht ein kritischer Befund: Chen, Chen und Xu (2025) zeigen, dass höhere Mathe-Angst die Bereitschaft zur KI-Nutzung steigert — und damit einen Abhängigkeitskreislauf begünstigt. Mathe-Angst moderiert den Zusammenhang zwischen KI-Tutoring und Problemlösefähigkeit negativ (Psychology in the Schools, DOI: 10.1002/pits.23500). Asiedu Menlah und Boateng (2025) bestätigen diesen Moderatoreffekt in einer Querschnittstudie mit 338 Sekundarschüler:innen: KI-Tutorsysteme verbessern Problemlösefähigkeiten direkt, werden aber bei ängstlichen Lernenden in ihrer Wirkung geschwächt (Journal of Pedagogical Sociology and Psychology, DOI: 10.33902/jpsp.202536137).

Emotionale Wirkungen im Unterricht: Omar, Daher und Bayaa (2025) untersuchten mit einem Mixed-Methods-Design (N=92, Klasse 8) die akademischen Emotionen palästinensischer Schüler:innen beim Algebra-Unterricht mit der KI-App CK-12 Flexi. Die KI-Gruppe berichtete signifikant mehr Freude und weniger Angst und Langeweile als die Kontrollgruppe; sechs App-Affordanzen (sofortiges Feedback, adaptive Schwierigkeit, schrittweise Hinweise) wurden als Auslöser identifiziert (Frontiers in Education, DOI: 10.3389/feduc.2025.1669360).

Gamification und Mathematikmotivation: Gamification — der Einsatz spieltypischer Elemente (Punkte, Leaderboards, Badges) in Lernkontexten — zeigt konsistent positive Motivationseffekte im Mathematikunterricht. Ein aktuelles systematisches Review und Meta-Analyse (45 Studien, N=4.345, Sekundarstufe und Hochschule) belegt einen signifikant kleinen bis mittleren Effekt auf Motivation (g=0,38; Wijers et al., 2026, Educational Psychology Review, DOI: 10.1007/s10648-025-10108-1). Digitale Plattformen wie Kahoot! und Classcraft sind die häufigsten Träger; Punkte und Leaderboards dominieren das Spieldesign, werden aber — so ein Befund des parallelen Systematic Literature Review zu Gamification-Design in der Sekundarstufe (2025, International Journal of Mathematical Education in Science and Technology, DOI: 10.1080/0020739X.2025.2555333) — häufig kritisch bewertet, da rein leistungsbasierte Spielelemente nicht zwingend tiefe Lernprozesse fördern. Die didaktische Schlussfolgerung: Gamification-Elemente sollten mit selbstbestimmungstheoretischen Prinzipien (Autonomie, Kompetenz, Eingebundenheit) kombiniert werden.

Bauer et al. (2025) liefern mit einem randomisierten Feldexperiment (Solomon-Gruppendesign, n = 90 Studierende, Universitäten Augsburg und München) einen direkten Wirksamkeitsnachweis für KI-generiertes adaptives Feedback: Die Experimentalgruppe mit individualisiertem Feedback erzielte signifikant bessere Leistungen als die Kontrollgruppe — ein Befund, der die Bedeutung personalisierter Rückmeldung über bloße Richtig/Falsch-Bewertung hinaus unterstreicht. Topali et al. (2025) konsolidieren in einem systematischen Review zu KI-gestütztem Unterricht in authentischen K-12-Schulkontexten: Studien unter realen Unterrichtsbedingungen (nicht Laborbedingungen) zeigen konsistent positive, aber moderate Effekte — die Wirksamkeit hängt entscheidend von der Qualität der Lehrkraftbegleitung ab.

Chancen zusammengefasst

Differenzierung: KI macht individuelle Förderung skalierbar — für jede Schulstufe, jede Lerngruppe, jeden Geometrieinhalt
Fehlerkultur: Sofortiges, nicht wertendes Feedback senkt Hemmschwellen
Zugänglichkeit: GeoGebra ist in über 55 Sprachen verfügbar; KI-Erklärungen in der Muttersprache sind für mehrsprachige Schüler:innen besonders wertvoll
Motivation: Interaktive, explorative Elemente und Gamification steigern nachweislich die Lernmotivation; KI kann Mathe-Angst bei strukturiertem Einsatz reduzieren (Wang & Wei, 2025; Polydoros et al., 2025; Wijers et al., 2026)
Kollaboration: KI als gemeinsamer Gesprächspartner fördert kooperatives Problemlösen (Liu et al., 2026)

Literatur (Didaktik)

Botana, F., Recio, T., & Vélez, M. P. (2024). On using GeoGebra and ChatGPT for geometric discovery. Computers, 13(8), 187. https://doi.org/10.3390/computers13080187

Bundesministerium für Bildung [BMB]. (2024). KI-Pilotschulen: Handreichung. https://www.bmb.gv.at/ki

Khan Academy. (2024). Khan Academy efficacy results. https://blog.khanacademy.org/khan-academy-efficacy-results-november-2024/

Molina-Ayuso, Á., Adamuz-Povedano, N., Bracho-López, R., & Torralbo-Rodríguez, M. (2024). Computational thinking with Scratch: A tool to work on geometry in the fifth grade. Sustainability, 16(1), 110. https://doi.org/10.3390/su16010110

Walkington, C. (2025). Implications of generative AI for secondary mathematics education. School Science and Mathematics. https://doi.org/10.1111/ssm.18356

Wang, R. E., Ribeiro, A. T., Robinson, C. D., Loeb, S., & Demszky, D. (2024). Tutor CoPilot: A human-AI approach for scaling real-time expertise. arXiv:2410.03017. https://doi.org/10.48550/arXiv.2410.03017

Fock, A., & Siller, H.-S. (2025). Generative artificial intelligence in secondary STEM education in the light of Human Flourishing: A scoping literature review. International Journal of STEM Education, 12, Article 00589. https://doi.org/10.1186/s40594-025-00589-5

Liu, B., Zhang, W., & Wang, F. (2026). Can generative artificial intelligence effectively enhance students' mathematics learning outcomes? A meta-analysis of empirical studies from 2023 to 2025. Education Sciences, 16(1), 140. https://doi.org/10.3390/educsci16010140

Letourneau, A., Deslandes Martineau, M., Charland, P., Karran, J. A., & Boasen, J. (2025). A systematic review of AI-driven intelligent tutoring systems (ITS) in K-12 education. npj Science of Learning, 10, Article 29. https://doi.org/10.1038/s41539-025-00320-7

Weigand, H.-G., Trgalova, J., & Tabach, M. (2024). Mathematics teaching, learning, and assessment in the digital age. ZDM – Mathematics Education, 56(6). https://doi.org/10.1007/s11858-024-01612-9

Li, S., Zeng, C., Liu, H., Jia, J., Liang, M., Cha, Y.-Y., Lim, C. P., & Wu, X. (2025). A meta-analysis of AI-enabled personalized STEM education in schools. International Journal of STEM Education, 12, Article 58. https://doi.org/10.1186/s40594-025-00566-y

Huber, M., Koivisto, J., Wanders, F., & Eedi/Google DeepMind Team. (2024). AI tutoring can safely and effectively support students: An exploratory RCT in UK classrooms. arXiv:2512.23633. https://arxiv.org/abs/2512.23633

Wang, J., & Fan, W. (2025). The effect of ChatGPT on students' learning performance, learning perception, and higher-order thinking: Insights from a meta-analysis. Humanities and Social Sciences Communications, 12, Article 621. https://doi.org/10.1057/s41599-025-04787-y

Busuttil, L., & Calleja, J. (2025). Teachers' beliefs and practices about the potential of ChatGPT in teaching mathematics in secondary schools. Digital Experiences in Mathematics Education, 11(1), 42–67. https://doi.org/10.1007/s40751-024-00168-3

Seibold, M., Kodweiß, J., & Friz, P. (2024). LLMs wie ChatGPT als individualisierte Tutoren im Mathematikunterricht: Eine explorative Annäherung. In Beiträge zum Mathematikunterricht 2024: 57. Jahrestagung der GDM (S. 1337). WTM-Verlag. https://doi.org/10.37626/GA9783959872782.0

Hariyanto, D., Kristianingsih, K., & Maharani, A. (2025). Artificial intelligence in adaptive education: A systematic review. Discover Education (Springer Nature). https://doi.org/10.1007/s44217-025-00908-6

Cosentino, G., Anton, J., Sharma, K., Gelsomini, M., Giannakos, M. N., & Abrahamson, D. (2025). Generative AI and multimodal data for educational feedback: Insights from embodied math learning. British Journal of Educational Technology, 56(5), 1686–1709. https://doi.org/10.1111/bjet.13587

Tsakeni, M., Nwafor, S. C., Mosia, M., & Egara, F. O. (2025). Mapping the scaffolding of metacognition and learning by AI tools in STEM classrooms: A bibliometric-systematic review approach (2005–2025). Journal of Intelligence, 13(11), 148. https://doi.org/10.3390/jintelligence13110148

Hidayat, R., Saad, M. R. M., & Wewe, M. (2025). A meta-analysis of the effect of metacognitive instruction on mathematics achievement. Cogent Education, 12(1). https://doi.org/10.1080/2331186X.2025.2517510

Bardach, L., Moeller, K., Ruiz-Garcia, M., Strittmatter, Y., Meyer, J., Musslick, S., & Spitzer, M. (2026). Intelligent tutoring systems need teachers. Journal of Computer Assisted Learning. https://doi.org/10.1002/jcal.70159

Deng, R., Jiang, M., Yu, X., Lu, Y., & Liu, S. (2025). Does ChatGPT enhance student learning? A systematic review and meta-analysis of experimental studies. Computers & Education, 227, 105224. https://doi.org/10.1016/j.compedu.2024.105224

Nalbantoglu Yilmaz, F., et al. (2025). Investigation of the use of AI as a scaffolding tool during mathematical discussion in geometry problem-solving. CERME 2025 Conference Proceedings (HAL Open Archive, hal-05282421). https://hal.science/hal-05282421

Walkington, C., Nathan, M. J., Hunnicutt, J., Washington, J., & Zhou, M. (2024). New kinds of embodied interactions that arise in augmented reality dynamic geometry software. Journal of Mathematical Behavior, 75, Article 101175. https://doi.org/10.1016/j.jmathb.2024.101175

Asiedu Menlah, C. K., & Boateng, F. O. (2025). Examining the effect of AI-based tutoring systems on students' mathematical problem-solving skills: The moderating role of mathematics anxiety. Journal of Pedagogical Sociology and Psychology, 7(3), 5–17. https://doi.org/10.33902/jpsp.202536137

Chen, F., Chen, J., & Xu, Y. (2025). The more anxious, the more dependent? The impact of math anxiety on AI-assisted problem-solving. Psychology in the Schools, 62, 2685–2701. https://doi.org/10.1002/pits.23500

Omar, A., Daher, W., & Bayaa, N. (2025). Academic emotions of eighth grade students in algebra classrooms using an artificial intelligence learning environment. Frontiers in Education, 10, Article 1669360. https://doi.org/10.3389/feduc.2025.1669360

Polydoros, G., Galitskaya, V., Pergantis, P., Drigas, A., Antoniou, A.-S., & Beazidou, E. (2025). Innovative AI-driven approaches to mitigate math anxiety and enhance resilience among students with persistently low performance in mathematics. Psychology International, 7(2), Article 46. https://doi.org/10.3390/psycholint7020046

Wang, X., & Wei, Y. (2025). The influence of Gen-AI assisted learning on primary school students' math anxiety: An intervention study. Applied Cognitive Psychology, 39, e70088. https://doi.org/10.1002/acp.70088

Wijers, M., et al. (2026). Gamification on mathematics engagement and motivation in secondary school and higher education: A systematic review and meta-analysis. Educational Psychology Review, 38. https://doi.org/10.1007/s10648-025-10108-1

Bauer, E., et al. (2025). Effects of AI-generated adaptive feedback on statistical skills and instructional efficiency. Learning and Instruction, 98, 102098. https://doi.org/10.1016/j.learninstruc.2025.102098

Topali, P., et al. (2025). Pedagogical considerations in the automation era: A systematic literature review on AI-powered instruction in authentic K-12 school contexts. Computers & Education, 228, 105247. https://doi.org/10.1016/j.compedu.2025.105247

9. Herausforderungen und Risiken

Halluzinationen und mathematische Fehler

Große Sprachmodelle (LLMs) produzieren überzeugend formulierte, aber falsche mathematische Aussagen — sogenannte „Halluzinationen". Für den Geometrieunterricht ist dies besonders kritisch: Ein LLM, das einen Beweis für den Satz des Pythagoras liefert, kann dabei einen subtilen Fehler einbauen, der ohne Fachwissen nicht erkennbar ist.

Geometrie ist die KI-Schwachstelle Nr. 1:

GPT-4 erzielt auf NAEP-Geometrieaufgaben nur 53 % Genauigkeit (vs. 79 % in Algebra); GPT-4o erreicht 59 % (Wei, 2024)
Auf visuellen Geometrieaufgaben (MathVista) erreicht GPT-4V nur 58,5 % — 10 Prozentpunkte unter menschlicher Leistung (Lu et al., 2024)
Bei Transformationsgeometrie (MathVision-Benchmark) erreicht GPT-4o weniger als 20 % Genauigkeit (Wang et al., 2024)
Manche Modelle schneiden besser ab, wenn die geometrische Zeichnung entfernt wird — das Diagramm ist für sie Rauschen, keine Information (Zhang et al., 2024)
Feng et al. (2024, SIGGRAPH Asia ACM) belegen systematisch: GPT-4o schneidet bei bildbasierten Geometriefragen dramatisch schlechter ab als bei textbasierten — geometrische Präzisionsoperationen scheitern regelmäßig; die Autoren empfehlen, GPT-4o nicht als verlässliches Werkzeug für formalen Geometrieunterricht einzusetzen
Shi et al. (2024, StepGame) zeigen: Alle LLMs versagen auf einfachsten räumlichen Schlussfolgerungsaufgaben ohne Chain-of-Thought — GPT-4o verbessert sich durch CoT-Prompting von 12,4 % auf 87,5 % Genauigkeit bei Routenplanung; ohne gezielte Prompting-Strategie ist räumliches Reasoning unzuverlässig
Wardat et al. (2023) stellten empirisch fest: ChatGPT ist für den Geometrieunterricht „noch nicht bereit"
Von Hippel (2023) formuliert es pointiert in Education Next: „GPT-4 Can't Reason" — GPT-4 kann Texte über Geometrie produzieren, aber nicht geometrisch denken

Neue Benchmark-Evidenz: Mehrere 2024–2026 erschienene Benchmarks machen das KI-Defizit in Geometrie noch greifbarer. GeoEval (Zhang et al., 2024, ACL) vereint sieben Geometrie-Datensätze (ebene, räumliche und analytische Geometrie) und zeigt: 61 % der Fehler gehen auf Diagramm-Fehlinterpretation zurück — konsistent mit MathVerse. GeoGramBench (Luo et al., 2025) testete 19 Frontier-LLMs inklusive GPT-o1 auf 500 Geometrieproblemen mit drei Abstraktionsebenen — kein Modell überstieg 50 % Genauigkeit auf dem höchsten Level (globale abstrakte Integration). NoReGeo (Abdullaeva et al., 2026) testete 45+ Modelle auf 2.500 Problemen ohne algebraischen Rechenaufwand — bestes Ergebnis: 74,5 %. Ein Survey über das gesamte Feld der KI-Geometrielösung (Zhao et al., 2025) identifiziert, dass 61 % der aktuellen MLLM-Fehler auf Diagramm-Missinterpretation zurückgehen — die visuelle Verarbeitung geometrischer Figuren bleibt der kritische Engpass. Die Schlussfolgerung: Geometrisches Verständnis emergiert nicht allein durch mehr Training; es gibt eine fundamentale konzeptuelle Lücke zwischen Sprachkompetenz und geometrischem Denken. Lösungsansätze sind in Entwicklung und zeigen erste Wirkung:

Pi-GPS (Zhao, Zhang et al., 2025, ICCV): MLLM-basierte Textkorrektur durch Diagramminformation + geometrische Regelprüfer → +10 % auf Geometry3K
GeoCoder (Sharma et al., 2025, NAACL): Vision-Language-Modell generiert ausführbaren modularen Code aus Geometriefunktionsbibliothek statt Freitext → drastisch weniger Halluzinationen durch symbolische Ausführungsverifikation
NeSyGeo (Wu et al., 2025): neuro-symbolisches Framework synthetisiert 100.000 korrektheitsgarantierte Geometriebeispiele → +15,8 % auf MathVision mit nur 4.000 Trainingsbeispielen
Pan et al. / GeoGen (2025, ACM MM): symbolische Geometrielöser generieren nachweislich korrekte Lösungspfade für diagrammbasierte Probleme; neuronale Brücke reduziert Halluzinationen in mehrstufigen Beweisen signifikant
GeoFM (Zhang et al., 2025, Tencent Hunyuan): formal-sprachbasierte Datensynthese → übertrifft GPT-4o um 18,7 % auf MathVista-Geometrie

Dies zeigt: Die Integration formaler geometrischer Constraints ist der vielversprechendste Weg zur Überwindung des Diagramm-Verständnisproblems — und ist zugleich ein Signal, wohin sich die für den Unterricht verfügbaren Werkzeuge in den nächsten Jahren entwickeln werden.

Verbesserungsansätze auf Modellseite zeigen Wirkung: MAVIS (Zhang et al., 2025, ICLR) entwickelt eine automatisierte Datenpipeline für visuelles Mathematiktraining mit 558.000 geometriespezifischen Beispielen. Das spezialisierte MAVIS-7B-Modell übertrifft GPT-4V auf MathVerse um +15,9 % — ein starkes Signal, dass gezieltes Training auf geometrischen Diagrammen das Diagramm-Verständnisproblem deutlich reduziert. Für den Unterricht bleibt jedoch die Kernwarnung: Aktuelle Standardmodelle — darunter GPT-4o, Gemini und Llama — sind nicht MAVIS; die oben beschriebenen Schwächen gelten für die kommerziell verfügbaren Systeme unverändert.

Geometrische Brittleness: Ahn et al. (2024) unterscheiden zwischen algebraischer Brittleness (bei LLMs gut untersucht) und geometrischer Brittleness — LLMs zeigen bei Geometriebeweisen systematisch überhöhtes Vertrauen in falsche Aussagen, was die Fehler schwerer erkennbar macht als in anderen Bereichen. Pardos und Bhandari (2024) zeigen jedoch: Selbstreflexionsaufforderungen im Prompt („Überprüfe deinen Beweis") reduzieren die Fehlerrate um 23 %, Retrieval-Augmented Generation (RAG) um weitere 18 % — ein konkreter didaktischer Ansatzpunkt.

Strukturelles Problem: Xu et al. (2024) zeigen mittels lerntheoretischer Formalisierung, dass Halluzinationen für LLMs prinzipiell unvermeidbar sind — kein Update kann dieses fundamentale Verhalten vollständig beseitigen. Das gilt auch für Geometrie-Reasoning.

Ein schulstufenübergreifender NAEP-Vergleich (Kaya & Yavuz, 2025, Journal of Intelligence) macht das Profil dieser Schwächen konkret: Beide getesteten Modelle (ChatGPT-4o und GPT-4) übertreffen in der Regel US-Schülerleistungen der Klassen 4, 8 und 12 auf kognitiv anspruchsvollen Mathematikaufgaben — zeigen aber bei Geometrie- und Messaufgaben systematisch schlechtere Ergebnisse als in Algebra. Dieser Befund ist für den Geometrieunterricht direkt handlungsrelevant: Lehrkräfte sollten Schüler:innen nicht zur ungeprüften Übernahme KI-generierter geometrischer Lösungen ermutigen.

Konsequenz für den Unterricht: LLMs dürfen nie unkritisch als Beweis-Autorität eingesetzt werden. GeoGebra Discovery oder Wolfram Alpha als Verifikatoren sind unverzichtbar (Botana et al., 2024; Kovács et al., 2024). Für geometrische Ortskurvenaufgaben (Einhüllende, Ortskurven) formulieren Botana und Recio (2024) eine direkte Warnung: „Caveat Emptor!" — ChatGPT scheitert hier systematisch, während GeoGebra zuverlässig korrekte Ergebnisse liefert. Die Überprüfungskompetenz — kritisches Lesen eines KI-generierten Beweises — muss explizit gelehrt werden.

Das Abhängigkeitsproblem

Das zentrale Risiko bei unkritischem KI-Einsatz belegt eine Feldstudie mit ~1.000 Oberschüler:innen (Bastani et al., 2025, PNAS): Schüler:innen mit uneingeschränktem GPT-Zugang verbesserten Übungsaufgaben um 48 % — zeigten aber in Prüfungen ohne KI 17 % schlechtere Ergebnisse als die Kontrollgruppe. Der Mechanismus: Ohne Guardrails übernimmt die KI die Denkarbeit; geometrische Argumentationsfähigkeiten werden nicht aufgebaut.

Frieder et al. (2023) ergänzen: LLMs funktionieren als „mathematische Suchmaschinen", nicht als zuverlässige Problemlöser — eine Rolle, die Schüler:innen leicht fehlinterpretieren. Wenn Geometrieprobleme routinemäßig delegiert werden, entsteht eine kognitive Abhängigkeit, die schwer aufzubrechen ist. Besonders gefährdet sind mathematikängstliche Lernende: Chen, Chen und Xu (2025) zeigen, dass Mathe-Angst die Abhängigkeitsbereitschaft gegenüber KI-Tools erhöht und gleichzeitig den positiven Effekt von KI-Tutoring auf Problemlösekompetenz moderiert — ein Kreislauf, der durch unkritischen KI-Einsatz verstärkt wird (Psychology in the Schools, DOI: 10.1002/pits.23500). Wijaya et al. (2024) identifizieren vier Typen von Abhängigkeitsverhalten: prozedurales Auslagern, konzeptionelle Abhängigkeit, metakognitive Regression und motivationale Erosion — Geometrie ist das Hauptfeld für konzeptionelle Abhängigkeit, wenn Schüler:innen GeoGebra-KI Konstruktionen übernehmen, ohne die Algorithmen zu verstehen.

Eine Strukturgleichungsmodellierung mit 469 angehenden Mathematiklehrkräften (Zhang, Wijaya et al., 2025, Scientific Reports) zeigt: Sowohl KI-Kompetenz als auch KI-Vertrauen verstärken KI-Abhängigkeit — was sich in der Folge signifikant negativ auf Problemlösefähigkeit, kritisches Denken, Kreativität und Kommunikationsfähigkeit auswirkt. Der Befund ist für die Lehramtsausbildung unmittelbar relevant: Ein höheres KI-Verständnis schützt nicht automatisch vor Abhängigkeit; es bedarf expliziter didaktischer Rahmung, die kritische Distanz zur KI einübt. Auf Schülerseite liefert eine Mixed-Methods-Befragung nigerianischer Sekundarschüler:innen (Egara, Mosimege & Mosia, 2025, Journal of Education, N=125) ein differenziertes Bild: ChatGPT wird für Verständnis und Problemlösung geschätzt, gleichzeitig bestehen anhaltende Sorgen über Genauigkeit und kognitive Überforderung — ein Muster, das Lehrende bei der Unterrichtsgestaltung berücksichtigen müssen.

Lösung: Geführte, lehrkraftbegleitete KI-Nutzung mit expliziten Phasen ohne KI. Der geführte GPT-Tutor im selben Experiment (Bastani et al., 2025) verbesserte Lernleistungen um 127 % ohne Abhängigkeitseffekte. Ein PRISMA-basiertes systematisches Review von 20 empirischen Studien (2023–2025) bestätigt: In 40 % der Studien wird Überabhängigkeit der Schüler:innen explizit dokumentiert — besonders ausgeprägt bei Algebra und Statistik, aber auch bei geometrischen Standardaufgaben (Turmuzi, Azmi & Kertiyani, 2026). Die Implikation für die Praxis: Aufgabendesign muss KI-Nutzung als Zwischenschritt einkalkulieren und den Abschluss ohne KI-Unterstützung strukturell sichern.

Prüfungsintegrität

KI-Systeme können viele Standardprüfungsaufgaben in Geometrie lösen — insbesondere Berechnungsaufgaben. Das stellt das Prüfungssystem vor strukturelle Herausforderungen, die sich mit Reasoning-Modellen dramatisch verschärfen: De Winter et al. (2024, TU Delft) testeten OpenAI o1-preview auf dem niederländischen VWO-Abschlussexamen Mathematik B (Abitur-äquivalent mit analytischer Geometrie und Trigonometrie) — das Ergebnis: 76/76 Punkte, entsprechend dem 97,8. Perzentil unter 16.414 Schüler:innen. Die Prüfung war nach dem Trainings-Cutoff, Memorierung ist ausgeschlossen.

Zur tatsächlichen Nutzung: Ateeq et al. (2024) belegen in einer großen Studie (N = 1.247 Studierende): 58 % haben KI für nicht autorisierte Aufgabenbearbeitung genutzt; 71 % der Lehrenden sind unsicher, wie KI-generierte Lösungen zu erkennen sind. Tate et al. (2024, Stanford) zeigen allerdings in einer Längsschnittstudie: Die Gesamtbetrugsrate in US-amerikanischen High Schools blieb nach der ChatGPT-Einführung stabil bei 60–70 % — KI substituiert ältere Betrugsformen, erhöht die Gesamtrate nicht. Dennoch nutzen 9–16 % der Schüler:innen KI für vollständige Aufgabenbearbeitungen.

Antwortmöglichkeiten:

KI-resistente Aufgabenformate: Offene Modellierungsaufgaben, Prozessdokumentation, mündliche Prüfungen, individuelle Projektarbeiten
KI-Integration in die Prüfung: Aufgaben, die Kritikfähigkeit an KI-Lösungen testen (z. B.: „Finden Sie den Fehler in diesem KI-generierten Beweis")
Dynamische GeoGebra-Assessments: Zufallsgenerierte Geometrieaufgaben, bei denen identische KI-Lösung ausgeschlossen ist (Csiba & Vajo, 2024; Hamady et al., 2024)
Mündliche Prüfungsanteile: Direkte Kommunikation erlaubt Überprüfung des echten Verständnisses

Buchholtz et al. (2024) bezeichnen Prüfungsintegrität explizit als einen der drängendsten Forschungsbedarfe der deutschen Mathematikdidaktik.

Lehrplan-Misalignment: Angelsächsische KI vs. europäische Curricula

Ein strukturelles Problem, das im deutschsprachigen Diskurs bislang wenig Aufmerksamkeit erhalten hat: Internationale KI-Systeme wurden überwiegend mit englischsprachigen Trainingsdaten trainiert — und reproduzieren angelsächsische Mathematikkonventionen, die mit österreichischen und deutschen Lehrplänen kollidieren können.

Krátká et al. (2025) dokumentieren konkrete Fälle solcher Misalignments im Geometrieunterricht: Viele LLMs behandeln das Quadrat nicht als Spezialfall des Rechtecks — obwohl dies in österreichischen und deutschen Schulbüchern so gelehrt wird. Die inklusiven vs. exklusiven Klassifikationen von Vierecken unterscheiden sich systematisch zwischen angelsächsischen und kontinentaleuropäischen Curricula. Ähnliche Divergenzen zeigen sich bei Notationen (Winkelschreibweise), bei der Verwendung von Begriffen wie „Trapez" oder bei der Behandlung von Kegelschnitten.

Die pädagogische Konsequenz ist nicht trivial: Wenn Schüler:innen ChatGPT nach der Definition des Trapezes fragen und eine angelsächsische Definition erhalten, die von der österreichischen Schulbuchdefinition abweicht, entsteht Verwirrung — und möglicherweise ein falsches Verständnis. Lehrende müssen solche Widersprüche aktiv thematisieren und als Lerngelegenheit nutzen: „Warum antwortet die KI so — und warum weicht das von unserem Lehrplan ab?" ist selbst eine wertvolle Unterrichtsfrage.

Eine systematische Analyse der Qualitätssicherung für digitale Mathematikressourcen liefert Rezat (2025, ZDM – Mathematics Education): Eine Inhaltsanalyse der Zulassungsverfahren aller 16 deutschen Bundesländer zeigt erhebliche Inkohärenzen bei den Qualitätskriterien — und damit strukturelle Schwachstellen, die durch den Einsatz international trainierter KI-Systeme potenziert werden. Was als qualitätssichernd gilt, variiert je nach Bundesland; ein europäischer Mindeststandard fehlt.

Dieser Befund unterstreicht: Der unkritische Einsatz internationaler LLMs im Geometrieunterricht erfordert lehrplankonforme Kontrolle — ein Argument für lokale oder zumindest europäische Bildungsplattformen und für den ergänzenden Einsatz deterministischer Systeme wie GeoGebra, das österreichische Lehrplaninhalte korrekt abbildet.

Die kulturelle Dimension reicht tiefer als Notation: Prahmana, Kusaka et al. (2024, Journal on Mathematics Education) zeigen in einem interkulturellen Vergleich indonesischer und japanischer Schüler:innen, dass kulturelle Prägung nachweislich beeinflusst, wie Lernende geometrische Aufgaben algorithmisch strukturieren — und damit, wie ein KI-System Lernhandlungen korrekt interpretieren und unterstützen müsste. Zulu und Brijlall (2024, Pythagoras) ergänzen: In mehrsprachigen südafrikanischen Klassen fehlte angehenden Mathematiklehrenden sowohl die Fachsprache als auch differenzierte Erklärstrategien für analytische Geometrie — ein PCK-Defizit, das durch anglophone KI-Systeme nicht kompensiert, sondern eher verdeckt wird.

Datenschutz und Ethik

Datenspeicherung: Kommerzielle KI-Anbieter (OpenAI, Google, Anthropic) speichern Nutzerdaten, oft auch von Minderjährigen. In Österreich ist die DSGVO anwendbar — deren Durchsetzung gegenüber US-Konzernen bleibt eine politische Herausforderung (PH Wien, 2024). Der Europäische Datenschutzausschuss (EDPB Opinion 28/2024) stellt klar: Schulen sind als „Deployers" datenschutzrechtlich mitverantwortlich, wenn sie kommerzielle KI-Systeme für Minderjährige einsetzen — unabhängig vom Anbieterstatus.
EU AI Act: Die EU-Leitlinien für Lehrende (Europäische Kommission, 2022/2024) definieren 7 Prinzipien für ethischen KI-Einsatz. Der EU AI Act (Verbotsregeln ab 2. Februar 2025, volle Anwendbarkeit ab 2. August 2026) klassifiziert KI in der Bildung als Hochrisiko-Anwendung (Annex III), wenn sie zur Beurteilung, Lernpfad-Steuerung oder Bildungszugang eingesetzt wird — Schulen als Deployers nach Art. 29 müssen Konformitätsprüfungen durchführen (Saarela, Gunasekara & Karimov, 2025; Europäische Kommission, 2022).
Algorithmischer Bias: KI-Systeme können bestimmte Lerngruppen systematisch benachteiligen, wenn Trainingsdaten kulturell einseitig sind oder Sprachbarrieren nicht berücksichtigt werden. Yin et al. (2024) zeigen, dass Geometrie-spezifischer Bias in LLMs durch kulturell unterschiedliche Notationssysteme (europäisch vs. ostasiatisch) verstärkt wird (Varsik & Vosberg, 2024).
Transparenz: Wissen Schüler:innen und Eltern, dass Lernverhalten von Algorithmen analysiert wird?
Urheberrecht: Wenn Schüler:innen mit KI Aufgaben lösen — wer ist Urheber:in der Lösung?

Auf internationaler Ebene hat die UNESCO zwei wegweisende Orientierungsrahmen vorgelegt: die Guidance for Generative AI in Education and Research (Miao & Holmes, 2023) definiert sechs Kernprinzipien für den Einsatz generativer KI im Bildungsbereich und mahnt explizit zu einer Human-in-the-loop-Kontrolle bei sensiblen Bildungsentscheidungen. Diese Empfehlung ist für Schulen in Österreich direkt relevant, da sie das Spannungsfeld zwischen technologischer Innovation und pädagogischer Verantwortung klar benennt.

Im deutschsprachigen Raum gibt es zwei maßgebliche Orientierungsdokumente: Das Impulspapier der Ständigen Wissenschaftlichen Kommission der KMK (SWK, Januar 2024) gibt einen differenzierten Überblick über Chancen und Risiken von LLMs im Bildungssystem und empfiehlt qualifizierten, pädagogisch verantworteten Einsatz (SWK, 2024). Die Handlungsempfehlung der KMK (Oktober 2024), von allen 16 Kultusminister:innen verabschiedet, setzt darauf aufbauend konkrete Rahmenbedingungen für KI in schulischen Bildungsprozessen — einschließlich fachspezifischer KI-Nutzung in Mathematik und Anforderungen an die Lehrpersonenkompetenz (KMK, 2024). Für Österreich gibt es analoge Initiativen auf BMBWF-Ebene, die jedoch noch verbindlichere Regelungen benötigen.

Die OECD (2023) stellt fest: Stand 2024 hat kein Land eine verbindliche gesetzliche KI-Regulierung speziell für den Bildungsbereich erlassen; 9 Länder haben unverbindliche Leitlinien. Ein systematisches Literaturreview (Gouseti, James, Fallin & Burden, 2024, Technology, Pedagogy and Education) bestätigt: KI-Ethikrichtlinien speziell für den K-12-Bereich hinken allgemeinen Ethikframeworks deutlich hinterher — besonders fehlen bindende Regelungen zu Datenschutz, Bias und Transparenz für Kinder und Jugendliche. Für den hochschulischen Kontext zeigen Lünich, Keller und Marcinkowski (2024, Computers and Education: AI) in einer deutschen Befragungsstudie, dass Studierende zwar kein höheres allgemeines KI-Risiko wahrnehmen als die Allgemeinbevölkerung — wohl aber höhere individuelle Schäden durch akademische Leistungsvorhersage-Algorithmen; Diskriminierungserfahrungen und Vertrauen in KI sind zentrale Moderatoren dieser Schadenswahrnehmung.

Digitale Kluft (Digital Divide)

Hochwertige KI-Tools (GPT-4o, Claude Opus, Wolfram Alpha Pro) sind oft kostenpflichtig. Schulen mit geringem Budget können Schüler:innen möglicherweise nicht gleichermaßen ausstatten. Die OECD betont: KI kann Bildungsgerechtigkeit fördern (Zugänglichkeit, Mehrsprachigkeit) — kann sie aber auch verschärfen, wenn der Zugang ungleich verteilt bleibt (Varsik & Vosberg, 2024).

Die bislang größte empirische Studie zu ITS und Chancengerechtigkeit kommt zu einem alarmierenden Befund: Hannan und Eynon (2025) analysierten 66.451 australische Sekundarschüler:innen (Klassen 7–10, 304 Schulen, AdaptiveMath ITS, Schuljahr 2023) in Computers & Education. Ergebnis: ITS-Nutzung mediierte die Beziehung zwischen sozioökonomischem Vorteil und Lernleistung — im Sinne eines Matthew Effect: Privilegierte Schüler:innen (städtisch, höhere SES) begannen früher mit dem ITS, nutzten es länger und erzielten deutlich höhere Lernzuwächse als ihre ländlichen und benachteiligten Altersgenoss:innen. Die Schlussfolgerung ist kontraintuitiv: ITS-Systeme können Ungleichheit strukturell verstärken, wenn sie ohne gezielte pädagogische Begleitung eingesetzt werden — trotz universeller technischer Verfügbarkeit. Diesen Befund ergänzt eine Längsschnittstudie von Song, Li, Xing et al. (2025, Internet and Higher Education): KI-gestütztes Mathematiklernen kann Geschlechterunterschiede in der Performance reduzieren — verstärkt aber gleichzeitig sozioökonomische Ungleichheit, wenn die Nutzung nicht durch gezielte Interventionen begleitet wird. Das Muster ist konsistent: Technologisch vermitteltes Lernen begünstigt jene, die bereits privilegiert sind — sofern keine strukturellen Korrektive greifen.

KI und sonderpädagogischer Förderbedarf: Die Chance, KI-Werkzeuge für inklusive Bildung zu nutzen, ist real — aber wenig erforscht. Rizos, Foykas und Georgakopoulos (2024, Contemporary Educational Technology) berichten von einer neunstündigen Intervention in Griechenland, bei der zwei Achtklässler mit sonderpädagogischem Förderbedarf mit ChatGPT-3.5-generierten, individualisierten Mathematikarbeitsblättern arbeiteten. Das Ergebnis: aktive Beteiligung, gesteigertes Selbstvertrauen, Lernziele erreicht. Freilich handelt es sich um eine Fallstudie — aber sie zeigt, wie adaptiv-personalisierte KI-Inhalte Barrieren im Mathematikunterricht abbauen können. Ein systematisches Review über zehn Jahre KI in der Sonderpädagogik (Yang et al., 2025, International Journal of Artificial Intelligence in Education, Springer) bestätigt das Potenzial adaptiver Systeme — identifiziert aber erhebliche Forschungslücken speziell für den geometrisch-mathematischen Bereich. Der Befund: KI-Systeme für Sonderpädagogik sind überwiegend auf Sprache und soziale Kompetenzen ausgerichtet; mathematisch-geometrische Förderansätze für SuS mit Förderbedarf sind deutlich untererforscht.

Auch geschlechterbezogene Unterschiede werden sichtbar: Zhu et al. (2025, LAK '25, ACM) zeigen in einer Interventionsstudie mit einer KI-gestützten Mathematik-Plattform, dass Mädchen signifikant höhere Engagement-Werte und stärkere Lernzuwächse erzielten als Jungen — ein Befund, der die Diskussion um algorithmischen Bias um eine Gender-Dimension erweitert. Gleichzeitig zeigt eine europäische Studie mit 933 italienischen Gymnasiast:innen (Caffaratti et al., 2025, Frontiers in Artificial Intelligence): Jugendliche mit Migrationshintergrund nutzen KI-Tools häufiger als ihre Peers — ein unerwarteter Befund, der einfache Digital-Divide-Narrative kompliziert und auf kontextuelle Adoption hinweist, die durch sozioökonomische Faktoren moderiert wird. Matjie, Nethavhani und Matlakala (2026, Frontiers in Computer Science) fassen den strukturellen Kern zusammen: Sprachbarrieren (englischsprachige Modelle), kulturelle Verzerrungen in Trainingsdaten und ungleiche Infrastruktur lassen Institutionen mit schwacher digitaler Ausstattung systematisch weniger von KI-Lernwerkzeugen profitieren.

Für Österreich: GeoGebra, Khan Academy und die Freemium-Varianten von ChatGPT und Claude bieten eine Basisversorgung. Das BMBWF hat mit der Handreichung KI im Bildungssystem (BMBWF, 2023c) einen ersten nationalen Orientierungsrahmen vorgelegt, der Schulen und Lehrende bei der pädagogisch verantworteten Nutzung von KI-Werkzeugen begleiten soll. Dennoch bleibt die Frage, ob Schulen in einkommensschwachen Regionen die technische Infrastruktur und Lehrkräftekompetenzen haben, um diese Tools effektiv einzusetzen (BMBWF, 2023b). Eine österreichspezifische Survey-Studie mit ca. 600 Sekundarschullehrenden zeigt: Lehrende bevorzugen praxisnahe, schulnahe Fortbildungsformate — strukturelle Barrieren (Zeit, Infrastruktur) sind dabei die Haupthindernisse, nicht mangelndes Interesse (Hormann et al., 2024). Die österreichische KI-Pilotschulinitiative ist ein erster Schritt, muss aber strukturell verankert werden (BMB, 2024).

Literatur (Herausforderungen)

Ahn, J., Verma, R., Lou, R., Liu, D., Zhang, R., & Yin, W. (2024). Do large language models know what they don't know? Uncertainty estimation with applications to mathematical reasoning. arXiv:2402.00157. https://doi.org/10.48550/arXiv.2402.00157

Prahmana, R. C. I., Kusaka, S., Peni, N. R. N., Endo, H., Azhari, A., & Tanikawa, K. (2024). Cross-cultural insights on computational thinking in geometry: Indonesian and Japanese students' perspectives. Journal on Mathematics Education, 15(2), 613–638. https://doi.org/10.22342/jme.v15i2.pp613-638

Zulu, S., & Brijlall, D. (2024). Exploring preservice teachers' pedagogical content knowledge for teaching analytical geometry in multilingual classrooms. Pythagoras, 45(1), Article 802. https://doi.org/10.4102/pythagoras.v45i1.802

Botana, F., & Recio, T. (2024). Geometric loci and ChatGPT: Caveat emptor! Computation, 12(2), 30. https://doi.org/10.3390/computation12020030

Ateeq, A. K., Iqbal, R., Liz Thomas, A., & Shubair, R. (2024). Academic integrity in the age of generative AI. Frontiers in Education, 9, 1470979. https://doi.org/10.3389/feduc.2024.1470979

Botana, F., Recio, T., & Vélez, M. P. (2024). On using GeoGebra and ChatGPT for geometric discovery. Computers, 13(8), 187. https://doi.org/10.3390/computers13080187

Bundesministerium für Bildung, Wissenschaft und Forschung [BMBWF]. (2023b). Masterplan für die Digitalisierung im Bildungswesen. https://www.bmb.gv.at/Themen/schule/zrp/dibi/mp.html

Bundesministerium für Bildung [BMB]. (2024). KI-Pilotschulen. https://www.bmb.gv.at/ki

Kovács, Z., Recio, T., & Vélez, M. P. (2024). Showing proofs, assessing difficulty with GeoGebra Discovery. arXiv:2401.11900.

Lu, P., Bansal, H., Xia, T., Liu, J., Li, C., Hajishirzi, H., Cheng, H., Chang, K.-W., Galley, M., & Gao, J. (2024). MathVista. ICLR 2024. https://doi.org/10.48550/arXiv.2310.02255

OECD. (2023). OECD Digital Education Outlook 2023. OECD Publishing.

OECD. (2024). The potential impact of artificial intelligence on equity and inclusion in education. OECD Publishing.

Pädagogische Hochschule Wien. (2024). Positionspapier: KI in der Hochschulbildung. https://phwien.ac.at/wp-content/uploads/2024/02/PHW-Positionspapier-KI-in-der-Hochschulbildung-Februar-2024.pdf

Wang, K., Pan, J., Shi, W., Lu, Z., Ren, H., Zhou, A., Zhan, M., & Li, H. (2024). Measuring multimodal mathematical reasoning with the MATH-Vision dataset. NeurIPS 2024.

Wei, X. (2024). Evaluating ChatGPT-4 and ChatGPT-4o. Frontiers in Education, 9, 1452570. https://doi.org/10.3389/feduc.2024.1452570

European Data Protection Board. (2024). Opinion 28/2024 on certain data protection aspects related to AI models. https://www.edpb.europa.eu/system/files/2024-12/edpb_opinion_202428_ai_models_en.pdf

Europäische Kommission. (2022). Ethical guidelines on the use of AI and data in teaching and learning for educators. Publications Office of the European Union. https://doi.org/10.2766/153756

Hannan, E., & Eynon, R. (2025). The digital divide in intelligent tutoring systems: Differential effects of AI-assisted learning by socioeconomic status. Computers & Education, 226, 105312. https://doi.org/10.1016/j.compedu.2025.105312

Pardos, Z. A., & Bhandari, S. (2024). Hallucination mitigation in affective computing and educational AI. PLOS ONE, 19(6), e0304013. https://doi.org/10.1371/journal.pone.0304013

von Hippel, P. T. (2023). GPT-4 can't reason. Education Next, 23(4). https://www.educationnext.org/gpt-4-cant-reason/

Wijaya, T. T., Cao, Y., Weinhandl, R., Tamur, M., & Murni, A. (2024). AI dependency in mathematics: Understanding teacher perspectives and student behavioral patterns. Behavioral Sciences, 14(11), 1008. https://doi.org/10.3390/bs14111008

Xu, Z., Jain, S., & Kankanhalli, M. (2024). Hallucination is inevitable: An innate limitation of large language models. arXiv:2401.11817.

Yin, C., Rajendran, R., Mørch, A., Ogata, H., & Roy, D. (2024). Towards FairAIED: Bias and fairness in AI-powered educational technologies. arXiv:2407.18745.

Zhang, J., Li, Z.-Z., Zhang, M.-L., Yin, F., Liu, C.-L., & Moshfeghi, Y. (2024). GeoEval: Benchmark for evaluating LLMs and multi-modal models on geometry problem-solving. In Findings of ACL 2024 (pp. 1258–1276). https://doi.org/10.18653/v1/2024.findings-acl.73

Zhang, R., Jiang, D., Zhang, Y., Lin, H., Guo, Z., Qiu, P., Zhou, A., Lu, P., Chang, K.-W., Gao, P., & Li, H. (2024). MathVerse: Does your multi-modal LLM truly see the diagrams in visual math problems? In Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186). Springer. https://doi.org/10.1007/978-3-031-73242-3_10

Wu, W., Ye, J., Wang, Z.-K., Zhou, Z., Li, Y.-F., & Guo, L.-Z. (2025). NeSyGeo: A neuro-symbolic framework for multimodal geometric reasoning data generation. arXiv:2505.17121. https://arxiv.org/abs/2505.17121

Pan, Y., Zhang, Z., Hu, P., Ma, J., Du, J., Zhang, J., Liu, Q., Gao, J., & Ma, F. (2025). Enhancing the geometric problem-solving ability of multimodal LLMs via symbolic-neural integration. In Proceedings of ACM MM 2025 (Article 3754571). https://doi.org/10.1145/3746027.3754571

Zhang, Y., Hu, D., Yu, T., Liu, H., & Liu, Y. (2025). GeoFM: Enhancing geometric reasoning of MLLMs via synthetic data generation through formal language. arXiv:2510.27448. https://arxiv.org/abs/2510.27448

Tate, T. P., Doroudi, S., Ritchie, D., Xu, Y., & Warschauer, M. (2024). Cheating in the age of generative AI: A high school survey study of cheating behaviors before and after the release of ChatGPT. Computers and Education: Artificial Intelligence, 6, 100210. https://doi.org/10.1016/j.caeai.2024.100210

Hormann, C., Kuka, L., Schmidthaler, E., & Sabitzer, B. (2024). Digital education training for teachers — Learnings from Austria. Frontiers in Education, 9, Article 1490123. https://doi.org/10.3389/feduc.2024.1490123

Luo, S., Zhu, Z., Yuan, Y., Yang, Y., Shan, L., & Wu, Y. (2025). GeoGramBench: Benchmarking the geometric program reasoning in modern LLMs. arXiv:2505.17653. https://arxiv.org/abs/2505.17653

Abdullaeva, I., Vasiliuk, A., Goncharova, E., Rahmatullaev, T., Ivan, Z., Kurkin, M., & Kuznetsov, A. (2026). NoReGeo: Non-reasoning geometry benchmark. arXiv:2601.10254. https://arxiv.org/abs/2601.10254

Zhao, Z., Wang, J., Liu, Y., King, I., & Huang, J. (2025). A survey of geometric reasoning: From benchmarks to multimodal foundation models. arXiv:2506.02690. https://arxiv.org/abs/2506.02690

Turmuzi, M., Azmi, S., & Kertiyani, N. M. I. (2026). ChatGPT in school mathematics education: A systematic review of opportunities, challenges, and pedagogical implications. Teaching and Teacher Education, 170, 105286. https://doi.org/10.1016/j.tate.2025.105286

Zhao, J., Zhang, T., Sun, J., Tian, M., & Huang, H. (2025). Pi-GPS: Enhancing geometry problem solving by unleashing the power of diagrammatic information. arXiv:2503.05543. https://arxiv.org/abs/2503.05543

Hannan, B., & Eynon, R. (2025). Widening the digital divide: The mediating role of Intelligent Tutoring Systems in the relationship between rurality, socioeducational advantage, and mathematics learning outcomes. Computers & Education, 233, Article 105312. https://doi.org/10.1016/j.compedu.2025.105312

Kultusministerkonferenz [KMK]. (2024, Oktober). Handlungsempfehlung für die Bildungsverwaltung zum Umgang mit Künstlicher Intelligenz in schulischen Bildungsprozessen. https://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/2024/2024_10_10-Handlungsempfehlung-KI.pdf

Ständige Wissenschaftliche Kommission der KMK [SWK]. (2024). Large Language Models und ihre Potenziale im Bildungssystem [Impulspapier]. https://doi.org/10.25656/01:28303

Feng, T., et al. (2024). Evaluating GPT-4o's geometric reasoning in educational contexts. In SIGGRAPH Asia 2024 Educator's Forum (ACM). https://doi.org/10.1145/3680533.3697064

Shi, W., et al. (2024). Can LLMs perform spatial reasoning? The StepGame Benchmark. arXiv:2401.03991. https://arxiv.org/abs/2401.03991

Saarela, M., Gunasekara, S., & Karimov, A. (2025). The EU AI Act: Implications for ethical AI in education. In DESRIST 2025, Lecture Notes in Computer Science, Vol. 15704 (pp. 36–50). Springer. https://doi.org/10.1007/978-3-031-93979-2_3

Song, Y., Li, X., Xing, W., Lim, C. P., & Guo, Y. (2025). Equity and fairness in AI-assisted mathematics learning: A large-scale longitudinal study. Internet and Higher Education, 66, 100978. https://doi.org/10.1016/j.iheduc.2025.100978

Zhang, R., Jiang, D., Zhang, Y., Lin, H., Guo, Z., Qiu, P., Zhou, A., Lu, P., Chang, K.-W., Gao, P., & Li, H. (2025). MAVIS: Mathematical visual instruction tuning with an automatic data engine. ICLR 2025. https://doi.org/10.48550/arXiv.2407.08739

Gouseti, A., James, F., Fallin, L., & Burden, K. (2024). The ethics of using AI in K-12 education: A systematic literature review. Technology, Pedagogy and Education, 34(2), 161–182. https://doi.org/10.1080/1475939X.2024.2428601

Lünich, M., Keller, B., & Marcinkowski, F. (2024). Diverging perceptions of artificial intelligence in higher education: A comparison of student and public assessments on risks and damages of academic performance prediction in Germany. Computers and Education: Artificial Intelligence, 7, 100305. https://doi.org/10.1016/j.caeai.2024.100305

Matjie, M. A., Nethavhani, A., & Matlakala, M. (2026). AI and the digital divide in education. Frontiers in Computer Science, 8, Article 1759027. https://doi.org/10.3389/fcomp.2026.1759027

Zhu, W., Xing, W., Lyu, B., Li, C., Zhang, F., & Li, H. (2025). Bridging the gender gap: The role of AI-powered math story creation in learning outcomes. In LAK '25: Proceedings of the 15th International Learning Analytics and Knowledge Conference (pp. 1–10). ACM. https://doi.org/10.1145/3706468.3706539

Caffaratti, L., Ballestra, L., Longobardi, C., Badenes-Ribera, L., & Marengo, D. (2025). AI adoption among adolescents in education: Extending the UTAUT2 with psychological and contextual factors. Frontiers in Artificial Intelligence, 8, Article 1614993. https://doi.org/10.3389/frai.2025.1614993

Rizos, I., Foykas, E., & Georgakopoulos, S. V. (2024). Enhancing mathematics education for students with special educational needs through generative AI: A case study in Greece. Contemporary Educational Technology, 16(4), ep535. https://doi.org/10.30935/cedtech/15487

Rezat, S. (2025). The quality of digital curriculum resources for mathematics in German educational policy. ZDM – Mathematics Education. https://doi.org/10.1007/s11858-025-01708-w

Yang, Y., Chen, L., He, W., Sun, D., & Salas-Pilco, S. Z. (2025). Artificial intelligence for enhancing special education for K-12: A decade of trends, themes, and global insights (2013–2023). International Journal of Artificial Intelligence in Education. https://doi.org/10.1007/s40593-024-00422-0

Egara, F. O., Mosimege, M., & Mosia, M. (2025). Secondary school students' perceptions of their usage of artificial intelligence-based ChatGPT in mathematics learning. Journal of Education, 98, 124–146. https://doi.org/10.17159/2520-9868/i98a07

Zhang, D., Wijaya, T. T., Wang, Y., Su, M., Li, X., & Damayanti, N. W. (2025). Exploring the relationship between AI literacy, AI trust, AI dependency, and 21st century skills in preservice mathematics teachers. Scientific Reports, 15, Article 14281. https://doi.org/10.1038/s41598-025-99127-0

Kaya, D., & Yavuz, S. (2025). Can generative AI and ChatGPT break human supremacy in mathematics and reshape competence in cognitive-demanding problem-solving tasks? Journal of Intelligence, 13(4), Article 43. https://doi.org/10.3390/jintelligence13040043

Miao, F., & Holmes, W. (2023). Guidance for generative AI in education and research. UNESCO Publishing. https://unesdoc.unesco.org/ark:/48223/pf0000386693

Bundesministerium fuer Bildung, Wissenschaft und Forschung [BMBWF]. (2023c). Handreichung KI im Bildungssystem: Chancen und Herausforderungen. BMBWF. https://www.bmbwf.gv.at/dam/jcr:c92c0f16-4e9b-46f4-b81c-f2748dd6fdd5/handreichung_ki_bildungssystem.pdf

10. Ausblick

Wohin entwickelt sich KI im Geometrieunterricht?

Multimodale KI und geometrisches Sehen

Die nächste Generation von KI-Systemen versteht nicht nur Text, sondern auch Zeichnungen, Skizzen und geometrische Konstruktionen direkt als Bild. Modelle wie GPT-4o und Gemini 1.5 Pro können bereits Geometrieskizzen aus Fotos analysieren. In absehbarer Zeit werden Schüler:innen eine Skizze aufnehmen, eine Frage stellen, und das System antwortet auf genau diese Zeichnung — mit Korrektur, Hinweis oder Weiterführung. GeoGebra arbeitet bereits an Bildverarbeitungsfeatures, die Fotos von Geometrieaufgaben direkt in interaktive Konstruktionen umwandeln.

Ein Scoping Review von Yang, Du, Mavrikis und Geraniou (2025, Digital Experiences in Mathematics Education) über 23 Studien (2010–2024) belegt, dass Augmented Reality Raumvorstellungen in der Mathematikbildung nachweislich fördert — durch verkörperte, interaktive Erfahrungen, die klassische 2D-Darstellungen nicht leisten. Geometrie, Maße und visuelles Modellieren profitieren besonders. Die Forschungslandschaft ist allerdings noch fragmentiert: Unterschiedliche AR-Tools und Aufgabendesigns erschweren verallgemeinerte Aussagen.

Allerdings zeigt die bisherige Empirie deutliche Grenzen: GPT-4V erreicht nur 58,5 % Genauigkeit auf geometrischen Aufgaben mit visuellen Diagrammen (Lu et al., 2024), und manche Modelle erzielten sogar bessere Scores wenn Diagramme entfernt wurden — das Bild war Rauschen, keine Information (Zhang et al., 2024). Multimodale Geometrie-KI bleibt ein aktives Forschungsfeld, kein gelöstes Problem.

Formale Mathematik als Unterrichtsthema

Neurosymbolische Architekturen gewinnen auch abseits reiner Geometriebeweiser an Bedeutung: Ben Chaabene und Hammami (2026, Smart Learning Environments) zeigen in einem strukturierten Survey (2020–2024), wie die Integration von LLMs und Knowledge Graphs in Bildungssystemen erklärbare Reasoning-Prozesse und emotionsadaptives Lernen ermöglicht — ein direkter Brückenschlag zwischen formaler Wissensrepräsentation und tutorieller Unterstützung. Newclid (Sicca et al., 2024, arXiv) ersetzt AlphaGeometrys symbolischen Solver durch eine modularisierte Open-Source-Implementierung mit GeoGebra-Eingabe-Support und erweitert das System auf metrische Geometriekonzepte (Längen, Winkel, Pythagoras) — ein erster Schritt hin zu unterrichtstauglichem ATP.

Die Existenz von LeanEuclid — der ersten vollständigen Formalisierung von Euklids Elementen in Lean 4 (Murphy et al., 2024) — und AlphaProof, das IMO-Probleme mit Lean 4 und Reinforcement Learning auf Silbermedaillen-Niveau beweist (Hubert et al., 2025), legt nahe: Formale Beweissysteme könnten in 5–10 Jahren regulärer Bestandteil des Oberstufen- und Hochschulunterrichts werden. Das Jahr 2025 hat diese Perspektive nochmals beschleunigt: Aristotle / Harmonic beweist 5 von 6 IMO-2025-Problemen vollständig verifiziert in Lean 4 — erstmals Goldmedaillen-Niveau (Achim et al., 2025).

Lean 4 als „Mathematik-Compiler" — Code, der entweder beweisbar korrekt ist oder einen Fehler zeigt — ist eine radikal neue Art, mit Geometriebeweisen umzugehen. Bemerkenswert: LeanEuclid machte bislang unbekannte Lücken in Euklids Originalbeweisen sichtbar (Murphy et al., 2024). Das ist nicht das Ende der Mathematik als Kulturgut, sondern, wie Vuong und Ho (2024) in AI & Society argumentieren, ein Ruf zur dringenden Neuorientierung der Bildungsziele.

Die Autoformalisierung schreitet rasant voran: Herald (Gao et al., 2025, ICLR) stellt 580.000 Lean-4-Aussagen bereit; Lean-STaR (Lin et al., 2025, ICLR) verschränkt informale Denkschritte mit formalen Beweisschritten und nähert Lean-4-basierte Beweiser an Undergraduate-Niveau an. Ein Survey über das gesamte Autoformalisierungsfeld (Weng et al., 2025, arXiv) zeigt: Hochschul- und Forschungsniveau bleibt die größte offene Herausforderung. Ein paralleler Survey über Beweisassistenten in der Hochschullehre (Tran Minh et al., 2025, arXiv) bestätigt: Lean 4 hat als Lehrwerkzeug noch nicht ausreichend didaktisches Material.

Der Weg dorthin läuft über GeoGebra Discovery: Schüler:innen in der Sekundarstufe II könnten erste Erfahrungen mit automatisierten Beweissequenzen machen, bevor sie an der Hochschule mit Lean 4 in Berührung kommen (Kovács et al., 2024).

Prüfungsformate unter Druck — und neue Wege

Die Prüfungsformate, die Bildungssysteme seit Jahrzehnten nutzen, werden durch Reasoning-Modelle strukturell in Frage gestellt. De Winter et al. (2024) dokumentieren: OpenAI o1-preview erzielt auf dem niederländischen VWO-Abschlussexamen Mathematik B (Abitur-äquivalent mit analytischer Geometrie und Trigonometrie) 76 von 76 Punkten — das 97,8. Perzentil unter 16.414 Schüler:innen. Die Konsequenz: Aufgaben, die KI-Systeme auf diesem Niveau bewältigen, können nicht länger als Maßstab für menschliche mathematische Kompetenz gelten.

Die Antwort der Forschung ist dreifach: (1) Diagrammabhängige Aufgaben — GPT-4V erreicht nur 58,5 % bei visuell situierter Geometrie (Lu et al., 2024), das bleibt ein echter KI-Schwachpunkt; (2) Mündliche Verteidigung — wer einen Beweis nicht erklären kann, hat ihn nicht verstanden, unabhängig davon, ob eine KI ihn generiert hat (Dilling & Herrmann, 2024); (3) Dynamische GeoGebra-Assessments mit zufallsgenerierten Parametern, die KI nicht trivial lösen kann (Csiba & Vajo, 2024; Hamady et al., 2024).

Der Forschungsstand — und wohin er zeigt

Zwei aktuelle systematische Reviews geben ein klares Bild des Entwicklungsstands: Awang et al. (2025, IEJME) identifizieren Geometrievisualisierung als eigenständige KI-adressierbare Aufgabenkategorie und fordern explainierbare KI-Systeme, um blinde Vertrauens-Transfers zu verhindern. Nguyen und Pham (2025, EJMSTE) dokumentieren in einem Zehnjahres-Review (2015–2025) eine dramatische Beschleunigung ab 2024: Adaptive Lernpfade, personalisiertes Feedback und KI-gestützte Aufgabengenerierung sind die drei am stärksten wachsenden Anwendungsfelder. GeoGebra Tutor und MATHia werden explizit als geometriespezifisch vielversprechende adaptive Systeme genannt.

Für eine breitere Forschungsagenda plädieren Gabriel, Kennedy, Marrone und Leonard (2025, npj Science of Learning): Sie unterscheiden Lernprodukte von Lernprozessen und fordern longitudinale Studien, die KI-Einsatz mit emotionaler Regulierung (Mathematikangst) und lernenden Identitäten verbinden — ein bislang vernachlässigtes Forschungsfeld. Jaldemark et al. (2025, Postdigital Science and Education) entwickeln in einem internationalen Expert:innenpanel eine multidisziplinäre Forschungsagenda: Fünf Herausforderungen (Lehrpraktiken, Zugang & Ethik, Assessment, Forschungskapazitäten, Stakeholder-Bereitschaft) und vier transformative Themen strukturieren das Feld für die nächsten Jahre — mit direkten Implikationen für den Geometrieunterricht.

Die bildungspolitische Perspektive liefert ein OECD Working Paper (Fuster Rabella, 2025): Lehrplanentwickler:innen werden aufgerufen, systematisch zu evaluieren, welche Curriculumziele angesichts wachsender KI-Fähigkeiten gültig bleiben. Prozedurales Geometriewissen — Konstruktionen, Berechnungen, Standardverfahren — steht unter besonderem Automatisierungsdruck. Die OECD empfiehlt laufende nationale Monitoring-Prozesse, verknüpft mit KI-Capability-Benchmarks.

Personalisierung im großen Maßstab

Adaptive Lernplattformen werden zunehmend präziser. Die Vorstellung, dass jeder Schüler / jede Schülerin einen individuellen geometrischen Lernpfad erhält — automatisch angepasst an Vorkenntnisse, Lerngeschwindigkeit und Stärken — rückt in greifbare Nähe. Die bislang umfassendste Meta-Analyse (22 Studien, N = 5.232) zeigt bereits moderate Gesamteffekte (Hedges' g = 0,534), mit dem geometriespezifischen Effekt (g = 0,906) als dem größten aller Inhaltsbereiche (Liu et al., 2026). Mit verbesserter KI und stärkerer Lehrkräfteintegration sind deutlich stärkere Effekte zu erwarten.

Google LearnLM demonstrierte in einem RCT mit 165 Sekundarschüler:innen bereits +5,5 Prozentpunkte bei der Lösung neuartiger Mathematikprobleme gegenüber der Kontrollgruppe (Huber et al., 2024). Tutor CoPilot (Stanford) zeigt, dass KI nicht nur direkt mit Schüler:innen, sondern auch Lehrende unterstützen kann — mit +9 Prozentpunkten für Schüler:innen schwächerer Tutor:innen (Wang et al., 2024). Den bislang ambitioniertesten nationalen Schritt ging Südkorea: Ab März 2025 wurden KI-gestützte adaptive Mathematik-Schulbücher für alle Primar- und Sekundarschüler des Landes eingeführt — mit 830 Millionen USD Investition; 30 % der Schulen nutzen sie bereits (Koreanisches Bildungsministerium, 2025).

GeoGebra als KI-Plattform

GeoGebra (österreichisches Ursprungsprodukt, heute global) entwickelt sich von einem DGS zu einer umfassenden KI-Plattform. Die Integration von GeoGebra Discovery (automatisierte Beweise), natürlichsprachlicher Eingabe und adaptiver Aufgabengenerierung schafft ein Ökosystem, das für alle Schulstufen geeignet ist — und das aus österreichischer Forschung stammt (Kovács et al., 2024). Die Komplementarität mit LLMs wie ChatGPT ist dabei produktiv nutzbar: GeoGebra für zertifizierte, symbolische Beweise; ChatGPT für natürlichsprachliche Kommunikation und Erklärungen (Botana et al., 2024).

KI-Kompetenz als Pflichtbestandteil der Lehramtsausbildung

Die Qualität des KI-Einsatzes im Unterricht steht und fällt mit den Lehrenden. Die Forschung ist eindeutig: Geführte, lehrkraftbegleitete KI-Nutzung erzielt dramatisch bessere Lerneffekte als unkritische Nutzung (Bastani et al., 2025). Doch aktuelle empirische Erhebungen zeigen: Lehramtsstudierende im DACH-Raum nutzen KI bereits intensiv — aber ohne kritische Reflexionskompetenz (Tröbelsberger et al., 2025; Dilling & Herrmann, 2024).

Das bedeutet: KI-Kompetenz für angehende Lehrende ist keine Option, sondern eine strukturelle Notwendigkeit. Die erste empirische Studie, die TPACK explizit auf generative KI in Mathematikklassen anwendet, liefert Shrestha und Yi (2026, Journal of Mathematics Teacher Education): Ein 90-minütiger TPACK-basierter Workshop für Lehramtsstudierende bewirkte statistisch signifikante positive Verschiebungen in der GenAI-Akzeptanz (UTAUT-Modell) — mit wahrgenommener Effizienzsteigerung als stärkstem Faktor und fehlender institutioneller Orientierung als Haupthindernis. Das ist der direkteste empirische Beleg, dass strukturierte TPACK-Fortbildungen die verantwortungsvolle GenAI-Integration im Mathematikunterricht fördern können.

Lee, Son und Yeo (2025, JCAL) zeigen in einem RCT mit 50 angehenden Mathematiklehrpersonen: KI-Chatbots als virtuelle Schüler verbessern responsives Lehren — das situative Eingehen auf Schülerantworten — signifikant. KI kann also nicht nur Schüler:innen, sondern auch die Ausbildung von Lehrkräften unterstützen. Han (2025, Frontiers in Psychology) bestätigt in einer quasi-experimentellen Studie (N=79): Strukturierte KI-Kurse in der Lehramtsausbildung verbessern KI-Kompetenzen messbar — ein Argument für die curriculare Verankerung solcher Kurse an PH und TU Graz.

Programme wie KIMADU in NRW (Universität Siegen, 25 Schulen, Laufzeit 2025–2027) zeigen, wie eine empirisch fundierte KI-Integration in Lehramt und Praxis gleichzeitig gelingen kann (Witzke & Steinhoff, 2025). Für Österreich ist die Virtuelle PH mit dem KI-MOOC (Mai 2024) ein erster Schritt — systematische Verankerung in Lehramtscurricula an TU Graz und PH Graz ist die notwendige Weiterentwicklung.

Neue Rollenbilder für Lehrende

Die Forschungslage ist eindeutig: Lehrkräftequalität bleibt entscheidend (Bastani et al., 2025). Lehrende werden weniger Zeit mit der Vermittlung von Standardverfahren verbringen und mehr Zeit mit dem, was KI (noch) nicht kann:

Beziehungsaufbau: Motivieren, ermutigen, individuelle Stärken erkennen
Problemstellung: Originelle, offene Aufgaben entwickeln, die KI nicht trivial löst
Kritisches Urteilsvermögen: KI-Ausgaben hinterfragen, Fehler identifizieren — gerade bei Geometrie, dem schwächsten Inhaltsbereich für LLMs (Wei, 2024)
Metakognition: Lernenden beibringen, über ihr eigenes Denken nachzudenken

Die GDM fordert explizit, diese Kompetenzen als prioritären Forschungsbereich zu entwickeln (Buchholtz et al., 2024). Österreichische Ansätze — von der Virtuellen PH bis zu KI-Pilotschulen — sind erste Schritte (BMB, 2024).

Empfehlungen für die Praxis

Aus der Analyse der Forschungslage ergeben sich fünf prioritäre Empfehlungen:

Kritische KI-Kompetenz als explizites Lernziel — auf allen Schulstufen, nicht nur in Informatik. Geometrieunterricht bietet ideale Gelegenheiten: Schüler:innen überprüfen KI-Beweise, analysieren Halluzinationen, diskutieren Grenzen. Eine explorative Studie mit 162 angehenden Primarstufen-Lehrenden zeigte, dass die meisten KI für geometrische Beweise in oberflächlicher Weise nutzten und Misskonzeptionen über die Zuverlässigkeit des Systems entwickelten (Dilling & Herrmann, 2024) — das muss in der Ausbildung adressiert werden.

Tool-Auswahl nach didaktischen, nicht Marketing-Kriterien — GeoGebra und Khan Academy bieten kostenfreie, qualitätsgesicherte und datenschutzkonformere Alternativen zu kostenpflichtigen Plattformen. Kriterien: Lernwirksamkeit, Datenschutz, Zugänglichkeit, Integration in bestehende Unterrichtspraxis. Der geführte GPT-Tutor mit Guardrails ist dem uneingeschränkten System klar überlegen: +127 % vs. +48 % in Übungsleistung (Bastani et al., 2025).

Offene, explorative Aufgabenformate stärken — statt Aufgaben, die KI trivial löst, mehr: „Untersuche...", „Begründe...", „Finde einen Fehler...", „Entwickle eine eigene Aufgabe...". Diese Formate sind KI-resistenter und fördern tieferes geometrisches Denken (Walkington, 2025). Die GDM sieht sie als prioritäre Forschungsrichtung für KI-kompatibles Assessment (Buchholtz et al., 2024).

Datenschutzkonforme Lösungen bevorzugen, insbesondere in Volksschule und Sekundarstufe I. GeoGebra, open-source Systeme und europäische Alternativangebote bevorzugen. DSGVO-Compliance als Pflichtkriterium bei Tool-Entscheidungen. Die OECD stellt fest: Stand 2024 hat kein Land eine verbindliche gesetzliche KI-Regulierung speziell für den Bildungsbereich erlassen (OECD, 2023).

Lehrkräftefortbildung massiv ausbauen — ohne kompetente Lehrende kein sinnvoller KI-Einsatz. Die österreichische Virtuelle PH hat mit dem KI-MOOC (Mai 2024) eine erste strukturierte Fortbildungsinfrastruktur geschaffen (BMB, 2024). PH Graz und TU Graz müssen diese Ansätze ausbauen und mit konkreten Geometrie-Werkstätten verbinden. Österreich hat dabei eine besondere institutionelle Geschichte: Helmut Heugl, Begründer des CAS-Unterrichts (erste CAS-Klasse weltweit 1986 in Wien), plädiert für das „White Box/Black Box"-Prinzip als Orientierung — nicht anders, als beim Taschenrechner oder CAS soll KI im Geometrieunterricht nicht blinden Automatismus, sondern verstehendes Arbeiten fördern (Heugl, 2025).

Die empirische Basis für diese Empfehlungen wächst rasant. Jin et al. (2025) konsolidieren in einem systematischen Review experimenteller Studien zu ChatGPT-Interventionen in der Hochschulbildung: Zwei Interventionstypen dominieren — ChatGPT als Lernassistent (Erklärung, Feedback) und als Aufgabengenerator. Beide zeigen positive Effekte, wobei die assistenzbasierte Nutzung stärkere Lernzuwächse erzielt. Dieser Befund stützt die Empfehlung, KI primär als unterstützendes Werkzeug einzusetzen, nicht als Ersatz für Lehrpersoneninteraktion.

Schlusswort

KI im Geometrieunterricht ist kein Trend, der vorbeizieht. Es ist eine strukturelle Verschiebung, die alle Schulstufen, alle Lehrinhalte und alle Beteiligten betrifft. AlphaGeometry löst IMO-Olympiadprobleme auf Goldmedaillen-Niveau (Trinh et al., 2024; Chervonyi et al., 2025). AlphaProof beweist in Lean 4 — formal, verifizierbar (Hubert et al., 2025). GeoGebra Discovery beweist euklidische Sätze in unter einer Sekunde (Kovács et al., 2024). Aristotle beweist 5 von 6 IMO-2025-Aufgaben (Achim et al., 2025).

Die entscheidende Frage ist nicht ob wir KI einsetzen, sondern wie — und wer diese Entscheidung trifft. Die Antwort darauf sollte die Bildungsgemeinschaft geben, nicht die Technologiekonzerne. Die Geometrie als Fach bietet dabei eine einzigartige Chance: Sie ist präzise genug, um KI-Fehler sichtbar zu machen — LLMs halluzinieren in geometrischen Kontexten systematisch stärker als in anderen Bereichen (Xu et al., 2024; Wei, 2024) — und reichhaltig genug, um echtes mathematisches Denken zu fordern. Das, was KI auf absehbare Zeit nicht vollständig ersetzen kann: das neugierige, kreative, fehlerhafte und lernende menschliche Denken.

Literatur (Ausblick)

Achim, T., Best, A., Bietti, A., et al. (2025). Aristotle: IMO-level automated theorem proving. arXiv:2510.01346.

BMB [Bundesministerium für Bildung]. (2024). KI-Pilotschulen. https://www.bmb.gv.at/ki

Botana, F., Recio, T., & Vélez, M. P. (2024). On using GeoGebra and ChatGPT for geometric discovery. Computers, 13(8), 187. https://doi.org/10.3390/computers13080187

Chervonyi, Y., Trinh, T. H., Olšák, M., Yang, X., Nguyen, H., et al. (2025). Gold-medalist performance in solving Olympiad Geometry with AlphaGeometry2. arXiv:2502.03544.