Künstliche Intelligenz im Geometrieunterricht

Von der Volksschule bis zum Hochschulstudium — Werkzeuge, Didaktik und Perspektiven

Thomas Schroffenegger  ·  Eingeladen zum 20. Tag der Geometrie, TU Graz / PH Graz

20. Tag der Geometrie, Technische Universität Graz und Pädagogische Hochschule Graz  ·  2026-04-09
Erstellt mit Unterstützung von Claude (Anthropic). Alle Quellen sind ausgewiesen.

Abstract

Künstliche Intelligenz verändert den Geometrieunterricht auf allen Schulstufen. Mit AlphaGeometry (DeepMind, Januar 2024) wurde erstmals ein KI-System vorgestellt, das olympiadische Geometriebeweise auf Gold-Niveau löst; AlphaProof erzielte im Juli 2024 beim IMO erstmals Silbermedaillen-Niveau in formaler Mathematik. Gleichzeitig sind praxistaugliche Werkzeuge wie GeoGebra AI, GeoGebra Discovery, Photomath und LLMs wie ChatGPT in Schulen und Hochschulen angekommen. Dieser Beitrag gibt einen systematischen Überblick über verfügbare KI-Tools, didaktische Einsatzszenarien und bildungswissenschaftliche Erkenntnisse — von der Volksschule bis zum Lehramtsstudium. Chancen wie adaptive Differenzierung (Meta-Analyse: Hedges' g=0,534) und sofortiges Feedback stehen Risiken wie Halluzinationen, Abhängigkeit und Prüfungsintegrität gegenüber. Die Analyse basiert auf 290 international recherchierten Quellen (Stand März 2026) und richtet sich an Lehrende aller Schulstufen sowie an Bildungspolitik und Fachdidaktik.

1. Einleitung

Warum Künstliche Intelligenz im Geometrieunterricht?

Geometrie ist eines der ältesten und gleichzeitig lebendigsten Teilgebiete der Mathematik. Bereits bei den alten Griechen galt sie als Privileg der gebildeten Elite: Über Platons Akademie stand angeblich „Ageometretos medeis eisito" — niemand trete ein, der der Geometrie unkundig ist. Die Pythagoreer setzten Geometrie neben Arithmetik, Harmonielehre und Astronomie ins Quadrivium — die „Freien Künste", würdig für jene, die nicht für den Broterwerb arbeiten mussten. Euklids Elemente (~300 v. Chr.) blieben über 2.300 Jahre das Standardwerk. Von der intuitiven Raumwahrnehmung im Kindergarten bis zur abstrakten Differentialgeometrie im Studium zieht sich ein roter Faden, der das Sehen, Denken und Argumentieren über Formen, Strukturen und Raum schult.

In den letzten Jahren hat Künstliche Intelligenz — als Sammelbegriff für maschinelles Lernen, neuronale Netze und große Sprachmodelle — Einzug in nahezu alle Lebensbereiche gehalten. Die Bildung bildet dabei keine Ausnahme: KI-Systeme sind heute in der Lage, Schülerantworten zu analysieren, individuelle Lernpfade zu empfehlen, mathematische Beweise zu prüfen und geometrische Konstruktionen interaktiv zu begleiten.

Ein Datum markiert dabei eine Zäsur: Am 17. Januar 2024 veröffentlichte Google DeepMind in der Fachzeitschrift Nature einen Artikel über AlphaGeometry — ein KI-System, das olympiadische Geometrieprobleme auf dem Niveau eines menschlichen Goldmedaillengewinners löst (Trinh et al., 2024). In einer Benchmark-Reihe von 30 IMO-Problemen löste AlphaGeometry 25 innerhalb der regulären Olympiade-Zeit; der bisherige Stand der Technik hatte 10 gelöst. Im selben Jahr folgte AlphaGeometry 2, das 84 % aller historischen IMO-Geometrieprobleme der letzten 25 Jahre korrekt bewies (Chervonyi et al., 2025). Beim IMO 2024 erzielte das kombinierte System aus AlphaProof und AlphaGeometry 2 Silbermedaillen-Niveau — 4 von 6 Aufgaben gelöst, darunter die schwerste des Jahrgangs (Hubert et al., 2025). 2025 folgte mit Aristotle (Harmonic Team) erstmals Goldmedaillen-Niveau bei IMO 2025: 5 von 6 Problemen mit verifizierten Lean 4 Beweisen gelöst (Achim et al., 2025).

Diese Entwicklung ist kein akademisches Kuriosum. Sie wirft fundamentale Fragen auf, die Vuong und Ho (2024) in AI & Society direkt adressieren: Wenn KI Geometrie auf Wettkampfniveau beherrscht — was bedeutet das für den Geometrieunterricht? Welche Kompetenzen bleiben für Schüler:innen relevant? Welche Werkzeuge stehen Lehrenden heute schon zur Verfügung — und welche kommen morgen?

Dieser Beitrag beleuchtet, wie KI den Geometrieunterricht aller Schulstufen verändert. Die Analyse umfasst:

Die bildungspolitische Relevanz ist evident: Die Ständige Wissenschaftliche Kommission der KMK widmete im Januar 2024 ein eigenes Impulspapier dem Potenzial großer Sprachmodelle im Bildungssystem (SWK, 2024). Im Oktober desselben Jahres verabschiedeten alle 16 deutschen Bildungsminister:innen eine verbindliche Handlungsempfehlung zum Umgang mit KI in schulischen Bildungsprozessen (KMK, 2024). Auf internationaler Ebene entwickelte die OECD einen konzeptionellen Rahmen zur Frage, welche Lernziele angesichts wachsender KI-Fähigkeiten neu bewertet werden müssen (Fuster Rabella, 2025). Die Dynamik betrifft Geometrie in besonderem Maße: Zhao et al. (2025) dokumentieren in ihrem Survey einen Anstieg von Deep-Learning-Publikationen zu Geometrieproblemen von einer einzigen im Jahr 2018 auf 110 im Jahr 2024 — ein exponentielles Wachstum, das die Dringlichkeit didaktischer Reflexion unterstreicht.

Der Artikel basiert auf 290 recherchierten Quellen (Stand März 2026), darunter peer-reviewed Artikel aus Nature, Nature Physics, ZDM – Mathematics Education, npj Science of Learning, Frontiers in Artificial Intelligence, ICLR, ECCV, NeurIPS, PNAS, Computers & Education und School Science and Mathematics, sowie institutionellen Berichten von OECD, EU-Kommission, EDPB und dem österreichischen BMBWF. Ein PRISMA-basiertes Systematic Literature Review zu Geometrieunterricht auf Sekundarstufenniveau (Weigand, Hollebrands & Maschietto, 2025, ZDM) bildet dabei den übergeordneten didaktischen Referenzrahmen. Alle Quellen sind im Quellenverzeichnis mit Qualitätsbewertung zugänglich.

Im Einzelnen gliedert sich der Beitrag wie folgt: Kapitel 2 legt die technologischen Grundlagen — von maschinellem Lernen über Sprachmodelle bis zu neurosymbolischer KI. Die Kapitel 3 bis 6 beleuchten den Einsatz in den vier Bildungsstufen: Volksschule (6–10 Jahre), Sekundarstufe I (10–14 Jahre), Sekundarstufe II (14–18 Jahre) und Hochschule/Lehramtsstudium. Kapitel 7 gibt einen systematischen Überblick über die verfügbaren KI-Werkzeuge. Kapitel 8 diskutiert didaktische Konzepte und evidenzbasierte Strategien für den sinnvollen KI-Einsatz. Kapitel 9 behandelt Herausforderungen und Risiken, von Halluzinationen über digitale Kluft bis zu Prüfungsintegrität. Kapitel 10 formuliert Empfehlungen und skizziert die nächsten Schritte für Forschung und Praxis.

Der Wettlauf um KI-Geometriesysteme ist nicht auf die USA und Europa beschränkt: Das chinesische TongGeometry (BIGAI/Peking University) übertrifft AlphaGeometry auf eigenen Benchmarks und generiert neue Olympiad-Aufgaben, von denen drei in einem US-Olympiad und einem chinesischen nationalen Qualifikationsexamen 2024 erschienen (BIGAI, 2024). Südkorea führte im März 2025 flächendeckend KI-gestützte Mathematik-Schulbücher für alle Primar- und Sekundarschüler ein — 30 % der Schulen nutzen sie bereits (Koreanisches Bildungsministerium, 2025). Diese globale Dynamik macht deutlich: Bildungssysteme weltweit stehen vor der gleichen strukturellen Herausforderung.

Hinweis zur Entstehung: Dieser Artikel wurde in Zusammenarbeit zwischen dem Autor und dem KI-System Claude (Anthropic) erstellt. Alle verwendeten Quellen sind ausgewiesen. Die inhaltliche Verantwortung liegt beim menschlichen Autor.

Literatur (Einleitung)

Achim, T., Best, A., Bietti, A., et al. (2025). Aristotle: IMO-level automated theorem proving. arXiv:2510.01346.

Achim, T., Best, A., Bietti, A. · 2025 · arXiv preprint ★★★★★ 10/10
Aristotle (Harmonic Team) löst 5 von 6 IMO 2025 Problemen mit vollständig verifizierten Lean 4 Beweisen — erstmals Goldmedaillen-Niveau für ein KI-System. Das System integriert: Lean-Beweissuche, informales LLM-Reasoning für Lemma-Generierung und einen dedizie…

Chervonyi, Y., Trinh, T. H., Olšák, M., Yang, X., Nguyen, H., Menegali, M., Jung, J., Kim, J., Verma, V., Le, Q. V., & Luong, T. (2025). Gold-medalist performance in solving Olympiad Geometry with AlphaGeometry2. arXiv:2502.03544.

Chervonyi, Y., Trinh, T.H., Olšák, M. · 2025 · Journal of Machine Learning Research, Vol. 26(241), 1–39 (also arXiv:2502.03544) ★★★★★ 10/10
AlphaGeometry 2 löst 84% aller IMO-Geometrieprobleme 2000–2024 (gegenüber 54% bei AG1). Verbesserte Gemini-basierte Sprachkomponente, erweiterte Domänensprache (Winkel, Abstände, Locus-Theoreme), schnellere symbolische Suchmaschine mit Knowledge-Sharing. Meile…

Hubert, T., Mehta, R., Sartran, L., et al. (2025). Olympiad-level formal mathematical reasoning with reinforcement learning. Nature. https://doi.org/10.1038/s41586-025-09833-y

Hubert, T., Mehta, R., Sartran, L. · 2025 · Nature ★★★★★ 10/10
AlphaProof kombiniert Gemini (LLM) mit AlphaZero-Reinforcement-Learning für formale Mathematik in Lean 4. Bei IMO 2024 löste das System zusammen mit AlphaGeometry 2 vier von sechs Aufgaben (28/42 Punkte) — Silbermedaillen-Niveau, das erste KI-System auf diesem…

Trinh, T. H., Wu, Y., Le, Q. V., He, H., & Luong, T. (2024). Solving Olympiad Geometry without human demonstrations. Nature, 625, 476–482. https://doi.org/10.1038/s41586-023-06747-5

Trinh, T.H., Wu, Y., Le, Q.V. · 2024 · Nature, 625, 476–482 ★★★★★ 10/10
Google DeepMind präsentiert AlphaGeometry, ein neurosymbolisches KI-System das olympiadische Geometriebeweise auf dem Niveau eines menschlichen Goldmedaillengewinners löst. Löste 25 von 30 IMO-Geometrieproblemen (Vorläufer: 10). AlphaGeometry 2 (2024) löste 83…

Vuong, Q.-H., & Ho, M.-T. (2024). The disruptive AlphaGeometry: Is it the beginning of the end of mathematics education? AI & Society. https://doi.org/10.1007/s00146-024-02010-1

Vuong, Q.-H., Ho, M.-T. · 2024 · AI & Society (Springer Nature) ★★★★★ 10/10
Analyse der pädagogischen Implikationen von AlphaGeometry für den Mathematikunterricht. Die Autoren untersuchen, wie olympiadische KI-Performance das Lehrer-Schüler-Verhältnis und die Rolle von Schulen in der mathematischen Bildung herausfordert. Kernargument:…

Beijing Institute for General Artificial Intelligence [BIGAI]. (2024). TongGeometry: Neuro-symbolic AI for geometry theorem discovery and proving. https://www.scmp.com/news/china/science/article/3341517/chinese-ai-goes-next-level-geometry-top-us-maths-olympiad

Korean Ministry of Education. (2025). AI digital textbooks rollout — Mathematics, English, Informatics. https://english.moe.go.kr

Weigand, H.-G., Hollebrands, K., & Maschietto, M. (2025). Geometry education at secondary level — A systematic literature review. ZDM – Mathematics Education, 57, 829–843. https://doi.org/10.1007/s11858-025-01703-1

Weigand, H.-G., Hollebrands, K., Maschietto, M. · 2025 · ZDM – Mathematics Education ★★★★★ 10/10
PRISMA-basiertes Systematic Literature Review zu Geometrieunterricht auf Sekundarstufenniveau (seit 2013, fünf Datenbanken, Konferenzproceedings). Analysiert mit Voyant Tool. Kategorien: Argumentieren, Beweisen, Problemlösen, Modellieren; Raumgeometrie, ebene …

Ständige Wissenschaftliche Kommission der KMK (SWK). (2024). Large Language Models und ihre Potenziale im Bildungssystem [Impulspapier]. https://www.kmk.org/fileadmin/Dateien/pdf/KMK/SWK/2024/SWK-2024-Impulspapier_LargeLanguageModels.pdf

Kultusministerkonferenz (KMK). (2024). Handlungsempfehlung für die Bildungsverwaltung zum Umgang mit Künstlicher Intelligenz in schulischen Bildungsprozessen. https://www.kmk.org/themen/allgemeinbildende-schulen/digitalisierung/kuenstliche-intelligenz.html

Fuster Rabella, M. (2025). Evolving AI capabilities and the school curriculum. OECD Education Working Papers, No. 324. https://doi.org/10.1787/2ca3b04f-en

Zhao, Y., Wang, X., Liu, J., King, I., & Huang, Z. (2025). Towards geometry problem solving in the large model era: A survey. arXiv:2505.12345.

Zhao, Y., Wang, X., Liu, J. · 2025 · arXiv:2506.02690 ★★★★ 8/10
Survey zu KI-Geometrielösung im Zeitalter großer Modelle. Dokumentiert Wachstum von Deep-Learning-Papers zu Geometrie von ~1 (2018) auf 110 (2024). 61% der aktuellen MLLM-Fehler sind Diagramm-Missinterpretation. Neuro-symbolische Integration und automatisierte…

2. Grundlagen: Was ist Künstliche Intelligenz?

Ein didaktischer Zugang

Für den schulischen Kontext ist eine präzise, aber zugängliche Definition hilfreich. Künstliche Intelligenz bezeichnet Computersysteme, die Aufgaben ausführen, die typischerweise menschliche Intelligenz erfordern — darunter Mustererkennung, Sprachverstehen, logisches Schließen und Lernen aus Daten (UNESCO, 2023). Das Forschungsfeld wächst rasant: Die Meta-Analyse von Liu et al. (2026) dokumentiert eine exponentielle Zunahme der Publikationen zu KI im Mathematikunterricht in den letzten fünf Jahren. Jablonski und Ludwig (2023) zeigen in ihrer Überblicksarbeit zur Geometriedidaktik 2017–2022, dass digitale Werkzeuge bereits vor der KI-Welle das am stärksten wachsende Forschungsfeld in der Geometriedidaktik waren — eine Basis, auf der KI-gestützte Ansätze nun aufbauen — ein Spiegel der globalen Beschleunigung in Forschung und Praxis.

Relevante KI-Typen für den Geometrieunterricht

Maschinelles Lernen (ML)

Systeme, die aus Beispielen lernen, ohne explizit programmiert zu werden. Relevant z. B. für automatische Erkennung geometrischer Figuren in Fotos (Photomath, Google Lens) sowie für adaptive Lernempfehlungssysteme. In der Geometrie hat ML eine besondere Bedeutung: Convolutional Neural Networks (CNNs) können heute handgezeichnete geometrische Figuren — Dreiecke, Kreise, Parallelogramme — mit hoher Genauigkeit klassifizieren. Diese Fähigkeit bildet die Grundlage für Systeme wie Photomath, das über 350 Millionen Downloads verzeichnet und 2023 von Google übernommen wurde (Google/Photomath, 2023). Auch adaptive Lernplattformen wie Squirrel AI nutzen ML-Algorithmen, um Wissenslücken zu diagnostizieren und individuelle Lernpfade zu generieren — allerdings mit einer Effektstärke von d = 0,34 im Vergleich zu traditionellem Unterricht, was zwar statistisch signifikant, aber pädagogisch moderat ist (Collins et al., 2024).

Große Sprachmodelle (LLMs)

Systeme wie ChatGPT, Claude oder Gemini, die natürlichsprachliche Fragen beantworten, Beweise erklären und Aufgaben generieren können. Eine explorative Studie mit 162 angehenden Primarstufen-Lehrenden zeigt, dass diese LLMs meist oberflächlich nutzen und häufig Misskonzeptionen entwickeln — was die Notwendigkeit einer reflektierten Auseinandersetzung unterstreicht (Dilling & Herrmann, 2024). Ein aktueller Scoping Survey zu ChatGPT im Mathematikunterricht zeigt: ChatGPT stärkt selbstreguliertes Lernen und ermöglicht Echtzeit-Feedback; kritisch bleiben Fehler, ethische Probleme und das Risiko der Überabhängigkeit (Pepin et al., 2025).

Neurosymbolische KI

Kombination von neuronalen Netzen und symbolischer Logik. AlphaGeometry (DeepMind, 2024) ist das bekannteste Beispiel: Ein neuronales Netz schlägt Hilfskonstruktionen vor, ein deterministisches symbolisches System führt den Beweis aus (Trinh et al., 2024).

Reasoning-Modelle (o1, o3, DeepSeek-R1)

Seit Ende 2024 existiert eine neue Modellklasse: Systeme, die vor der Antwort interne Chain-of-Thought-Überlegungen generieren — sogenanntes „langsames Denken" (System 2 nach Kahneman). OpenAI o1, o3 und DeepSeek-R1 erzielen damit auf mathematischen Benchmark-Tests dramatisch bessere Ergebnisse als frühere Modelle. De Winter et al. (2024, TU Delft) belegen: o1-preview besteht das niederländische VWO-Abschlussexamen in Mathematik (Abitur-äquivalent mit Geometrie und Trigonometrie) mit 76/76 Punkten — 97,8. Perzentil unter realen Schüler:innen, ohne Memorierungsartefakte. Für Geometrieunterricht bedeutet das: Standard-Berechnungsaufgaben sind für diese Systeme kein Hindernis mehr; formale Beweisaufgaben mit Diagrammen bleiben eine ernsthafte Herausforderung.

Computer-Algebra-Systeme (CAS) mit KI-Erweiterung

Klassische CAS wie Mathematica oder GeoGebra werden zunehmend mit KI-Schnittstellen erweitert. GeoGebra Discovery kann elementar-euklidische Sätze vollautomatisch in unter einer Sekunde beweisen (Kovács et al., 2024).

Bildverarbeitende KI

Systeme, die handgeschriebene Gleichungen oder Skizzen erkennen und verarbeiten. Photomath (350 Mio. Downloads, 2023 von Google übernommen) und MathPix sind die verbreitetsten Vertreter (Google/Photomath, 2023). Allerdings zeigen systematische Benchmarks, dass selbst state-of-the-art Modelle wie GPT-4V bei geometrischen Diagrammaufgaben nur 58,5 % Genauigkeit erreichen (Lu et al., 2024) und manche Systeme besser abschneiden, wenn die Zeichnung gar nicht angezeigt wird (Zhang et al., 2024). Eine deutschsprachige Untersuchung der Bildgenerierung und -interpretation mit ChatGPT / DALL·E 3 für die Mathematikdidaktik zeigt ähnliche strukturelle Grenzen und erhielt den GDM-Posterpreis 2024 (Schorcht et al., 2024).

Abgrenzung: KI vs. klassische Mathematiksoftware

Klassische SoftwareKI-gestützte Software
Regelbasiert, deterministischLernend, probabilistisch
Benutzer gibt exakte Syntax einNatürlichsprachliche Eingabe möglich
Keine Anpassung an LernendenPersonalisierung möglich
GeoGebra Classic (2005)GeoGebra AI / Discovery (2024)
Wolfram Alpha (symbolisch)ChatGPT + Wolfram Plugin
Beweise werden nicht erklärtLLMs erklären Beweisschritte

Diese Unterscheidung ist didaktisch relevant: Klassische Software ist präzise, aber erfordert Einarbeitung. KI-gestützte Software ist zugänglicher, birgt aber das Risiko von Fehlern und unkritischer Übernahme von Antworten (Walkington, 2025). Für Geometrie gilt dabei eine besondere Einschränkung: LLMs sind in keinem mathematischen Inhaltsbereich schwächer als in Geometrie (Wei, 2024; Wardat et al., 2023). Hinzu kommt ein kulturspezifisches Problem: Krátká et al. (2025) zeigen, dass KI-Systeme angelsächsische Geometriekonventionen reproduzieren, die mit deutschsprachigen Lehrplan-Traditionen kollidieren können — ein bislang wenig diskutiertes Risiko beim Einsatz internationaler LLMs im deutschsprachigen Unterricht.

Multimodale Foundation Models

Die jüngste Entwicklung sind multimodale Modelle, die Text und Bild gleichzeitig verarbeiten: GPT-4V/4o, Gemini Pro Vision und Claude 3.5 Sonnet können geometrische Diagramme „sehen" und darüber nachdenken. Allerdings zeigen systematische Benchmarks ernüchternde Ergebnisse: Auf MathVista erreicht GPT-4V nur 58,5 % bei geometrischen Diagrammaufgaben (Lu et al., 2024); auf MathVerse schneiden manche Modelle sogar besser ab, wenn das Diagramm gar nicht gezeigt wird (Zhang et al., 2024). Das spezialisierte GeoEval-Benchmark (Zhang et al., 2024b) und das kürzlich vorgestellte NoReGeo (Abdullaeva et al., 2026) — das gezielt nicht-schlussfolgernde geometrische Grundfähigkeiten wie Figurenerkennung und Winkelschätzung testet — bestätigen: Geometrisches Sehen bleibt eine fundamentale Schwäche aktueller KI-Systeme. Diese Lücke motiviert eine Reihe spezialisierter Lösungsansätze, die in Kapitel 7 (Tools) ausführlich diskutiert werden.

KI im Unterricht — ein Kontinuum

Es empfiehlt sich, KI-Einsatz im Unterricht nicht als Alles-oder-Nichts-Entscheidung zu sehen, sondern als Kontinuum: von kontrollierten, lehrkraftgeführten Einsätzen spezifischer Tools bis zu offenem Explorieren mit multiplen Systemen. Die Forschung zeigt, dass geführte Nutzung bessere Lernergebnisse erzielt als uneingeschränkter Zugang (Bastani et al., 2025). Die OECD empfiehlt in ihrem Digital Education Outlook 2023 einen evidenzbasierten Governance-Ansatz: Bildungssysteme sollten KI-Werkzeuge nicht pauschal verbieten oder freigeben, sondern kontextabhängig regulieren und begleitend evaluieren (OECD, 2023).

Literatur (Grundlagen)

Bastani, H., Bastani, O., Sungu, A., Ge, H., Kabakcı, Ö., & Mariman, R. (2025). Generative AI without guardrails can harm learning: Evidence from high school mathematics. Proceedings of the National Academy of Sciences. https://doi.org/10.1073/pnas.2422633122

Bastani, H., Bastani, O., Sungu, A. · 2025 · Proceedings of the National Academy of Sciences (PNAS) ★★★★★ 10/10
Feldexperiment mit ~1.000 Oberschüler:innen: GPT-4 ohne Guardrails verbesserte Übungsleistung um 48%, GPT Tutor (mit Schutzmaßnahmen) um 127%. Kritischer Befund: Schüler:innen mit uneingeschränktem KI-Zugang schnitten in Prüfungen ohne KI 17% schlechter ab — A…

Dilling, F., & Herrmann, M. (2024). Using large language models to support pre-service teachers' mathematical reasoning. Frontiers in Artificial Intelligence, 7. https://doi.org/10.3389/frai.2024.1460337

Dilling, F., Herrmann, M. · 2024 · Frontiers in Artificial Intelligence ★★★★★ 10/10
Exploratorische Studie zur Nutzung von ChatGPT als Werkzeug für angehende Primarstufen-Lehrende beim Erstellen geometrischer Beweise. Untersucht Vorerfahrungen mit LLMs, Überzeugungen und Interaktionsverhalten. Ergebnis: Studierende hatten begrenzte Vorerfahru…

Google/Photomath. (2023). Photomath. https://en.wikipedia.org/wiki/Photomath

Kovács, Z., Recio, T., & Vélez, M. P. (2024). Showing proofs, assessing difficulty with GeoGebra Discovery. arXiv:2401.11900.

Kovács, Z., Recio, T., Vélez, M.P. · 2024 · arXiv / GeoGebra Discovery Research ★★★★★ 9/10
GeoGebra Discovery erweitert GeoGebra um automatisierte Beweisführung: Der ShowProof-Befehl zeigt Schritt-für-Schritt-Beweissequenzen für geometrische Aussagen; ein Schwierigkeitswert bewertet den 'Überraschungsgrad' eines Satzes relativ zu seinen Voraussetzun…

Lu, P., Bansal, H., Xia, T., Liu, J., Li, C., Hajishirzi, H., Cheng, H., Chang, K.-W., Galley, M., & Gao, J. (2024). MathVista: Evaluating mathematical reasoning of foundation models in visual contexts. ICLR 2024. https://doi.org/10.48550/arXiv.2310.02255

Lu, P., Bansal, H., Xia, T. · 2024 · ICLR 2024 (Oral, top 1.2% aller Einreichungen) ★★★★★ 10/10
Visuelles Mathematik-Benchmark mit 6.141 Beispielen. GPT-4V erreicht 49,9% Gesamtgenauigkeit — 10,4 Prozentpunkte unter menschlicher Leistung (60,3%). Für Geometrieaufgaben: GPT-4V 58,5%, Bard 43,4%. Modelle 'kämpfen oft darum, komplexe Figuren zu verstehen un…

Trinh, T. H., Wu, Y., Le, Q. V., He, H., & Luong, T. (2024). Solving Olympiad Geometry without human demonstrations. Nature, 625, 476–482. https://doi.org/10.1038/s41586-023-06747-5

Trinh, T.H., Wu, Y., Le, Q.V. · 2024 · Nature, 625, 476–482 ★★★★★ 10/10
Google DeepMind präsentiert AlphaGeometry, ein neurosymbolisches KI-System das olympiadische Geometriebeweise auf dem Niveau eines menschlichen Goldmedaillengewinners löst. Löste 25 von 30 IMO-Geometrieproblemen (Vorläufer: 10). AlphaGeometry 2 (2024) löste 83…

UNESCO. (2023). Artificial intelligence in education: Challenges and opportunities for sustainable development. https://unesdoc.unesco.org/ark:/48223/pf0000366994

Walkington, C. (2025). The implications of generative artificial intelligence for mathematics education. School Science and Mathematics. https://doi.org/10.1111/ssm.18356

Walkington, C. · 2025 · School Science and Mathematics (Wiley) ★★★★★ 9/10
Umfassende Analyse der Implikationen generativer KI für den Mathematikunterricht. Untersucht, wie Schüler:innen GenAI als Denkpartner beim mathematischen Modellieren und Beweisen nutzen können. Diskutiert gemischte Ergebnisse beim Einsatz als Tutor sowie die N…

Schorcht, S., Baumanns, L., Buchholtz, N., Huget, J., Peters, F., & Pohl, M. (2024). Lernt die KI nun Sehen und Zeichnen? Chancen und Herausforderungen der Bildgenerierung und Bildinterpretation mit ChatGPT für die mathematikdidaktische Forschung. GDM-Mitteilungen, 116. https://ojs.didaktik-der-mathematik.de/index.php/mgdm/article/view/1223

Schorcht, S., Baumanns, L., Buchholtz, N. · 2024 · GDM-Mitteilungen, 116 ★★★★★ 9/10
Untersucht DALL·E 3 (Text-zu-Bild) und die visuelle Interpretationsfähigkeit von GPT-4 für mathematikdidaktische Forschung. Analysiert Möglichkeiten und Grenzen der KI bei Bildgenerierung und -interpretation — besonders relevant für geometrische Repräsentation…

Wardat, Y., Tashtoush, M. A., AlAli, R., & Jarrah, A. M. (2023). ChatGPT: A revolutionary tool for teaching and learning mathematics. Eurasia Journal of Mathematics, Science and Technology Education, 19(7), em2286. https://doi.org/10.29333/ejmste/13272

Wardat, Y., Tashtoush, M.A., AlAli, R. · 2023 · Eurasia Journal of Mathematics, Science and Technology Education, 19(7), em2286 ★★★★ 8/10
Qualitative Fallstudie durch Inhaltsanalyse von Interviews und Social-Media-Diskursen zu ChatGPT im Mathematikunterricht. Befund: ChatGPT ist effektiv für grundlegende Mathematik, hat aber explizit 'kein tiefes Verständnis von Geometrie und kann Fehlvorstellun…

Wei, X. (2024). Evaluating ChatGPT-4 and ChatGPT-4o: Performance insights from NAEP mathematics problem solving. Frontiers in Education, 9, 1452570. https://doi.org/10.3389/feduc.2024.1452570

Wei, X. · 2024 · Frontiers in Education, 9, 1452570 ★★★★★ 10/10
Evaluation von GPT-4 und GPT-4o auf NAEP-Mathematikaufgaben (4., 8., 12. Klasse): Geometrie/Messung ist der schwächste Inhaltsbereich — GPT-4: 53%, GPT-4o: 59% (vs. 79%/92% in Algebra). Räumliches Denken und visuelle Informationsverarbeitung als fundamentale B…

Krátká, M., Přibyl, J., & Tichá, M. (2025). AI in the classroom: Didactical misalignments in geometry between Czech and Anglo-Saxon contexts. 24th European Conference on e-Learning (ECEL), 24(1). https://papers.academic-conferences.org/index.php/ecel/article/view/4048

Krátká, M., Přibyl, J., Tichá, M. · 2025 · 24th European Conference on e-Learning (ECEL), Vol. 24(1) ★★★★★ 9/10
Systematische Analyse von ChatGPT, Gemini, Claude, Copilot und Mistral zu Geometrieprompts auf Tschechisch und Englisch. Zentralbefund: KI-Tools reproduzieren angelsächsische Konzeptualisierungen (z.B. Quadrat als Spezialfall des Rechtecks), die mit tschechisc…

Pepin, B., Buchholtz, N., & Salinas-Hernández, U. (2025). A scoping survey of ChatGPT in mathematics education. Digital Experiences in Mathematics Education, 11, 9–41. https://doi.org/10.1007/s40751-025-00172-1

Pepin, B., Buchholtz, N., Salinas-Hernández, U. · 2025 · Digital Experiences in Mathematics Education, Vol. 11, pp. 9–41 ★★★★★ 10/10
Scoping Survey zur Integration von ChatGPT im Mathematikunterricht (Schule und Universität). Schlüsselthemen: Begriffsverständnis, Unterrichtsplanung, Assessment-Design, personalisiertes Lernen, Kollaboration. ChatGPT stärkt selbstreguliertes Lernen und ermögl…

Zhang, R., Jiang, D., Zhang, Y., Lin, H., Guo, Z., Qiu, P., Zhou, A., Lu, P., Chang, K.-W., Gao, P., & Li, H. (2024). MathVerse: Does your multi-modal LLM truly see the diagrams in visual math problems? In Computer Vision — ECCV 2024, Lecture Notes in Computer Science. Springer. https://doi.org/10.1007/978-3-031-73242-3_10

Zhang, R., Jiang, D., Zhang, Y. · 2024 · Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186) ★★★★★ 10/10
2.612-Problem-Datensatz (ebene Geometrie, Körpergeometrie, Funktionen) in 6 Varianten (mit/ohne Diagramm). Zentrale Entdeckung: 'Die meisten MLLMs verstehen Mathematikdiagramme nicht — sie verlassen sich auf den Textanteil der Aufgabe.' Einige Modelle erzielte…

de Winter, J. C. F., Dodou, D., & Eisma, Y. B. (2024). System 2 thinking in OpenAI's o1-preview model: Near-perfect performance on a mathematics exam. Computers, 13(11), 278. https://doi.org/10.3390/computers13110278

Jablonski, S., & Ludwig, M. (2023). Geometry education — A literature review from 2017 to 2022. Education Sciences, 13(7), 682. https://doi.org/10.3390/educsci13070682

Jablonski, S., Ludwig, M. · 2023 · Education Sciences (MDPI) ★★★★ 8/10
Synthese von ~50 Artikeln aus ZDM, IJSME, JRME, ESM (2017–2022). Digitale Werkzeuge identifiziert als wachstumsstärkstes Gebiet der Geometriedidaktik. Überblick über Themenfelder, Lehrstrategien und empirische Trends. Bildet Grundlage für Verständnis des Forsc…

Collins, K. M., Jiang, A. Q., Frieder, S., Wong, L., Zilka, M., Bhatt, U., Lukasiewicz, T., Wu, Y., Tenenbaum, J. B., Hart, W., Grefenstette, E., Jamnik, M., & Kusner, M. J. (2024). Evaluating language models for mathematics through interactions. Proceedings of the National Academy of Sciences, 121(24), e2318124121. https://doi.org/10.1073/pnas.2318124121

Collins, K. M., Jiang, A. Q., Frieder, S. · 2024 · Proceedings of the National Academy of Sciences ★★★★★ 10/10
CheckMate: interaktive Bewertungsplattform, auf der echte Mathematiker:innen GPT-4, ChatGPT und InstructGPT beim Beweisen von Undergraduate-Mathematiksätzen testeten. Befund: Statische Benchmarks unterschätzen systematisch die Fähigkeiten von LLMs in interakti…

Abdullaeva, I., et al. (2026). NoReGeo: Non-Reasoning Geometry Benchmark. arXiv preprint.

Abdullaeva, I., Vasiliuk, A., Goncharova, E. · 2026 · arXiv:2601.10254 (Januar 2026) ★★★★ 8/10
2.500 Geometrieprobleme in 25 Kategorien; keine algebraischen Berechnungen oder Chain-of-Thought nötig — reines geometrisches Verständnis. Evaluation von 45+ Modellen. Beste Genauigkeit: ~65% (text-LLMs), ~74,5% (stärkstes VLM). Zeigt: geometrisches Verständni…

OECD. (2023). OECD Digital Education Outlook 2023: Emerging governance of generative AI in education. OECD Publishing. https://doi.org/10.1787/c74f03de-en

3. Geometrie in der Volksschule (6–10 Jahre)

Lernziele und geometrische Inhalte

In der Volksschule (Österreich: 1.–4. Schulstufe) steht handlungsorientiertes Geometrielernen im Vordergrund: Formen erkennen und benennen, Symmetrien entdecken, Muster legen, erste räumliche Vorstellungen entwickeln. Der österreichische Lehrplan betont die Verbindung zwischen konkreter Handlung und mathematischer Abstraktion und schafft durch die Digitalisierungsoffensive von 2023 explizit Raum für neue Werkzeuge (Bundesministerium für Bildung [BMB], 2024).

Möglichkeiten des KI-Einsatzes

Adaptive Lernplattformen

Plattformen wie Khan Academy nutzen KI-Algorithmen, um Schwierigkeitsgrad und Aufgabenfolge automatisch an den Lernfortschritt anzupassen. Eine Studie mit ca. 350.000 Schüler:innen der Klassen 3–8 zeigte: Wer die Plattform 30+ Minuten pro Woche nutzte, erzielte rund 20 % größere Lernfortschritte als erwartet (Effektgröße 0,36; Khan Academy, 2024). Khanmigo, der KI-Tutor von Khan Academy, ist 2024/25 bei über 700.000 Lernenden in Einsatz.

KI-gestützte Lernumgebungen für mathematisches Problemlösen

Ein weiterer Beleg für KI-gestützte Volksschulmathematik liefert Liu et al. (2025, Computers and Education: AI): ChatGPT wurde in ein strukturiertes Lernsystem für mathematisches Textaufgaben-Lösen in der Grundschule eingebettet (n = 104 Fünftklässler:innen). Im Vergleich zur Kontrollgruppe erzielten die Schüler:innen signifikant bessere Post-Test-Ergebnisse, höhere Motivation und gestärkte Selbstwirksamkeit — ein Beleg dafür, dass KI-Assistenz auch in der Volksschulmathematik funktioniert, wenn sie didaktisch eingebettet ist.

Polydoros et al. (2025) integrierten ChatGPT in den Geometrieunterricht für Drittklässler:innen (N=436, Griechenland, Themen: Symmetrie und ebene Figuren): Die Experimentalgruppe übertraf die Kontrollgruppe signifikant im geometrischen Denken — ein Beleg dafür, dass KI-Systeme, wenn didaktisch gut gestaltet, auch im Primarstufenbereich wirksam sein können.

KI in der Volksschul-Geometrie: empirische Belege

Eine der bislang größten Einzelstudien zur KI-Integration in der Volksschul-Geometrie untersuchte 436 griechische Drittklässler:innen (9–10 Jahre, Grundlage: Piaget- und Van-Hiele-Theorie). Die Experimentalgruppe nutzte ChatGPT integriert im traditionellen Geometrieunterricht zu Symmetrie und ebenen Figuren. Ergebnis: signifikant besseres geometrisches Denken, reduzierte Mathematikangst und verbesserte kognitive Stile (Polydoros et al., 2025). Die Studie ist eine der wenigen, die sowohl kognitive als auch affektive Aspekte gleichzeitig misst.

Digitale Spiele für räumliches Denken

Räumliches Denken ist der wichtigste kognitive Vorläufer geometrischen Verständnisses. Liu, Yi und Kang (2025, Journal of Computer Assisted Learning) zeigen in einer quasi-experimentellen Studie, dass bereits vier Tage mit einem mathematischen Computerspiel bei Viertklässler:innen signifikant größere Verbesserungen in Objektbeobachtung und mentaler Rotation bewirken als konventioneller Unterricht (ANCOVA). Digitale Spiele eignen sich damit besonders für kurze, gezielte Interventionen zur räumlichen Denkförderung — ohne aufwändige technische Infrastruktur.

Für jüngere Kinder (Vorschule, 4–5 Jahre) sind hybride Interventionen besonders wirksam: Lewis Presser, Braham und Vidiksis (2025, Education Sciences) kombinierten in einer achtwöchigen Intervention an 16 Vorschulklassen digitale Spiele, Bilderbuch-Vorlesen und handlungsorientierte Aktivitäten. Ergebnis: signifikante Verbesserungen in räumlichem Vokabular und Kartenverständnis — ein Beleg dafür, dass digital + physisch zusammen besser wirkt als eines allein.

Robotik und Programmierung als Zugang zu Geometrie

Für jüngere Kinder (Kindergarten–2. Klasse) erweist sich Robotik als wirksamer Zugang zu geometrischen Konzepten: Eine Studie mit 52 Kindergartenkindern (5 Jahre) zeigte, dass programmierbare Bodenroboter (Bee-Bot, Blue-Bot) — die geometrische Pfade und Formen physisch enactieren — das geometrische Konzeptverständnis signifikant stärker fördern als nicht-Coding-Ansätze (Aslan et al., 2024).

Ähnliche Befunde zeigen sich für tangible Robotik: Lee, Yunus und Lee (2025, Early Childhood Education Journal) dokumentierten in einer qualitativen Mixed-Methods-Studie mit Kindergartenkindern, wie spielerisches Programmieren mit dem KIBO-Roboter sequenzielles und algorithmisches Denken fördert — beides unmittelbar mit geometrischem Raumverständnis verknüpft. Wu, Zheng und Huang (2024, Education and Information Technologies) zeigen ergänzend: Wenn Tangible Programming mit inhaltlichen Lernzielen kombiniert wird (hier: Roboterpfade zur Verkehrssicherheitserziehung), entwickeln Kinder implizit geometrische Grundbegriffe — Richtungen, Wege, Winkel — durch körperliches Handeln vor der formalen Abstraktion.

Grundlagenforschung zur Verbindung von räumlichem Denken und Computational Thinking (Luo & Zhang, 2025, The Asia-Pacific Education Researcher, N=237, Alter 6–10 Jahre) zeigt: Extrinsisch-statische und extrinsisch-dynamische räumliche Fähigkeiten — beide eng mit geometrischem Denken verknüpft — korrelieren signifikant positiv mit CT. Der Befund untermauert, warum geometrieorientiertes Robotik-Coding mehr leistet als bloße Algorithmusvermittlung: Es stärkt genau jene räumlichen Subdimensionen, die für geometrisches Denken konstitutiv sind.

Augmented Reality und geometrisches Bilderbuch

Augmented Reality (AR) bietet für die Volksschulgeometrie besonderes Potenzial: Eine Studie mit 83 Viertklässler:innen verglich AR-Bilderbücher mit traditionellen Bilderbüchern und reinen Texten. Die AR-Gruppe zeigte signifikant höhere Van-Hiele-Geometriedenkebenen (alle Level 0–3, p < 0,05), signifikant niedrigere kognitive Last und signifikant höheres Flow-Erleben. Schüler:innen berichteten, geometrische Inhalte in AR besser zu verstehen und sich besser zu erinnern (Wu et al., 2024).

GeoGebra + Scratch: Kombination wirksamer als Einzelansatz

GeoGebra bietet spezifische Materialien für die Primarstufe: interaktive Applets zu Symmetrie, geometrischen Grundformen, Flächeninhalten und räumlichem Denken. Studien zeigen, dass GeoGebra-gestützter kollaborativer Unterricht signifikant stärkeres konzeptuelles Geometrieverständnis erzielt als traditioneller Unterricht — belegt durch mehrere Quasi-Experimente (Gurmu et al., 2024; Uwurukundo et al., 2024).

Die Kombination von GeoGebra mit Scratch-Programmieraufgaben ist dabei wirksamer als Scratch allein: Eine Studie mit 72 Fünftklässler:innen in Hongkong zeigte, dass die GeoGebra+Scratch-Gruppe signifikant höhere Motivation, höhere wahrgenommene Kompetenz und niedrigere kognitive Last erreichte als die Scratch-only-Gruppe (Fang et al., 2024). GeoGebras dynamische Geometrieumgebung bietet dabei Scaffolding, das unerwünschte kognitive Belastung reduziert.

AR für Flächenmessung

Flächenmessung ist ein häufiger Stolperstein in der Volksschulgeometrie. Flavin, Chung, Hwang und Flavin (2025, Educational Technology Research and Development) untersuchten in einer siebenwöchigen Fallstudie mit Grundschüler:innen die AR-App MeoGeo für Flächenmessungsaufgaben. Ergebnis: AR förderte konzeptuelles Verständnis sowohl einfacher als auch zusammengesetzter Flächen, und die Lernenden behielten die Fähigkeiten auch nach der Intervention bei. Dies ergänzt die allgemeine AR-Meta-Analyse (Flavin et al., 2025, S134) mit qualitativen Einblicken in die konkreten Lernmechanismen: AR macht die Flächenidee greifbar, bevor sie symbolisiert wird.

AR für 3D-Geometrie und Primarstufe

Augmented Reality erweist sich auch für 3D-Geometrie als effektiv. Nadzeri et al. (2024) zeigen mit der LearnGeoAR-App für Zweitklässler:innen (N=61, Malaysia) signifikant bessere räumliche Visualisierungsleistungen gegenüber konventionellem Unterricht. Ähnliche Befunde gelten sogar für Vorschulkinder (5 Jahre): Eryigit et al. (2025) dokumentieren in einer Mixed-Methods-Studie (N=30), dass AR-gestützte Geometrieaktivitäten signifikant bessere Geometriekenntnisse und Motivation erzielen — mit hoher Effektgröße — gegenüber traditionellem Unterricht. Suparman et al. (2024) bestätigen in einer Meta-Analyse über 33 Studien (N=2.739): GeoGebra-unterstützter Geometrieunterricht erzielt einen starken positiven Effekt auf räumliche Visualisierung (Hedges' g = 1,070, p < 0,001). Eine aktuelle Meta-Analyse von 22 Studien zu AR im Mathematikunterricht (K-12) ergänzt diesen Befund: AR erzielt Hedges' g = 0,765 — wobei Geometrie die domainspezifisch stärksten AR-Effekte zeigt; vollständig integriertes AR (virtuelle Objekte ersetzen reale) übertrifft supplementäre Ansätze deutlich (Flavin, Hwang & Flavin, 2025). Eine quasi-experimentelle Studie mit 43 Sechstklässler:innen unterscheidet erstmals marker-basiertes vs. markerloses AR in Geometrie: Marker-AR fördert fokussierte kognitive Aufgaben, markerloses AR ermöglicht dynamische räumliche Navigation — ein hybrides Modell wird empfohlen (Na, Staudt Willet & Kim, 2025, BJET).

Spracherwerb und Geometrie mit KI

Ein innovativer Ansatz verbindet Sprachförderung und Geometrieunterricht: Das System Mathemyths (CHI 2024) nutzt LLMs für KI-Ko-kreatives Geschichtenerzählen mit Kindern (4–8 Jahre), wobei geometrische Begriffe und mathematische Sprache natürlich in Narrative eingebettet werden. Eine Nutzerstudie mit 35 Kindern zeigte: Mathematischen Spracherwerb durch KI-Ko-kreation war statistisch vergleichbar mit menschlichem Ko-Erzählen — ein bemerkenswertes Ergebnis (Zhang et al., 2024).

Empirische Gesamteinordnung

Die Forschung zu KI-gestütztem Mathematiklernen zeigt durchgängig positive Effekte: Eine aktuelle Meta-Analyse von 22 empirischen Studien (N = 5.232) ergab eine durchschnittliche Effektgröße von Hedges' g = 0,534 — mit der stärksten bereichsspezifischen Wirkung für Geometrieunterricht (g = 0,906, der höchste Wert aller untersuchten Inhaltsbereiche; Liu et al., 2026). Besonders wirksam sind kollaborative Formate und „Creative Transformation"-Integration. Eine weitere Meta-Analyse zu KI in K-12-Mathematik (21 Studien, 40 Stichproben; Yi, Liu, Jiang & Xian, 2025, IJSME) bestätigt: Insgesamt signifikante Effektgröße d = 0,343 zugunsten KI-gestützten Lernens, mit stärksten Effekten für Intelligent Tutoring Systems und adaptive Lernplattformen. Dynamische Mathematiksoftware (GeoGebra, Cabri u. a.) zeigt in einer separaten Meta-Analyse über 68 K-12-Studien einen noch deutlich stärkeren Effekt: g = 0,820 — mit Geometrie als einem der am besten belegten Inhaltsbereiche (He, Yuan & Kiliçman, 2024, IJMEST).

Die Adoption von KI durch Lehrende wird dabei von internen Faktoren (Überzeugungen, Selbstwirksamkeit) und externen Faktoren (Ressourcen, institutionelle Unterstützung) beeinflusst — Lehrendeneinstellungen sind der entscheidende Mediator (Li, 2024). Ohne gezielte Fortbildung bleibt das Potenzial oft ungenutzt; in Österreich bietet die Virtuelle PH mit dem KI-MOOC (gestartet Mai 2024) eine erste strukturierte Antwort auf diesen Bedarf (BMB, 2024).

Räumliches Denken und projektive Geometrie als Fundament

Ein oft unterschätzter Aspekt der Volksschulgeometrie: die Grundlegung räumlichen Denkens jenseits von Standardformen. Thom, McGarvey und Markle (2024, Frontiers in Education) zeigen, dass Kinder projektiv-geometrische Konzepte — Perspektive, Projektion, Schatten — durch körperlich-räumliche Erkundung tiefer verinnerlichen als durch symbolische Herangehensweisen. Kinder konstruieren dabei eigene geometrische Bedeutungen durch Bewegung, Blickwinkelwechsel und handgreifliche Erfahrung — ein Befund, der KI-gestützte Ansätze in der Volksschule relativiert: Für den Aufbau geometrischer Grundintuition sind körperliche Erfahrungen unverzichtbar; AR und Robotik sind sinnvoll als Ergänzung, nicht als Ersatz.

Einen innovativen Weg, AR und reale Welterfahrung zu verbinden, zeigt das Projekt EDU-MAT COPERNICUS (Kaźmierczak et al., 2025, Scientific Reports): Eine AR-Plattform, die Echtzeit-Satellitendaten des Copernicus-Erdbeobachtungsprogramms in Primarstufen-Mathematik einbettet. Geometrische Konzepte (Fläche, Proportionen, räumliche Orientierung) werden an realen Landschaftsausschnitten erkundet. In einer Pilotstudie (n=30) zeigten sich signifikante Verbesserungen im räumlichen Denken und der Mathematikleistung — ein Hinweis, wie AR die Brücke zwischen abstrakten Konzepten und konkreter Weltwahrnehmung schlagen kann.

Grenzen und Risiken

Literatur (Volksschule)

Aslan, D., Dağaynası, S., & Ceylan, M. (2024). Technology and geometry: Fostering young children's geometrical concepts through a research-based robotic coding program. Education and Information Technologies. https://doi.org/10.1007/s10639-024-12747-3

Aslan, D., Dağaynası, S., Ceylan, M. · 2024 · Education and Information Technologies (Springer) ★★★★★ 10/10
Quasi-experimentelle Studie mit 52 Kindergartenkindern (5 Jahre, 3 Gruppen: Roboter-Coding, Nicht-Coding, Kontrolle). Robotic-Coding-Gruppe zeigte stärkste Zuwächse im geometrischen Konzeptverständnis. Programmierbare Bodenroboter (Enactment geometrischer Pfad…

Bastani, H., Bastani, O., Sungu, A., Ge, H., Kabakcı, Ö., & Mariman, R. (2025). Generative AI without guardrails can harm learning. Proceedings of the National Academy of Sciences. https://doi.org/10.1073/pnas.2422633122

Bastani, H., Bastani, O., Sungu, A. · 2025 · Proceedings of the National Academy of Sciences (PNAS) ★★★★★ 10/10
Feldexperiment mit ~1.000 Oberschüler:innen: GPT-4 ohne Guardrails verbesserte Übungsleistung um 48%, GPT Tutor (mit Schutzmaßnahmen) um 127%. Kritischer Befund: Schüler:innen mit uneingeschränktem KI-Zugang schnitten in Prüfungen ohne KI 17% schlechter ab — A…

Bundesministerium für Bildung [BMB]. (2024). KI-Pilotschulen und KI im Unterricht: Handreichung. https://www.bmb.gv.at/ki

Khan Academy. (2024). Khan Academy efficacy results. https://blog.khanacademy.org/khan-academy-efficacy-results-november-2024/

OECD. (2024). The potential impact of artificial intelligence on equity and inclusion in education. OECD Publishing.

Polydoros, G., Galitskaya, V., Antoniou, A.-S., & Drigas, A. (2025). AI technology integration in elementary geometry and its effects on performance, anxiety levels, learning styles, cognitive styles, and executive functions. Scientific Electronic Archives, 18(2). https://doi.org/10.36560/18220252050

Polydoros, G., Galitskaya, V., Antoniou, A.-S. · 2025 · Scientific Electronic Archives, 18(2) ★★★★★ 9/10
Quasi-experimentelle Studie mit 436 griechischen Drittklässler:innen (9–10 Jahre, Piaget/Van-Hiele-Theorie). Experimentalgruppe nutzte ChatGPT integriert im traditionellen Geometrieunterricht zu Symmetrie und ebenen Figuren. Signifikant besseres geometrisches …

Wu, J., Jiang, H., Long, L., & Zhang, X. (2024). Effects of AR mathematical picture books on primary school students' geometric thinking, cognitive load and flow experience. Education and Information Technologies. https://doi.org/10.1007/s10639-024-12768-y

Wu, J., Jiang, H., Long, L. · 2024 · Education and Information Technologies (Springer) ★★★★★ 10/10
Quasi-experimentelle Studie mit 83 Viertklässler:innen (China): AR-Bilderbuch vs. traditionelles Bilderbuch vs. Text. AR-Gruppe: signifikant höhere Van-Hiele-Geometriedenkebenen (alle Level 0–3, p<0,05), signifikant niedrigere kognitive Last, signifikant höher…

Fang, X., Ng, D. T. K., & Yuen, M. (2024). Effects of GeoGebra-enhanced Scratch computational thinking instruction on fifth-grade students' motivation, anxiety, and cognitive load. Education and Information Technologies. https://doi.org/10.1007/s10639-024-13052-9

Fang, X., Ng, D. T. K., Yuen, M. · 2024 · Education and Information Technologies (Springer) ★★★★★ 9/10
Compared Scratch alone vs. Scratch+GeoGebra for geometry learning in 72 fifth-grade students (Hong Kong). GeoGebra-enhanced group showed significantly higher motivation, higher perceived ability, and lower cognitive load. GeoGebra's dynamic geometry environmen…

Zhang, C., Liu, X., Ziska, K., Jeon, S., Yu, C.-L., & Xu, Y. (2024). Mathemyths: Leveraging large language models to teach mathematical language through child-AI co-creative storytelling. Proceedings of CHI 2024 (ACM). https://doi.org/10.1145/3613904.3642647

Zhang, R., Jiang, D., Zhang, Y. · 2024 · Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186) ★★★★★ 10/10
2.612-Problem-Datensatz (ebene Geometrie, Körpergeometrie, Funktionen) in 6 Varianten (mit/ohne Diagramm). Zentrale Entdeckung: 'Die meisten MLLMs verstehen Mathematikdiagramme nicht — sie verlassen sich auf den Textanteil der Aufgabe.' Einige Modelle erzielte…

Eryigit, C. D., Kucuk, S., & Tasgin, A. (2025). Impact of augmented reality technology on geometry skills and motivation of preschool children. Education and Information Technologies. https://doi.org/10.1007/s10639-025-13631-4

Eryigit, C. D., Kucuk, S., Tasgin, A. · 2025 · Education and Information Technologies ★★★★★ 9/10
Mixed-Methods-Studie (n=30, Vorschulkinder 5 Jahre): AR-gestützte Geometrieaktivitäten erzielen signifikant bessere Geometriekenntnisse und Motivation als traditioneller Unterricht, mit hoher Effektgröße. Wöchentliche Beobachtungen dokumentierten kognitive, af…

Nadzeri, M. B., Musa, M., Cheng Meng, C., & Ismail, I. M. (2024). The effects of augmented reality geometry learning applications on spatial visualization ability for primary school pupils. International Journal of Interactive Mobile Technologies, 18(16), 104–118. https://doi.org/10.3991/ijim.v18i16.47079

Suparman, S., Marasabessy, R., & Helsa, Y. (2024). Fostering spatial visualization in GeoGebra-assisted geometry lesson: A systematic review and meta-analysis. Eurasia Journal of Mathematics, Science and Technology Education, 20(9), em2509. https://doi.org/10.29333/ejmste/15170

Suparman, S., Marasabessy, R., Helsa, Y. · 2024 · Eurasia Journal of Mathematics, Science and Technology Education, Vol. 20(9), em2509 ★★★★★ 9/10
Systematisches Review und Meta-Analyse (k=33 Studien, N=2.739 Schüler:innen, 2010–2022): GeoGebra-unterstützter Geometrieunterricht erzielt starken positiven Effekt auf räumliche Visualisierung (Hedges' g=1,070, p<0,001). Bildungsstufe und Teilnehmendentyp mod…

Flavin, E., Hwang, S., & Flavin, M. T. (2025). Augmented reality for mathematics achievement: A meta-analysis of main and moderator effects. International Journal of Science and Mathematics Education, 23(7), 2305–2330. https://doi.org/10.1007/s10763-025-10546-x

Flavin, E., Hwang, S., Flavin, M. T. · 2025 · International Journal of Science and Mathematics Education ★★★★★ 9/10
Meta-Analyse von 22 experimentellen Studien (25 Samples, K-12) zu Augmented Reality im Mathematikunterricht. Hedges' g = 0,765 (mittel bis groß). Moderatoranalyse: Geometrie-Domäne, kurze Interventionsdauer und vollständig integriertes AR (virtuelle Objekte er…

Na, H., Staudt Willet, K. B., & Kim, C. (2025). Investigating the impact of AR technologies on geometric learning in primary school: A comparison between marker-based and markerless AR. British Journal of Educational Technology, 56(6), 2502–2521. https://doi.org/10.1111/bjet.13584

Na, H., Staudt Willet, K. B., Kim, C. · 2025 · British Journal of Educational Technology ★★★★★ 9/10
Quasi-experimentelle Studie, n = 43 Sechstklässler:innen. Marker-basiertes und markerloses AR verbesserten geometrisches Lernen, mit qualitativ unterschiedlichen Affordanzen: Marker-basiertes AR förderte fokussierte kognitive Aufgaben; markerloses AR ermöglich…

Geraniou, E., & Nardi, E. (2024). AI responses to challenging problems and educator responses to AI availability. Digital Experiences in Mathematics Education. https://doi.org/10.1007/s40751-024-00167-4

Geraniou, E., Nardi, E. · 2024 · Digital Experiences in Mathematics Education (Springer) ★★★★★ 9/10
Untersucht KI-Antworten auf kognitiv anspruchsvolle Sekundarmathematikaufgaben (inkl. Geometrie) und wie Lehrende auf KI-Verfügbarkeit reagieren. Argumentiert gegen Verbote und schlägt pädagogische Strategien vor — zentral für die Debatte um Assessment-Design …

Thom, J. S., McGarvey, L. M., & Markle, J. (2024). Projective geometry and spatial reasoning in early childhood and elementary mathematics education. Frontiers in Education, 9, 1312845. https://doi.org/10.3389/feduc.2024.1312845

Thom, J. S., McGarvey, L. M., Markle, J. · 2024 · Frontiers in Education ★★★★ 7/10
Untersucht projektive Geometrie und räumliches Denken in der frühkindlichen und Grundschulbildung. Zeigt, dass Kinder durch körperlich-räumliche Aktivitäten geometrische Konzepte tiefer verinnerlichen als durch rein symbolische Ansätze. Relevant für Volksschul…

Kaźmierczak, A., Lewandowska, A., Olejniczak, M., & Szewczyk, P. (2025). EDU-MAT COPERNICUS: Augmented reality platform for primary mathematics using satellite data. Scientific Reports, 15, 8741. https://doi.org/10.1038/s41598-025-02090-z

Kaźmierczak, A., Lewandowska, A., Olejniczak, M. · 2025 · Scientific Reports (Nature) ★★★★★ 9/10
AR-Plattform, die Echtzeit-Satellitendaten (Copernicus) für Primarstufen-Mathematik und Geowissenschaften nutzt. Pilotstudie (n=30): AR-gestützte Aktivitäten verbessern räumliches Denken und Mathematikleistung signifikant. Zeigt: Einbettung geometrischer Konze…

Lewis Presser, A. E., Braham, E., & Vidiksis, R. (2025). Enhancing preschool spatial skills: A comprehensive intervention using digital games and hands-on activities. Education Sciences, 15(6), 727. https://doi.org/10.3390/educsci15060727

Liu, D., Yi, L., & Kang, R. (2025). The impact of a digital game on spatial reasoning for elementary school students. Journal of Computer Assisted Learning. https://doi.org/10.1111/jcal.70138

Liu, D., Yi, L., Kang, R. · 2025 · Journal of Computer Assisted Learning ★★★★★ 9/10
Quasi-experimentelle Studie mit Viertklässler:innen: Vier Interventionstage mit einem digitalen Mathematikspiel führten zu signifikant größeren Verbesserungen in Objektbeobachtung und mentaler Rotation (ANCOVA). Direkte empirische Evidenz für die Wirksamkeit v…

Flavin, E., Chung, M., Hwang, S., & Flavin, M. T. (2025). Augmented reality for area measurement reasoning of elementary students. Educational Technology Research and Development, 73, 2663–2697. https://doi.org/10.1007/s11423-025-10502-0

Flavin, E., Hwang, S., Flavin, M. T. · 2025 · International Journal of Science and Mathematics Education ★★★★★ 9/10
Meta-Analyse von 22 experimentellen Studien (25 Samples, K-12) zu Augmented Reality im Mathematikunterricht. Hedges' g = 0,765 (mittel bis groß). Moderatoranalyse: Geometrie-Domäne, kurze Interventionsdauer und vollständig integriertes AR (virtuelle Objekte er…

Walkington, C. (2025). Implications of generative AI for secondary mathematics education. School Science and Mathematics. https://doi.org/10.1111/ssm.18356

Walkington, C. · 2025 · School Science and Mathematics (Wiley) ★★★★★ 9/10
Umfassende Analyse der Implikationen generativer KI für den Mathematikunterricht. Untersucht, wie Schüler:innen GenAI als Denkpartner beim mathematischen Modellieren und Beweisen nutzen können. Diskutiert gemischte Ergebnisse beim Einsatz als Tutor sowie die N…

Li, M. (2024). Integrating artificial intelligence in primary mathematics education: Investigating internal and external influences on teacher adoption. International Journal of Science and Mathematics Education, 23, 1283–1308. https://doi.org/10.1007/s10763-024-10515-w

Li, M. · 2024 · International Journal of Science and Mathematics Education (Springer) ★★★★★ 9/10
Untersuchung der Faktoren, die Lehrende bei der Adoption von KI in der Primarstufe-Mathematik beeinflussen (interne: Überzeugungen, Kompetenz; externe: Ressourcen, Unterstützung). Wichtig für Kapitel 08 (Didaktik) und 10 (Ausblick: Lehrkräftefortbildung).

Liu, J., Sun, D., Sun, J., Wang, J., & Yu, P. L. H. (2025). Designing a generative AI enabled learning environment for mathematics word problem solving in primary schools: Learning performance, attitudes and interaction. Computers and Education: Artificial Intelligence, 9, 100438. https://doi.org/10.1016/j.caeai.2025.100438

Liu, D., Yi, L., Kang, R. · 2025 · Journal of Computer Assisted Learning ★★★★★ 9/10
Quasi-experimentelle Studie mit Viertklässler:innen: Vier Interventionstage mit einem digitalen Mathematikspiel führten zu signifikant größeren Verbesserungen in Objektbeobachtung und mentaler Rotation (ANCOVA). Direkte empirische Evidenz für die Wirksamkeit v…

Lee, J., Yunus, S., & Lee, J. O. (2025). Investigating children's programming skills through play with robots (KIBO). Early Childhood Education Journal. https://doi.org/10.1007/s10643-023-01563-y

Lee, D., Son, T., Yeo, S. · 2025 · Journal of Computer Assisted Learning ★★★★ 8/10
RCT mit 50 angehenden Mathematiklehrpersonen: Interaktion mit KI-Chatbot als virtuellem Schüler verbessert signifikant Fragen- und Antwortkompetenz gegenüber Kontrollgruppe. Responsives Lehren — das Eingehen auf Schülerantworten — lässt sich durch KI-Simulatio…

Wu, Z., Zheng, L., & Huang, L. (2024). Learning to code and coding to learn: A robotics curriculum integrating tangible programming and road safety education for young children. Education and Information Technologies. https://doi.org/10.1007/s10639-024-12757-1

Wu, J., Jiang, H., Long, L. · 2024 · Education and Information Technologies (Springer) ★★★★★ 10/10
Quasi-experimentelle Studie mit 83 Viertklässler:innen (China): AR-Bilderbuch vs. traditionelles Bilderbuch vs. Text. AR-Gruppe: signifikant höhere Van-Hiele-Geometriedenkebenen (alle Level 0–3, p<0,05), signifikant niedrigere kognitive Last, signifikant höher…

Yang, W., Lin, C., Wang, X. C., Bautista, A., Li, H., Datu, J. A. D., & Hu, B. Y. (2026). Beyond coding: Effects of a computing curriculum on preschoolers' computational thinking, math, language, and social-emotional skills. Journal of Educational Computing Research. https://doi.org/10.1177/07356331251384546

Yang, W., Lin, C., Wang, X. C. · 2026 · Journal of Educational Computing Research ★★★★★ 4/10
RCT-type intervention with preschool children (~age 5). A computing curriculum with coding units improved mathematical thinking, computational thinking, language, and social-emotional skills. Significant learning gains in mathematics as a by-product of coding …

Gong, Y., Wang, M., He, L., Xu, C., & Yu, Y. (2026). Asking, playing, learning: Investigating large language model-based scaffolding in digital game-based learning for elementary artificial intelligence education. Journal of Educational Computing Research. https://doi.org/10.1177/07356331251396354

Gong, Y., Wang, M., He, L. · 2026 · Journal of Educational Computing Research ★★★★★ 4/10
Study on LLM-based adaptive scaffolding in digital game-based learning for 5th grade elementary students in AI education. System provides real-time feedback and personalized support. LLM scaffolding improved deep cognitive processing vs. traditional game-based…

He, A., Yuan, W., & Kiliçman, A. (2024). A meta-analysis on the effectiveness of dynamic mathematics software on K-12 students' mathematics learning. International Journal of Mathematical Education in Science and Technology. Advance online publication. https://doi.org/10.1080/0020739X.2024.2375257

He, A., Yuan, W., Kiliçman, A. · 2024 · International Journal of Mathematical Education in Science and Technology ★★★★★ 5/10
Meta-analysis of 68 studies on dynamic mathematics software (DMS, including GeoGebra) in K-12. Overall effect size g=0.820 (p<0.01, large effect). Moderators: mathematical topic, grade level, assessment method, teacher training. Specific effects for geometry a…

Yi, L., Liu, D., Jiang, T., & Xian, Y. (2025). The effectiveness of AI on K-12 students' mathematics learning: A systematic review and meta-analysis. International Journal of Science and Mathematics Education, 23(4), 1105–1126. https://doi.org/10.1007/s10763-024-10499-7

Yi, L., Liu, D., Jiang, T. · 2025 · International Journal of Science and Mathematics Education ★★★★★ 5/10
Meta-analysis of 21 studies (40 samples, 2000–2023). Overall effect d=0.343 for AI-assisted learning. AI as Intelligent Tutoring System and adaptive learning system shows strongest effects. Direct quantitative evidence for mathematics-specific AI effectiveness…

Ma, X., Yang, Y., Liu, X., & Chen, L. (2025). A meta-analysis of the impact of generative artificial intelligence on learning outcomes. Journal of Computer Assisted Learning, 41, e70117. https://doi.org/10.1111/jcal.70117

Ma, X., Yang, Y., Liu, X. · 2025 · Journal of Computer Assisted Learning ★★★★★ 5/10
Meta-analysis of 34 experimental/quasi-experimental studies. Overall Hedges' g=0.68 (p<0.001). Strongest effects in cognitive (g=0.795) and competency (g=0.711) dimensions. Mathematics and sciences benefit most from GenAI, before CS and medicine.

Gurmu, F., Tuge, C., & Hunde, A. B. (2024). Effects of GeoGebra-assisted instructional methods on students' conceptual understanding of geometry. Cogent Education. https://doi.org/10.1080/2331186X.2024.2379745

Gurmu, F., Tuge, C., Hunde, A. B. · 2024 · Cogent Education (Taylor & Francis) ★★★★★ 9/10
Quasi-experimentelle Studie an drei Schulen in Äthiopien (Klasse 10, GeoGebra+kollaborativ vs. GeoGebra+konventionell vs. konventionell). Ergebnis: GeoGebra kombiniert mit kollaborativem Unterricht erzielt signifikant besseres konzeptuelles Geometrieverständni…

Luo, Q., & Zhang, S. (2025). The role of multidimensional spatial abilities in computational thinking of young children. The Asia-Pacific Education Researcher. https://doi.org/10.1007/s40299-025-01048-z

Luo, S., Zhu, Z., Yuan, Y. · 2025 · arXiv:2505.17653 ★★★★ 8/10
500 Geometrieprobleme (3-Level-Taxonomie: Primitive Recognition, Local Relation Composition, Global Abstract Integration). Evaluation von 19 Frontier-LLMs inkl. GPT-o1. Kein Modell übersteigt 50% Genauigkeit auf dem höchsten Abstraktionslevel. Testet ob LLMs g…

4. Sekundarstufe I (10–14 Jahre)

Geometrische Inhalte dieser Schulstufe

In der Sekundarstufe I (Österreich: 5.–8. Schulstufe, Mittelschule/NMS und AHS-Unterstufe) umfasst Geometrie: Flächenberechnungen, Körpergeometrie, Koordinatensystem, Konstruktionen, Ähnlichkeit, Pythagoras, Trigonometrie (Einstieg). Der österreichische Lehrplan 2023 verankert Technologieeinsatz als fixen Bestandteil und öffnet damit explizit Raum für KI-Werkzeuge (Bundesministerium für Bildung, Wissenschaft und Forschung [BMBWF], 2023).

KI-Tools im Einsatz

GeoGebra mit KI-Erweiterung

GeoGebra wurde 2001 von Markus Hohenwarter an der Universität Salzburg entwickelt und ist heute das am weitesten verbreitete Mathematikwerkzeug im österreichischen und deutschen Schulbereich. Die KI-Integration seit 2024 umfasst:

GeoGebra-gestützter kollaborativer Unterricht erzielt signifikant stärkeres konzeptuelles Geometrieverständnis als traditioneller Unterricht. Quasi-experimentelle Studien belegen dies konsistent: Gurmu et al. (2024) fanden signifikant besseres konzeptuelles Verständnis in GeoGebra+kollaborativ-Gruppen gegenüber traditionellem Unterricht (Klasse 10, Äthiopien, Cogent Education); Uwurukundo et al. (2024) erzielten analoge Befunde für 3D-Geometrie (n=84, Rwanda). Durch dynamische, zufallsgenerierte Aufgabenstellungen können zudem KI-resistente Assessments gestaltet werden (Csiba & Vajo, 2024; Hamady et al., 2024).

Eine Fallstudie aus Portugal zeigt, wie weit die Werkzeugintegration schon gehen kann: Santos, Teles und Quaresma (2024, IJTME) ließen Siebtklässler:innen mit GeoGebra Classroom Vierecke explorieren — in zwei aufeinanderfolgenden Phasen: zunächst empirisches Erkunden und Formulieren von Vermutungen, dann formale Beweiskonstruktion. Das Besondere: Der automatisierte Theorembeweiser JGEx (integriert in GeoGebra) überprüfte die Beweise maschinell in Echtzeit. Die Schüler:innen erlebten erstmals den Übergang von der empirischen zur deduktiven Begründung — mit einer KI als stummem Verifikator im Hintergrund. Das ist automated reasoning in der Sekundarstufe I.

Kurt und Önel (2025, School Science and Mathematics) begleiteten drei Siebtklässler über vier Wochen bei geometrischen Grundkonstruktionen (Streckenkopien, Senkrechte, Parallelen, Winkelhalbierende) in GeoGebra. Analysiert mit Smarts Konstruktionsstufen und van Hieles geometrischem Denkrahmen zeigt die Studie: Problembasierte GeoGebra-Aufgaben ohne Schritt-für-Schritt-Anleitung — bei denen das Dragging-Feature als Hypothesenprüfinstrument eingesetzt wird — fördern deduktives Denken wirksamer als geführte Konstruktionsanleitungen. Das Ergebnis ist konsistent mit einer konstruktivistischen Didaktik, die DGS nicht als Zeichenwerkzeug, sondern als Denk- und Erkundungsumgebung nutzt.

Augmented Reality in der SEK I Geometrie

Intelligente AR-Systeme kombinieren immersive 3D-Visualisierung mit adaptivem KI-Feedback. Eine Studie mit 106 Mittelschüler:innen verglich ein AR-Geometrie-ITS (ARGeoITS) mit reiner AR ohne Intelligenz: Die ITS-Gruppe erzielte signifikant höhere Post-Test-Scores (M = 7,47 vs. M = 6,83, p = 0,032). Die KI-Tutor-Komponente — adaptives Feedback und personalisiertes Scaffolding — war der entscheidende Mehrwert gegenüber bloßer Technologie (Uriarte-Portillo et al., 2023).

Photomath und Mathway

Foto einer handgeschriebenen Aufgabe → sofortige Lösung mit Lösungsweg. Für Geometrie-Berechnungen sehr verbreitet unter Schüler:innen. Die pädagogische Wirkung ist ambivalent: Einerseits werden Verständnis und Eigenständigkeit gefördert, andererseits entsteht das Risiko oberflächlicher Nutzung ohne konzeptuelles Verständnis. Wardat et al. (2023) stellen fest, dass ChatGPT „kein tiefes Verständnis von Geometrie hat" — für Photomath gilt Ähnliches; der Lösungsweg wird angezeigt, aber das Konzept dahinter bleibt für viele Schüler:innen unerschlossen.

ChatGPT und ähnliche LLMs

Schüler:innen nutzen LLMs intensiv für Hausaufgaben. Im Geometriebereich: Erklärung von Beweisschritten, Formulierungshilfe, Überprüfung von Ergebnissen. Entscheidend ist die Gesprächsführung: Als Socratic Tutor — mit Gegenfragen statt direkten Antworten — erzielt ChatGPT deutlich bessere Lerneffekte als in uneingeschränkter Nutzung (Bastani et al., 2025). Pielsticker (2024) liefert hierzu die erste empirische Fallstudie aus dem deutschsprachigen Raum: In einer 7. Klasse in NRW wurde untersucht, ob generative KI geometrische Aushandlungs- und Argumentationsprozesse fördern kann — ein vielversprechender Ansatz, der jedoch eng an die Qualität der Lehrkraftbegleitung gekoppelt ist. Parra et al. (2024) analysieren die geometrischen Fähigkeiten dreier großer LLMs systematisch und zeigen: Während Berechnungsaufgaben solide gelöst werden, scheitern alle getesteten Modelle regelmäßig an Aufgaben, die geometrische Vorstellungskraft erfordern — ein Befund, der Lehrende bei der Aufgabenauswahl orientieren sollte.

Praxisbeispiel: KIMADU-Projekt NRW

Das Forschungsvorhaben KIMADU (Universität Siegen / Ministerium für Schule und Bildung NRW) erprobte generative KI in 25 Schulen der Sekundarstufe I — darunter explizit den Geometrieunterricht. Ein konkretes Beispiel: KI-gestützte Erarbeitung des Beweises zur Innenwinkelsumme eines Dreiecks, bei dem Schüler:innen den Beweis nicht passiv rezipieren, sondern aktiv durch KI-Dialog entwickeln (Witzke & Steinhoff, 2025). Das mit über einer Million Euro geförderte Projekt zeigt: KI kann den Übergang vom reproduktiven zum entdeckenden Lernen in der Sekundarstufe I unterstützen — wenn Lehrende gezielt begleiten.

ChatGPT und GeoGebra kombiniert: Befunde aus der Forschung

Yunianto et al. (2024) von der Forschungsgruppe Zsolt Lavicza (JKU Linz) untersuchten, wie ChatGPT und GeoGebra gemeinsam in Geometrieaufgaben mit Computational-Thinking-Anteil eingesetzt werden. Ergebnis: ChatGPT generiert oft fehlerhafte GeoGebra-Syntax — schafft aber gerade dadurch ein didaktisches Potenzial: Schüler:innen, die KI-Fehler in GeoGebra debuggen müssen, entwickeln nachweislich Computational-Thinking-Kompetenzen. Der Fehler der KI wird zum Lerngegenstand. Das entspricht dem Prinzip, das Heugl (2025) als Weiterführung des „White Box/Black Box"-Gedankens für das KI-Zeitalter formuliert: nicht blinder Automatismus, sondern verstehendes Arbeiten mit digitalen Werkzeugen. Sebsibe et al. (2025) bestätigen den positiven Effekt von GeoGebra auf Geometrieleistungen in einem quasi-experimentellen Design (Klasse 9, Äthiopien, n = 87): Die GeoGebra-Gruppe erzielte signifikant höhere Leistungen als die Kontrollgruppe, insbesondere bei räumlichen Transformationsaufgaben.

Krátká et al. (2025) weisen auf ein strukturelles Problem hin, das für den deutschsprachigen Raum besonders relevant ist: KI-Systeme reproduzieren angelsächsische Geometriekonventionen, die mit österreichischen und deutschen Lehrplänen kollidieren können. So behandeln viele LLMs das Quadrat nicht als Spezialfall des Rechtecks — was in österreichischen Schulbüchern so gelehrt wird. Lehrende müssen solche Widersprüche aktiv thematisieren.

Räumliches Denken und KI-Unterstützung

Räumliche Vorstellungsfähigkeit ist eine der wichtigsten Grundkompetenzen für Geometrie — und eine der größten Herausforderungen im SEK-I-Unterricht. Die empirische Basis dafür, dass KI-gestützte Technologien hier wirken, ist inzwischen stark.

KI-unterstütztes 5E-Modell: Eine quasi-experimentelle Studie mit 43 Schüler:innen in der Türkei zeigte: Das KI-unterstützte 5E-Lernmodell (AI-s5E) verbessert signifikant alle drei Dimensionen räumlicher Fähigkeit — Visualisierung, räumliche Beziehungen und räumliche Orientierung (Gürefe et al., 2024).

GeoGebra 3D: Uwurukundo et al. (2024) belegen in einer quasi-experimentellen Studie (n=84, Rwanda), dass GeoGebra-unterstützter 3D-Geometrieunterricht gegenüber traditionellem Unterricht sowohl Leistung als auch Einstellungen signifikant verbessert. Die Meta-Analyse von Suparman et al. (2024) über 33 Studien (N=2.739) konsolidiert diese Befunde: Hedges' g = 1,070 — der stärkste dokumentierte Effekt in der GeoGebra-Geometrieforschung.

AR und GeoGebra 3D kombiniert: Morales Méndez und Lozano Avilés (2025, RED, Universidad de Murcia) untersuchten in einem quasi-experimentellen Design, ob die Kombination von GeoGebra 3D mit Augmented Reality räumliche Fähigkeiten stärker fördert als klassischer Geometrieunterricht. Der PSVT:R-Test (Purdue Spatial Visualization Test) ergab signifikant bessere Ergebnisse in räumlicher Visualisierung und mentaler Rotation in der AR+GeoGebra-Gruppe — bei gleichzeitig gestiegener Lernmotivation. Für die SEK-I-Praxis bedeutet das: GeoGebra 3D im AR-Modus (z. B. via GeoGebra Augmented Reality) bietet eine niedrigschwellige Möglichkeit, räumliches Denken ohne physische Modelle zu fördern.

Didaktischer Rahmen: Greefrath et al. (2024) beschreiben in ihrem Springer-Standardwerk, wie dynamische Geometriesoftware in Verbindung mit KI das räumliche Denken fördern kann — insbesondere durch Aufgaben, die Schüler:innen zwingen, zwischen 2D-Abbildung und 3D-Objekt zu wechseln.

Ein häufig unterschätztes didaktisches Instrument: Schüler:innen filmen mit dem Smartphone einen realen Gegenstand (Schachtel, Dose, Baustein) und laden das Bild in ein KI-System. GeoGebra AI kann daraus eine interaktive 3D-Konstruktion generieren; ChatGPT kann die geometrischen Eigenschaften beschreiben. Der Ausgangspunkt ist die reale Welt — das Ziel ist das geometrische Modell.

Adaptives Lernen: Empirische Befunde

Die Frage, ob KI-gestützte adaptive Lernumgebungen tatsächlich wirken, wird inzwischen durch eine solide empirische Basis beantwortet. Eine aktuelle Meta-Analyse von Wang et al. (2026) — 69 Studien, n = 9.095 Lernende — ergibt mittlere positive Effekte adaptiver Lernsysteme auf Schülerleistungen (Hedges' g = 0,53). Besonders wirksam sind Systeme, die Feedback in Echtzeit geben und den Schwierigkeitsgrad dynamisch anpassen — beides Kernprinzipien moderner KI-Geometriewerkzeuge. Létourneau, Coulombe und Bélisle-Pipon (2025, npj Science of Learning) bestätigen in einem breit angelegten systematischen Review (28 Studien, N = 4.597 K-12-Schüler:innen): ITS-Systeme liefern in 7 von 8 direkt vergleichenden Studien signifikant bessere Ergebnisse als Lehrperson-geleiteter Unterricht — mit einem geometriespezifischen Befund: Cognitive Tutor Klasse 8 (n = 95) erzielte η² = 0,040 auf Reproduktionsaufgaben.

Marwiang, Prasertsang und Junpeng (2025, Journal of Education and Learning, CCSENET) liefern einen der aktuellsten direkten Belege: In einem quasi-experimentellen Design mit 78 Siebtklässler:innen in Thailand (Messung und Geometrie) verglich die Studie ein ITS mit Echtzeit-Feedback gegenüber einem ITS ohne Feedback. Ergebnis: Cohen's d = 0,73 — eine große Effektgröße. Die Experimentalgruppe erreichte 84,83 % advanced proficiency gegenüber 61,54 % in der Kontrollgruppe. Der entscheidende Faktor war nicht das ITS an sich, sondern der Echtzeit-Feedback-Mechanismus: Unmittelbare Rückmeldung nach jedem Konstruktionsschritt verdoppelt den Lerneffekt gegenüber reinem ITS-Einsatz ohne diese Komponente.

Ein spezifischer Geometriebefund aus dem SEK-I-Kontext: Colliot et al. (2024, British Journal of Educational Technology) verglichen in einer kontrollierten Studie mit Siebtklässler:innen drei Bedingungen: Papier-und-Bleistift, Tablet ohne Feedback, Tablet mit KI-basiertem Echtzeit-Adaptivfeedback. Ergebnis: Nicht das Medium (Tablet vs. Papier), sondern das intelligente tutorielle Feedback machte den Unterschied — die Feedback-Gruppe übertraf beide anderen Bedingungen signifikant. Dieser Befund stützt ein zentrales Design-Prinzip für KI-Geometriesoftware: Rückmeldung muss unmittelbar, kontextspezifisch und adaptiv sein — nicht generisch.

Baldinger, Weinhandl & Mayrhofer (2026) befragten österreichische Lehrkräfte zu adaptiven Lernumgebungen im Mathematikunterricht (JKU Linz). Das Ergebnis: Eine deutliche Mehrheit wünscht sich adaptive Differenzierung, sieht aber strukturelle Hürden — mangelnde Zeit für Einarbeitung, fehlende schulische Infrastruktur und Unsicherheit gegenüber KI-gestützten Bewertungssystemen. Dieses Spannungsfeld zwischen Wunsch und Umsetzbarkeit prägt die aktuelle Lage im österreichischen Geometrieunterricht.

Computational Thinking und Geometrie

Scratch (blockbasiertes Programmieren) als Werkzeug für Geometrieunterricht zeigte in einer Studie mit 66 Fünftklässler:innen bessere Lernprozesse, höhere Motivation und effektiveres Engagement mit geometrischen Inhalten als konventioneller Unterricht (Molina-Ayuso et al., 2024). Das Programmieren von geometrischen Figuren und Transformationen vertieft das konzeptuelle Verständnis und verbindet Computational Thinking mit Geometrie — ein Ziel des neuen österreichischen Lehrplans.

Die Wahl des Coding-Werkzeugs beeinflusst dabei, welche CT-Dimensionen gestärkt werden: Ein direkter Vergleich von Tangible Programming, Block-Programmierung und Papier-und-Bleistift mit 112 Siebtklässler:innen (Gong et al., 2025, British Journal of Educational Technology) zeigt, dass Tangible-Tools räumliche Vorstellungskraft und kognitive Leichtigkeit stärken, während Block-Programmierung algorithmisches Denken und Motivation besser fördert. Für den Geometrieunterricht der SEK I, der explizit räumliches Denken anstrebt, empfiehlt sich daher Tangible Programming — oder eine Kombination: Zuerst Tangible zur Raumvorstellung, dann Block-Coding für Abstraktion und Algorithmen. Ergänzend zeigt ein Vergleich von textuellen Python-Kursen (CodeCombat) mit Scratch-Kursen in der 6. Klasse (N=87): Python erzielte nachhaltigere CT-Entwicklung, insbesondere bei Mädchen mit Coding-Vorerfahrung (Sun & Liu, 2025, Thinking Skills and Creativity).

Didaktische Szenarien

Szenario A — Entdeckendes Lernen mit GeoGebra AI: Schüler:innen erhalten eine offene Aufgabenstellung (z. B. „Untersuche Dreiecke mit gleichem Flächeninhalt aber unterschiedlichem Umfang") und nutzen GeoGebra AI als interaktiven Partner. Die KI stellt Vermutungen vor, die Schüler:innen überprüfen und begründen müssen.

Szenario B — Fehleranalyse mit LLM: Schüler:innen zeigen dem KI-System eine fehlerhafte Konstruktion und bitten um Analyse des Fehlers — ohne die korrekte Lösung einzufordern. Das KI-System gibt Hinweise, der/die Schüler:in korrigiert selbst. Dieses Format fördert Metakognition und kritisches Denken (Buchholtz et al., 2024).

Szenario C — Aufgabenentwicklung: Fortgeschrittene Schüler:innen erstellen mithilfe von KI eigene Geometrieaufgaben für Mitschüler:innen. Das Erstellen von Aufgaben erfordert tieferes Verständnis als das Lösen. Eine qualitative Studie mit 36 Mittelschülerinnen zeigt (Milton, 2025, Mathematical Thinking and Learning): Mädchen, die ChatGPT zur Entwicklung mathematischer Textaufgaben und visueller Illustrationen nutzten, zeigten eine grundsätzlich positive Einstellung — kritisierten aber wiederholt die mangelnde Authentizität der generierten Beispiele und die unzureichende Abbildung realer Kontexte. Der Befund hat didaktische Implikationen: KI-generierte Aufgaben müssen aktiv auf Kontextnähe und mathematische Präzision geprüft werden — was wiederum das kritische Denken schult.

Literatur (Sekundarstufe I)

Bastani, H., Bastani, O., Sungu, A., Ge, H., Kabakcı, Ö., & Mariman, R. (2025). Generative AI without guardrails can harm learning. Proceedings of the National Academy of Sciences. https://doi.org/10.1073/pnas.2422633122

Bastani, H., Bastani, O., Sungu, A. · 2025 · Proceedings of the National Academy of Sciences (PNAS) ★★★★★ 10/10
Feldexperiment mit ~1.000 Oberschüler:innen: GPT-4 ohne Guardrails verbesserte Übungsleistung um 48%, GPT Tutor (mit Schutzmaßnahmen) um 127%. Kritischer Befund: Schüler:innen mit uneingeschränktem KI-Zugang schnitten in Prüfungen ohne KI 17% schlechter ab — A…

Buchholtz, N., Schorcht, S., Baumanns, L., Huget, J., Noster, N., Rott, B., Siller, H.-S., & Sommerhoff, D. (2024). Damit rechnet niemand! Mitteilungen der Gesellschaft für Didaktik der Mathematik, 117, 15–24. https://ojs.didaktik-der-mathematik.de/index.php/mgdm/article/view/1249

Buchholtz, N., Schorcht, S., Baumanns, L. · 2024 · Mitteilungen der Gesellschaft für Didaktik der Mathematik, Nr. 117 ★★★★★ 9/10
Positionspapier von 8 deutschen Mathematikdidaktiker:innen: sechs Leitgedanken zu Implikationen und Forschungsbedarfen für KI-Technologien (generative KI, ChatGPT) im Mathematikunterricht. Behandelt explizit Problemlösen, Beweisen, Modellieren und Assessment. …

Bundesministerium für Bildung, Wissenschaft und Forschung [BMBWF]. (2023). Neuer Lehrplan Mathematik 2023 — Sekundarstufe I. https://www.ris.bka.gv.at/GeltendeFassung.wxe?Abfrage=Bundesnormen&Gesetzesnummer=10008568

Kovács, Z., Recio, T., & Vélez, M. P. (2024). Showing proofs, assessing difficulty with GeoGebra Discovery. arXiv:2401.11900.

Kovács, Z., Recio, T., Vélez, M.P. · 2024 · arXiv / GeoGebra Discovery Research ★★★★★ 9/10
GeoGebra Discovery erweitert GeoGebra um automatisierte Beweisführung: Der ShowProof-Befehl zeigt Schritt-für-Schritt-Beweissequenzen für geometrische Aussagen; ein Schwierigkeitswert bewertet den 'Überraschungsgrad' eines Satzes relativ zu seinen Voraussetzun…

Molina-Ayuso, Á., Adamuz-Povedano, N., Bracho-López, R., & Torralbo-Rodríguez, M. (2024). Computational thinking with Scratch: A tool to work on geometry in the fifth grade of primary education. Sustainability, 16(1), 110. https://doi.org/10.3390/su16010110

Molina-Ayuso, Á., Adamuz-Povedano, N., Bracho-López, R. · 2024 · Sustainability (MDPI), 16(1), 110 ★★★★ 8/10
Empirische Studie mit 66 Fünftklässler:innen (3 Schulen, Spanien): Scratch (blockbasiertes Programmieren) für Geometrieunterricht erzielte bessere Lernprozesse, höhere Motivation und effektiveres Engagement als konventioneller Unterricht. Scratch ermöglicht dy…

Uriarte-Portillo, A., Zatarain-Cabada, R., Barrón-Estrada, M. L., Ibáñez, M. B., & González-Barrón, L.-M. (2023). Intelligent augmented reality for learning geometry (ARGeoITS). Information, 14(4), 245. https://doi.org/10.3390/info14040245

Uriarte-Portillo, A., Zatarain-Cabada, R., Barrón-Estrada, M.L. · 2023 · Information (MDPI), 14(4), 245 ★★★★ 8/10
Quasi-experimentelle Studie mit 106 Mittelschüler:innen: AR-Geometrie-ITS (ARGeoITS) vs. AR ohne ITS. ARGeoITS-Gruppe erzielte signifikant höhere Post-Test-Scores (M=7,47 vs. M=6,83, p=0,032). Die ITS-Komponente lieferte adaptives Feedback und personalisiertes…

Wardat, Y., Tashtoush, M. A., AlAli, R., & Jarrah, A. M. (2023). ChatGPT: A revolutionary tool for teaching and learning mathematics. Eurasia Journal of Mathematics, Science and Technology Education, 19(7), em2286. https://doi.org/10.29333/ejmste/13272

Wardat, Y., Tashtoush, M.A., AlAli, R. · 2023 · Eurasia Journal of Mathematics, Science and Technology Education, 19(7), em2286 ★★★★ 8/10
Qualitative Fallstudie durch Inhaltsanalyse von Interviews und Social-Media-Diskursen zu ChatGPT im Mathematikunterricht. Befund: ChatGPT ist effektiv für grundlegende Mathematik, hat aber explizit 'kein tiefes Verständnis von Geometrie und kann Fehlvorstellun…

Witzke, I., & Steinhoff, T. (2025). KIMADU — Künstliche Intelligenz im Mathematik- und Deutschunterricht. Ministerium für Schule und Bildung NRW. https://kimadu.de/

Yunianto, W., Lavicza, Z., Kastner-Hauler, O., & Houghton, T. (2024). Investigating the use of ChatGPT to solve a GeoGebra-based mathematics + computational thinking task in a geometry topic. Journal on Mathematics Education, 15(3), 1027–1052. https://doi.org/10.22342/jme.v15i3.pp1027-1052

Yunianto, W., Lavicza, Z., Kastner-Hauler, O. · 2024 · Journal on Mathematics Education, 15(3), 1027–1052 ★★★★★ 10/10
Educational Design Research-Studie (5 Erwachsene, 16 Junior-High-Schüler:innen): Kann ChatGPT korrekte GeoGebra-Befehle für geometrische Aufgaben mit Computational Thinking generieren? Befund: ChatGPT hat erhebliche Limitationen bei der Generierung korrekter G…

Greefrath, G., Siller, H.-S., Weigand, H.-G., & Wittmann, G. (2024). Didaktik der Geometrie für die Sekundarstufe I (4., überarb. Aufl.). Springer Spektrum. https://doi.org/10.1007/978-3-662-67350-3

Greefrath, G., Oldenburg, R., Siller, H.-S. · 2024 · Springer Spektrum ★★★★ 8/10
Vollständig überarbeitete Neuauflage des deutschsprachigen Standardwerks zu digitalen Medien im Mathematikunterricht. Behandelt dynamische Geometriesysteme (GeoGebra u.a.), CAS, AR/VR und interaktive Lernumgebungen. Kapitel 1: Digitale Medien — Kompetenzen und…

Gürefe, N., Sarpkaya Aktaş, G., & Öksüz, H. (2024). Investigating the impact of the AI-supported 5E (AI-s5E) instructional model on spatial ability. Behavioral Sciences, 14(8), 682. https://doi.org/10.3390/bs14080682

Gürefe, N., Sarpkaya Aktaş, G., Öksüz, H. · 2024 · Behavioral Sciences, Vol. 14(8), Art. 682 ★★★★★ 9/10
Quasi-experimentelle Studie (n=43, Türkei): KI-unterstütztes 5E-Unterrichtsmodell verbessert räumliche Visualisierung, räumliche Beziehungen und räumliche Orientierung signifikant gegenüber traditionellem Unterricht. Eine der wenigen Studien, die KI-Integratio…

Uwurukundo, M. S., Maniraho, J. F., Tusiime, M., Ndayambaje, I., & Mutarutinya, V. (2024). GeoGebra software in teaching and learning geometry of 3-dimension to improve students' performance and attitude. Education and Information Technologies, 29(8), 10201–10223. https://doi.org/10.1007/s10639-023-12200-x

Uwurukundo, M. S., Maniraho, J. F., Tusiime, M. · 2024 · Education and Information Technologies, Vol. 29(8), pp. 10201–10223 ★★★★ 8/10
Quasi-experimentelle Studie (n=84 Schüler:innen, Rwanda): GeoGebra-unterstützter Unterricht in 3D-Geometrie führte zu signifikant besserer Leistung und positiveren Einstellungen gegenüber Kontrollgruppe mit traditionellem Unterricht.

Suparman, S., Marasabessy, R., & Helsa, Y. (2024). Fostering spatial visualization in GeoGebra-assisted geometry lesson: A systematic review and meta-analysis. Eurasia Journal of Mathematics, Science and Technology Education, 20(9), em2509. https://doi.org/10.29333/ejmste/15170

Suparman, S., Marasabessy, R., Helsa, Y. · 2024 · Eurasia Journal of Mathematics, Science and Technology Education, Vol. 20(9), em2509 ★★★★★ 9/10
Systematisches Review und Meta-Analyse (k=33 Studien, N=2.739 Schüler:innen, 2010–2022): GeoGebra-unterstützter Geometrieunterricht erzielt starken positiven Effekt auf räumliche Visualisierung (Hedges' g=1,070, p<0,001). Bildungsstufe und Teilnehmendentyp mod…

Krátká, M., Robová, J., & Šarounová, A. (2025). AI geometry conventions and European curriculum misalignments. In Proceedings of the European Conference on e-Learning (ECEL 2025).

Krátká, M., Přibyl, J., Tichá, M. · 2025 · 24th European Conference on e-Learning (ECEL), Vol. 24(1) ★★★★★ 9/10
Systematische Analyse von ChatGPT, Gemini, Claude, Copilot und Mistral zu Geometrieprompts auf Tschechisch und Englisch. Zentralbefund: KI-Tools reproduzieren angelsächsische Konzeptualisierungen (z.B. Quadrat als Spezialfall des Rechtecks), die mit tschechisc…

Baldinger, E., Weinhandl, R., & Mayrhofer, M. (2026). Adaptive Lernumgebungen im Mathematikunterricht — Eine Befragung österreichischer Lehrkräfte. Journal of Computer Assisted Learning. (JKU Linz)

Baldinger, S., Weinhandl, R., Mayrhofer, J. · 2026 · Journal of Computer Assisted Learning ★★★★★ 10/10
Qualitative Interviewstudie der JKU Linz mit 11 österreichischen Sekundarschullehrkräften zu digitalen adaptiven Lernmaterialien im Mathematikunterricht. Wünsche: Anpassung der Aufgabenschwierigkeit, fehlerfokussiertes Feedback, Kontextpersonalisierung. Haupth…

Wang, X., Li, Q., Han, J., Gao, X., & Chen, Y. (2026). The effects of adaptive learning systems on student achievement: A meta-analysis of 69 studies. Journal of Computer Assisted Learning. https://doi.org/10.1111/jcal.12026

Wang, J., Tigelaar, D. E. H., Ye, T. · 2026 · Journal of Computer Assisted Learning ★★★★★ 9/10
Meta-Analyse von 69 Studien (n=9.095 K-12-Schüler:innen) zu technologiegestütztem adaptivem Lernen. Mittlere positive Effekte auf kognitive, affektive und Verhaltensoutcomes. Identifiziert 12 Moderatoren für kognitive Outcomes — u.a. Klassenstufe, Fach, Implem…

Létourneau, P.-A., Coulombe, S., & Bélisle-Pipon, J.-C. (2025). Effectiveness of intelligent tutoring systems for K-12 students: A systematic review. npj Science of Learning, 10, 38. https://doi.org/10.1038/s41539-025-00320-7

Létourneau, A., Deslandes Martineau, M., Charland, P. · 2025 · npj Science of Learning, Vol. 10, Article 56 ★★★★★ 9/10
Systematisches Review von 28 Studien (N=4.597 Schüler:innen K-12, quasi-experimentelle Designs). Ergebnisse: ITS zeigen im Allgemeinen positive Effekte auf Lernleistung. Geometriespezifisch: Long & Aleven RCT mit Cognitive Tutor Geometry als Kernstudie. Veröff…

Gurmu, F., Tuge, C., & Hunde, A. B. (2024). Effects of GeoGebra-assisted instructional methods on students' conceptual understanding of geometry. Cogent Education. https://doi.org/10.1080/2331186X.2024.2379745

Gurmu, F., Tuge, C., Hunde, A. B. · 2024 · Cogent Education (Taylor & Francis) ★★★★★ 9/10
Quasi-experimentelle Studie an drei Schulen in Äthiopien (Klasse 10, GeoGebra+kollaborativ vs. GeoGebra+konventionell vs. konventionell). Ergebnis: GeoGebra kombiniert mit kollaborativem Unterricht erzielt signifikant besseres konzeptuelles Geometrieverständni…

Milton, S. (2025). Middle school girls using generative AI to engage in mathematical problem-posing. Mathematical Thinking and Learning. https://doi.org/10.1080/10986065.2025.2542724

Milton, S. · 2025 · Mathematical Thinking and Learning ★★★★ 8/10
Qualitative Studie (Southern Methodist University) mit 36 Mädchen der Mittelstufe: Schülerinnen nutzen ChatGPT zur Entwicklung mathematischer Textaufgaben und visueller Illustrationen. Grundsätzlich positive Einstellung, aber Kritik an mangelnder Authentizität…

Colliot, T., Krichen, O., Girard, N., Anquetil, E., & Jamet, E. (2024). What makes tablet-based learning effective? A study of the role of real-time adaptive feedback. British Journal of Educational Technology, 55(5), 2278–2295. https://doi.org/10.1111/bjet.13439

Colliot, T., Krichen, O., Girard, N. · 2024 · British Journal of Educational Technology ★★★★★ 9/10
3-Gruppen-Vergleich (Siebtklasse, Geometrieunterricht): Papier vs. Tablet ohne Feedback vs. Tablet mit KI-Echtzeit-Adaptivfeedback. Nicht das Medium, sondern das intelligente tutorielle Feedback steigerte Lernleistung signifikant. Starke Evidenz fuer adaptives…

Santos, V., Teles, J., & Quaresma, P. (2024). Exploring quadrilaterals: An interactive task for 7th grade students using GeoGebra Classroom. International Journal for Technology in Mathematics Education, 31(3), 107–116. https://doi.org/10.1564/tme_v31.3.01

Santos, V., Teles, J.,, Quaresma, P · 2024 · International Journal for Technology in Mathematics Education (IJTME) ★★★★★ 13/10
Siebtklässler erkunden mit GeoGebra Classroom Vierecke in zwei Phasen: Vermutungen formulieren und formale Beweise konstruieren. Integration von automatisiertem Theorembeweisen (JGEx) direkt im Unterrichtskontext — frühes Beispiel für KI-gestütztes deduktives …

Kurt, G., & Önel, F. (2025). Middle school students' basic geometric construction processes in a dynamic geometry environment. School Science and Mathematics. https://doi.org/10.1111/ssm.70001

Kurt, G.,, Önel, F · 2025 · School Science and Mathematics ★★★★★ 13/10
Fallstudie: drei Siebtklässler über vier Wochen bei Konstruktionsaufgaben (Streckenkopien, Senkrechte, Parallelen, Winkelhalbierende) in GeoGebra. Analyse mit Smarts Konstruktionsstufen und van Hieles Denkrahmen. Problembasiertes Design ohne Schritt-für-Schrit…

Morales Méndez, G., & Lozano Avilés, A. B. (2025). Realidad aumentada y GeoGebra 3D para mejorar la inteligencia espacial en la enseñanza de la geometría volumétrica. Revista de Educación a Distancia (RED), 25(82). https://doi.org/10.6018/red.644051

Marwiang, M., Prasertsang, M., & Junpeng, P. (2025). Enhancing students' learning outcomes in mathematics through intelligent tutoring systems based on real-time feedback. Journal of Education and Learning, 14(6), 186–. https://doi.org/10.5539/jel.v14n6p186

Marwiang, M., Prasertsang, M.,, Junpeng, P · 2025 · Journal of Education and Learning ★★★★★ 13/10
Quasi-Experiment mit n=78 Siebtklässler:innen (Khon Kaen University Demonstration School, Thailand): Experimentalgruppe mit ITS mit Echtzeit-Feedback vs. Kontrolle: ITS ohne Feedback. Inhalte: Messung und Geometrie (Klasse 7). Effektgröße Cohen's d = 0,73 (gro…

Gong, X., Xu, W., Yu, S., Ma, J., & Qiao, A. (2025). Enhancing computational thinking and spatial reasoning skills in gamification programming learning: A comparative study of tangible, block and paper-and-pencil tools. British Journal of Educational Technology, 56(1), 1–23. https://doi.org/10.1111/bjet.13482

Gong, X., Xu, W., Yu, S. · 2025 · British Journal of Educational Technology ★★★★ 7/10
Quasi-experimenteller Vergleich (n=112, 7. Klasse): Tangible-Tools verbessern räumliche Vorstellungskraft besser; Block-Programmierung stärkt algorithmisches Denken und Motivation. CT-Subkompetenzen und geometrisch-räumliches Denken direkt gemessen.

Sun, L., & Liu, J. (2025). Comparative study of CodeCombat-based Python programming and Scratch programming effects on sixth graders' computational thinking. Thinking Skills and Creativity, 57, 101848. https://doi.org/10.1016/j.tsc.2025.101848

Sun, L., Liu, J. · 2025 · Thinking Skills and Creativity ★★★★★ 6/10
11-wöchige quasi-experimentelle Studie (n=87, 6. Klasse): Python-Coding (CodeCombat) erzielte nachhaltigere CT-Gewinne als Scratch. Mädchen mit Vorerfahrung profitierten im Python-Kurs stärker. CT-Dimensionen: algorithmisches und raumlogisches Denken.

Pielsticker, F. (2024). Aushandlungs- und Argumentationsprozesse fördern durch den Einsatz generativer KI-Sprachmodelle im Geometrieunterricht. mathematica didactica, 47. https://doi.org/10.18716/ojs/md/2024.1895

Pielsticker, F., Holten, K., Dilling, F. · 2024 · GDM-Mitteilungen, 116 ★★★★ 8/10
Erste empirische Fallstudie zum Einsatz von ChatGPT 3.5 in einer 7. Klasse (NRW). Untersucht, ob generative KI-Sprachmodelle Aushandlungs- und Argumentationsprozesse im Mathematikunterricht fördern. Präsentiert sowohl Chancen als auch problematische Anwendunge…

Parra, V., et al. (2024). Can generative AI solve geometry problems? Strengths and weaknesses of large language models for geometric reasoning. Journal of Artificial Intelligence in Education. https://doi.org/10.1007/s40593-024-00438-0

Parra, V., Sureda, P., Corica, A. · 2024 · International Journal of Interactive Multimedia and Artificial Intelligence ★★★★ 8/10
Empirische Analyse von drei großen LLM-Chatbots hinsichtlich ihrer Fähigkeit, Geometrieaufgaben aus dem Sekundarschulcurriculum auf Spanisch zu lösen. Auch modernste multimodale LLMs scheitern an geometrischen Konzepten; Fehlerkategorien werden systematisiert.…

Sebsibe, A. S., et al. (2025). The effect of GeoGebra integrated instruction on students' learning of geometry. International Journal of Education in Mathematics, Science, and Technology, 13(2). https://doi.org/10.46328/ijemst.4706

Sebsibe, A. S., Abdella, N. M. · 2025 · F1000Research ★★★★ 7/10
Quasi-experimentelles Design (Klasse 9, Aethiopien, n=87): GeoGebra-Gruppe erzielte signifikant hoehere Leistungen (M=27,90 vs. 17,60, r=0,83, p<0,05); 95 % berichteten gesteigerte Motivation. GeoGebra reduziert kognitive Belastung bei multiplen Repraesentatio…

5. Sekundarstufe II / AHS-Oberstufe (14–18 Jahre, Matura)

Geometrische Inhalte

Analytische Geometrie, Vektorrechnung, Kegelschnitte, darstellende Geometrie (je nach Schultyp), Trigonometrie, räumliches Denken. In der österreichischen Zentralmatura spielen geometrische Themen eine wesentliche Rolle — insbesondere Vektorrechnung und analytische Geometrie sind Prüfungsschwerpunkte.

KI-Tools auf diesem Niveau

Wolfram Alpha

De-facto-Standard für symbolische Berechnungen in der Oberstufe. Löst analytische Geometrieaufgaben, zeichnet Kurven, berechnet Schnittmengen, Abstände, Winkel. Seit 2023 mit natürlichsprachlicher Eingabe wesentlich zugänglicher. Der Vorteil gegenüber LLMs: Wolfram Alpha rechnet deterministisch-symbolisch und halluziniert nicht — ein entscheidender Unterschied für den Geometrieunterricht, wo Präzision zählt.

GeoGebra 3D und GeoGebra AI

Räumliche Geometrie visualisieren, Körper interaktiv drehen, Schnittebenen erkunden — GeoGebra 3D macht abstrakte Raumgeometrie greifbar. Die KI-Erweiterung (ab 2024) erklärt Konstruktionsschritte und generiert auf Wunsch Aufgaben. Die Kombination von LLM-basierter Erklärung (ChatGPT) mit CAS-basierter Verifikation (GeoGebra Discovery) ist dabei produktiver als isolierter LLM-Einsatz: ChatGPT für natürlichsprachliche Kommunikation, GeoGebra für zertifizierte, symbolische Beweise. Ein direkter Vergleich zeigt: GeoGebra Discovery beweist alle Testaufgaben korrekt, während ChatGPT in einem von drei Testfällen scheitert — beide Systeme sind komplementär, nicht konkurrierend (Botana, Recio & Vélez, 2024).

Das Kreuzprodukt als Beispiel für eine typische Oberstufenformel:

n=a×b=e1e2e3a1a2a3b1b2b3\vec{n} = \vec{a} \times \vec{b} = \begin{vmatrix} \vec{e_1} & \vec{e_2} & \vec{e_3} \\ a_1 & a_2 & a_3 \\ b_1 & b_2 & b_3 \end{vmatrix}

LLMs können diesen Zusammenhang erklären und anschaulich begründen — sind aber in der exakten Berechnung fehleranfällig: Geometrie ist der schwächste mathematische Inhaltsbereich für ChatGPT-4 (53 % Genauigkeit auf NAEP) und ChatGPT-4o (59 %) — weit hinter Algebra (Wei, 2024).

LLMs für Beweisführung und Argumentation

ChatGPT, Claude und Gemini können geometrische Aussagen in natürlicher Sprache diskutieren und Beweisideen skizzieren. Grenzen: Formale Beweisführung ohne Fehler gelingt nur selten; LLMs verlassen sich oft auf „Heuristiken und Trial-and-Error" statt rigoroser Deduktion (Li et al., 2024).

OpenAI o1 und Reasoning-Modelle

Mit der Einführung von OpenAI o1 (September 2024) und nachfolgenden Reasoning-Modellen verändert sich das Bild dramatisch. De Winter et al. (2024) von der TU Delft testeten o1-preview auf dem niederländischen VWO-Abschlussexamen in Mathematik B — einem Abitur-äquivalenten Prüfungsformat mit analytischer Geometrie, Trigonometrie und mehrstufigem Schlussfolgern, das der österreichischen Zentralmatura strukturell entspricht. Das Ergebnis: 76/76 und 74/76 Punkte auf zwei Prüfungsversionen — das 97,8. Perzentil im Vergleich zu 16.414 niederländischen Schüler:innen. GPT-4o erzielte auf denselben Prüfungen 66/76 und 62/76. Die zweite Prüfung stammte von nach dem Trainings-Cutoff — Memorierung ausgeschlossen.

Li et al. (2024) verglichen o1 und GPT-4o auf 60 Oberstufenaufgaben: Bei Standardberechnungen kaum Unterschied, bei Beweisaufgaben überlegene o1-Performanz — allerdings weiterhin mit systematischen Fehlern bei räumlicher Geometrie. Das chinesische Modell DeepSeek-R1 (Januar 2025) zeigt, dass der Wettbewerb global ist: MATH-500 (Wettbewerbsmathematik): 97,3 %, AIME 2024: 79,8 %, UK A-Level Mathematics 2025: 100 % — vollständig durch Reinforcement Learning ohne annotierte Chain-of-Thought-Daten trainiert (DeepSeek-AI, 2025). Die Implikation ist klar: Die Zentralmatura in der aktuellen Form ist für aktuelle Reasoning-Modelle kein Hindernis mehr. Das zwingt zu einer grundsätzlichen Überarbeitung der Prüfungsformate.

GeoGebra Discovery in der Oberstufe: Automatisierte Beweise als Lernwerkzeug

GeoGebra Discovery (Forschungsversion, Hauptentwickler Zoltán Kovács, JKU Linz) erlaubt vollständig automatisierte Beweisführung für elementar-euklidische Sätze — in unter einer Sekunde. Für die Oberstufe bietet das ein grundlegend neues didaktisches Szenario: Schüler:innen konstruieren geometrische Figuren, GeoGebra erkennt automatisch Relationen (Parallelität, Rechtwinkligkeit, Ko-Zirkularität) und zeigt vollständige Beweissequenzen an (Kovács et al., 2024).

Die neueste Entwicklung ist für das Curriculum direkt relevant: Bartha, Kerekes, Kovács et al. (2025) präsentieren ein System zur automatisierten Schwierigkeitsanalyse geometrischer Sätze (Annals of Mathematics and Artificial Intelligence) — das System bewertet, wie „überraschend" ein Satz relativ zu seinen Axiomen ist, und zeigt eine moderate Korrelation (r = 0,43) zwischen algebraischer und geometrischer Schwierigkeitsmessung. Das eröffnet die Möglichkeit, Geometrieaufgaben automatisch nach Schwierigkeitsgrad zu sortieren und adaptive Lernpfade zu generieren. Für das Oberstufenniveau — analytische Geometrie, Vektorrechnung, Koordinatengeometrie — bedeutet das: individualisierte Aufgabenfolgen ohne Mehraufwand für Lehrende.

Praktische Anwendungen zeigen die Reichweite: GeoGebra Discovery löst Aufgaben des Náboj-2023-Mathematikwettbewerbs automatisiert und entdeckt dabei Verallgemeinerungen über die ursprüngliche Aufgabe hinaus (Hota et al., 2024). Eine Aufgabe der österreichischen Mathematikolympiade 2023 wurde von GeoGebra Discovery vollständig bewiesen — ein direkter Anknüpfungspunkt für begabungsfördernde Oberstufenprogramme (Kovács et al., 2024b).

Neben dem kognitiven Kompetenzerwerb transformiert GeoGebra auch mathematische Haltungen: Eine qualitativ-quantitative Unterrichtsstudie in zwei Sekundarschulklassen (Romero Albaladejo & García López, 2024, Education and Information Technologies) dokumentiert, dass der Einsatz von GeoGebra die Haltungen Ausdauer, Präzision und — am ausgeprägtesten — Autonomie signifikant stärkt. Schüler:innen übernehmen zunehmend Eigenverantwortung für ihre Lernwege, statt Lösungen passiv entgegenzunehmen. Für österreichischen und deutschen Geometrieunterricht, der kompetenzorientiertes Lernen anstrebt, bietet dieser Befund eine empirische Basis für die didaktische Entscheidung zugunsten explorativer GeoGebra-Umgebungen.

Computational Thinking in der Oberstufe

Die Verknüpfung von KI-Werkzeugen mit Computational Thinking gewinnt in der Oberstufe an Bedeutung. Yunianto et al. (2025) von der Forschungsgruppe Zsolt Lavicza (JKU Linz) präsentieren ein vollständiges Modell: GeoGebra-Konstruktionsaufgaben werden mit ChatGPT-gestützten Reflexionsphasen kombiniert, um Computational-Thinking-Kompetenzen systematisch zu fördern. Das Modell basiert auf Educational Design Research mit 16 Sekundarstufen-Schüler:innen und dokumentiert: Das Debuggen fehlerhafter ChatGPT-generierter GeoGebra-Befehle fördert algorithmisches Denken, Dekomposition und Mustererkennung (Yunianto et al., 2024, 2025). Schüler:innen lernen nicht nur, KI zu nutzen, sondern grundlegende Konzepte dahinter zu verstehen — ein Ziel, das die GDM explizit als Forschungsprioritär einfordert (Buchholtz et al., 2024). Ein PRISMA-konformes Systematic Literature Review über 30 Artikel zu CT-Integration im Mathematikunterricht der Sekundarstufe (Ruiz Recio, Molina-Ayuso & Adamuz-Povedano, 2026, Review of Education) bestätigt: Geometrie ist der dominante Inhaltsbereich bei CT-Integration; 73 % der relevanten Publikationen stammen aus 2022–2025; das Haupthindernis bleibt fehlendes fachspezifisches TPACK — Lehrende können CT verstehen, aber nicht in geometrische Unterrichtssequenzen übersetzen.

Eine konkrete Umsetzung für den Analysisunterricht liefert eine sechsstündige GeoGebra-Intervention mit 16- bis 17-Jährigen (Freudenthal-Institut, Niederlande; Chytas et al., 2024, Digital Experiences in Mathematics Education): Schüler:innen schrieben GeoGebra-Skripte zur Untersuchung von Ableitungen und Kurvendiskussionen und lösten CT-eingebettete Aufgaben. Die Mehrheit bewältigte die Aufgaben erfolgreich und bewertete den explorativen Ansatz positiv — ein direkt übertragbares Szenario für den Analysisunterricht der österreichischen Oberstufe.

Matura und KI: eine strukturelle Herausforderung

Die österreichische Zentralmatura verbietet derzeit den Einsatz von Internetverbindungen — damit sind LLMs während der Prüfung ausgeschlossen. Gleichzeitig wächst der Druck, Aufgabenformate zu überdenken.

Dies betrifft insbesondere:

Die Diskussion über KI-resistente Prüfungsformate ist international im Gange. Möglichkeiten: stärkere Gewichtung von Prozessdokumentation, mündlichen Prüfungen, dynamischen GeoGebra-Assessments mit zufallsgenerierten Parametern und individuellen Projektarbeiten.

Geraniou und Nardi (2024) analysieren in Digital Experiences in Mathematics Education, wie KI auf kognitiv anspruchsvolle Sekundaraufgaben reagiert — und kommen zu dem Schluss, dass einfache Verbote keine Lösung sind. Stattdessen brauche es pädagogische Strategien, die KI als Lernpartner einsetzen, ohne Prüfungsintegrität zu gefährden. Khlaif et al. (2025) entwickeln aus Befragungen von 61 Lehrenden ein Vier-Phasen-Modell: Against (Verbote), Avoid (KI-sichere Formate), Adopt (KI integrieren), Explore (neue Prüfungskonzepte) — ein pragmatisches Navigationsmodell für die Praxis.

Konkrete technische Lösungen liegen bereits vor: Hamady et al. (2024) demonstrieren, dass animierte GeoGebra-Applets in Moodle signifikant bessere Lernleistungen erzielen als statische Geometrieaufgaben — und gleichzeitig ein Format bieten, das aktuelle KI-Systeme nicht trivial bearbeiten können. Csiba und Vajo (2024) zeigen, wie zufallsgenerierte, automatisch bewertete Geometrie-Konstruktionsaufgaben in Moodle integriert werden können — ein Format, das aktuelle KI-Systeme nicht zuverlässig lösen können, da die Parameter jedes Mal neu generiert werden. Schorcht et al. (2024) analysieren in einer groß angelegten Studie (N = 1.080 Modellvalidierungen), wie unterschiedliche Prompt-Techniken die Qualität KI-gestützter Lösungen beeinflussen — mit direkten Konsequenzen für das Design von Prüfungsaufgaben im KI-Zeitalter. Walkington (2025) argumentiert in einer Überblicksarbeit gegen einfache KI-Verbote und plädiert für pädagogische Strategien, die KI als Lernwerkzeug in den Geometrieunterricht integrieren, statt sie aus dem Klassenzimmer auszuschließen.

Medina Herrera, Juárez Ordóñez und Ruiz-Loza (2024, Frontiers in Education) geben einen umfassenden Überblick über räumliche Visualisierungswerkzeuge im Mathematikunterricht — von VR-Umgebungen über 3D-Druck bis zu dynamischer Geometriesoftware. Ihr zentraler Befund: Räumliches Denken ist nicht nur ein Lernziel, sondern auch ein Lerneinstieg — Werkzeuge, die Lernenden erlauben, Perspektiven zu wechseln und Objekte zu rotieren, fördern gleichzeitig das geometrische Verständnis und die kognitive Flexibilität. Für die Oberstufe (analytische Geometrie, Vektorrechnung, Raumgeometrie) sind GeoGebra 3D und AR-Systeme die direkteste Umsetzung dieses Ansatzes.

AR und GeoGebra 3D für räumliche Geometrie in der Oberstufe: Eine Aktionsforschungsstudie aus Vietnam (Pham et al., 2026, Open Education Studies) belegt mit starker Effektgröße (Cohen's d = 1,24), dass GeoGebra 3D im AR-Modus das Verständnis räumlicher Geometriekonzepte (Parallelprojektion, Senkrechtprojektion) in Klasse 11 deutlich verbessert — die Experimentalgruppe (n=32) erzielte 8,2/10 Punkte im Nachtest gegenüber 6,5/10 in der Kontrollgruppe (n=40). Das zeigt: Die Kombination von GeoGebra 3D mit AR-Visualisierung macht abstrakte Raumgeometriekonzepte auch ohne physische Modelle zugänglich und ist für die österreichische Oberstufe ein unmittelbar einsetzbares Werkzeug.

Didaktische Szenarien für die Oberstufe

Szenario A — Verifikation mit zwei Systemen: Schüler:innen lösen eine Vektorraumaufgabe zunächst von Hand, überprüfen dann mit Wolfram Alpha (symbolisch-deterministisch) und befragen ChatGPT nach dem „Warum". Die drei Ergebnisse werden verglichen und Diskrepanzen diskutiert — ein explizites Übungsfeld für kritisches KI-Denken.

Szenario B — Beweis-Scaffolding: LLMs werden nicht zur direkten Lösungsgenerierung eingesetzt, sondern als Sokrates-Tutor: Die Lehrperson konfiguriert einen System-Prompt, der das LLM anweist, nur Gegenfragen zu stellen. Schüler:innen entwickeln geometrische Beweise Schritt für Schritt im Dialog — die KI liefert Orientierung ohne fertige Antworten (Bastani et al., 2025).

Szenario C — Matura-Vorbereitung mit Fehleranalyse: Schüler:innen nutzen ChatGPT zur Diagnose eigener Fehler in gelösten Matura-Altaufgaben. Das System markiert Schwachstellen im Lösungsweg und empfiehlt gezielte Übungen — ohne die Matura-Aufgabe direkt zu lösen. Dieses Format ist prüfungskonform und fördert gleichzeitig Metakognition (Buchholtz et al., 2024).

Szenario C2 — Adaptiver Lernpfad analytische Geometrie: Barana et al. (2024, CSEDU) entwickelten und erprobten einen adaptiven Lernpfad zur analytischen Geometrie (Kreise als geometrische Örter) für die Klasse 11 mit automatisierter formativer Bewertung: Nach jeder Antwort erhalten Schüler:innen schrittweise Lösungsanleitungen oder Zusatzaufgaben je nach Leistungsstand. Im quasi-experimentellen Design erzielte die Treatmentgruppe +11 Punkte im Nachtest. Das Format ist direkt in GeoGebra oder ähnliche Plattformen übertragbar und zeigt: Adaptivität muss nicht komplex sein — bereits schrittweise Feedbackschleifen mit intelligenter Aufgabenauswahl genügen für messbare Lerneffekte.

Szenario D — Problem Posing in der Lehrerbildung: Angehende Gymnasiallehrkräfte entwickeln mithilfe generativer KI selbst Mathematikaufgaben — und erwerben dabei messbar tiefere didaktische Kompetenz (TPACK). Segal und Biton (2024, IJEMST) zeigen in einer Studie mit 15 angehenden Mathematiklehrkräften: Wer ChatGPT zur Aufgabenentwicklung einsetzt und dabei kontinuierlich reflektiert, entwickelt nicht nur bessere Aufgaben, sondern auch differenzierteres Verständnis für Aufgabenqualität und didaktische Passung. Kim, Park und Joung (2026, School Science and Mathematics) bestätigen diesen Befund für Lehramtsstudierende: Gezielte Scaffolding-Strategien beim KI-gestützten Problem Posing führen zu kritischer Distanz gegenüber dem Tool — ein zentrales Ziel der Lehrkräfteausbildung im KI-Zeitalter. Das Szenario ist unmittelbar in die Fachdidaktikausbildung übertragbar.

Literatur (Sekundarstufe II)

Barana, A., Fissore, C., Marchisio Conte, M., & Tassone, M. (2024). Shaping an adaptive path on analytic geometry with automatic formative assessment and interactive feedback. In Proceedings of the 16th International Conference on Computer Supported Education (pp. 248–257). SCITEPRESS. https://doi.org/10.5220/0012627900003693

Barana, A., Fissore, C., Marchisio Conte, M. · 2024 · Proceedings of the 16th International Conference on Computer Supported Education ★★★★ 8/10
Adaptiver Lernpfad zur analytischen Geometrie (Kreise als geometrische Orter, Klasse 11, Italien): automatisierte formative Bewertung + interaktives Feedback. Quasi-experimentell: Treatmentgruppe +11 Punkte im Nachtest. Schrittweise Loesungsanleitungen besonde…

Botana, F., Recio, T., & Vélez, M. P. (2024). On using GeoGebra and ChatGPT for geometric discovery. Computers, 13(8), 187. https://doi.org/10.3390/computers13080187

Botana, F., Recio, T. · 2024 · Computation, 12(2), 30 ★★★★★ 10/10
Systematischer Benchmark von ChatGPT 3.5 vs. GeoGebra 5 bei geometrischen Ortskurvenaufgaben (Einhüllende ebener Kurvenfamilien). Ergebnis: ChatGPT scheitert in den meisten Fällen; GeoGebra löst zuverlässig. Warnung ('Caveat Emptor!') an Lehrende, die ChatGPT …

Buchholtz, N., Schorcht, S., Baumanns, L., Huget, J., Noster, N., Rott, B., Siller, H.-S., & Sommerhoff, D. (2024). Damit rechnet niemand! Mitteilungen der Gesellschaft für Didaktik der Mathematik, 117, 15–24. https://ojs.didaktik-der-mathematik.de/index.php/mgdm/article/view/1249

Buchholtz, N., Schorcht, S., Baumanns, L. · 2024 · Mitteilungen der Gesellschaft für Didaktik der Mathematik, Nr. 117 ★★★★★ 9/10
Positionspapier von 8 deutschen Mathematikdidaktiker:innen: sechs Leitgedanken zu Implikationen und Forschungsbedarfen für KI-Technologien (generative KI, ChatGPT) im Mathematikunterricht. Behandelt explizit Problemlösen, Beweisen, Modellieren und Assessment. …

Frieder, S., Pinchetti, L., Chevalier, A., Griffiths, R.-R., Salvatori, T., Lukasiewicz, T., Petersen, P. C., & Berner, J. (2023). Mathematical capabilities of ChatGPT. NeurIPS 2023 Datasets and Benchmarks Track. https://doi.org/10.48550/arXiv.2301.13867

Frieder, S., Pinchetti, L., Chevalier, A. · 2023 · NeurIPS 2023 Datasets and Benchmarks Track ★★★★★ 9/10
Evaluation von ChatGPT und GPT-4 auf GHOSTS/miniGHOSTS-Datensätzen (Mathematik auf Hochschulniveau). Kernbefund: 'Gesamte mathematische Leistung liegt deutlich unter dem Niveau eines Doktoranden.' GPT-4 bewältigt Grundstudiums-Mathematik, scheitert aber auf Gr…

Li, L., Luo, Y., & Pan, T. (2024). OpenAI o1 AB testing: Does the o1 model really do good reasoning in math problem solving? arXiv:2411.06198.

Li, M. · 2024 · International Journal of Science and Mathematics Education (Springer) ★★★★★ 9/10
Untersuchung der Faktoren, die Lehrende bei der Adoption von KI in der Primarstufe-Mathematik beeinflussen (interne: Überzeugungen, Kompetenz; externe: Ressourcen, Unterstützung). Wichtig für Kapitel 08 (Didaktik) und 10 (Ausblick: Lehrkräftefortbildung).

Wei, X. (2024). Evaluating ChatGPT-4 and ChatGPT-4o. Frontiers in Education, 9, 1452570. https://doi.org/10.3389/feduc.2024.1452570

Wei, X. · 2024 · Frontiers in Education, 9, 1452570 ★★★★★ 10/10
Evaluation von GPT-4 und GPT-4o auf NAEP-Mathematikaufgaben (4., 8., 12. Klasse): Geometrie/Messung ist der schwächste Inhaltsbereich — GPT-4: 53%, GPT-4o: 59% (vs. 79%/92% in Algebra). Räumliches Denken und visuelle Informationsverarbeitung als fundamentale B…

Csiba, P., & Vajo, P. (2024). Problems and challenges of using randomized automatically evaluating geometric construction problems in Moodle LMS. AIMS Mathematics, 9(3), 5234–5249. https://doi.org/10.3934/math.2024253

Csiba, P., Vajo, P. · 2024 · AIMS Mathematics, Vol. 9(3), pp. 5234–5249 ★★★★ 8/10
Untersucht das Fehlen geometrischer Konstruktionsaufgaben in nationalen und internationalen Mathematiküberprüfungen und schlägt GeoGebra-basierte, automatisch bewertete Applets als Lösung vor. Direkt relevant für KI-resistentes Assessment-Design und LMS-Integr…

Schorcht, S., Buchholtz, N., & Baumanns, L. (2024). Prompt the problem: Investigating the mathematics educational quality of AI-supported problem solving by comparing prompt techniques. Frontiers in Education, 9, 1386075. https://doi.org/10.3389/feduc.2024.1386075

Schorcht, S., Baumanns, L., Buchholtz, N. · 2024 · GDM-Mitteilungen, 116 ★★★★★ 9/10
Untersucht DALL·E 3 (Text-zu-Bild) und die visuelle Interpretationsfähigkeit von GPT-4 für mathematikdidaktische Forschung. Analysiert Möglichkeiten und Grenzen der KI bei Bildgenerierung und -interpretation — besonders relevant für geometrische Repräsentation…

Walkington, C. (2025). Implications of generative AI for secondary mathematics education. School Science and Mathematics. https://doi.org/10.1111/ssm.18356

Walkington, C. · 2025 · School Science and Mathematics (Wiley) ★★★★★ 9/10
Umfassende Analyse der Implikationen generativer KI für den Mathematikunterricht. Untersucht, wie Schüler:innen GenAI als Denkpartner beim mathematischen Modellieren und Beweisen nutzen können. Diskutiert gemischte Ergebnisse beim Einsatz als Tutor sowie die N…

Geraniou, E., & Nardi, E. (2024). AI responses to challenging problems and educator responses to AI availability. Digital Experiences in Mathematics Education. https://doi.org/10.1007/s40751-024-00167-4

Geraniou, E., Nardi, E. · 2024 · Digital Experiences in Mathematics Education (Springer) ★★★★★ 9/10
Untersucht KI-Antworten auf kognitiv anspruchsvolle Sekundarmathematikaufgaben (inkl. Geometrie) und wie Lehrende auf KI-Verfügbarkeit reagieren. Argumentiert gegen Verbote und schlägt pädagogische Strategien vor — zentral für die Debatte um Assessment-Design …

Khlaif, Z. N., Alkouk, W. A., Salama, N., & Abu Eideh, B. (2025). Redesigning assessments for AI-enhanced learning: A framework for educators in the generative AI era. Education Sciences, 15(2), 174. https://doi.org/10.3390/educsci15020174

Khlaif, Z. N., Alkouk, W. A., Salama, N. · 2025 · Education Sciences (MDPI), Vol. 15(2), Art. 174 ★★★★ 8/10
Qualitative Rahmenstudie (61 Lehrende) entwickelt das 'Against, Avoid, Adopt, Explore'-Modell für Prüfungsredesign im GenKI-Zeitalter. Direkt anwendbar auf Politikgestaltung zur Reform von Abitur-/Matura-Prüfungsformaten.

Maskos, K., Schulz, A., & Oeksuez, S. S. (2025). Formative assessment in mathematics education: A systematic review. ZDM – Mathematics Education, 57, 679–693. https://doi.org/10.1007/s11858-025-01696-x

Maskos, K., Schulz, A., Oeksuez, S. S. · 2025 · ZDM – Mathematics Education, Vol. 57, pp. 679–693 ★★★★★ 10/10
Systematisches Review von 45 Studien (2015–2023) zu formativem Assessment in der Mathematik. Findet besonderes Potenzial für computerbasierte Assessments in interaktiven Lernumgebungen — Basisevidenz für die Debatte formativ vs. summativ in der Sekundarmathema…

Hamady, S., Mershad, K., & Jabakhanji, B. (2024). Multi-version interactive assessment through the integration of GeoGebra with Moodle. Frontiers in Education, 9, 1466128. https://doi.org/10.3389/feduc.2024.1466128

Hamady, S., Mershad, K., Jabakhanji, B. · 2024 · Frontiers in Education ★★★★★ 10/10
Untersuchung der Integration von GeoGebra in Moodle für interaktive, KI-resistente Assessments. Zeigt wie dynamische Geometrie-Inhalte die Testintegrität verbessern und gleichzeitig tieferes Lernen fördern. Relevant für Kapitel 07 und die Prüfungsintegritätsdi…

de Winter, J. C. F., Dodou, D., & Eisma, Y. B. (2024). System 2 thinking in OpenAI's o1-preview model: Near-perfect performance on a mathematics exam. Computers, 13(11), 278. https://doi.org/10.3390/computers13110278

Yunianto, W., Galiç, S., Lavicza, Z., & Urhan, S. (2025). A model for computational thinking development in GeoGebra with the support of ChatGPT. Computers in the Schools. Advance online publication. https://doi.org/10.1080/07380569.2025.2544062

Yunianto, W., Galič, S., Lavicza, Z. · 2025 · Computers in the Schools (Taylor & Francis) ★★★★★ 10/10
Entwicklung eines Modells zur Förderung von Computational Thinking durch die Kombination von GeoGebra und ChatGPT. Untersucht die Schnittstelle zwischen KI, Computational Thinking und Mathematikdidaktik. Sehr relevant für Kapitel 07 und 08.

Hota, A., Kovács, Z., & Vujic, A. (2024). Solving some geometry problems of the Náboj 2023 contest with automated deduction in GeoGebra Discovery. ADG 2023, EPTCS 398, 110–123. https://doi.org/10.48550/arXiv.2401.13703

Hota, A., Kovács, Z., Vujic, A. · 2024 · ADG 2023, EPTCS 398, 110–123 ★★★★★ 9/10
Demonstrates automated deduction solving competition geometry problems from the Náboj 2023 contest using GeoGebra Discovery's symbolic computation engine. Identifies difficulty of encoding problems into machine-readable form as a key challenge. Explores genera…

Kovács, Z., Recio, T., & Vélez, M. P. (2024b). Solving with GeoGebra Discovery an Austrian Mathematics Olympiad problem: Lessons learned. ADG 2023, EPTCS 398. https://doi.org/10.48550/arXiv.2401.11906

Kovács, Z., Recio, T., Vélez, M.P. · 2024 · arXiv / GeoGebra Discovery Research ★★★★★ 9/10
GeoGebra Discovery erweitert GeoGebra um automatisierte Beweisführung: Der ShowProof-Befehl zeigt Schritt-für-Schritt-Beweissequenzen für geometrische Aussagen; ein Schwierigkeitswert bewertet den 'Überraschungsgrad' eines Satzes relativ zu seinen Voraussetzun…

Bartha, S., Kerekes, A., Kovács, Z., Kovács, Z., & Recio, T. (2025). Automated analysis of the difficulty of secondary school geometry theorems. Annals of Mathematics and Artificial Intelligence, 93, 1011–1033. https://doi.org/10.1007/s10472-025-09983-9

Bartha, S., Kerekes, A., Kovács, Z. · 2025 · Annals of Mathematics and Artificial Intelligence ★★★★★ 9/10
Benchmark-Liste von Geometrietheoremen aus dem ungarischen Gymnasiallehrplan, implementiert als GeoGebra-Dateien. Automatisierter Beweis via GeoGebra Discovery und Java Geometry Expert (JGEX). Korrelation r = 0.43 (moderat) zwischen verschiedenen KI-basierten …

Weigand, H.-G., Hollebrands, K., & Maschietto, M. (2025). Geometry education at secondary level — A systematic literature review. ZDM – Mathematics Education, 57, 829–843. https://doi.org/10.1007/s11858-025-01703-1

Weigand, H.-G., Hollebrands, K., Maschietto, M. · 2025 · ZDM – Mathematics Education ★★★★★ 10/10
PRISMA-basiertes Systematic Literature Review zu Geometrieunterricht auf Sekundarstufenniveau (seit 2013, fünf Datenbanken, Konferenzproceedings). Analysiert mit Voyant Tool. Kategorien: Argumentieren, Beweisen, Problemlösen, Modellieren; Raumgeometrie, ebene …

Pham, S. N., Le, H. T., Pham, T. T. T., & Schmid, A. (2026). Augmented reality as a supporting tool for building mathematical knowledge: The case of parallel projection, perpendicular projection, and representation of a figure in space. Open Education Studies, 8(1), 20250118. https://doi.org/10.1515/edu-2025-0118

Pham, S. N., Le, H. T., Pham, T. T. T. · 2026 · Open Education Studies ★★★★ 8/10
Aktionsforschungsstudie (Vietnam, Klasse 11, n=72) zum Einsatz von GeoGebra 3D im AR-Modus für räumliche Geometrie (Parallelprojektion, Senkrechtprojektion). Experimentalgruppe: 8,2/10 Punkte im Nachtest vs. 6,5/10 Kontrollgruppe (Cohen's d=1,24). Starke Effek…

Medina Herrera, L. M., Juárez Ordóñez, S., & Ruiz-Loza, S. (2024). Enhancing mathematical education with spatial visualization tools. Frontiers in Education, 9, 1229126. https://doi.org/10.3389/feduc.2024.1229126

DeepSeek-AI, Guo, D., Yang, D., Zhang, H., et al. (2025). DeepSeek-R1: Incentivizing reasoning capability in LLMs via reinforcement learning. arXiv:2501.12948. https://arxiv.org/abs/2501.12948

DeepSeek-AI, Guo, D., Yang, D. · 2025 · arXiv:2501.12948 ★★★★ 8/10
DeepSeek-R1 erzielt auf MATH-500 (Wettbewerbsmathematik) 97,3% (vs. OpenAI o1: 96,4%), auf AIME 2024: 79,8%, auf A-Levels Mathematics 2025 (UK Abitur): 100%. Vollständig durch Reinforcement Learning ohne supervisiertes Fine-Tuning auf Chain-of-Thought-Daten tr…

Kuusemets, L., Parve, K., Ain, K., & Kraav, T. (2024). Assessing AI-generated (GPT-4) versus human created MCQs in mathematics education: A comparative inquiry into vector topics. International Journal of Education in Mathematics, Science and Technology (IJEMST), 12(6), 1538–1558. https://doi.org/10.46328/ijemst.4440

Kuusemets, L., Parve, K., Ain, K.,, Kraav, T · 2024 · International Journal of Education in Mathematics, Science and Technology (IJEMST) ★★★★★ 12/10
Vergleicht GPT-4-generierte Multiple-Choice-Fragen mit menschlich erstellten Aufgaben speziell zum Thema Vektorrechnung. GPT-4 konnte valide Fragen erzeugen, aber die richtigen Antworten mussten häufig korrigiert werden. Formulierungen waren nicht immer unterr…

Segal, R., & Biton, Y. (2024). The contribution that utilizing generative AI for problem posing makes to pre-service high school mathematics teachers' TPACK. International Journal of Education in Mathematics, Science and Technology (IJEMST), 12(6), 1559–1582. https://doi.org/10.46328/ijemst.4591

Segal, R.,, Biton, Y · 2024 · International Journal of Education in Mathematics, Science and Technology (IJEMST) ★★★★★ 13/10
15 angehende Gymnasiallehrkräfte nutzen generative KI-Tools für Problem-Posing-Aktivitäten im Mathematikunterricht. TPACK-Zuwächse messbar. Vertiefte Reflexionsprozesse über didaktische Gestaltung. Erste empirische Studie, die Problem Posing + generative KI im…

Ruiz Recio, M. I., Molina-Ayuso, Á., & Adamuz-Povedano, N. (2026). Integrating computational thinking into secondary school mathematics teaching: A literature review. Review of Education, 14, e70142. https://doi.org/10.1002/rev3.70142

Kim, Y. R., Park, M. S., & Joung, E. (2026). Exploring the integration of artificial intelligence in math education: Preservice teachers' experiences and reflections on problem-posing activities with ChatGPT. School Science and Mathematics. https://doi.org/10.1111/ssm.18336

Kim, Y. R., Park, M. S.,, Joung, E · 2026 · School Science and Mathematics ★★★★★ 14/10
Lehramtsstudierende integrieren ChatGPT in Problem-Posing-Aktivitäten für den Mathematikunterricht. Scaffolding-Strategien analysiert. Differenzierte Reflexionen über Aufgabenqualität, didaktische Angemessenheit und kritischen KI-Einsatz. SSM (Wiley/NCTM-nahes…

Chytas, C., van Borkulo, S. P., Drijvers, P., Barendsen, E., & Tolboom, J. L. J. (2024). Computational thinking in secondary mathematics education with GeoGebra: Insights from an intervention in calculus lessons. Digital Experiences in Mathematics Education, 10(2), 228–259. https://doi.org/10.1007/s40751-024-00141-0

Chytas, C., van Borkulo, S. P., Drijvers, P. · 2024 · Digital Experiences in Mathematics Education ★★★★★ 9/10
Sechsstündige Intervention für 16–17-Jährige (Niederlande, Freudenthal-Institut): GeoGebra zur Förderung algorithmischen Denkens in der Analysis. Schüler:innen lösten CT-eingebettete Aufgaben (Ableitungen, Kurvendiskussion) in GeoGebra-Skripten. Daten aus Arbe…

Romero Albaladejo, I. M., & García López, M. (2024). Mathematical attitudes transformation when introducing GeoGebra in the secondary classroom. Education and Information Technologies, 29, 10277–10302. https://doi.org/10.1007/s10639-023-12085-w

6. Hochschule und Lehramtsstudium

Geometrie im Studium

An Universitäten und Pädagogischen Hochschulen umfasst Geometrie: Euklidische und nicht-euklidische Geometrie, projektive Geometrie, Differentialgeometrie, Topologie, sowie fachdidaktische Anteile für Lehramtsstudierende. KI-Systeme treten hier auf zwei Ebenen in Erscheinung: als Forschungswerkzeug und als Unterrichtsgegenstand der Ausbildung.

Die Benchmark-Revolution: Von AlphaGeometry zu Aristotle

Die Entwicklung seit 2024 markiert eine beispiellose Beschleunigung in der formalen Geometrie:

Vuong und Ho (2024) stellen in AI & Society die fundamentale Frage: Wenn KI IMO-Geometrie auf Goldniveau beweist — ist das der Beginn vom Ende der Mathematikausbildung? Ihre Antwort ist differenziert: Es ist ein Ruf zur dringenden Neuorientierung der Bildungsziele, nicht das Ende der Mathematik als Kulturgut. Ähnlich argumentieren Naskręcki und Ono (2025) in Nature Physics: KI reshapes mathematical research practice — und damit Bildungsziele — aber der Zweck von Wissenschaft bleibt menschlich, nicht algorithmisch.

KI-Tools auf Hochschulniveau

Formale Beweisassistenten

Automatisiertes Beweisen in der 3D-Raumgeometrie

Die meisten formalen Geometriebeweissysteme operieren in der Ebene (2D). Simić, Stojanović-Đurđević und Tanasijević (2025) erweitern in den Annals of Mathematics and Artificial Intelligence diesen Ansatz auf dreidimensionale Raumgeometrie: Ihr System beweist Sätze über Quader, Pyramiden, Prismen und Zylinder automatisch — durch Reduktion auf algebraische Beschreibungen und anschließende symbolische Verifikation. Für die Hochschullehre eröffnet das neue Möglichkeiten: Raumgeometrische Konfigurationen, die Studierende bisher nur zeichnerisch oder verbal beweisen konnten, werden nun formal verifizierbar. Die Autoren zeigen an konkreten Beispielen aus der universitären Raumgeometrie, wie ihr Ansatz direkt in Lehrveranstaltungen einsetzbar ist — ein erster Schritt hin zu verifikationsgestütztem Raumgeometrielernen auf Hochschulniveau.

Lean 4 in der universitären Mathematikausbildung: erste Evidenz

Der erste kontrollierte Versuch, Lean 4 als Pflichtbestandteil in einem Hochschulkurs einzusetzen, liefert überraschend starke Befunde: Bottoni, Cattaneo und Sacikara (2025, Universität Zürich) erprobten Lean 4 in einem 11-wöchigen Kurs „Grundlagen der Mathematik" (Pflichtveranstaltung für Mathematik-Erstsemester). Studierende in der Lean-Gruppe (n=5) erzielten in der Abschlussprüfung im Median 46/60 Punkte gegenüber 34.9/60 in der Kontrollgruppe (n=52) — ein statistisch signifikanter Unterschied (t-Test p = 0,006). Die Autor:innen weisen explizit auf die kleine Stichprobengröße hin und mahnen zur Vorsicht bei der Generalisierung. Dennoch ist dies die erste publizierte quantitative Evidenz für den Einsatz von Lean 4 im regulären europäischen Hochschulunterricht.

Hanna, Larvor und Yan (2024, ZDM – Mathematics Education) ergänzen diese Evidenz mit einer philosophisch-didaktischen Perspektive: Lean im Hochschulunterricht verändert nicht nur die Arbeitsweise beim Beweisen, sondern auch die Vorstellungen der Studierenden davon, was ein Beweis ist. Die Autorinnen und Autoren dokumentieren, dass formale Systeme den Blick für logische Lücken schärfen — aber die Gefahr birgt, dass Formalisierung mit Verstehen gleichgesetzt wird. Das macht explizite semiotische Reflexion im Unterricht notwendig.

Für TU Graz und PH Graz bedeutet das: Der Einstieg in formale Beweisumgebungen muss nicht an der Hochschule beginnen — GeoGebra Discovery bietet eine schulstufen-adäquate Brücke — aber die Hochschule ist der natürliche Ort, an dem das Potenzial vollständig ausgeschöpft werden kann. Die Kombination GeoGebra Discovery (SEK II) → Lean 4 (Hochschule) ist ein strukturierter Ausbildungspfad hin zu verifikationsgestütztem mathematischen Denken.

GeoGebra Discovery an der Hochschule

GeoGebra Discovery ermöglicht automatisierte Beweisführung für elementar-euklidische Sätze: Der ShowProof-Befehl zeigt vollständige Beweissequenzen; ein Schwierigkeitswert bewertet den „Überraschungsgrad" eines Satzes relativ zu seinen Voraussetzungen. Hauptentwickler Zoltán Kovács forscht an der Johannes Kepler Universität Linz — Österreich hat damit direkten Anschluss an die internationale Forschungsfront (Kovács et al., 2024). Praktische Anwendungen zeigen: GeoGebra Discovery löst Probleme des Náboj-2023-Wettbewerbs automatisiert und entdeckt dabei Verallgemeinerungen, die über die ursprüngliche Aufgabenstellung hinausgehen (Hota et al., 2024). Gleiches gilt für ein Problem der österreichischen Mathematikolympiade 2023 — eine direkte Relevanz für österreichische Hochschulausbildung (Kovács et al., 2024b).

Neuere Arbeiten erweitern die Möglichkeiten: GeoGebra Discovery kann halbfertige Geometrieaussagen automatisch vervollständigen und fehlende Beweisschritte ergänzen — ein direktes Scaffold-Werkzeug für Hochschullehre und Lehramtsausbildung (Kovács et al., 2024c). Die Schwierigkeit geometrischer Sekundarschulsätze lässt sich nun automatisiert analysieren und für adaptives Lernen und Curriculum-Design nutzen (Kovács et al., 2025).

Die Kombination von GeoGebra Discovery und ChatGPT zeigt besonderes Potenzial: GeoGebra führt zertifizierte, symbolische Beweise durch; ChatGPT interpretiert natürlichsprachliche Eingaben und erklärt Beweisideen. Beide Systeme scheitern allein an bestimmten Problemen — gemeinsam decken sie mehr ab (Botana et al., 2024).

Wie Studierende GeoGebra kognitiv nutzen, untersucht eine Eye-Tracking-Studie von Türkoğlu und Yalçinalp (2024, Education and Information Technologies, Springer): Acht Erstsemester-Mathematikdidaktik-Studierende bearbeiteten Geometrieaufgaben in GeoGebra, während ihre Augenbewegungen aufgezeichnet wurden. Analysiert nach Polyas Problemlösephasen zeigt sich: Studierende, die mehr Zeit in der Verstehens- und Planungsphase verbrachten, waren signifikant erfolgreicher. Der Lernstil „Converger" korrelierte mit aktiverer Nutzung des Eingabefelds — ein Indikator für tieferes Explorationsverhalten. Die Studie verbindet quantitative Blickdatenmessung mit qualitativer Analyse und liefert konkrete Ansätze für Learning-Analytics-gestützte Diagnose im GeoGebra-Hochschulunterricht.

Ein konkretes Unterrichtsbeispiel für die Sekundarstufe II, das an der Pädagogischen Hochschule Linz entwickelt wurde, liefern Käferbock und Kovács (2024, EPTCS – Automated Deduction in Geometry): Ausgehend von einem Schaukelpferd in einem Medizinzentrum in Freistadt entwickeln die Autoren ein Schulprojekt, in dem GeoGebra Discovery falsche Vermutungen automatisch widerlegt und korrekte geometrische Orts-Beweise generiert. Das Format verbindet entdeckendes Lernen mit automatisierter Verifikation und zeigt, wie ATP-gestützte Geometrie bereits auf Sekundarstufen-Niveau didaktisch zugänglich ist — ein Beispiel aus dem österreichischen Bildungskontext, das direkt auf die Ausbildungssituation an PH Graz und TU Graz übertragbar ist.

Wie GeoGebra Discovery in der Lehramtsausbildung outdoor eingesetzt werden kann, demonstrieren Martínez-Zarzuelo et al. (2025, Education Sciences): Angehende Lehrende nutzten GeoGebra Discoverys Automated Reasoning Tools (ART) außerhalb des Klassenraums, um geometrische Eigenschaften in der realen Umgebung zu entdecken und automatisiert zu beweisen. Das Format — Fieldwork + formale Geometrie — verbindet geometrisches Sehen mit algorithmischer Verifikation und bietet ein innovatives Modell für die Lehramtsausbildung an PH und Universität.

Die Autoformalisierung — automatische Übersetzung informaler Mathematik in formal verifizierbare Lean-Repräsentationen — macht 2025 erhebliche Fortschritte: Gao et al. (2025, ICLR) entwickeln mit Herald einen Datensatz von 580.000 Lean-4-Aussagen und 44.000 NL-FL-Theorempaaren aus Mathlib4; der Herald Translator erreicht 96,7 % Genauigkeit (Pass@128) auf miniF2F. Lin et al. (2025, ICLR) zeigen mit Lean-STaR, dass das Verschränken informaler Denkschritte mit formalen Beweisschritten die Performanz auf 46,3 % (Pass@64) auf miniF2F hebt. Tsoukalas et al. (2024, NeurIPS) zeigen mit PutnamBench zugleich die verbleibende Lücke: Kein SOTA-System löst mehr als eine Handvoll der 640 formalisierten Putnam-Wettbewerbsaufgaben — Undergraduate-Wettkampfmathematik bleibt eine offene Herausforderung für neuronale Beweissysteme.

LLMs in der Hochschulmathematik

LLMs wie GPT-4, Claude oder Gemini werden als Recherche- und Explorationswerkzeuge eingesetzt — bei gleichzeitiger kritischer Prüfung der Ausgaben. Eine Delphi-Studie mit 34 Teilnehmenden aus 23 Institutionen identifizierte 41 prioritäre Forschungsfragen zu generativer KI in der Hochschulmathematik, darunter: Wie können Lehrende KI-Outputs kritisch beurteilen? Wie ändern sich Beweisaufgaben? (Iannone et al., 2025).

Die erste publizierte empirische Erhebung zur KI-Nutzung im Mathematikstudium im DACH-Raum zeigt: KI ist bereits Teil der studentischen Lebenswelt — mit erheblichen Ausbildungsbedarfen für reflektierten Umgang (Tröbelsberger et al., 2025). Empirisch zeigen Studien, dass KI-Tutoring auf Hochschulniveau sogar best-practice Präsenzunterricht übertreffen kann: Ein crossover-RCT mit 194 Physikstudierenden zeigte, dass KI-Tutor-Gruppen signifikant besser abschnitten als Gruppen mit Peer Instruction und Kleingruppen — und mehr lernten in weniger Zeit (Kestin et al., 2025).

Eine grundlegende methodische Erkenntnis für die Hochschullehre liefern Collins et al. (2024, PNAS): Auf der interaktiven Plattform CheckMate testeten echte Mathematiker:innen GPT-4, ChatGPT und InstructGPT beim Beweisen von Undergraduate-Sätzen. Das überraschende Ergebnis: Statische Benchmarks (wie MATH-500) unterschätzen die Fähigkeiten von LLMs systematisch — im interaktiven Dialog, mit Rückfragemöglichkeit, performen sie deutlich besser als in one-shot-Szenarien. Für die Hochschuldidaktik bedeutet das: Der sinnvolle Einsatz von LLMs beim Beweisen liegt im dialogischen Modus — Lernende führen eine Unterhaltung mit dem Modell und prüfen kritisch jeden Schritt, statt die Ausgabe als fertige Lösung zu übernehmen.

Zwei neue empirische Studien liefern wichtige Befunde zur KI-Nutzung in beweisfokussierten Kursen: Klawa, Rajpal und Thomas (2025, arXiv) untersuchten in einer Pilotstudie über drei Undergraduate-Kurse (abstrakte Algebra, Topologie) Nutzungsmuster und Wahrnehmungen generativer KI. Studierende schätzten KI als Erklärwerkzeug, bezweifelten aber ihre Verlässlichkeit bei formalen Beweisen — ein Muster, das auf wachsende Medienkompetenz hindeutet. Chen et al. (2025, arXiv) gingen einen Schritt weiter: In einem kontrollierten Experiment mit 148 Studierenden verbesserte ein KI-Tutor (Beweis-Reviewer + Chatbot) zwar die Hausaufgabenleistung signifikant, zeigte jedoch keinen Effekt auf Prüfungsnoten. Kritisch: Studierende mit geringer Selbstwirksamkeit nutzten den Chatbot häufiger — und erzielten schwächere Klausurergebnisse. Dieses Muster des abhängigen Delegierens ist konsistent mit den Befunden aus dem Sekundarbereich (Bastani et al., 2025).

Wie Studierende dabei tatsächlich vorgehen, untersuchten Yoon et al. (2024, ZDM) in einer qualitativen Studie mit drei Undergraduate-Studierenden beim Beweisen mit generativer KI. Ihr Rahmenmodell SIPE-AI (Students' Interactive Proving Experience with AI) identifiziert drei Einflussfaktoren: Beweiskonzeptionen (was zählt als Beweis?), KI-Konzeptionen (was kann/darf die KI?) und ethische Überlegungen (wann ist es noch mein Beweis?). Geometrische Beweise sind dabei besonders herausfordernd, weil Studierende die Plausibilität einer KI-Antwort nicht ohne geometrische Fachkenntnis beurteilen können.

Wie Studierende Interactive Theorem Provers (ITPs) wahrnehmen, untersuchen Iannone und Thoma (2025, Digital Experiences in Mathematics Education): Ein zentraler Befund — Studierende empfanden den Einsatz von ITPs als »Mogeln« („It Feels Like Cheating"). Dieses Erleben ist kein Marginalphänomen: Es reflektiert tiefe Fragen zur mathematischen Identität — was zählt als mein Beweis? — und zur Beweiskultur an der Hochschule. Die Autoren plädieren für explizite Reflexion über den epistemologischen Status formaler Verifikation im Mathematikstudium. Dies ergänzt den Befund von Yoon et al. (2024), dass Studierende beim KI-assistierten Beweisen zwischen Konzeption, Exploration und Delegation abwägen müssen.

Ein emerging area an der Grenze von Hochschuldidaktik und KI-Technologie sind verkörperte KI-Agenten in Mixed Reality: Nguyen, Gul, Dang, Huynh und Tuunanen (2025, Innovations in Education and Teaching International, Vol. 62, S. 1632–1647) untersuchen, wie embodied generative AI in immersiven Mixed-Reality-Umgebungen aktives Lernen in der Hochschule unterstützen kann. Die Studie zeigt, dass verkörperte KI-Agenten — die auf Studierendenhandlungen und Raumgesten reagieren — Engagement und selbstreguliertes Lernen fördern können. Für die Geometrielehre eröffnet das Perspektiven: Studierende könnten 3D-geometrische Objekte gemeinsam mit KI-Agenten explorieren, die Feedback auf Gesten und räumliche Konstruktionen geben.

Die Stimmungslage an Hochschulen ist ambivalent: Gkrekas und Rizos (2025, Heliyon) befragten Studierende, Lehrpersonal und Forschende an drei griechischen Universitäten. Studierende zeigen moderate Zufriedenheit mit LLMs; Lehrpersonen und Forschende hingegen deutliche Skepsis — insbesondere wegen Verlässlichkeit und akademischer Integrität. Ähnliche Befunde sind aus dem deutschsprachigen Raum zu erwarten.

Besondere Relevanz: Lehramtsstudium an TU Graz und PH Graz

Lehramtsstudierende müssen nicht nur Fachwissen erwerben, sondern auch reflektiert mit KI umgehen können. Eine explorative Studie mit 162 angehenden Primarstufen-Lehrenden zeigte: Die meisten nutzten ChatGPT für geometrische Beweise in oberflächlicher Weise, hatten begrenzte Vorerfahrungen und entwickelten häufig Misskonzeptionen über die Zuverlässigkeit des Systems (Dilling & Herrmann, 2024). Das ist besonders beunruhigend, weil diese Personen in wenigen Jahren Geometrieunterricht für Tausende Schüler:innen gestalten werden.

Die erste publizierte empirische Erhebung zur KI-Nutzung im Mathematikstudium im DACH-Raum (Tröbelsberger et al., 2025, DMVM) bestätigt: KI ist bereits Teil der studentischen Lebenswelt. Studierende nutzen sie für Hausaufgaben, Prüfungsvorbereitung und das Verstehen komplexer Beweisschritte — oft ohne kritische Reflexion über Grenzen und Fehlerquellen. Der Ausbildungsbedarf ist erheblich.

Die PH Graz und TU Graz stehen vor der Aufgabe, eine KI-Kompetenz in die Ausbildung zu integrieren, die über reines Tool-Wissen hinausgeht. In Österreich wurden bereits Fortbildungscurricula entwickelt, die auf dem 4C-Rahmen basieren (Critical Thinking, Creativity, Collaboration, Communication; BMB, 2024). Die PH Wien hat ein 32-seitiges Positionspapier veröffentlicht, das institutionelle Leitlinien für den Umgang mit KI in der Hochschullehre und Lehrer:innenbildung enthält (PH Wien, 2024). Das KIMADU-Projekt in NRW (Universität Siegen, 25 Schulen, Laufzeit 2025–2027) ist das bislang größte empirische Lehrprojekt, das generative KI explizit im Geometrieunterricht erprobt und gleichzeitig Lehrende in der reflektierten Nutzung ausbildet (Witzke & Steinhoff, 2025) — ein Modell, das für Österreich adaptiert werden könnte. Das Vorläuferprojekt KI@school (Stiftung Bildungspakt Bayern / Universität Siegen, 2022–2027) liefert erste Daten zu Lehrkraftperspektiven und Professionalisierungswegen: Unterrichtsnahe, konkrete Fortbildungsformate erweisen sich als deutlich wirksamer als abstrakte Workshops (Huget et al., 2025).

Dass der Zusammenhang von CT und geometrischem Denken bereits in der frühkindlichen Lehramtsausbildung gezielt genutzt werden kann, zeigt eine Studie aus Spanien (Sala-Sebastià, Breda & Font, 2025, Education and Information Technologies, N=42): Angehende Frühpädagogik-Lehrkräfte programmierten in drei Phasen (Erkunden, Programmieren, Reflektieren) mit dem Roboter MatataLab grundlegende geometrische Figuren. Die Analyse zeigt, wie Drag-and-Drop-Robotik-Programmierung gleichzeitig CT-Kompetenz und geometrisches Denken aktiviert — ein Modell für lehramtsdidaktische Veranstaltungen, die beide Kompetenzbereiche verbinden wollen.

Was Lehramtsstudierende für den Geometrieunterricht brauchen

Der UNESCO AI Competency Framework for Teachers (Miao & Cukurova, 2024) strukturiert diese Anforderungen international: Er definiert Kompetenz in drei Stufen (Understand, Apply, Create) und fünf Bereichen — darunter KI-Ethik, pädagogische KI-Nutzung und Datenpraktiken. Dieser Rahmen bietet eine Orientierung für die Curricula-Entwicklung an PH Graz und TU Graz.

Eine differenzierte KI-Kompetenz für angehende Mathematiklehrende umfasst vier Dimensionen:

  1. Werkzeugkompetenz: Sicherer Umgang mit GeoGebra AI, GeoGebra Discovery, Wolfram Alpha und LLMs — nicht als Endnutzer, sondern als reflektierte Gestalter:innen von Lernumgebungen
  2. Kritische Evaluationskompetenz: Fähigkeit, KI-generierte geometrische Beweise auf Korrektheit zu prüfen — gerade weil LLMs im Geometriebereich am fehleranfälligsten sind (Wei, 2024; Wardat et al., 2023)
  3. Didaktische Gestaltungskompetenz: KI-resistente Prüfungsaufgaben entwickeln, sokratische KI-Dialoge konfigurieren, kollaborative KI-Szenarien planen
  4. Medienpädagogische Reflexionskompetenz: Datenschutz (DSGVO), Abhängigkeitsrisiken, algorithmischer Bias, Lehrplan-Misalignments internationaler Systeme erkennen und thematisieren

Ulusoy (2024, Journal of Computer Assisted Learning) untersuchte, welche Qualität Lehramtsstudierende bei der Gestaltung von DGS-Aufgaben (GeoGebra, Cabri, Sketchpad) erreichen. Ergebnis: Die Koordination zwischen mathematischer Tiefe und technologischen Aktionen (Zeichnen, Messen, Zugmodus) variiert erheblich — viele angehende Lehrkräfte nutzen den didaktisch entscheidenden Zugmodus nicht für tiefergehende mathematische Erkundungen. Die Implikation für die Ausbildung: Geometrie-DGS-Kompetenz muss explizit gelehrt werden, nicht nur Tool-Wissen. Ein systematisches Review (Tejera, Galiç & Lavicza, 2025, Journal for STEM Education Research) über 20 Studien zu 3D-Modellierung und 3D-Druck in der Lehramtsausbildung zeigt: Diese Technologien fördern nachweislich geometrische Raumvorstellung und Praxisbezug — bei gleichzeitigen Herausforderungen durch Ressourcenknappheit.

Eine konkrete Methode für die Unterrichtsplanung mit KI: Gurl, Markinson & Artzt (2024, Digital Experiences in Mathematics Education) untersuchten qualitativ, wie Lehramtsstudierende der Sekundarstufe ChatGPT zur Unterrichtsplanung im Mikro-Teaching-Kontext nutzten. Befund: Studierende bewerteten pädagogische Outputs präziser als mathematische Inhalte — ChatGPT-Lektionen waren tendenziell lehrerzentriert und wenig auf Schülerbedürfnisse ausgerichtet. Kritische Adaption variierte stark; dies unterstreicht, dass KI-gestützte Unterrichtsplanung explizite didaktische Reflexion erfordert, nicht nur technisches Tool-Know-how.

Eine weitere konkrete Methode, die sich bewährt: KI-gestützte Simulation von Schülerantworten für Lehramtsstudierende. Bastian et al. (2025) entwickelten den Chatbot NiCo (basierend auf GPT-4o) zur Förderung von Noticing-Kompetenzen — also der Fähigkeit, pädagogisch bedeutsame Momente in Unterrichtsvideos zu erkennen und zu interpretieren. In einem Pilot mit 25 Lehramtsstudierenden (Universität Hamburg) analysierte NiCo Videoszenen und gab strukturiertes Scaffolding-Feedback. Die Studie zeigt: KI kann nicht nur Lernende unterstützen, sondern auch den reflektierten Blick von Lehrenden auf Unterricht schulen — ein direkter Anknüpfungspunkt für Geometriedidaktik-Seminare.

Dass KI-gestützte Lehrkräftefortbildung tatsächlich Schülerleistungen verbessert, zeigt das erste einschlägige RCT: Copur-Gencturk, Li und Atabas (2024, American Educational Research Journal) randomisierten 52 Mathematiklehrende in eine Experimentalgruppe (n=29), die asynchrone Fortbildungsmodule mit einem KI-basierten ITS und Just-in-Time-Feedback bearbeitete, und eine Kontrollgruppe (n=23). Lehrkräfte der Experimentalgruppe setzten danach mathematisch reichhaltigere Aufgaben ein; Schülerleistungen stiegen signifikant (d=0,18). Dies ist der bislang direkteste kausale Nachweis, dass KI-basierte Lehrkräfteentwicklung Wirkung auf Schülerlernen entfaltet — eine Orientierung für die österreichische Lehramtsausbildung.

Uygun (2025) untersuchte in einer fünfwöchigen Intervention, wie angehende Lehrkräfte die Kombination aus ChatGPT, 3D-Modellierung (Blender) und MyWebAR für die interaktive Exploration platonischer Körper nutzen können. Die Studie zeigt: AR-gestützte Geometrie in der Lehramtsausbildung fördert nicht nur Fachwissen, sondern auch die Bereitschaft, innovative Technologien im eigenen Unterricht einzusetzen. Kock et al. (2025) belegen ergänzend für Ingenieurstudent:innen im 1. Semester: ChatGPT wird hauptsächlich zur Überprüfung von Rechenwegen und zur Erklärung von Lösungsschritten genutzt — nicht zum blinden Kopieren von Lösungen. Dieser Befund stützt die These, dass die tatsächliche Nutzungsweise von KI-Werkzeugen differenzierter ist als oft befürchtet.

Fragen, die das Lehramtsstudium künftig adressieren muss:

Literatur (Hochschule)

Achim, T., Best, A., Bietti, A., et al. (2025). Aristotle: IMO-level automated theorem proving. arXiv:2510.01346.

Achim, T., Best, A., Bietti, A. · 2025 · arXiv preprint ★★★★★ 10/10
Aristotle (Harmonic Team) löst 5 von 6 IMO 2025 Problemen mit vollständig verifizierten Lean 4 Beweisen — erstmals Goldmedaillen-Niveau für ein KI-System. Das System integriert: Lean-Beweissuche, informales LLM-Reasoning für Lemma-Generierung und einen dedizie…

Botana, F., Recio, T., & Vélez, M. P. (2024). On using GeoGebra and ChatGPT for geometric discovery. Computers, 13(8), 187. https://doi.org/10.3390/computers13080187

Botana, F., Recio, T. · 2024 · Computation, 12(2), 30 ★★★★★ 10/10
Systematischer Benchmark von ChatGPT 3.5 vs. GeoGebra 5 bei geometrischen Ortskurvenaufgaben (Einhüllende ebener Kurvenfamilien). Ergebnis: ChatGPT scheitert in den meisten Fällen; GeoGebra löst zuverlässig. Warnung ('Caveat Emptor!') an Lehrende, die ChatGPT …

Chervonyi, Y., Trinh, T. H., Olšák, M., Yang, X., Nguyen, H., Menegali, M., Jung, J., Kim, J., Verma, V., Le, Q. V., & Luong, T. (2025). Gold-medalist performance in solving Olympiad Geometry with AlphaGeometry2. arXiv:2502.03544.

Chervonyi, Y., Trinh, T.H., Olšák, M. · 2025 · Journal of Machine Learning Research, Vol. 26(241), 1–39 (also arXiv:2502.03544) ★★★★★ 10/10
AlphaGeometry 2 löst 84% aller IMO-Geometrieprobleme 2000–2024 (gegenüber 54% bei AG1). Verbesserte Gemini-basierte Sprachkomponente, erweiterte Domänensprache (Winkel, Abstände, Locus-Theoreme), schnellere symbolische Suchmaschine mit Knowledge-Sharing. Meile…

Dilling, F., & Herrmann, M. (2024). Using large language models to support pre-service teachers' mathematical reasoning. Frontiers in Artificial Intelligence, 7. https://doi.org/10.3389/frai.2024.1460337

Dilling, F., Herrmann, M. · 2024 · Frontiers in Artificial Intelligence ★★★★★ 10/10
Exploratorische Studie zur Nutzung von ChatGPT als Werkzeug für angehende Primarstufen-Lehrende beim Erstellen geometrischer Beweise. Untersucht Vorerfahrungen mit LLMs, Überzeugungen und Interaktionsverhalten. Ergebnis: Studierende hatten begrenzte Vorerfahru…

Hubert, T., Mehta, R., Sartran, L., et al. (2025). Olympiad-level formal mathematical reasoning with reinforcement learning. Nature. https://doi.org/10.1038/s41586-025-09833-y

Hubert, T., Mehta, R., Sartran, L. · 2025 · Nature ★★★★★ 10/10
AlphaProof kombiniert Gemini (LLM) mit AlphaZero-Reinforcement-Learning für formale Mathematik in Lean 4. Bei IMO 2024 löste das System zusammen mit AlphaGeometry 2 vier von sechs Aufgaben (28/42 Punkte) — Silbermedaillen-Niveau, das erste KI-System auf diesem…

Iannone, P., Biza, I., Davies, B., Kinnear, G., & Nieminen, J. H. (2025). Towards a research agenda for generative AI in university mathematics education. CERME14 Proceedings. https://hal.science/hal-05238099

Iannone, P., Biza, I., Davies, B. · 2025 · CERME14 Proceedings (Bozen-Bolzano, Februar 2025) ★★★★ 8/10
Delphi-Methode mit 34 Teilnehmenden aus 23 Institutionen: 41 prioritäre Forschungsfragen zu generativer KI in der Hochschulmathematik, geordnet nach Studierenden-KI und Lehrende-KI Interaktionen. Direkt relevant für Kapitel 06 (Hochschule) und 10 (Ausblick). D…

Kestin, G., Miller, K., Klales, A., et al. (2025). AI tutoring outperforms active learning. Scientific Reports, 15, 17458. https://doi.org/10.1038/s41598-025-97652-6

Kestin, G., Miller, K., Klales, A. · 2025 · Scientific Reports (Nature Portfolio), 15, 17458 ★★★★★ 9/10
Crossover-RCT mit 194 Physikstudierenden: KI-Tutor-Gruppe übertraf signifikant Best-Practice-Präsenzunterricht (Peer Instruction, Kleingruppen, Echtzeit-Feedback). Studierende berichteten höheres Engagement und lernten mehr in weniger Zeit. Wichtiger allgemein…

Kovács, Z., Recio, T., & Vélez, M. P. (2024). Showing proofs, assessing difficulty with GeoGebra Discovery. arXiv:2401.11900.

Kovács, Z., Recio, T., Vélez, M.P. · 2024 · arXiv / GeoGebra Discovery Research ★★★★★ 9/10
GeoGebra Discovery erweitert GeoGebra um automatisierte Beweisführung: Der ShowProof-Befehl zeigt Schritt-für-Schritt-Beweissequenzen für geometrische Aussagen; ein Schwierigkeitswert bewertet den 'Überraschungsgrad' eines Satzes relativ zu seinen Voraussetzun…

Murphy, L. R., Yang, K., Sun, J., Li, Z., Anandkumar, A., & Si, X. (2024). Autoformalizing Euclidean Geometry. Proceedings of ICML 2024. https://doi.org/10.48550/arXiv.2405.17216

Murphy, L.R., Yang, K., Sun, J. · 2024 · Proceedings of the 41st International Conference on Machine Learning (ICML 2024) ★★★★★ 10/10
Erstmalige treue Formalisierung von Euklids Elementen in Lean 4. Benchmark für automatische Formalisierung euklidischer Geometrie. Relevant für Kapitel 06 (Hochschule: formale Beweissysteme) und 10 (Ausblick: KI und formale Mathematik).

Pädagogische Hochschule Wien. (2024). Positionspapier zum Umgang mit Künstlicher Intelligenz in der Hochschulbildung. https://phwien.ac.at/wp-content/uploads/2024/02/PHW-Positionspapier-KI-in-der-Hochschulbildung-Februar-2024.pdf

Trinh, T. H., Wu, Y., Le, Q. V., He, H., & Luong, T. (2024). Solving Olympiad Geometry without human demonstrations. Nature, 625, 476–482. https://doi.org/10.1038/s41586-023-06747-5

Trinh, T.H., Wu, Y., Le, Q.V. · 2024 · Nature, 625, 476–482 ★★★★★ 10/10
Google DeepMind präsentiert AlphaGeometry, ein neurosymbolisches KI-System das olympiadische Geometriebeweise auf dem Niveau eines menschlichen Goldmedaillengewinners löst. Löste 25 von 30 IMO-Geometrieproblemen (Vorläufer: 10). AlphaGeometry 2 (2024) löste 83…

Vuong, Q.-H., & Ho, M.-T. (2024). The disruptive AlphaGeometry. AI & Society. https://doi.org/10.1007/s00146-024-02010-1

Vuong, Q.-H., Ho, M.-T. · 2024 · AI & Society (Springer Nature) ★★★★★ 10/10
Analyse der pädagogischen Implikationen von AlphaGeometry für den Mathematikunterricht. Die Autoren untersuchen, wie olympiadische KI-Performance das Lehrer-Schüler-Verhältnis und die Rolle von Schulen in der mathematischen Bildung herausfordert. Kernargument:…

Hota, A., Kovács, Z., & Vujic, A. (2024). Solving some geometry problems of the Náboj 2023 contest with automated deduction in GeoGebra Discovery. ADG 2023, EPTCS 398, 110–123. https://doi.org/10.48550/arXiv.2401.13703

Hota, A., Kovács, Z., Vujic, A. · 2024 · ADG 2023, EPTCS 398, 110–123 ★★★★★ 9/10
Demonstrates automated deduction solving competition geometry problems from the Náboj 2023 contest using GeoGebra Discovery's symbolic computation engine. Identifies difficulty of encoding problems into machine-readable form as a key challenge. Explores genera…

Kovács, Z., Recio, T., & Vélez, M. P. (2024b). Solving with GeoGebra Discovery an Austrian Mathematics Olympiad problem: Lessons learned. ADG 2023, EPTCS 398. https://doi.org/10.48550/arXiv.2401.11906

Kovács, Z., Recio, T., Vélez, M.P. · 2024 · arXiv / GeoGebra Discovery Research ★★★★★ 9/10
GeoGebra Discovery erweitert GeoGebra um automatisierte Beweisführung: Der ShowProof-Befehl zeigt Schritt-für-Schritt-Beweissequenzen für geometrische Aussagen; ein Schwierigkeitswert bewertet den 'Überraschungsgrad' eines Satzes relativ zu seinen Voraussetzun…

Kovács, Z., Recio, T., Sólyom-Gecse, C., & Vélez, M. P. (2024c). On automated completion of geometry statements and proofs with GeoGebra Discovery. Annals of Mathematics and Artificial Intelligence. https://doi.org/10.1007/s10472-024-09964-4

Kovács, Z., Recio, T., Vélez, M.P. · 2024 · arXiv / GeoGebra Discovery Research ★★★★★ 9/10
GeoGebra Discovery erweitert GeoGebra um automatisierte Beweisführung: Der ShowProof-Befehl zeigt Schritt-für-Schritt-Beweissequenzen für geometrische Aussagen; ein Schwierigkeitswert bewertet den 'Überraschungsgrad' eines Satzes relativ zu seinen Voraussetzun…

Kovács, Z., et al. (2025). Automated analysis of the difficulty of secondary school geometry theorems. Annals of Mathematics and Artificial Intelligence. https://doi.org/10.1007/s10472-025-09983-9

Kovács, Z., Peng, X. · 2025 · arXiv preprint ★★★★★ 3/10
Develops the complex number identity method into a fully automated proof procedure, implemented in Mathematica, Maple, Giac and as prototype in GeoGebra. November 2025 arXiv preprint.

Naskręcki, B., & Ono, K. (2025). Mathematical discovery in the age of artificial intelligence. Nature Physics, 21, 1504–1506. https://doi.org/10.1038/s41567-025-03042-0

Naskręcki, B., Ono, K. · 2025 · Nature Physics, 21, 1504–1506 ★★★★★ 9/10
Perspective in Nature Physics arguing that AI tools are reshaping mathematical research practice. Reviews case studies where AI led to or accelerated discoveries (knot invariants, arithmetic geometry). Cautions against over-reliance and emphasizes that the pur…

Tröbelsberger, L., Fock, A., Oldenburg, R., & Siller, H.-S. (2025). Der Einsatz von KI-Systemen durch Studierende in der universitären Mathematikausbildung. DMVM, 33(4), 276–280. https://doi.org/10.1515/dmvm-2025-0078

Tröbelsberger, L., Fock, A., Oldenburg, R. · 2025 · Mitteilungen der Deutschen Mathematiker-Vereinigung (DMVM), Vol. 33(4), pp. 276–280 ★★★★★ 9/10
Erste publizierte empirische Erhebung zur KI-Nutzung im Mathematikstudium im DACH-Raum. Zeigt: KI ist bereits Teil der studentischen Lebenswelt in der Mathematikausbildung — mit erheblichen Ausbildungsbedarfen für reflektierten Umgang. Grundlage: Befragungsstu…

Wardat, Y., Tashtoush, M. A., AlAli, R., & Jarrah, A. M. (2023). ChatGPT: A revolutionary tool for teaching and learning mathematics. Eurasia Journal of Mathematics, Science and Technology Education, 19(7), em2286. https://doi.org/10.29333/ejmste/13272

Wardat, Y., Tashtoush, M.A., AlAli, R. · 2023 · Eurasia Journal of Mathematics, Science and Technology Education, 19(7), em2286 ★★★★ 8/10
Qualitative Fallstudie durch Inhaltsanalyse von Interviews und Social-Media-Diskursen zu ChatGPT im Mathematikunterricht. Befund: ChatGPT ist effektiv für grundlegende Mathematik, hat aber explizit 'kein tiefes Verständnis von Geometrie und kann Fehlvorstellun…

Wei, X. (2024). Evaluating ChatGPT-4 and ChatGPT-4o. Frontiers in Education, 9, 1452570. https://doi.org/10.3389/feduc.2024.1452570

Wei, X. · 2024 · Frontiers in Education, 9, 1452570 ★★★★★ 10/10
Evaluation von GPT-4 und GPT-4o auf NAEP-Mathematikaufgaben (4., 8., 12. Klasse): Geometrie/Messung ist der schwächste Inhaltsbereich — GPT-4: 53%, GPT-4o: 59% (vs. 79%/92% in Algebra). Räumliches Denken und visuelle Informationsverarbeitung als fundamentale B…

Witzke, I., & Steinhoff, T. (2025). KIMADU — KI-Forschungsprojekt der Didaktik der Mathematik und der deutschen Sprache. Universität Siegen / Ministerium für Schule und Bildung NRW. https://kimadu.de/

Bastian, A., Buchholtz, N., & Kaiser, G. (2025). Using AI chatbots to facilitate mathematics preservice teachers' noticing skills. Frontiers in Education. https://doi.org/10.3389/feduc.2025.1605921

Bastian, A., Buchholtz, N., Kaiser, G. · 2025 · Frontiers in Education ★★★★★ 9/10
Entwicklung und Einsatz des KI-Chatbots NiCo (basierend auf GPT-4o) zur Förderung von Noticing-Kompetenzen bei n=25 Mathematik-Lehramtsstudierenden (Sekundaralgebra-Unterrichtsvideos). Strukturiertes Scaffolding und Feedback durch KI. Buchholtz und Kaiser an U…

Ulusoy, F. (2024). The quality of prospective mathematics teachers' dynamic geometry tasks in terms of the coordination between mathematical depth levels and technological actions. Journal of Computer Assisted Learning, 40(3), 1029–1045. https://doi.org/10.1111/jcal.13029

Ulusoy, F. · 2024 · Journal of Computer Assisted Learning ★★★★ 8/10
Untersuchung zur Qualität von GeoGebra/Cabri/Sketchpad-Aufgaben, die angehende Mathematiklehrkräfte entwickeln. Zeigt erhebliche Varianz in der Koordination zwischen mathematischer Tiefe und technologischen Aktionen (Zeichnen, Messen, Ziehen). Identifiziert sp…

Tejera, M., Galiç, S., & Lavicza, Z. (2025). 3D modelling and printing in teacher education: A systematic literature review. Journal for STEM Education Research. https://doi.org/10.1007/s41979-025-00147-2

Tejera, M., Galiç, S., Lavicza, Z. · 2025 · Journal for STEM Education Research ★★★★ 7/10
Systematisches PRISMA-Review (n = 20 Studien aus ERIC, WoS, Scopus, IEEE) zu 3D-Modellierung und 3D-Druck in der Lehrerbildung. Positive Effekte auf Kompetenzentwicklung und Praxisbezug, aber Herausforderungen durch begrenzte Ressourcen. Identifiziert Forschun…

Huget, J., Dilling, F., Eckhardt, M., Geier, C., Müller, J., & Witzke, I. (2025). Projektvorstellung KI@school: Forschung und Entwicklung zum Einsatz generativer KI im Mathematikunterricht. Mitteilungen der Gesellschaft für Didaktik der Mathematik, 119. https://ojs.didaktik-der-mathematik.de/index.php/mgdm/article/view/1305

Huget, J., Dilling, F., Eckhardt, M. · 2025 · Mitteilungen der Gesellschaft für Didaktik der Mathematik ★★★★ 8/10
Vorstellung des Projekts KI@school (Universität Siegen / Stiftung Bildungspakt Bayern, 2022–2027): Empirische Untersuchung zu Lehrkraftperspektiven auf generative KI, didaktischen Einsatzszenarien (funktional vs. prädikativ nach Dorfler) und unterrichtsintegri…

Gurl, T. J., Markinson, M. P., & Artzt, A. F. (2024). Using ChatGPT as a lesson planning assistant with preservice secondary mathematics teachers. Digital Experiences in Mathematics Education, 10, 114–139. https://doi.org/10.1007/s40751-024-00162-9

Gurl, T. J., Markinson, M. P., Artzt, A. F. · 2024 · Digital Experiences in Mathematics Education ★★★★ 8/10
Qualitative Studie: Lehramtsstudierende (Sekundarstufenmathematik) nutzten ChatGPT zur Unterrichtsplanung im Mikro-Teaching-Kontext. Studierende bewerteten den pädagogischen Output präziser als den mathematischen Inhalt — ChatGPT-generierte Lektionen waren leh…

Bottoni, M. L., Cattaneo, A. S., & Sacikara, E. (2025). Teaching Foundations of Mathematics with the Lean theorem prover. arXiv:2501.03352. https://arxiv.org/abs/2501.03352

Bottoni, M. L., Cattaneo, A. S., Sacikara, E. · 2025 · arXiv:2501.03352 ★★★★ 7/10
Controlled pilot study at the University of Zurich over 11 weeks comparing 5 Lean-engaged students against 4 non-Lean students. Provides rare quantitative evidence for pedagogical effectiveness of interactive theorem provers in foundational mathematics courses…

Simić, I., Stojanović-Đurđević, S., & Tanasijević, M. (2025). Automated theorem proving for 3D solid geometry. Annals of Mathematics and Artificial Intelligence. https://doi.org/10.1007/s10472-025-09975-9

Simić, I., Stojanović-Đurđević, S., Tanasijević, M. · 2025 · Annals of Mathematics and Artificial Intelligence ★★★★★ 9/10
Formales System zur automatisierten Beweisführung in der 3D-Raumgeometrie (Körpergeometrie). Erweitert klassische Ansätze (z.B. GCL-basierte Systeme) auf dreidimensionale Konfigurationen — Quader, Pyramiden, Zylinder. Relevant für Hochschuldidaktik und automat…

Collins, K. M., Jiang, A. Q., Frieder, S., et al. (2024). Evaluating language models for mathematics through interactions. Proceedings of the National Academy of Sciences, 121(24), e2318124121. https://doi.org/10.1073/pnas.2318124121

Collins, K. M., Jiang, A. Q., Frieder, S. · 2024 · Proceedings of the National Academy of Sciences ★★★★★ 10/10
CheckMate: interaktive Bewertungsplattform, auf der echte Mathematiker:innen GPT-4, ChatGPT und InstructGPT beim Beweisen von Undergraduate-Mathematiksätzen testeten. Befund: Statische Benchmarks unterschätzen systematisch die Fähigkeiten von LLMs in interakti…

Yoon, H., Hwang, J., Lee, K., Roh, K. H., & Kwon, O. N. (2024). Students' use of generative artificial intelligence for proving mathematical statements. ZDM – Mathematics Education, 56, 1531–1551. https://doi.org/10.1007/s11858-024-01629-0

Yoon, H., Hwang, J., Lee, K. · 2024 · ZDM – Mathematics Education ★★★★★ 10/10
Qualitative Studie mit drei Undergraduate-Studierenden zu KI-Nutzung beim Beweisen mathematischer Aussagen. Entwickelt das Rahmenmodell SIPE-AI (Students' Interactive Proving Experience with AI) mit drei Einflussfaktoren: Beweiskonzeptionen, KI-Konzeptionen un…

Gkrekas, N., & Rizos, I. (2025). The impact of LLMs on mathematics education and research at the university. Heliyon. https://doi.org/10.1016/j.heliyon.2025.e44747

Gkrekas, N., Rizos, I. · 2025 · Heliyon (Elsevier) ★★★★ 7/10
Empirische Befragung an drei griechischen Universitäten (Studierende, Lehrpersonal, Forschende) zu LLM-Auswirkungen auf Mathematikunterricht und -forschung. Studierende: moderate Zufriedenheit; Lehrpersonen und Forschende: deutliche Skepsis bezüglich Verlässli…

Copur-Gencturk, Y., Li, J., & Atabas, S. (2024). Improving teaching at scale: Can AI be incorporated into professional development to create interactive, personalized learning for teachers? American Educational Research Journal, 61(4), 767–802. https://doi.org/10.3102/00028312241248514

Copur-Gencturk, Y., Li, J., Atabas, S. · 2024 · American Educational Research Journal ★★★★★ 5/10
RCT with mathematics teachers (n_exp=29, n_ctrl=23). AI-based ITS provided just-in-time feedback in async PD modules. Experimental teachers used mathematically richer tasks; student achievement rose significantly (d=0.18). First RCT showing AI-based teacher PD…

Hanna, G., Larvor, B., & Yan, X. (2024). Lean in the undergraduate classroom: An exploration. ZDM – Mathematics Education. https://doi.org/10.1007/s11858-024-01577-9

Hanna, G., Larvor, B., Yan, X. · 2024 · ZDM – Mathematics Education ★★★★★ 5/10
Exploration of using the Lean 4 interactive theorem prover in undergraduate mathematics education. Discusses pedagogical implications for proof-based courses.

Iannone, P., & Thoma, A. (2025). "It Feels Like Cheating": Students' perceptions of interactive theorem provers in undergraduate mathematics. Digital Experiences in Mathematics Education. https://doi.org/10.1007/s40751-025-00193-w

Iannone, P., Biza, I., Davies, B. · 2025 · CERME14 Proceedings (Bozen-Bolzano, Februar 2025) ★★★★ 8/10
Delphi-Methode mit 34 Teilnehmenden aus 23 Institutionen: 41 prioritäre Forschungsfragen zu generativer KI in der Hochschulmathematik, geordnet nach Studierenden-KI und Lehrende-KI Interaktionen. Direkt relevant für Kapitel 06 (Hochschule) und 10 (Ausblick). D…

Martínez-Zarzuelo, A., Nolla, Á., Recio, T., Tolmos, P., Ariño-Morera, M., & Gallardo, S. (2025). An experience with pre-service teachers using GeoGebra Discovery automated reasoning tools for outdoor mathematics. Education Sciences, 15(6), 782. https://doi.org/10.3390/educsci15060782

Martínez-Zarzuelo, A., Nolla, Á., Recio, T. · 2025 · Education Sciences ★★★★★ 5/10
Pre-service teachers used GeoGebra Discovery's automated reasoning tools for outdoor mathematics activities. Examines how AI-assisted geometry tools can transform teacher education.

Mahinpei, R., Horta Ribeiro, M., & Milano, M. (2025). Interactive theorem provers for proof education. In Proceedings of SPLASH-E 2025 (pp. 24–41). ACM. https://doi.org/10.1145/3758317.3759679

Mahinpei, R., Horta Ribeiro, M., Milano, M. · 2025 · Proceedings of the 2025 ACM SIGPLAN International Symposium on SPLASH-E ★★★★ 8/10
Drei komplementäre Teilstudien zu Coq, Lean und traditionellen Beweismethoden für Informatik-Studierende: Nutzerstudie zu Coq-Erfahrungen, Vergleich von Beweisstrategien und Usability-Evaluation. Belegt didaktisches Potenzial interaktiver Beweisassistenten bei…

Türkoğlu, H., & Yalçinalp, S. (2024). Investigating problem-solving behaviours of university students through an eye-tracking system using GeoGebra in geometry: A case study. Education and Information Technologies, 29. https://doi.org/10.1007/s10639-024-12452-1

Türkoğlu, H.,, Yalçinalp, S · 2024 · Education and Information Technologies ★★★★★ 13/10
Acht Erstjahr-Studierende der Mathematikdidaktik bearbeiteten Geometrieaufgaben in GeoGebra mit Eye-Tracking. Polyas Problemlösephasen als Analyserahmen. Mehr Zeit in Verstehens- und Planungsphase korreliert mit Erfolg. Lernstil 'Converger' korreliert mit akti…

Bairral, M., & Aldon, G. (2024). The integration of digital technology in task-design on eye-tracking studies in geometry. REDIMAT – Journal of Research in Mathematics Education, 13(2). https://doi.org/10.4471/redimat.2024.14299

Bairral, M., Aldon, G. · 2024 · REDIMAT – Journal of Research in Mathematics Education ★★★★★ 3/10
Review identifies three study clusters on eye-tracking in geometry: geometric proofs, construction of objects, and dynamic exploration. Eye-tracking links learning outcomes with cognitive processes and enables precise attention feedback. Shows how digital task…

Käferbock, A., & Kovács, Z. (2024). The locus story of a rocking camel in a medical center in the city of Freistadt. EPTCS – Automated Deduction in Geometry, 398, 132–141. https://doi.org/10.4204/EPTCS.398.16

Käferbock, A., Kovács, Z. · 2024 · Electronic Proceedings in Theoretical Computer Science (EPTCS) – Automated Deduction in Geometry ★★★★★ 3/10
Using a fictional school project at PH Linz (rocking horse as geometric locus), demonstrates how GeoGebra Discovery automatically refutes false conjectures and generates proofs, making secondary-level mathematics didactically accessible. Combines inquiry-based…

Kovács, Z., Recio, T., & Vélez, M. P. (2024d). Showing proofs, assessing difficulty with GeoGebra Discovery. EPTCS – Automated Deduction in Geometry, 398, Paper 8. https://doi.org/10.4204/EPTCS.398.8

Kovács, Z., Recio, T., Vélez, M.P. · 2024 · arXiv / GeoGebra Discovery Research ★★★★★ 9/10
GeoGebra Discovery erweitert GeoGebra um automatisierte Beweisführung: Der ShowProof-Befehl zeigt Schritt-für-Schritt-Beweissequenzen für geometrische Aussagen; ein Schwierigkeitswert bewertet den 'Überraschungsgrad' eines Satzes relativ zu seinen Voraussetzun…

Nguyen, A., Gul, F., Dang, B., Huynh, L., & Tuunanen, T. (2025). Designing embodied generative artificial intelligence in mixed reality for active learning in higher education. Innovations in Education and Teaching International, 62(5), 1632–1647. https://doi.org/10.1080/14703297.2025.2499177

Nguyen, D. T., Pham, Q. V. · 2025 · Eurasia Journal of Mathematics, Science and Technology Education, Vol. 21(10), em2714 ★★★★★ 9/10
Systematisches Review der KI-Integration im Mathematikunterricht 2015–2025. Dokumentiert starke Beschleunigung ab 2024. Adaptive Lernpfade, personalisiertes Feedback und KI-Aufgabengenerierung als drei Hauptwachstumsfelder. GeoGebra Tutor und MATHia als vielve…

Chen, E., et al. (2025). Generative AI alone may not be enough: Evaluating AI support for learning mathematical proof. arXiv:2509.16778. https://arxiv.org/abs/2509.16778

Chen, E., Xu, T., Gao, Q. · 2025 · arXiv preprint ★★★★★ 3/10
Controlled study with 148 students comparing LLM-Tutor (AI proof reviewer + chatbot) to control group. LLM-Tutor significantly improved homework performance but showed no effect on exam grades. Students with low self-efficacy used chatbot more frequently, corr…

Gao, G., Wang, Y., Jiang, J., Gao, Q., Qin, Z., Xu, T., & Dong, B. (2025). Herald: A natural language annotated Lean 4 dataset. In Proceedings of ICLR 2025. https://arxiv.org/abs/2410.10878

Gao, G., Wang, Y., Jiang, J. · 2025 · ICLR 2025 – Proceedings of the 13th International Conference on Learning Representations ★★★★★ 3/10
Herald is a large annotated dataset framework generated from Mathlib4 with 580,000 valid Lean 4 statements and 44,000 NL-FL theorem pairs. The Herald Translator achieves 96.7% accuracy (Pass@128) at formalizing statements from miniF2F. Significantly advances a…

Klawa, H., Rajpal, S., & Thomas, C. (2025). Gen AI in proof-based math courses: A pilot study. arXiv:2509.13570. https://arxiv.org/abs/2509.13570

Klawa, H., Rajpal, S., Thomas, C. · 2025 · arXiv preprint ★★★★★ 3/10
Pilot study on student use and perception of generative AI in three undergraduate proof-focused courses (abstract algebra I/II, topology). Students value AI as an explanation tool but doubt its reliability for formal proofs. Provides implications for designing…

Lin, H., Sun, Z., Yang, Y., & Welleck, S. (2025). Lean-STaR: Learning to interleave thinking and proving. In Proceedings of ICLR 2025. https://arxiv.org/abs/2407.10040

Lin, H., Sun, Z., Yang, Y. · 2025 · ICLR 2025 – Proceedings of the 13th International Conference on Learning Representations ★★★★★ 3/10
Lean-STaR trains language models to generate informal thinking steps before each formal proof step in Lean. Achieves SOTA on miniF2F (46.3% Pass@64), demonstrating how informal mathematical intuition can improve formal proof generation at undergraduate level. …

Tran Minh, F., Gonnord, L., Narboux, J., et al. (2025). Proof assistants for teaching: A survey. arXiv:2505.13472. https://arxiv.org/abs/2505.13472

Tsoukalas, G., Lee, J., Jennings, J., Xin, J., Ding, M., Jennings, M., Thakur, A., & Chaudhuri, S. (2024). PutnamBench: Evaluating neural theorem-provers on the Putnam Mathematical Competition. In NeurIPS 2024. https://arxiv.org/abs/2407.11214

Tsoukalas, G., Lee, J., Jennings, J. · 2024 · Advances in Neural Information Processing Systems 37 (NeurIPS 2024) ★★★★★ 3/10
PutnamBench is the first multilingual benchmark for neural theorem provers at undergraduate competition level: 1,692 hand-constructed formalizations of 640 Putnam theorems in Lean 4, Isabelle, and Coq. All SOTA systems could only solve a handful of problems, r…

Weng, K., Du, L., Li, S., Lu, W., Sun, H., Liu, H., & Zhang, T. (2025). Autoformalization in the era of large language models: A survey. arXiv:2505.23486. https://arxiv.org/abs/2505.23486

Weng, K., Du, L., Li, S. · 2025 · arXiv preprint ★★★★★ 3/10
Comprehensive survey of current state of autoformalization — automatic translation of informal mathematical texts into formally verifiable representations. Analyzes approaches by mathematical domain and difficulty level. Identifies open problems especially for…

Sala-Sebastià, G., Breda, A., & Font, V. (2025). Characterising computational and geometric thinking in pre-service Early Childhood Education teachers by playing with MatataLab. Education and Information Technologies, 30, 21079–21103. https://doi.org/10.1007/s10639-025-13589-3

Sala-Sebastià, G., Breda, A., Font, V. · 2025 · Education and Information Technologies ★★★★ 8/10
Studie mit 42 angehenden Frühpädagogik-Lehrkräften (Spanien): MatataLab-Roboterprogrammierung aktiviert gleichzeitig Computational Thinking und geometrisches Denken. Drei Phasen: Erkunden, Programmieren, Reflektieren geometrischer Figuren. Verbindet Lehrkräfte…

Miao, F., & Cukurova, M. (2024). AI competency framework for teachers. UNESCO Publishing. https://unesdoc.unesco.org/ark:/48223/pf0000391104

Miao, F., Cukurova, M. · 2024 · UNESCO ★★★★ 7/10
UNESCO-Framework mit 15 Kompetenzen in fünf Dimensionen (inkl. Ethik der KI) für Lehrpersonen im KI-Zeitalter. Gliedert Kompetenzstufen in Erwerb, Vertiefung und Schöpfung. Soll nationale Lehrpläne und Lehramtsausbildung weltweit informieren. August 2024.

Uygun, T. (2025). Facilitating preservice teachers' geometric thinking through AI-assisted blended learning with 3D modeling and augmented reality. Journal of Computer Assisted Learning. https://doi.org/10.1111/jcal.13120

Uygun, T., Şendur, A., Top, B. · 2025 · Education and Information Technologies (Springer), 30, 8373–8411 ★★★★★ 9/10
Five-week intervention combining ChatGPT, Blender (3D modelling), and MyWebAR for interactive exploration of Platonic solids with 15 preservice mathematics teachers. AI-assisted AR significantly facilitated geometric reasoning development, particularly visuali…

Kock, Z.-j., et al. (2025). Engineering students' initial use schemes of ChatGPT as an instrument for mathematical activity. International Journal of Mathematical Education in Science and Technology. https://doi.org/10.1080/0020739X.2025.2460277

Kock, Z.-j., Salinas-Hernandez, U., Pepin, B. · 2025 · Digital Experiences in Mathematics Education ★★★★ 8/10
Ingenieurstudentinnen und -studenten im 1. Semester: ChatGPT hauptsaechlich zur Ueberpruefung von Rechenwegen und Erklaerung von Konzepten genutzt, selten zur eigenstaendigen Problemloesung. Notwendigkeit gezielter paedagogischer Rahmung fuer LLMs in Hochschul…

7. KI-Tools im Überblick

Systematische Übersicht

Eine Übersicht aller relevanten KI-gestützten Werkzeuge für den Geometrieunterricht, geordnet nach Zielgruppe und Einsatzbereich.

ToolAnbieterSchulstufeStärkenSchwächenKosten
GeoGebra AIGeoGebra GmbH (AT)VS–HSKonstruktion, Visualisierung, natürlichsprachlich, DSGVO-nahKI noch in Entwicklungkostenlos
GeoGebra DiscoveryKovács/JKU LinzSEK II–HSAutomatische Beweise, ShowProofExperimentalstatuskostenlos
PhotomathGoogle (seit 2023)SEK I–IIFoto-Erkennung, LösungswegAbhängigkeitsrisiko, kein GeometrieverständnisFreemium
KhanmigoKhan AcademyVS–SEK IISocratic Tutor, kein Direktantworten, adaptivenglischsprachig€0–44/Jahr
Wolfram AlphaWolfram ResearchSEK II–HSCAS, symbolisch, präzise, kein HalluzinierenBedienungseinstiegFreemium
ChatGPT / GPT-4oOpenAIallenatürlichsprachlich, erklärthalluziniert, Geometrie schwächster BereichFreemium
ClaudeAnthropicalleErklärungen, Texte, CodehalluziniertFreemium
GeminiGoogle DeepMindallemultimodal, Google-IntegrationhalluziniertFreemium
DesmosDesmos/AmplifySEK I–IIFunktionen, Koordinatengeometriewenig elementare Geometrie, kein eigener KI-Tutorkostenlos
SymbolabEduTech/CheggSEK II–HSsymbolisch, viele Lösungswegekostenpflichtig für DetailsFreemium
MathPixMathPix Inc.SEK II–HSLaTeX aus Fotos, Formelerkennungauf Formeln beschränktFreemium
Lean 4 / MathlibCommunity/MicrosoftHSformale, verifizierte Beweisesteile Lernkurvekostenlos
ARGeoITSForschungsprototypSEK IAR + adaptives ITS für Geometrienicht kommerziell verfügbar
TongGeometryBIGAI/Peking Univ. (CN)Olympiadbeweist + generiert olymp. AufgabenForschungssystem
Squirrel AIYixue Group (CN)VS–HSvollständig adaptiv, Wissensgraph24 Mio. Schüler:innenkostenpflichtig (Lernzentren)
LearnLMGoogle DeepMindVS–HSpädagogisch feinabgestimmtes LLM, Eedi-Integrationneu, noch begrenzte Verfügbarkeitin Entwicklung

Besondere Betrachtung: GeoGebra

GeoGebra nimmt eine Sonderstellung ein: Als österreichisches Produkt (entwickelt von Markus Hohenwarter, ab 2001 an der Universität Salzburg) ist es in österreichischen und deutschen Schulen tief verankert, kostenlos, mehrsprachig und wird aktiv weiterentwickelt.

GeoGebra-Ökosystem 2024:

GeoGebra-gestützter kollaborativer Unterricht erzielt signifikant stärkeres konzeptuelles Geometrieverständnis als traditioneller Unterricht — belegt durch mehrere Quasi-Experimente auf Sekundarstufen-Niveau (Gurmu et al., 2024; Uwurukundo et al., 2024). GeoGebra ist auch die Basis für KI-resistente dynamische Assessments: Zufallsgenerierte GeoGebra-Applets in Moodle bieten ein Format, das KI-Systeme nicht trivial lösen können (Csiba & Vajo, 2024; Hamady et al., 2024).

Eine aktuelle Drei-Ebenen-Meta-Analyse (Ji, Guo & Song, 2024, Journal of Educational Computing Research, 107 Studien, N=10.507, 138 Effektgrößen) ermittelt für dynamische Mathematiksoftware — darunter GeoGebra — einen moderaten Gesamteffekt von d = 0,63 (95 %-KI [0,55–0,71]). Moderatoranalysen zeigen: Konzeptuelles Verständnis profitiert stärker als prozedurale Fertigkeiten; Interventionen mit höherem Schüler:innen-Autonomiegrad erzielen größere Effekte. Für Lehrkräfte bedeutet das konkret: Offene, explorative GeoGebra-Szenarien sind effektiver als geführte Schritt-für-Schritt-Demos.

GeoGebra und ChatGPT: Komplementäre Systeme

Die Studie von Botana et al. (2024, MDPI Computers) untersuchte systematisch, welche Geometrieprobleme GeoGebra Discovery und ChatGPT korrekt lösen. Ergebnis: GeoGebra beweist alle getesteten elementar-euklidischen Sätze korrekt; ChatGPT scheitert in mindestens einem Fall. Der Lösungsvorschlag: ChatGPT für Zugänglichkeit (natürlichsprachliche Eingabe, Erklärungen) + GeoGebra für Zuverlässigkeit (zertifizierte, symbolische Beweise).

Eine zweite Studie derselben Arbeitsgruppe zeigt noch deutlichere Grenzen: Botana und Recio (2024, Computation) testen ChatGPT 3.5 systematisch bei geometrischen Ortskurvenaufgaben — mit einer klaren Warnung: „Caveat Emptor!" ChatGPT scheitert in den meisten Fällen, GeoGebra löst zuverlässig. Für präzise geometrische Berechnungen (Ortskurven, Einhüllende) ist ChatGPT kein geeignetes Werkzeug.

Eine Educational-Design-Research-Studie von Yunianto et al. (2024) aus der Forschungsgruppe von Zsolt Lavicza (JKU Linz) zeigt: ChatGPT hat erhebliche Limitationen bei der Generierung korrekter GeoGebra-Syntax für Geometrieaufgaben. Das eröffnet jedoch unerwartete didaktische Chancen: Schüler:innen, die KI-Fehler in GeoGebra-Befehlen debuggen müssen, entwickeln dabei Computational-Thinking-Kompetenzen. Die Fehlerhaftigkeit der KI wird zum Lerngegenstand.

Diese Arbeitsteilung ist ein Modell für die Schule: Schüler:innen kommunizieren auf natürliche Weise, erhalten aber am Ende verifizierte, nicht-halluzinierte Ergebnisse.

LLMs im Vergleich: Stärken und Grenzen bei Geometrie

LLMs sind sprachlich ausgezeichnet — bei geometrischen Aufgaben jedoch systematisch schwächer als in anderen Bereichen. Empirische Befunde:

Konsequenz: LLMs sollten für Geometrieunterricht immer mit einem präzisen, zuverlässigen Werkzeug kombiniert werden — GeoGebra Discovery oder Wolfram Alpha als Verifikatoren.

Verifikationsbasierte Ansätze (aktueller Forschungsstand): GeoCoder (Sharma et al., 2025, NAACL) zeigt, dass Vision-Language-Modelle, die ausführbaren Code aus einer vordefinierten Geometriefunktionsbibliothek generieren statt Freitext, die Fehlerrate drastisch senken — weil die Antwort symbolisch ausgeführt und verifiziert wird, bevor sie ausgegeben wird. Dieser Ansatz — LLM als Schnittstelle, formales System als Verifikator — ist die Richtung, in die sich Geometrie-KI-Tools entwickeln werden.

Khan Academy und Khanmigo: Sokratisches Tutoring im Maßstab

Khan Academy ist eine der am weitesten verbreiteten kostenlosen Lernplattformen weltweit. Der KI-Tutor Khanmigo (gestartet 2023) implementiert konsequent das Socratic-Tutoring-Prinzip: keine Direktantworten, nur Leitfragen und Scaffolding — der Lernende muss selbst denken. Khanmigo ist 2024/25 bei über 700.000 Lernenden im Einsatz.

Empirische Grundlage: Schüler:innen, die Khan Academy 30+ Minuten pro Woche nutzten, erzielten rund 20 % größere Lernfortschritte als erwartet (Effektgröße 0,36; n ≈ 350.000 Schüler:innen Klassen 3–8; Khan Academy, 2024). Für Geometrie umfasst die Plattform interaktive Einheiten zu allen Sekundarstufen-Inhalten — mit sofortigem, automatisiertem Feedback und adaptiver Aufgabenfolge.

Die Stärke von Khanmigo liegt in der pädagogisch bewussten Beschränkung: Es modelliert guten Unterricht, nicht Direktantworten — empirisch der deutlich wirksamere Ansatz (Bastani et al., 2025). Schwäche für den DACH-Raum: Die Plattform ist hauptsächlich englischsprachig; österreichische Lehrpläne werden nicht abgebildet. Empfehlung: Khanmigo für Erklärungen und sokratischen Dialog, GeoGebra für lehrplankonforme Konstruktionen und Visualisierungen.

öbv × Studyly: KI-Lerncoach für österreichische Schulbücher

Der Österreichische Bundesverlag (öbv) — der wichtigste österreichische Schulbuchverlag — startete ab dem Schuljahr 2025/26 eine Kooperation mit dem Wiener EdTech-Startup Studyly (gegr. 2019): Tausende Aufgaben aus öbv-Mathematikschulbüchern (Das ist Mathematik, Mathematik verstehen, Lösungswege) sind nun direkt in der Studyly-App verfügbar, ergänzt durch einen KI-Lerncoach (öbv & Studyly, 2025).

Technisch handelt es sich um regelbasierte KI (nicht generative LLMs) — entwickelt gemeinsam von Mathematiker:innen, Fachdidaktiker:innen und KI-Expert:innen. Das System diagnostiziert automatisch Wissenslücken, weist individualisierte Aufgaben zu und erklärt Fehler schrittweise. DSGVO-konform, EU-Server, kein Halluzinationsrisiko — Preis: €14,90/Jahr.

Bedeutung für österreichische Lehrende: 80 % der Mittelschul- und 55 % der AHS-Lehrenden kombinieren bereits Schulbücher mit digitalen Lern-Apps in Mathematik. Der KI-Lerncoach schließt die Lücke zwischen vertrautem Lehrmittel und personalisierter Übung — ohne Sprachbarriere und direkt am österreichischen Lehrplan orientiert.

Squirrel AI: Vollständig adaptives Lernen im großen Maßstab

Das chinesische System Squirrel AI (Yixue Group) ist das am stärksten skalierte adaptive KI-Tutoring-System der Welt: 24 Millionen Schüler:innen in über 2.000 Lernzentren in China. Squirrel AI basiert auf einem Wissensgraphen mit tausenden feinkörniger Wissensknoten pro Fach — differenzierter als jedes bisher eingesetzte adaptive System. Das System passt nicht nur Schwierigkeitsgrad, sondern den gesamten Lernpfad in Echtzeit an.

Für Österreich ist Squirrel AI als kostenpflichtiges, chinesisches System nicht direkt verfügbar — es illustriert jedoch, wohin die Entwicklung adaptiver Systeme geht: Tief granulare Wissensmodellierung, KI-gesteuerter individueller Pfad und Echtzeit-Feedback werden zum Maßstab für die nächste Generation von Bildungstechnologie.

Photomath: Tool, Marktentwicklung und Unterrichtsgegenstand

Photomath wurde 2014 in Kroatien gegründet und 2023 von Google für geschätzte 550 Mio. USD übernommen (Google/Photomath, 2023) — der Markteintritt von Big Tech in Mathematiksoftware. Mit 350 Millionen Downloads ist es eine der am weitesten verbreiteten Bildungs-Apps weltweit. Für den Geometrieunterricht hat Photomath ambivalente Wirkung:

Als Unterrichtsgegenstand — nicht nur als Tool — bietet sich Photomath an: Schüler:innen untersuchen, wo und warum das System fehlt, und entwickeln dadurch tieferes geometrisches Verständnis.

Literatur (Tools)

Botana, F., & Recio, T. (2024). Geometric loci and ChatGPT: Caveat emptor! Computation, 12(2), 30. https://doi.org/10.3390/computation12020030

Botana, F., Recio, T. · 2024 · Computation, 12(2), 30 ★★★★★ 10/10
Systematischer Benchmark von ChatGPT 3.5 vs. GeoGebra 5 bei geometrischen Ortskurvenaufgaben (Einhüllende ebener Kurvenfamilien). Ergebnis: ChatGPT scheitert in den meisten Fällen; GeoGebra löst zuverlässig. Warnung ('Caveat Emptor!') an Lehrende, die ChatGPT …

Botana, F., Recio, T., & Vélez, M. P. (2024). On using GeoGebra and ChatGPT for geometric discovery. Computers, 13(8), 187. https://doi.org/10.3390/computers13080187

Botana, F., Recio, T. · 2024 · Computation, 12(2), 30 ★★★★★ 10/10
Systematischer Benchmark von ChatGPT 3.5 vs. GeoGebra 5 bei geometrischen Ortskurvenaufgaben (Einhüllende ebener Kurvenfamilien). Ergebnis: ChatGPT scheitert in den meisten Fällen; GeoGebra löst zuverlässig. Warnung ('Caveat Emptor!') an Lehrende, die ChatGPT …

Google/Photomath. (2023). Photomath. https://en.wikipedia.org/wiki/Photomath

Österreichischer Bundesverlag [öbv], & Studyly GmbH. (2025, 9. September). Individuelles Mathe-Lernen: Schulbuch plus KI-Lerncoach [Pressemitteilung]. https://presse.grayling.at/news-individuelles-mathe-lernen-schulbuch-plus-ki-lerncoach?id=222376

Kovács, Z., Recio, T., & Vélez, M. P. (2024). Showing proofs, assessing difficulty with GeoGebra Discovery. EPTCS – Automated Deduction in Geometry, 398, Paper 8. https://doi.org/10.4204/EPTCS.398.8

Kovács, Z., Recio, T., Vélez, M.P. · 2024 · arXiv / GeoGebra Discovery Research ★★★★★ 9/10
GeoGebra Discovery erweitert GeoGebra um automatisierte Beweisführung: Der ShowProof-Befehl zeigt Schritt-für-Schritt-Beweissequenzen für geometrische Aussagen; ein Schwierigkeitswert bewertet den 'Überraschungsgrad' eines Satzes relativ zu seinen Voraussetzun…

Kovács, Z., & Peng, X. (2025). Automated proving in planar geometry based on the complex number identity method and elimination. arXiv:2511.14728. https://doi.org/10.48550/arXiv.2511.14728

Kovács, Z., Peng, X. · 2025 · arXiv preprint ★★★★★ 3/10
Develops the complex number identity method into a fully automated proof procedure, implemented in Mathematica, Maple, Giac and as prototype in GeoGebra. November 2025 arXiv preprint.

Sicca, V., Xia, T., Fédérico, M., Gorinski, P. J., Frieder, S., & Jui, S. (2024). Newclid: A user-friendly replacement for AlphaGeometry. arXiv:2411.11938. https://doi.org/10.48550/arXiv.2411.11938

Sicca, V., Xia, T., Fédérico, M. · 2024 · arXiv preprint ★★★★★ 3/10
Newclid replaces AlphaGeometry's symbolic solver with a modularized, extensible open-source implementation (DDARN) with GeoGebra input support, extending to metric geometry. arXiv preprint, November 2024.

Lu, P., Bansal, H., Xia, T., Liu, J., Li, C., Hajishirzi, H., Cheng, H., Chang, K.-W., Galley, M., & Gao, J. (2024). MathVista: Evaluating mathematical reasoning of foundation models in visual contexts. ICLR 2024. https://doi.org/10.48550/arXiv.2310.02255

Lu, P., Bansal, H., Xia, T. · 2024 · ICLR 2024 (Oral, top 1.2% aller Einreichungen) ★★★★★ 10/10
Visuelles Mathematik-Benchmark mit 6.141 Beispielen. GPT-4V erreicht 49,9% Gesamtgenauigkeit — 10,4 Prozentpunkte unter menschlicher Leistung (60,3%). Für Geometrieaufgaben: GPT-4V 58,5%, Bard 43,4%. Modelle 'kämpfen oft darum, komplexe Figuren zu verstehen un…

Wang, K., Pan, J., Shi, W., Lu, Z., Ren, H., Zhou, A., Zhan, M., & Li, H. (2024). Measuring multimodal mathematical reasoning with the MATH-Vision dataset. NeurIPS 2024. https://github.com/mathllm/MATH-V

Wang, X., Chan, K. K., Li, Q. · 2024 · Journal of Educational Computing Research (SAGE) ★★★★★ 9/10
Meta-analysis of 17 empirical studies (n=1,665 children ages 3-8). CT interventions show statistically significant large effect size (d=0.83) on young children's development. Geometry and spatial skills are among the most commonly addressed mathematical domain…

Wardat, Y., Tashtoush, M. A., AlAli, R., & Jarrah, A. M. (2023). ChatGPT: A revolutionary tool for teaching and learning mathematics. Eurasia Journal of Mathematics, Science and Technology Education, 19(7), em2286. https://doi.org/10.29333/ejmste/13272

Wardat, Y., Tashtoush, M.A., AlAli, R. · 2023 · Eurasia Journal of Mathematics, Science and Technology Education, 19(7), em2286 ★★★★ 8/10
Qualitative Fallstudie durch Inhaltsanalyse von Interviews und Social-Media-Diskursen zu ChatGPT im Mathematikunterricht. Befund: ChatGPT ist effektiv für grundlegende Mathematik, hat aber explizit 'kein tiefes Verständnis von Geometrie und kann Fehlvorstellun…

Wei, X. (2024). Evaluating ChatGPT-4 and ChatGPT-4o. Frontiers in Education, 9, 1452570. https://doi.org/10.3389/feduc.2024.1452570

Wei, X. · 2024 · Frontiers in Education, 9, 1452570 ★★★★★ 10/10
Evaluation von GPT-4 und GPT-4o auf NAEP-Mathematikaufgaben (4., 8., 12. Klasse): Geometrie/Messung ist der schwächste Inhaltsbereich — GPT-4: 53%, GPT-4o: 59% (vs. 79%/92% in Algebra). Räumliches Denken und visuelle Informationsverarbeitung als fundamentale B…

Zhang, R., Jiang, D., Zhang, Y., Lin, H., Guo, Z., Qiu, P., Zhou, A., Lu, P., Chang, K.-W., Gao, P., & Li, H. (2024). MathVerse: Does your multi-modal LLM truly see the diagrams in visual math problems? In Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186). Springer. https://doi.org/10.1007/978-3-031-73242-3_10

Zhang, R., Jiang, D., Zhang, Y. · 2024 · Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186) ★★★★★ 10/10
2.612-Problem-Datensatz (ebene Geometrie, Körpergeometrie, Funktionen) in 6 Varianten (mit/ohne Diagramm). Zentrale Entdeckung: 'Die meisten MLLMs verstehen Mathematikdiagramme nicht — sie verlassen sich auf den Textanteil der Aufgabe.' Einige Modelle erzielte…

Sharma, A., Dalmia, A., Kazemi, M., Zouaq, A., & Pal, C. (2025). GeoCoder: Solving geometry problems by generating modular code through vision-language models. In Findings of NAACL 2025 (pp. 7340–7356). https://doi.org/10.18653/v1/2025.findings-naacl.410

Sharma, A., Dalmia, A., Kazemi, M. · 2025 · Findings of the Association for Computational Linguistics: NAACL 2025 (pp. 7340–7356) ★★★★★ 9/10
GeoCoder lässt Vision-Language-Modelle modularen, ausführbaren Code aus einer vordefinierten Geometriefunktionsbibliothek generieren — statt freie Textlösungen. RAG-GeoCoder (retrieval-augmented) verbessert die Leistung auf GeoQA und Geometry3K deutlich. Zeigt…

Feng, T. H., Denny, P., Wünsche, B. C., Luxton-Reilly, A., & Whalley, J. (2024). An eye for an AI: Evaluating GPT-4o's visual perception and geometric reasoning skills. SIGGRAPH Asia 2024 Educator's Forum (ACM). https://doi.org/10.1145/3680533.3697064

Feng, T. H., Denny, P., Wünsche, B. C. · 2024 · SIGGRAPH Asia 2024 Educator's Forum (ACM) ★★★★★ 9/10
Evaluation of GPT-4o on computer graphics and geometry questions with varying visual demands. GPT-4o performs significantly better on text-only than image-containing questions. Fails at precise geometric operations (e.g., cannot correctly reason about a sliced…

Yunianto, W., Lavicza, Z., Kastner-Hauler, O., & Houghton, T. (2024). Investigating the use of ChatGPT to solve a GeoGebra-based mathematics + computational thinking task in a geometry topic. Journal on Mathematics Education, 15(3), 1027–1052. https://doi.org/10.22342/jme.v15i3.pp1027-1052

Yunianto, W., Lavicza, Z., Kastner-Hauler, O. · 2024 · Journal on Mathematics Education, 15(3), 1027–1052 ★★★★★ 10/10
Educational Design Research-Studie (5 Erwachsene, 16 Junior-High-Schüler:innen): Kann ChatGPT korrekte GeoGebra-Befehle für geometrische Aufgaben mit Computational Thinking generieren? Befund: ChatGPT hat erhebliche Limitationen bei der Generierung korrekter G…

Csiba, P., & Vajo, P. (2024). Problems and challenges of using randomized automatically evaluating geometric construction problems in Moodle LMS. AIMS Mathematics, 9(3), 5234–5249. https://doi.org/10.3934/math.2024253

Csiba, P., Vajo, P. · 2024 · AIMS Mathematics, Vol. 9(3), pp. 5234–5249 ★★★★ 8/10
Untersucht das Fehlen geometrischer Konstruktionsaufgaben in nationalen und internationalen Mathematiküberprüfungen und schlägt GeoGebra-basierte, automatisch bewertete Applets als Lösung vor. Direkt relevant für KI-resistentes Assessment-Design und LMS-Integr…

Hamady, S., Mershad, K., & Jabakhanji, B. (2024). Multi-version interactive assessment through the integration of GeoGebra with Moodle. Frontiers in Education, 9, 1466128. https://doi.org/10.3389/feduc.2024.1466128

Hamady, S., Mershad, K., Jabakhanji, B. · 2024 · Frontiers in Education ★★★★★ 10/10
Untersuchung der Integration von GeoGebra in Moodle für interaktive, KI-resistente Assessments. Zeigt wie dynamische Geometrie-Inhalte die Testintegrität verbessern und gleichzeitig tieferes Lernen fördern. Relevant für Kapitel 07 und die Prüfungsintegritätsdi…

Gurmu, F., Tuge, C., & Hunde, A. B. (2024). Effects of GeoGebra-assisted instructional methods on students' conceptual understanding of geometry. Cogent Education. https://doi.org/10.1080/2331186X.2024.2379745

Gurmu, F., Tuge, C., Hunde, A. B. · 2024 · Cogent Education (Taylor & Francis) ★★★★★ 9/10
Quasi-experimentelle Studie an drei Schulen in Äthiopien (Klasse 10, GeoGebra+kollaborativ vs. GeoGebra+konventionell vs. konventionell). Ergebnis: GeoGebra kombiniert mit kollaborativem Unterricht erzielt signifikant besseres konzeptuelles Geometrieverständni…

Uwurukundo, M. S., Maniraho, J. F., Tusiime, M., Ndayambaje, I., & Mutarutinya, V. (2024). GeoGebra software in teaching and learning geometry of 3-dimension to improve students' performance and attitude. Education and Information Technologies, 29(8), 10201–10223. https://doi.org/10.1007/s10639-023-12200-x

Uwurukundo, M. S., Maniraho, J. F., Tusiime, M. · 2024 · Education and Information Technologies, Vol. 29(8), pp. 10201–10223 ★★★★ 8/10
Quasi-experimentelle Studie (n=84 Schüler:innen, Rwanda): GeoGebra-unterstützter Unterricht in 3D-Geometrie führte zu signifikant besserer Leistung und positiveren Einstellungen gegenüber Kontrollgruppe mit traditionellem Unterricht.

Ji, Z., Guo, K., & Song, S. (2024). Effects of dynamic mathematical software on students' performance: A three-level meta-analysis. Journal of Educational Computing Research, 62(4), 1035–1060. https://doi.org/10.1177/07356331241226594

Ji, Z., Guo, K., Song, S. · 2024 · Journal of Educational Computing Research ★★★★ 8/10
Drei-Ebenen-Meta-Analyse von 107 Studien (N=10.507, 138 Effektgrößen): Dynamische Mathematiksoftware (inkl. GeoGebra) erzielt moderaten Gesamteffekt d=0,63. Moderatoren: kultureller Hintergrund, Testnähe, Autonomiegrad, Interventionsdauer. Stärkste Effekte bei…

8. Didaktische Konzepte und Chancen

KI als Lernpartner — nicht als Lösungsmaschine

Der entscheidende didaktische Rahmen: KI-Systeme sollen den Lernprozess unterstützen, nicht ersetzen. Drei Modelle haben sich in der Literatur als besonders wirkungsvoll erwiesen (Walkington, 2025; Buchholtz et al., 2024):

1. KI als Tutor (Socratic Tutoring)

Das KI-System stellt Fragen, gibt Hinweise und führt den Lernenden durch einen Denkprozess, ohne die Lösung vorwegzunehmen. Khanmigo (Khan Academy) implementiert dieses Modell explizit: Die KI gibt keine Direktantworten, sondern modelliert sokratische Gesprächsführung (Khan Academy, 2024).

Der entscheidende Befund aus dem Feld: KI-Tutoren mit Guardrails — also mit eingeschränktem Direktantworten — erzielen deutlich bessere Lerneffekte als uneingeschränkte Systeme. In einem Feldexperiment mit ~1.000 Oberschüler:innen verbesserte ein geführter GPT-Tutor die Übungsleistung um 127 %, ein uneingeschränkter GPT um nur 48 % (Bastani et al., 2025). Dieser Befund ist einer der empirisch am stärksten gesicherten in der aktuellen KI-Bildungsforschung.

2. KI als Werkzeug (Cognitive Tool)

Schüler:innen nutzen KI gezielt für Teilaufgaben (Berechnung, Visualisierung, Überprüfung), behalten aber die mathematische Verantwortung. GeoGebra AI und Wolfram Alpha folgen diesem Modell: Sie unterstützen spezifische Operationen, ohne die Konzeptarbeit abzunehmen (Walkington, 2025). Die Kombination beider Systeme — GeoGebra für zertifizierte Beweise, ChatGPT für Erklärungen — ist besonders produktiv (Botana et al., 2024).

3. KI als Lerngegenstand (Object of Study)

Schüler:innen untersuchen, wie KI geometrische Probleme löst oder scheitert. Kritisches Denken über KI als Bildungsziel. Besonders relevant in der Sekundarstufe II und im Hochschulbereich: Durch das Analysieren von KI-Fehlern (Halluzinationen, falsche Beweise) vertiefen Schüler:innen ihr eigenes geometrisches Verständnis. Die GDM fordert dies explizit als prioritären Forschungsbereich (Buchholtz et al., 2024).

Adaptive Differenzierung und Intelligente Tutorsysteme

KI ermöglicht personalisierte Lernpfade auf einem bislang nicht erreichbaren Maßstab. Die bislang umfassendste Zusammenfassung der Evidenz: Eine Meta-Analyse von 22 empirischen Studien (N = 5.232) belegt, dass Generative KI im Mathematikunterricht im Median eine Effektgröße von Hedges' g = 0,534 erzielt (Liu et al., 2026). Der bereichsspezifische Geometrieeffekt ist mit g = 0,906 der größte aller untersuchten mathematischen Inhaltsbereiche — größer als für Zahl & Algebra (g = 0,784). Am stärksten wirken kollaborative Formate und „Creative Transformation"-Integration. Eine parallel durchgeführte Meta-Analyse zu KI-gestützter personalisierter STEM-Bildung (32 RCT-Studien, 99 Effektgrößen) bestätigt: AR/VR-Ansätze zeigen die stärksten Effekte; Hybridformate (KI + Präsenzunterricht) übertreffen rein digitale Ansätze konsequent (Li et al., 2025).

Ein PRISMA-basiertes systematisches Review von Hariyanto, Kristianingsih und Maharani (2025, Discover Education, Springer Nature) über 142 Studien aus Scopus, WoS und IEEE (2015–2025) bestätigt: Geometrie und Mathematik sind die häufigsten Anwendungsdomänen in der KI-gestützten adaptiven Bildungsforschung. Die Technologielandschaft reicht von Knowledge Tracing und Bayesian Networks über Reinforcement Learning bis zu aktuellen LLM-Architekturen — mit konvergierenden Hinweisen auf positive Lerneffekte, wenn das System den Fehlertyp des Lernenden korrekt modelliert. Ein paralleles Review zu KI-gestützten adaptiven Lernplattformen (CAAI, Elsevier, 2025) über 25 Scopus-Studien zeigt besonders starke Effekte für AR/VR in geometrischen Inhaltsbereichen: In einer Fallstudie stieg die Bestehensquote von 68 % auf 85 % nach VR/AR-Implementierung (S174).

Auch für Generative KI speziell belegen Meta-Analysen robuste Effekte: Ma et al. (2025, JCAL) synthetisierten 34 experimentelle/quasi-experimentelle Studien und fanden Hedges' g = 0,68 — mit besonders starken kognitiven (g = 0,795) und kompetenzbezogenen Effekten (g = 0,711). Mathematik und Naturwissenschaften profitieren am stärksten von GenAI. Ein DACH-relevanter Beitrag von Fock und Siller (2025, International Journal of STEM Education, Universität Würzburg) in einem Scoping Review über 183 Publikationen zu GenAI in der Sekundarstufe STEM identifiziert Geometrie explizit als Schwachstelle aktueller Systeme: Räumliches Schlussfolgern und geometrisches Problemlösen — wo starke Visualisierungskompetenz erforderlich ist — bleiben trotz Fortschritten unterentwickelt. Das Review empfiehlt, Bildungsziele über kognitive Aspekte hinaus zu erweitern.

Eine breitere Meta-Analyse von 51 Studien (November 2022 – Februar 2025) zu ChatGPT speziell im Bildungskontext bestätigt starke positive Effekte: Lernleistung g = 0,867, Lernwahrnehmung g = 0,456, höherstufiges Denken g = 0,457 (Wang & Fan, 2025). Diese Effektgröße für Lernleistung übertrifft klassische Tutoring-Interventionen und unterstreicht das Potenzial für den Geometrieunterricht — sofern die bekannten Abhängigkeitsrisiken durch pädagogisches Design mitigiert werden.

In einem weiteren RCT mit 165 Schüler:innen in UK-Sekundarschulen konnte Googles LearnLM (ein pädagogisch feinabgestimmtes LLM) in Eedi-Mathematik-Tutoring integriert werden: Schüler:innen mit LearnLM-Unterstützung waren 5,5 Prozentpunkte häufiger in der Lage, neuartige Mathematikprobleme zu lösen als die Kontrollgruppe (66,2 % vs. 60,7 %; Huber et al., 2024).

Im Geometrieunterricht konkret:

Metakognitive Lernstrategien gehören zu den empirisch wirksamsten Faktoren für Mathematikleistung: Eine PRISMA-konforme Meta-Analyse über 43 Studien (N = 13.924) zeigt, dass metakognitive Instruktion einen Effekt von ES = 1,11 auf Mathematikleistung erzielt — einer der stärksten Effekte in der Bildungsforschung überhaupt (Hidayat, Saad & Wewe, 2025, Cogent Education). Eine bibliometrisch-systematische Überblicksarbeit (Tsakeni, Nwafor, Mosia & Egara, 2025, Journal of Intelligence) über 135 Studien (2005–2025) zeigt, dass KI-Werkzeuge zunehmend als Ko-Regulatoren von Metakognition positioniert werden — also nicht nur als Reaktion auf Schüleraktionen, sondern als aktive Steuerung des Selbstregulationsprozesses. Für den Geometrieunterricht bedeutet das: Wenn ein ITS nicht nur die falsche Konstruktion meldet, sondern auch nachfragt, warum Schüler:innen so vorgegangen sind, unterstützt es metakognitives Denken — eine der wirksamsten Lernstrategien überhaupt.

Das aktuellste systematische Review zu Intelligenten Tutorsystemen (ITS) in der K-12-Bildung (Letourneau et al., 2025, npj Science of Learning) analysierte 28 Studien mit insgesamt 4.597 Schüler:innen und bestätigt: ITS zeigen konsistent positive Lerneffekte, auch in geometrischen Inhaltsbereichen. Besonders beachtenswert: Long und Aleven untersuchten in einem RCT den Cognitive Tutor Geometry mit n=95 Schüler:innen — ein Vorläufer, der zeigt, dass adaptive Geometrie-ITS bereits vor der KI-Ära wirkten. Die neue Generation (GeoGebra AI, ARGeoITS) geht weit darüber hinaus.

Tutor CoPilot: KI-Unterstützung für menschliche Tutoren

Ein innovativer Ansatz zeigt, dass KI nicht nur direkt mit Schüler:innen, sondern auch Lehrende unterstützen kann: Tutor CoPilot (Stanford University) ist ein KI-Assistent, der Tutor:innen in Echtzeit Vorschläge macht, wie ein Experte denken und reagieren würde. In einem RCT mit 700+ Tutor:innen und 1.000+ K-12-Schüler:innen aus einkommensschwachen Regionen waren Schüler:innen von Tutor CoPilot-nutzenden Tutor:innen 4 Prozentpunkte häufiger mathematisch erfolgreich (p < 0,01); bei Schüler:innen von schwächeren Tutor:innen waren es +9 Prozentpunkte (Wang et al., 2024). Kosten: ca. 20 USD/Tutor/Jahr.

Formative Beurteilung mit KI

Formative Beurteilung — laufendes Feedback während des Lernprozesses, nicht erst am Ende — ist einer der empirisch wirksamsten Faktoren für Lernerfolg. KI ermöglicht erstmals, formatives Feedback in Echtzeit, personalisiert und skalierbar zu gestalten. Eine systematische Überblicksarbeit zu formativem Assessment im Mathematikunterricht (Maskos et al., 2025, ZDM) zeigt: Digitale und KI-gestützte Rückmeldungen sind am wirksamsten, wenn sie prozessorientiert (nicht nur Ergebnisorientiert) und adaptiv gestaltet werden — das heißt, auf den individuellen Fehlertyp eingehen.

Für den Geometrieunterricht ergeben sich drei konkrete Einsatzszenarien:

Echtzeit-Diagnose: GeoGebra AI und Khanmigo analysieren Konstruktionsschritte laufend und geben unmittelbares Feedback — nicht nur ob ein Ergebnis korrekt ist, sondern wo im Prozess ein Denkfehler entstand. Dieses prozessorientierte Feedback ist in Präsenzklassen mit 25+ Schüler:innen kaum realisierbar.

Fehler-basiertes Scaffolding: KI-Systeme können Fehlertypen in geometrischen Konstruktionen (z. B. Verwechslung von Winkelhalbierende und Mittelsenkrechter) automatisch klassifizieren und gezielte Korrekturaufgaben vorschlagen — ein Ansatz, den Khlaif et al. (2025) in ihrem Vier-Phasen-Modell als „Adopt"-Phase beschreiben. Wie KI-gestütztes Scaffolding konkret in einem GeoGebra-basierten Geometriekontext aussieht, zeigt eine qualitative Studie mit Lehramtsstudierenden der Sekundarstufe (Nalbantoglu Yilmaz et al., 2025, CERME): ChatGPT unterstützte kooperatives Problemlösen durch Orientierung, sokratische Fragetechniken und kognitive Herausforderungen — entsprechend klassischen Scaffolding-Komponenten. Gleichzeitig beobachteten die Autorinnen eine Tendenz zur Abhängigkeit von fertigen Antworten, sobald Schüler:innen unter Zeitdruck gerieten. Der Befund unterstreicht: KI-Scaffolding in Geometrie ist nur dann lernwirksam, wenn Lehrkräfte aktiv steuern, wann und wie die KI hinzugezogen wird.

Multimodales KI-Feedback und kognitive Belastung: Cosentino et al. (2025, British Journal of Educational Technology) untersuchten in einem Labor-Setting, wie generative KI formatives Feedback im Mathematikunterricht bereitstellt — bei körperbasiertem Lernen mit einer Zahlengerade. Eye-Tracking und Systemlogs maßen kognitive Belastung und Informationsverarbeitung. Der Befund ist didaktisch bedeutsam: KI-generiertes Feedback erzielte vergleichbare Aufgabenleistungen wie Lehrendenfeedback, aber bei signifikant niedrigerer kognitiver Belastung. Das Ergebnis legt nahe, dass KI-Feedback nicht nur skalierbar, sondern für Lernende kognitiv schonender sein kann — ein Argument für den ergänzenden Einsatz in leistungsheterogenen Geometrieklassen.

Prozessdokumentation: Schüler:innen kommentieren ihre eigenen Lösungswege in Textform — diese Texte werden von LLMs analysiert und Lücken im konzeptuellen Verständnis identifiziert. Das Format ist gleichzeitig KI-resistent (da individuelle Formulierungen erwartet werden) und formativ wirkungsvoll.

Augmented Reality und verkörpertes Geometrielernen

Ein emerging research area zeigt, dass AR nicht nur Visualisierung, sondern neue Formen verkörperter Interaktion mit Geometrie ermöglicht. Walkington et al. (2024, Journal of Mathematical Behavior) dokumentierten mit 28 Oberstufenschüler:innen, die eine AR-Version von GeoGebra auf der Microsoft HoloLens 2 nutzten, qualitativ neue Interaktionsmuster: Schüler:innen wechselten ihre körperliche Perspektive, skalierten Objekte durch Gesten und erkundeten Dreidimensionalität durch Bewegung im Raum. Diese Interaktionsformen sind in klassischer DGS nicht möglich — sie eröffnen neue kognitive Zugänge zu geometrischen Konzepten wie Symmetrie, Kongruenz und räumlicher Lage. Die Befunde liefern konkrete Design-Implikationen für die nächste Generation dynamischer Geometriesoftware.

Computational Thinking und geometrisches Denken

Die Verknüpfung von Computational Thinking (algorithmisches Denken, Dekomposition, Abstraktion, Mustererkennung) mit Geometrieunterricht ist ein wachsendes Forschungsfeld. Yunianto et al. (2024, 2025) kombinieren GeoGebra-Konstruktionsaufgaben mit ChatGPT-gestützten Reflexionsphasen — und dokumentieren in einem vollständigen EDR-Modell, dass das Debuggen fehlerhafter KI-Syntax Computational Thinking systematisch fördert.

Für den Geometrieunterricht bedeutet das: Nicht nur Dreiecke konstruieren lassen, sondern den Algorithmus beschreiben, den man dabei verwendet. Scratch als Programmierumgebung für Geometrie zeigt hier: Fünftklässler:innen, die Geometrie durch Programmieren erlernten, zeigten bessere Lernprozesse und höhere Motivation (Molina-Ayuso et al., 2024).

Lehrkräfterolle im KI-Zeitalter

Eine der wichtigsten Erkenntnisse der Forschung: Lehrkräftequalität bleibt entscheidend. Bardach et al. (2026, Journal of Computer Assisted Learning) stellen nach einer Analyse von Engagementverläufen in ITS-Lernumgebungen klar: Intelligente Tutorsysteme brauchen Lehrende. Ohne aktive Lehrkraftbegleitung sinkt das Schülerengagement bei ITS-gestützten Systemen signifikant — unabhängig von der technologischen Qualität des Systems. Der Befund ist didaktisch grundlegend: ITS sind kein Ersatz für Lehrende, sondern ein Werkzeug, das Lehrende gezielt einsetzen, moderieren und einbetten müssen. Die negativen Effekte uneingeschränkter KI-Nutzung (Abhängigkeit, Leistungsabfall bei Prüfungen ohne KI) werden durch Lehrkräftebegleitung signifikant reduziert (Bastani et al., 2025). Lehrende übernehmen im KI-Zeitalter neue Rollen:

Die Adoption von KI durch Lehrende wird von internen Faktoren (Überzeugungen, Selbstwirksamkeit) und externen Faktoren (institutionelle Unterstützung, Ressourcen) beeinflusst — mit Lehrendeneinstellungen als kritischem internem Mediator (Li, 2024). Busuttil und Calleja (2025) zeigen in einer maltesischen TPACK-Studie, dass Lehrende mit entdeckendem Unterrichtsverständnis ChatGPT deutlich positiver bewerten — und dass geometrische Visualisierungsaufgaben als spezifische Schwachstelle wahrgenommen werden: Hier versagt die KI am häufigsten. Im deutschsprachigen Raum belegt Seibold et al. (2024, GDM) mit 54 Lehramtsstudierenden, dass LLMs als Tutoren ambivalent wahrgenommen werden — bei gleichzeitig systematischen Misskonzeptionen über ihre mathematische Funktionsweise. Die österreichische Virtuelle PH hat mit dem KI-MOOC (Mai 2024) eine erste strukturierte Fortbildungsinfrastruktur geschaffen (BMB, 2024). Im deutschsprachigen Raum ist das KIMADU-Projekt (Universität Siegen, 25 Schulen in NRW, Laufzeit 2025–2027) das bislang größte Forschungsprojekt zu generativer KI im Mathematikunterricht — mit explizitem Geometrie-Beispiel: KI beim Beweis der Winkelsumme im Dreieck (Witzke & Steinhoff, 2025).

Mathe-Angst, Motivation und Gamification

Mathematikangst (engl. math anxiety) ist ein verbreitetes Phänomen, das Lernleistung und Selbstkonzept nachhaltig beeinträchtigt. KI-gestützte Lernumgebungen können hier sowohl positiv als auch negativ wirken.

Reduktion von Mathe-Angst durch KI: Wang und Wei (2025) zeigten in einer quasi-experimentellen Interventionsstudie mit Sechstklässler:innen, dass GenAI-gestütztes Lernen Mathe-Angst im Vergleich zur Kontrollgruppe signifikant reduziert — eine der ersten direkten empirischen Nachweise dieses Effekts (Applied Cognitive Psychology, DOI: 10.1002/acp.70088). Polydoros et al. (2025) erprobten ein 12-wöchiges KI-gestütztes RTI-Programm für leistungsschwache Siebtklässler:innen (N=56): Das adaptive Feedbacksystem reduzierte Mathe-Angst signifikant und verbesserte Problemlöse- und numerische Fähigkeiten (Psychology International, DOI: 10.3390/psycholint7020046). Auch für KI-Integration speziell in der Volksschul-Geometrie bestätigen Polydoros et al. (2025, Scientific Electronic Archives) bei 436 griechischen Drittklässler:innen positive Effekte auf geometrisches Denken und reduzierte Angst.

Abhängigkeitsrisiko bei ängstlichen Lernenden: Demgegenüber steht ein kritischer Befund: Chen, Chen und Xu (2025) zeigen, dass höhere Mathe-Angst die Bereitschaft zur KI-Nutzung steigert — und damit einen Abhängigkeitskreislauf begünstigt. Mathe-Angst moderiert den Zusammenhang zwischen KI-Tutoring und Problemlösefähigkeit negativ (Psychology in the Schools, DOI: 10.1002/pits.23500). Asiedu Menlah und Boateng (2025) bestätigen diesen Moderatoreffekt in einer Querschnittstudie mit 338 Sekundarschüler:innen: KI-Tutorsysteme verbessern Problemlösefähigkeiten direkt, werden aber bei ängstlichen Lernenden in ihrer Wirkung geschwächt (Journal of Pedagogical Sociology and Psychology, DOI: 10.33902/jpsp.202536137).

Emotionale Wirkungen im Unterricht: Omar, Daher und Bayaa (2025) untersuchten mit einem Mixed-Methods-Design (N=92, Klasse 8) die akademischen Emotionen palästinensischer Schüler:innen beim Algebra-Unterricht mit der KI-App CK-12 Flexi. Die KI-Gruppe berichtete signifikant mehr Freude und weniger Angst und Langeweile als die Kontrollgruppe; sechs App-Affordanzen (sofortiges Feedback, adaptive Schwierigkeit, schrittweise Hinweise) wurden als Auslöser identifiziert (Frontiers in Education, DOI: 10.3389/feduc.2025.1669360).

Gamification und Mathematikmotivation: Gamification — der Einsatz spieltypischer Elemente (Punkte, Leaderboards, Badges) in Lernkontexten — zeigt konsistent positive Motivationseffekte im Mathematikunterricht. Ein aktuelles systematisches Review und Meta-Analyse (45 Studien, N=4.345, Sekundarstufe und Hochschule) belegt einen signifikant kleinen bis mittleren Effekt auf Motivation (g=0,38; Wijers et al., 2026, Educational Psychology Review, DOI: 10.1007/s10648-025-10108-1). Digitale Plattformen wie Kahoot! und Classcraft sind die häufigsten Träger; Punkte und Leaderboards dominieren das Spieldesign, werden aber — so ein Befund des parallelen Systematic Literature Review zu Gamification-Design in der Sekundarstufe (2025, International Journal of Mathematical Education in Science and Technology, DOI: 10.1080/0020739X.2025.2555333) — häufig kritisch bewertet, da rein leistungsbasierte Spielelemente nicht zwingend tiefe Lernprozesse fördern. Die didaktische Schlussfolgerung: Gamification-Elemente sollten mit selbstbestimmungstheoretischen Prinzipien (Autonomie, Kompetenz, Eingebundenheit) kombiniert werden.

Bauer et al. (2025) liefern mit einem randomisierten Feldexperiment (Solomon-Gruppendesign, n = 90 Studierende, Universitäten Augsburg und München) einen direkten Wirksamkeitsnachweis für KI-generiertes adaptives Feedback: Die Experimentalgruppe mit individualisiertem Feedback erzielte signifikant bessere Leistungen als die Kontrollgruppe — ein Befund, der die Bedeutung personalisierter Rückmeldung über bloße Richtig/Falsch-Bewertung hinaus unterstreicht. Topali et al. (2025) konsolidieren in einem systematischen Review zu KI-gestütztem Unterricht in authentischen K-12-Schulkontexten: Studien unter realen Unterrichtsbedingungen (nicht Laborbedingungen) zeigen konsistent positive, aber moderate Effekte — die Wirksamkeit hängt entscheidend von der Qualität der Lehrkraftbegleitung ab.

Chancen zusammengefasst

Literatur (Didaktik)

Bastani, H., Bastani, O., Sungu, A., Ge, H., Kabakcı, Ö., & Mariman, R. (2025). Generative AI without guardrails can harm learning. Proceedings of the National Academy of Sciences. https://doi.org/10.1073/pnas.2422633122

Bastani, H., Bastani, O., Sungu, A. · 2025 · Proceedings of the National Academy of Sciences (PNAS) ★★★★★ 10/10
Feldexperiment mit ~1.000 Oberschüler:innen: GPT-4 ohne Guardrails verbesserte Übungsleistung um 48%, GPT Tutor (mit Schutzmaßnahmen) um 127%. Kritischer Befund: Schüler:innen mit uneingeschränktem KI-Zugang schnitten in Prüfungen ohne KI 17% schlechter ab — A…

Botana, F., Recio, T., & Vélez, M. P. (2024). On using GeoGebra and ChatGPT for geometric discovery. Computers, 13(8), 187. https://doi.org/10.3390/computers13080187

Botana, F., Recio, T. · 2024 · Computation, 12(2), 30 ★★★★★ 10/10
Systematischer Benchmark von ChatGPT 3.5 vs. GeoGebra 5 bei geometrischen Ortskurvenaufgaben (Einhüllende ebener Kurvenfamilien). Ergebnis: ChatGPT scheitert in den meisten Fällen; GeoGebra löst zuverlässig. Warnung ('Caveat Emptor!') an Lehrende, die ChatGPT …

Buchholtz, N., Schorcht, S., Baumanns, L., Huget, J., Noster, N., Rott, B., Siller, H.-S., & Sommerhoff, D. (2024). Damit rechnet niemand! Mitteilungen der Gesellschaft für Didaktik der Mathematik, 117, 15–24. https://ojs.didaktik-der-mathematik.de/index.php/mgdm/article/view/1249

Buchholtz, N., Schorcht, S., Baumanns, L. · 2024 · Mitteilungen der Gesellschaft für Didaktik der Mathematik, Nr. 117 ★★★★★ 9/10
Positionspapier von 8 deutschen Mathematikdidaktiker:innen: sechs Leitgedanken zu Implikationen und Forschungsbedarfen für KI-Technologien (generative KI, ChatGPT) im Mathematikunterricht. Behandelt explizit Problemlösen, Beweisen, Modellieren und Assessment. …

Bundesministerium für Bildung [BMB]. (2024). KI-Pilotschulen: Handreichung. https://www.bmb.gv.at/ki

Khan Academy. (2024). Khan Academy efficacy results. https://blog.khanacademy.org/khan-academy-efficacy-results-november-2024/

Molina-Ayuso, Á., Adamuz-Povedano, N., Bracho-López, R., & Torralbo-Rodríguez, M. (2024). Computational thinking with Scratch: A tool to work on geometry in the fifth grade. Sustainability, 16(1), 110. https://doi.org/10.3390/su16010110

Molina-Ayuso, Á., Adamuz-Povedano, N., Bracho-López, R. · 2024 · Sustainability (MDPI), 16(1), 110 ★★★★ 8/10
Empirische Studie mit 66 Fünftklässler:innen (3 Schulen, Spanien): Scratch (blockbasiertes Programmieren) für Geometrieunterricht erzielte bessere Lernprozesse, höhere Motivation und effektiveres Engagement als konventioneller Unterricht. Scratch ermöglicht dy…

Walkington, C. (2025). Implications of generative AI for secondary mathematics education. School Science and Mathematics. https://doi.org/10.1111/ssm.18356

Walkington, C. · 2025 · School Science and Mathematics (Wiley) ★★★★★ 9/10
Umfassende Analyse der Implikationen generativer KI für den Mathematikunterricht. Untersucht, wie Schüler:innen GenAI als Denkpartner beim mathematischen Modellieren und Beweisen nutzen können. Diskutiert gemischte Ergebnisse beim Einsatz als Tutor sowie die N…

Geraniou, E., & Nardi, E. (2024). AI responses to challenging problems and educator responses to AI availability. Digital Experiences in Mathematics Education. https://doi.org/10.1007/s40751-024-00167-4

Geraniou, E., Nardi, E. · 2024 · Digital Experiences in Mathematics Education (Springer) ★★★★★ 9/10
Untersucht KI-Antworten auf kognitiv anspruchsvolle Sekundarmathematikaufgaben (inkl. Geometrie) und wie Lehrende auf KI-Verfügbarkeit reagieren. Argumentiert gegen Verbote und schlägt pädagogische Strategien vor — zentral für die Debatte um Assessment-Design …

Li, M. (2024). Integrating artificial intelligence in primary mathematics education: Investigating internal and external influences on teacher adoption. International Journal of Science and Mathematics Education, 23, 1283–1308. https://doi.org/10.1007/s10763-024-10515-w

Li, M. · 2024 · International Journal of Science and Mathematics Education (Springer) ★★★★★ 9/10
Untersuchung der Faktoren, die Lehrende bei der Adoption von KI in der Primarstufe-Mathematik beeinflussen (interne: Überzeugungen, Kompetenz; externe: Ressourcen, Unterstützung). Wichtig für Kapitel 08 (Didaktik) und 10 (Ausblick: Lehrkräftefortbildung).

Yunianto, W., Galiç, S., Lavicza, Z., & Urhan, S. (2025). A model for computational thinking development in GeoGebra with the support of ChatGPT. Computers in the Schools. Advance online publication. https://doi.org/10.1080/07380569.2025.2544062

Yunianto, W., Galič, S., Lavicza, Z. · 2025 · Computers in the Schools (Taylor & Francis) ★★★★★ 10/10
Entwicklung eines Modells zur Förderung von Computational Thinking durch die Kombination von GeoGebra und ChatGPT. Untersucht die Schnittstelle zwischen KI, Computational Thinking und Mathematikdidaktik. Sehr relevant für Kapitel 07 und 08.

Wang, R. E., Ribeiro, A. T., Robinson, C. D., Loeb, S., & Demszky, D. (2024). Tutor CoPilot: A human-AI approach for scaling real-time expertise. arXiv:2410.03017. https://doi.org/10.48550/arXiv.2410.03017

Wang, X., Chan, K. K., Li, Q. · 2024 · Journal of Educational Computing Research (SAGE) ★★★★★ 9/10
Meta-analysis of 17 empirical studies (n=1,665 children ages 3-8). CT interventions show statistically significant large effect size (d=0.83) on young children's development. Geometry and spatial skills are among the most commonly addressed mathematical domain…

Ma, X., Yang, Y., Liu, X., & Chen, L. (2025). A meta-analysis of the impact of generative artificial intelligence on learning outcomes. Journal of Computer Assisted Learning, 41, e70117. https://doi.org/10.1111/jcal.70117

Ma, X., Yang, Y., Liu, X. · 2025 · Journal of Computer Assisted Learning ★★★★★ 5/10
Meta-analysis of 34 experimental/quasi-experimental studies. Overall Hedges' g=0.68 (p<0.001). Strongest effects in cognitive (g=0.795) and competency (g=0.711) dimensions. Mathematics and sciences benefit most from GenAI, before CS and medicine.

Fock, A., & Siller, H.-S. (2025). Generative artificial intelligence in secondary STEM education in the light of Human Flourishing: A scoping literature review. International Journal of STEM Education, 12, Article 00589. https://doi.org/10.1186/s40594-025-00589-5

Fock, A., Siller, H.-S. · 2025 · International Journal of STEM Education ★★★★★ 4/10
PRISMA scoping review of 183 publications on GenAI in secondary STEM. Hans-Stefan Siller (Universität Würzburg, DACH) coauthor. Geometry: GenAI weaknesses in spatial reasoning and geometric problem-solving where strong visualization is required. Identifies cog…

He, A., Yuan, W., & Kiliçman, A. (2024). A meta-analysis on the effectiveness of dynamic mathematics software on K-12 students' mathematics learning. International Journal of Mathematical Education in Science and Technology. Advance online publication. https://doi.org/10.1080/0020739X.2024.2375257

He, A., Yuan, W., Kiliçman, A. · 2024 · International Journal of Mathematical Education in Science and Technology ★★★★★ 5/10
Meta-analysis of 68 studies on dynamic mathematics software (DMS, including GeoGebra) in K-12. Overall effect size g=0.820 (p<0.01, large effect). Moderators: mathematical topic, grade level, assessment method, teacher training. Specific effects for geometry a…

Yi, L., Liu, D., Jiang, T., & Xian, Y. (2025). The effectiveness of AI on K-12 students' mathematics learning: A systematic review and meta-analysis. International Journal of Science and Mathematics Education, 23(4), 1105–1126. https://doi.org/10.1007/s10763-024-10499-7

Yi, L., Liu, D., Jiang, T. · 2025 · International Journal of Science and Mathematics Education ★★★★★ 5/10
Meta-analysis of 21 studies (40 samples, 2000–2023). Overall effect d=0.343 for AI-assisted learning. AI as Intelligent Tutoring System and adaptive learning system shows strongest effects. Direct quantitative evidence for mathematics-specific AI effectiveness…

Liu, B., Zhang, W., & Wang, F. (2026). Can generative artificial intelligence effectively enhance students' mathematics learning outcomes? A meta-analysis of empirical studies from 2023 to 2025. Education Sciences, 16(1), 140. https://doi.org/10.3390/educsci16010140

Liu, B., Zhang, W., Wang, F. · 2026 · Education Sciences (MDPI), 16(1), 140 ★★★★★ 10/10
Meta-Analyse von 22 empirischen Studien (46 Stichproben, N=5.232): GenAI hat moderaten positiven Effekt auf Mathematiklernen (Hedges' g=0,534). Geometrie erzielte den GRÖSSTEN bereichsspezifischen Effekt aller Inhaltsbereiche (g=0,906), vor Zahl & Algebra (g=0…

Witzke, I., & Steinhoff, T. (2025). KIMADU — KI-Forschungsprojekt der Didaktik der Mathematik und der deutschen Sprache. Universität Siegen / Ministerium für Schule und Bildung NRW. https://kimadu.de/

Maskos, K., Schulz, A., & Oeksuez, S. S. (2025). Formative assessment in mathematics education: A systematic review. ZDM – Mathematics Education, 57, 679–693. https://doi.org/10.1007/s11858-025-01696-x

Maskos, K., Schulz, A., Oeksuez, S. S. · 2025 · ZDM – Mathematics Education, Vol. 57, pp. 679–693 ★★★★★ 10/10
Systematisches Review von 45 Studien (2015–2023) zu formativem Assessment in der Mathematik. Findet besonderes Potenzial für computerbasierte Assessments in interaktiven Lernumgebungen — Basisevidenz für die Debatte formativ vs. summativ in der Sekundarmathema…

Khlaif, Z. N., Alkouk, W. A., Salama, N., & Abu Eideh, B. (2025). Redesigning assessments for AI-enhanced learning: A framework for educators in the generative AI era. Education Sciences, 15(2), 174. https://doi.org/10.3390/educsci15020174

Khlaif, Z. N., Alkouk, W. A., Salama, N. · 2025 · Education Sciences (MDPI), Vol. 15(2), Art. 174 ★★★★ 8/10
Qualitative Rahmenstudie (61 Lehrende) entwickelt das 'Against, Avoid, Adopt, Explore'-Modell für Prüfungsredesign im GenKI-Zeitalter. Direkt anwendbar auf Politikgestaltung zur Reform von Abitur-/Matura-Prüfungsformaten.

Letourneau, A., Deslandes Martineau, M., Charland, P., Karran, J. A., & Boasen, J. (2025). A systematic review of AI-driven intelligent tutoring systems (ITS) in K-12 education. npj Science of Learning, 10, Article 29. https://doi.org/10.1038/s41539-025-00320-7

Weigand, H.-G., Trgalova, J., & Tabach, M. (2024). Mathematics teaching, learning, and assessment in the digital age. ZDM – Mathematics Education, 56(6). https://doi.org/10.1007/s11858-024-01612-9

Weigand, H.-G., Trgalova, J., Tabach, M. · 2024 · ZDM – Mathematics Education, Vol. 56(6) ★★★★★ 9/10
Lead-Paper eines ZDM-Sonderhefts zu Lehren, Lernen und Beurteilen mit Technologie im Mathematikunterricht. Drei Forschungslinien: (1) Lehren mit Technologie, (2) Lernen mit Technologie, (3) Beurteilen mit Technologie. Prognostiziert KI-gestützte adaptive Tests…

Li, S., Zeng, C., Liu, H., Jia, J., Liang, M., Cha, Y.-Y., Lim, C. P., & Wu, X. (2025). A meta-analysis of AI-enabled personalized STEM education in schools. International Journal of STEM Education, 12, Article 58. https://doi.org/10.1186/s40594-025-00566-y

Li, S., Zeng, C., Liu, H. · 2025 · International Journal of STEM Education, Vol. 12, Article 58 ★★★★★ 9/10
Meta-Analyse von 99 Effektgrößen aus 32 RCT-Studien (K-12 STEM). Signifikante Moderatoren: Schulstufe (Sekundarstufe profitiert stärker), KI-Typ (AR/VR zeigt stärkste Effekte), Lernmodell (Hybridansätze > rein digital). Springer International Journal of STEM E…

Huber, M., Koivisto, J., Wanders, F., & Eedi/Google DeepMind Team. (2024). AI tutoring can safely and effectively support students: An exploratory RCT in UK classrooms. arXiv:2512.23633. https://arxiv.org/abs/2512.23633

Huber, M., Koivisto, J., Wanders, F. · 2024 · arXiv:2512.23633 (December 2024) ★★★★★ 9/10
Exploratorische RCT mit N=165 Schüler:innen (Year 9+10, Alter 13-15) in fünf britischen Sekundarschulen. Drei Bedingungen: statische Hinweise, menschliche Tutoren, LearnLM (Google). LearnLM-Gruppe: 66,2% der Folgeaufgaben gelöst; Human-Tutor-Gruppe: 60,7% — +5…

Wang, J., & Fan, W. (2025). The effect of ChatGPT on students' learning performance, learning perception, and higher-order thinking: Insights from a meta-analysis. Humanities and Social Sciences Communications, 12, Article 621. https://doi.org/10.1057/s41599-025-04787-y

Wang, J., Fan, W. · 2025 · Humanities and Social Sciences Communications ★★★★★ 9/10
Meta-Analyse von 51 Studien (Nov. 2022 – Feb. 2025). Lernleistung: Hedges' g = 0,867 (großer positiver Effekt). Lernwahrnehmung: g = 0,456 (mittlerer Effekt). Höherstufiges Denken: g = 0,457 (mittlerer Effekt). Stärkste quantitative Evidenz für Lernwirksamkeit…

Busuttil, L., & Calleja, J. (2025). Teachers' beliefs and practices about the potential of ChatGPT in teaching mathematics in secondary schools. Digital Experiences in Mathematics Education, 11(1), 42–67. https://doi.org/10.1007/s40751-024-00168-3

Busuttil, L., Calleja, J. · 2025 · Digital Experiences in Mathematics Education ★★★★ 8/10
TPACK-basierte Fallstudie an maltesischen Sekundarschulen: Lehrerüberzeugungen zu ChatGPT vor und nach professioneller Weiterbildung. Lehrkräfte mit entdeckendem/konnektionistischem Bildungsverständnis bewerten ChatGPT positiv für aktives Lernen. Herausforderu…

Seibold, M., Kodweiß, J., & Friz, P. (2024). LLMs wie ChatGPT als individualisierte Tutoren im Mathematikunterricht: Eine explorative Annäherung. In Beiträge zum Mathematikunterricht 2024: 57. Jahrestagung der GDM (S. 1337). WTM-Verlag. https://doi.org/10.37626/GA9783959872782.0

Seibold, M., Kodweiß, J., Friz, P. · 2024 · Beiträge zum Mathematikunterricht 2024: 57. Jahrestagung der GDM ★★★★ 8/10
GDM-Konferenzbeitrag (Schwäbisch Gmünd) mit Befragung von 54 Mathematik-Lehramtsstudierenden und Entwicklung eines LLM-Tutor-Prototyps. Ambivalente, aber interessierte Haltungen gegenüber LLMs als Tutoren; systematische Misskonzeptionen über die mathematische …

Hariyanto, D., Kristianingsih, K., & Maharani, A. (2025). Artificial intelligence in adaptive education: A systematic review. Discover Education (Springer Nature). https://doi.org/10.1007/s44217-025-00908-6

Hariyanto, D., Kristianingsih, K., Maharani, A. · 2025 · Discover Education, 4, 458 ★★★★★ 9/10
PRISMA-compliant analysis of 142 peer-reviewed empirical studies (2015–2025) from Scopus, Web of Science, IEEE Xplore. Identifies key AI techniques in adaptive education: knowledge tracing, Bayesian networks, reinforcement learning, and LLMs. Geometry and math…

Cosentino, G., Anton, J., Sharma, K., Gelsomini, M., Giannakos, M. N., & Abrahamson, D. (2025). Generative AI and multimodal data for educational feedback: Insights from embodied math learning. British Journal of Educational Technology, 56(5), 1686–1709. https://doi.org/10.1111/bjet.13587

Cosentino, G., Anton, J., Sharma, K., Gelsomini, M., Giannakos, M. N.,, Abrahamson, D · 2025 · British Journal of Educational Technology ★★★★★ 14/10
Untersucht, wie generative KI formatives Feedback im Mathematikunterricht bereitstellt bei körperbasiertem Zahlengeraden-Lernen. Eye-Tracking und Systemlogs messen kognitive Belastung; KI-generiertes Feedback verglichen mit Lehrendenfeedback. Ergebnis: verglei…

Tsakeni, M., Nwafor, S. C., Mosia, M., & Egara, F. O. (2025). Mapping the scaffolding of metacognition and learning by AI tools in STEM classrooms: A bibliometric-systematic review approach (2005–2025). Journal of Intelligence, 13(11), 148. https://doi.org/10.3390/jintelligence13110148

Tsakeni, M., Nwafor, S. C., Mosia, M. · 2025 · Journal of Intelligence ★★★★ 7/10
Gemischte Methode (Bibliometrie + Systematic Review), 135 Peer-Reviewed-Artikel 2005–2025. Analysiert, wie KI-Werkzeuge Metakognition und Lernen in STEM-Klassen unterstützen. Zeigt Trend zu posthumanistischen Rahmungen, wo KI-Systeme als Ko-Regulatoren des Ler…

Hidayat, R., Saad, M. R. M., & Wewe, M. (2025). A meta-analysis of the effect of metacognitive instruction on mathematics achievement. Cogent Education, 12(1). https://doi.org/10.1080/2331186X.2025.2517510

Hidayat, R., Saad, M. R. M., Wewe, M. · 2025 · Cogent Education ★★★★ 8/10
PRISMA-konforme Meta-Analyse über 43 Studien (N = 13.924): Metakognitive Instruktion hat einen großen positiven Effekt auf Mathematikleistung (ES = 1,11), metakognitive Kompetenzen (ES = 1,18) und weitere Lernoutcomes (ES = 1,27). Stützt die Relevanz explizite…

Bardach, L., Moeller, K., Ruiz-Garcia, M., Strittmatter, Y., Meyer, J., Musslick, S., & Spitzer, M. (2026). Intelligent tutoring systems need teachers. Journal of Computer Assisted Learning. https://doi.org/10.1002/jcal.70159

Bardach, L., Moeller, K., Ruiz-Garcia, M., Strittmatter, Y., Meyer, J., Musslick, S.,, Spitzer, M · 2026 · Journal of Computer Assisted Learning ★★★★★ 15/10
Untersucht Schülerengagement bei ITS-Nutzung im Mathematikunterricht. Befund: ITS-Systeme zeigen starke Abhängigkeit von Lehrkraftbegleitung für nachhaltige Lerneffekte; ohne Lehrkraftunterstützung sinkt Engagement signifikant. Direkte Implikation: ITS ersetze…

Deng, R., Jiang, M., Yu, X., Lu, Y., & Liu, S. (2025). Does ChatGPT enhance student learning? A systematic review and meta-analysis of experimental studies. Computers & Education, 227, 105224. https://doi.org/10.1016/j.compedu.2024.105224

Deng, R., Jiang, M., Yu, X., Lu, Y.,, Liu, S · 2025 · Computers & Education ★★★★★ 14/10
Systematisches Review und Meta-Analyse experimenteller Studien über ChatGPT-Wirkungen auf Lernleistung. Computers & Education (Q1 Elsevier). Untersucht Bedingungen, unter denen ChatGPT Lernleistungen verbessert oder beeinträchtigt.

Nalbantoglu Yilmaz, F., et al. (2025). Investigation of the use of AI as a scaffolding tool during mathematical discussion in geometry problem-solving. CERME 2025 Conference Proceedings (HAL Open Archive, hal-05282421). https://hal.science/hal-05282421

Colliot, T., Krichen, O., Girard, N., Anquetil, E., & Jamet, E. (2024). What makes tablet-based learning effective? A study of the role of real-time adaptive feedback. British Journal of Educational Technology, 55(5), 2278–2295. https://doi.org/10.1111/bjet.13439

Colliot, T., Krichen, O., Girard, N. · 2024 · British Journal of Educational Technology ★★★★★ 9/10
3-Gruppen-Vergleich (Siebtklasse, Geometrieunterricht): Papier vs. Tablet ohne Feedback vs. Tablet mit KI-Echtzeit-Adaptivfeedback. Nicht das Medium, sondern das intelligente tutorielle Feedback steigerte Lernleistung signifikant. Starke Evidenz fuer adaptives…

Walkington, C., Nathan, M. J., Hunnicutt, J., Washington, J., & Zhou, M. (2024). New kinds of embodied interactions that arise in augmented reality dynamic geometry software. Journal of Mathematical Behavior, 75, Article 101175. https://doi.org/10.1016/j.jmathb.2024.101175

Walkington, C., Nathan, M. J., Hunnicutt, J. · 2024 · Journal of Mathematical Behavior ★★★★★ 9/10
28 Oberstufenschueler:innen nutzten AR-Version von GeoGebra (Microsoft HoloLens 2). Neue verkoerperte Interaktionen dokumentiert: Perspektive/Orientierung, Massstaeb, Dreidimensionalitaet. Designimplikationen fuer dynamische Geometriesoftware der naechsten Gen…

Asiedu Menlah, C. K., & Boateng, F. O. (2025). Examining the effect of AI-based tutoring systems on students' mathematical problem-solving skills: The moderating role of mathematics anxiety. Journal of Pedagogical Sociology and Psychology, 7(3), 5–17. https://doi.org/10.33902/jpsp.202536137

Chen, F., Chen, J., & Xu, Y. (2025). The more anxious, the more dependent? The impact of math anxiety on AI-assisted problem-solving. Psychology in the Schools, 62, 2685–2701. https://doi.org/10.1002/pits.23500

Chen, E., Xu, T., Gao, Q. · 2025 · arXiv preprint ★★★★★ 3/10
Controlled study with 148 students comparing LLM-Tutor (AI proof reviewer + chatbot) to control group. LLM-Tutor significantly improved homework performance but showed no effect on exam grades. Students with low self-efficacy used chatbot more frequently, corr…

Omar, A., Daher, W., & Bayaa, N. (2025). Academic emotions of eighth grade students in algebra classrooms using an artificial intelligence learning environment. Frontiers in Education, 10, Article 1669360. https://doi.org/10.3389/feduc.2025.1669360

Omar, A., Daher, W., Bayaa, N. · 2025 · Frontiers in Education ★★★★ 8/10
Mixed-Methods-Studie (N=92, Klasse 8, Palästina): Nutzung der KI-Anwendung CK-12 Flexi im Algebra-Unterricht erhöhte Freude signifikant und reduzierte Angst und Langeweile. Sechs Affordanzen der App (sofortiges Feedback, adaptive Schwierigkeit, schrittweise Hi…

Polydoros, G., Galitskaya, V., Pergantis, P., Drigas, A., Antoniou, A.-S., & Beazidou, E. (2025). Innovative AI-driven approaches to mitigate math anxiety and enhance resilience among students with persistently low performance in mathematics. Psychology International, 7(2), Article 46. https://doi.org/10.3390/psycholint7020046

Polydoros, G., Galitskaya, V., Antoniou, A.-S. · 2025 · Scientific Electronic Archives, 18(2) ★★★★★ 9/10
Quasi-experimentelle Studie mit 436 griechischen Drittklässler:innen (9–10 Jahre, Piaget/Van-Hiele-Theorie). Experimentalgruppe nutzte ChatGPT integriert im traditionellen Geometrieunterricht zu Symmetrie und ebenen Figuren. Signifikant besseres geometrisches …

Wang, X., & Wei, Y. (2025). The influence of Gen-AI assisted learning on primary school students' math anxiety: An intervention study. Applied Cognitive Psychology, 39, e70088. https://doi.org/10.1002/acp.70088

Wang, J., Fan, W. · 2025 · Humanities and Social Sciences Communications ★★★★★ 9/10
Meta-Analyse von 51 Studien (Nov. 2022 – Feb. 2025). Lernleistung: Hedges' g = 0,867 (großer positiver Effekt). Lernwahrnehmung: g = 0,456 (mittlerer Effekt). Höherstufiges Denken: g = 0,457 (mittlerer Effekt). Stärkste quantitative Evidenz für Lernwirksamkeit…

Wijers, M., et al. (2026). Gamification on mathematics engagement and motivation in secondary school and higher education: A systematic review and meta-analysis. Educational Psychology Review, 38. https://doi.org/10.1007/s10648-025-10108-1

Wijers, M., et al. · 2026 · Educational Psychology Review ★★★★★ 10/10
Systematisches Review und Meta-Analyse (45 Studien qualitativ, 11 quantitativ, N=4.345, Sekundarstufe + Hochschule): Gamification hat einen signifikant kleinen bis mittleren positiven Effekt auf Mathematikmotivation (g=0,38). Digitale Plattformen wie Kahoot! u…

Bauer, E., et al. (2025). Effects of AI-generated adaptive feedback on statistical skills and instructional efficiency. Learning and Instruction, 98, 102098. https://doi.org/10.1016/j.learninstruc.2025.102098

Bauer, E., Richters, C., Pickal, A. J. · 2025 · British Journal of Educational Technology ★★★★ 8/10
Randomisiertes Feldexperiment (2x2-Solomon-Gruppendesign, n=90 Bildungswissenschaftsstudierende, Universität Augsburg & LMU München). KI-generiertes adaptives Feedback vs. statisches Expertenfeedback: Vorteile beim Kompetenzerwerb, differenzierter Einfluss auf…

Topali, P., et al. (2025). Pedagogical considerations in the automation era: A systematic literature review on AI-powered instruction in authentic K-12 school contexts. Computers & Education, 228, 105247. https://doi.org/10.1016/j.compedu.2025.105247

Topali, P., Ortega-Arranz, A., Martinez-Mones, A. · 2025 · British Educational Research Journal ★★★★ 8/10
Systematisches Review zu KI-gestütztem Unterricht in authentischen K-12-Schulkontexten (nicht Laborbedingungen). Untersucht pädagogische Voraussetzungen für wirksamen KI-Einsatz. Das Review betont, dass Lernwirksamkeit stark von der Unterrichtsintegration und …

9. Herausforderungen und Risiken

Halluzinationen und mathematische Fehler

Große Sprachmodelle (LLMs) produzieren überzeugend formulierte, aber falsche mathematische Aussagen — sogenannte „Halluzinationen". Für den Geometrieunterricht ist dies besonders kritisch: Ein LLM, das einen Beweis für den Satz des Pythagoras liefert, kann dabei einen subtilen Fehler einbauen, der ohne Fachwissen nicht erkennbar ist.

Geometrie ist die KI-Schwachstelle Nr. 1:

Neue Benchmark-Evidenz: Mehrere 2024–2026 erschienene Benchmarks machen das KI-Defizit in Geometrie noch greifbarer. GeoEval (Zhang et al., 2024, ACL) vereint sieben Geometrie-Datensätze (ebene, räumliche und analytische Geometrie) und zeigt: 61 % der Fehler gehen auf Diagramm-Fehlinterpretation zurück — konsistent mit MathVerse. GeoGramBench (Luo et al., 2025) testete 19 Frontier-LLMs inklusive GPT-o1 auf 500 Geometrieproblemen mit drei Abstraktionsebenen — kein Modell überstieg 50 % Genauigkeit auf dem höchsten Level (globale abstrakte Integration). NoReGeo (Abdullaeva et al., 2026) testete 45+ Modelle auf 2.500 Problemen ohne algebraischen Rechenaufwand — bestes Ergebnis: 74,5 %. Ein Survey über das gesamte Feld der KI-Geometrielösung (Zhao et al., 2025) identifiziert, dass 61 % der aktuellen MLLM-Fehler auf Diagramm-Missinterpretation zurückgehen — die visuelle Verarbeitung geometrischer Figuren bleibt der kritische Engpass. Die Schlussfolgerung: Geometrisches Verständnis emergiert nicht allein durch mehr Training; es gibt eine fundamentale konzeptuelle Lücke zwischen Sprachkompetenz und geometrischem Denken. Lösungsansätze sind in Entwicklung und zeigen erste Wirkung:

Dies zeigt: Die Integration formaler geometrischer Constraints ist der vielversprechendste Weg zur Überwindung des Diagramm-Verständnisproblems — und ist zugleich ein Signal, wohin sich die für den Unterricht verfügbaren Werkzeuge in den nächsten Jahren entwickeln werden.

Verbesserungsansätze auf Modellseite zeigen Wirkung: MAVIS (Zhang et al., 2025, ICLR) entwickelt eine automatisierte Datenpipeline für visuelles Mathematiktraining mit 558.000 geometriespezifischen Beispielen. Das spezialisierte MAVIS-7B-Modell übertrifft GPT-4V auf MathVerse um +15,9 % — ein starkes Signal, dass gezieltes Training auf geometrischen Diagrammen das Diagramm-Verständnisproblem deutlich reduziert. Für den Unterricht bleibt jedoch die Kernwarnung: Aktuelle Standardmodelle — darunter GPT-4o, Gemini und Llama — sind nicht MAVIS; die oben beschriebenen Schwächen gelten für die kommerziell verfügbaren Systeme unverändert.

Geometrische Brittleness: Ahn et al. (2024) unterscheiden zwischen algebraischer Brittleness (bei LLMs gut untersucht) und geometrischer Brittleness — LLMs zeigen bei Geometriebeweisen systematisch überhöhtes Vertrauen in falsche Aussagen, was die Fehler schwerer erkennbar macht als in anderen Bereichen. Pardos und Bhandari (2024) zeigen jedoch: Selbstreflexionsaufforderungen im Prompt („Überprüfe deinen Beweis") reduzieren die Fehlerrate um 23 %, Retrieval-Augmented Generation (RAG) um weitere 18 % — ein konkreter didaktischer Ansatzpunkt.

Strukturelles Problem: Xu et al. (2024) zeigen mittels lerntheoretischer Formalisierung, dass Halluzinationen für LLMs prinzipiell unvermeidbar sind — kein Update kann dieses fundamentale Verhalten vollständig beseitigen. Das gilt auch für Geometrie-Reasoning.

Ein schulstufenübergreifender NAEP-Vergleich (Kaya & Yavuz, 2025, Journal of Intelligence) macht das Profil dieser Schwächen konkret: Beide getesteten Modelle (ChatGPT-4o und GPT-4) übertreffen in der Regel US-Schülerleistungen der Klassen 4, 8 und 12 auf kognitiv anspruchsvollen Mathematikaufgaben — zeigen aber bei Geometrie- und Messaufgaben systematisch schlechtere Ergebnisse als in Algebra. Dieser Befund ist für den Geometrieunterricht direkt handlungsrelevant: Lehrkräfte sollten Schüler:innen nicht zur ungeprüften Übernahme KI-generierter geometrischer Lösungen ermutigen.

Konsequenz für den Unterricht: LLMs dürfen nie unkritisch als Beweis-Autorität eingesetzt werden. GeoGebra Discovery oder Wolfram Alpha als Verifikatoren sind unverzichtbar (Botana et al., 2024; Kovács et al., 2024). Für geometrische Ortskurvenaufgaben (Einhüllende, Ortskurven) formulieren Botana und Recio (2024) eine direkte Warnung: „Caveat Emptor!" — ChatGPT scheitert hier systematisch, während GeoGebra zuverlässig korrekte Ergebnisse liefert. Die Überprüfungskompetenz — kritisches Lesen eines KI-generierten Beweises — muss explizit gelehrt werden.

Das Abhängigkeitsproblem

Das zentrale Risiko bei unkritischem KI-Einsatz belegt eine Feldstudie mit ~1.000 Oberschüler:innen (Bastani et al., 2025, PNAS): Schüler:innen mit uneingeschränktem GPT-Zugang verbesserten Übungsaufgaben um 48 % — zeigten aber in Prüfungen ohne KI 17 % schlechtere Ergebnisse als die Kontrollgruppe. Der Mechanismus: Ohne Guardrails übernimmt die KI die Denkarbeit; geometrische Argumentationsfähigkeiten werden nicht aufgebaut.

Frieder et al. (2023) ergänzen: LLMs funktionieren als „mathematische Suchmaschinen", nicht als zuverlässige Problemlöser — eine Rolle, die Schüler:innen leicht fehlinterpretieren. Wenn Geometrieprobleme routinemäßig delegiert werden, entsteht eine kognitive Abhängigkeit, die schwer aufzubrechen ist. Besonders gefährdet sind mathematikängstliche Lernende: Chen, Chen und Xu (2025) zeigen, dass Mathe-Angst die Abhängigkeitsbereitschaft gegenüber KI-Tools erhöht und gleichzeitig den positiven Effekt von KI-Tutoring auf Problemlösekompetenz moderiert — ein Kreislauf, der durch unkritischen KI-Einsatz verstärkt wird (Psychology in the Schools, DOI: 10.1002/pits.23500). Wijaya et al. (2024) identifizieren vier Typen von Abhängigkeitsverhalten: prozedurales Auslagern, konzeptionelle Abhängigkeit, metakognitive Regression und motivationale Erosion — Geometrie ist das Hauptfeld für konzeptionelle Abhängigkeit, wenn Schüler:innen GeoGebra-KI Konstruktionen übernehmen, ohne die Algorithmen zu verstehen.

Eine Strukturgleichungsmodellierung mit 469 angehenden Mathematiklehrkräften (Zhang, Wijaya et al., 2025, Scientific Reports) zeigt: Sowohl KI-Kompetenz als auch KI-Vertrauen verstärken KI-Abhängigkeit — was sich in der Folge signifikant negativ auf Problemlösefähigkeit, kritisches Denken, Kreativität und Kommunikationsfähigkeit auswirkt. Der Befund ist für die Lehramtsausbildung unmittelbar relevant: Ein höheres KI-Verständnis schützt nicht automatisch vor Abhängigkeit; es bedarf expliziter didaktischer Rahmung, die kritische Distanz zur KI einübt. Auf Schülerseite liefert eine Mixed-Methods-Befragung nigerianischer Sekundarschüler:innen (Egara, Mosimege & Mosia, 2025, Journal of Education, N=125) ein differenziertes Bild: ChatGPT wird für Verständnis und Problemlösung geschätzt, gleichzeitig bestehen anhaltende Sorgen über Genauigkeit und kognitive Überforderung — ein Muster, das Lehrende bei der Unterrichtsgestaltung berücksichtigen müssen.

Lösung: Geführte, lehrkraftbegleitete KI-Nutzung mit expliziten Phasen ohne KI. Der geführte GPT-Tutor im selben Experiment (Bastani et al., 2025) verbesserte Lernleistungen um 127 % ohne Abhängigkeitseffekte. Ein PRISMA-basiertes systematisches Review von 20 empirischen Studien (2023–2025) bestätigt: In 40 % der Studien wird Überabhängigkeit der Schüler:innen explizit dokumentiert — besonders ausgeprägt bei Algebra und Statistik, aber auch bei geometrischen Standardaufgaben (Turmuzi, Azmi & Kertiyani, 2026). Die Implikation für die Praxis: Aufgabendesign muss KI-Nutzung als Zwischenschritt einkalkulieren und den Abschluss ohne KI-Unterstützung strukturell sichern.

Prüfungsintegrität

KI-Systeme können viele Standardprüfungsaufgaben in Geometrie lösen — insbesondere Berechnungsaufgaben. Das stellt das Prüfungssystem vor strukturelle Herausforderungen, die sich mit Reasoning-Modellen dramatisch verschärfen: De Winter et al. (2024, TU Delft) testeten OpenAI o1-preview auf dem niederländischen VWO-Abschlussexamen Mathematik B (Abitur-äquivalent mit analytischer Geometrie und Trigonometrie) — das Ergebnis: 76/76 Punkte, entsprechend dem 97,8. Perzentil unter 16.414 Schüler:innen. Die Prüfung war nach dem Trainings-Cutoff, Memorierung ist ausgeschlossen.

Zur tatsächlichen Nutzung: Ateeq et al. (2024) belegen in einer großen Studie (N = 1.247 Studierende): 58 % haben KI für nicht autorisierte Aufgabenbearbeitung genutzt; 71 % der Lehrenden sind unsicher, wie KI-generierte Lösungen zu erkennen sind. Tate et al. (2024, Stanford) zeigen allerdings in einer Längsschnittstudie: Die Gesamtbetrugsrate in US-amerikanischen High Schools blieb nach der ChatGPT-Einführung stabil bei 60–70 % — KI substituiert ältere Betrugsformen, erhöht die Gesamtrate nicht. Dennoch nutzen 9–16 % der Schüler:innen KI für vollständige Aufgabenbearbeitungen.

Antwortmöglichkeiten:

Buchholtz et al. (2024) bezeichnen Prüfungsintegrität explizit als einen der drängendsten Forschungsbedarfe der deutschen Mathematikdidaktik.

Lehrplan-Misalignment: Angelsächsische KI vs. europäische Curricula

Ein strukturelles Problem, das im deutschsprachigen Diskurs bislang wenig Aufmerksamkeit erhalten hat: Internationale KI-Systeme wurden überwiegend mit englischsprachigen Trainingsdaten trainiert — und reproduzieren angelsächsische Mathematikkonventionen, die mit österreichischen und deutschen Lehrplänen kollidieren können.

Krátká et al. (2025) dokumentieren konkrete Fälle solcher Misalignments im Geometrieunterricht: Viele LLMs behandeln das Quadrat nicht als Spezialfall des Rechtecks — obwohl dies in österreichischen und deutschen Schulbüchern so gelehrt wird. Die inklusiven vs. exklusiven Klassifikationen von Vierecken unterscheiden sich systematisch zwischen angelsächsischen und kontinentaleuropäischen Curricula. Ähnliche Divergenzen zeigen sich bei Notationen (Winkelschreibweise), bei der Verwendung von Begriffen wie „Trapez" oder bei der Behandlung von Kegelschnitten.

Die pädagogische Konsequenz ist nicht trivial: Wenn Schüler:innen ChatGPT nach der Definition des Trapezes fragen und eine angelsächsische Definition erhalten, die von der österreichischen Schulbuchdefinition abweicht, entsteht Verwirrung — und möglicherweise ein falsches Verständnis. Lehrende müssen solche Widersprüche aktiv thematisieren und als Lerngelegenheit nutzen: „Warum antwortet die KI so — und warum weicht das von unserem Lehrplan ab?" ist selbst eine wertvolle Unterrichtsfrage.

Eine systematische Analyse der Qualitätssicherung für digitale Mathematikressourcen liefert Rezat (2025, ZDM – Mathematics Education): Eine Inhaltsanalyse der Zulassungsverfahren aller 16 deutschen Bundesländer zeigt erhebliche Inkohärenzen bei den Qualitätskriterien — und damit strukturelle Schwachstellen, die durch den Einsatz international trainierter KI-Systeme potenziert werden. Was als qualitätssichernd gilt, variiert je nach Bundesland; ein europäischer Mindeststandard fehlt.

Dieser Befund unterstreicht: Der unkritische Einsatz internationaler LLMs im Geometrieunterricht erfordert lehrplankonforme Kontrolle — ein Argument für lokale oder zumindest europäische Bildungsplattformen und für den ergänzenden Einsatz deterministischer Systeme wie GeoGebra, das österreichische Lehrplaninhalte korrekt abbildet.

Die kulturelle Dimension reicht tiefer als Notation: Prahmana, Kusaka et al. (2024, Journal on Mathematics Education) zeigen in einem interkulturellen Vergleich indonesischer und japanischer Schüler:innen, dass kulturelle Prägung nachweislich beeinflusst, wie Lernende geometrische Aufgaben algorithmisch strukturieren — und damit, wie ein KI-System Lernhandlungen korrekt interpretieren und unterstützen müsste. Zulu und Brijlall (2024, Pythagoras) ergänzen: In mehrsprachigen südafrikanischen Klassen fehlte angehenden Mathematiklehrenden sowohl die Fachsprache als auch differenzierte Erklärstrategien für analytische Geometrie — ein PCK-Defizit, das durch anglophone KI-Systeme nicht kompensiert, sondern eher verdeckt wird.

Datenschutz und Ethik

Auf internationaler Ebene hat die UNESCO zwei wegweisende Orientierungsrahmen vorgelegt: die Guidance for Generative AI in Education and Research (Miao & Holmes, 2023) definiert sechs Kernprinzipien für den Einsatz generativer KI im Bildungsbereich und mahnt explizit zu einer Human-in-the-loop-Kontrolle bei sensiblen Bildungsentscheidungen. Diese Empfehlung ist für Schulen in Österreich direkt relevant, da sie das Spannungsfeld zwischen technologischer Innovation und pädagogischer Verantwortung klar benennt.

Im deutschsprachigen Raum gibt es zwei maßgebliche Orientierungsdokumente: Das Impulspapier der Ständigen Wissenschaftlichen Kommission der KMK (SWK, Januar 2024) gibt einen differenzierten Überblick über Chancen und Risiken von LLMs im Bildungssystem und empfiehlt qualifizierten, pädagogisch verantworteten Einsatz (SWK, 2024). Die Handlungsempfehlung der KMK (Oktober 2024), von allen 16 Kultusminister:innen verabschiedet, setzt darauf aufbauend konkrete Rahmenbedingungen für KI in schulischen Bildungsprozessen — einschließlich fachspezifischer KI-Nutzung in Mathematik und Anforderungen an die Lehrpersonenkompetenz (KMK, 2024). Für Österreich gibt es analoge Initiativen auf BMBWF-Ebene, die jedoch noch verbindlichere Regelungen benötigen.

Die OECD (2023) stellt fest: Stand 2024 hat kein Land eine verbindliche gesetzliche KI-Regulierung speziell für den Bildungsbereich erlassen; 9 Länder haben unverbindliche Leitlinien. Ein systematisches Literaturreview (Gouseti, James, Fallin & Burden, 2024, Technology, Pedagogy and Education) bestätigt: KI-Ethikrichtlinien speziell für den K-12-Bereich hinken allgemeinen Ethikframeworks deutlich hinterher — besonders fehlen bindende Regelungen zu Datenschutz, Bias und Transparenz für Kinder und Jugendliche. Für den hochschulischen Kontext zeigen Lünich, Keller und Marcinkowski (2024, Computers and Education: AI) in einer deutschen Befragungsstudie, dass Studierende zwar kein höheres allgemeines KI-Risiko wahrnehmen als die Allgemeinbevölkerung — wohl aber höhere individuelle Schäden durch akademische Leistungsvorhersage-Algorithmen; Diskriminierungserfahrungen und Vertrauen in KI sind zentrale Moderatoren dieser Schadenswahrnehmung.

Digitale Kluft (Digital Divide)

Hochwertige KI-Tools (GPT-4o, Claude Opus, Wolfram Alpha Pro) sind oft kostenpflichtig. Schulen mit geringem Budget können Schüler:innen möglicherweise nicht gleichermaßen ausstatten. Die OECD betont: KI kann Bildungsgerechtigkeit fördern (Zugänglichkeit, Mehrsprachigkeit) — kann sie aber auch verschärfen, wenn der Zugang ungleich verteilt bleibt (Varsik & Vosberg, 2024).

Die bislang größte empirische Studie zu ITS und Chancengerechtigkeit kommt zu einem alarmierenden Befund: Hannan und Eynon (2025) analysierten 66.451 australische Sekundarschüler:innen (Klassen 7–10, 304 Schulen, AdaptiveMath ITS, Schuljahr 2023) in Computers & Education. Ergebnis: ITS-Nutzung mediierte die Beziehung zwischen sozioökonomischem Vorteil und Lernleistung — im Sinne eines Matthew Effect: Privilegierte Schüler:innen (städtisch, höhere SES) begannen früher mit dem ITS, nutzten es länger und erzielten deutlich höhere Lernzuwächse als ihre ländlichen und benachteiligten Altersgenoss:innen. Die Schlussfolgerung ist kontraintuitiv: ITS-Systeme können Ungleichheit strukturell verstärken, wenn sie ohne gezielte pädagogische Begleitung eingesetzt werden — trotz universeller technischer Verfügbarkeit. Diesen Befund ergänzt eine Längsschnittstudie von Song, Li, Xing et al. (2025, Internet and Higher Education): KI-gestütztes Mathematiklernen kann Geschlechterunterschiede in der Performance reduzieren — verstärkt aber gleichzeitig sozioökonomische Ungleichheit, wenn die Nutzung nicht durch gezielte Interventionen begleitet wird. Das Muster ist konsistent: Technologisch vermitteltes Lernen begünstigt jene, die bereits privilegiert sind — sofern keine strukturellen Korrektive greifen.

KI und sonderpädagogischer Förderbedarf: Die Chance, KI-Werkzeuge für inklusive Bildung zu nutzen, ist real — aber wenig erforscht. Rizos, Foykas und Georgakopoulos (2024, Contemporary Educational Technology) berichten von einer neunstündigen Intervention in Griechenland, bei der zwei Achtklässler mit sonderpädagogischem Förderbedarf mit ChatGPT-3.5-generierten, individualisierten Mathematikarbeitsblättern arbeiteten. Das Ergebnis: aktive Beteiligung, gesteigertes Selbstvertrauen, Lernziele erreicht. Freilich handelt es sich um eine Fallstudie — aber sie zeigt, wie adaptiv-personalisierte KI-Inhalte Barrieren im Mathematikunterricht abbauen können. Ein systematisches Review über zehn Jahre KI in der Sonderpädagogik (Yang et al., 2025, International Journal of Artificial Intelligence in Education, Springer) bestätigt das Potenzial adaptiver Systeme — identifiziert aber erhebliche Forschungslücken speziell für den geometrisch-mathematischen Bereich. Der Befund: KI-Systeme für Sonderpädagogik sind überwiegend auf Sprache und soziale Kompetenzen ausgerichtet; mathematisch-geometrische Förderansätze für SuS mit Förderbedarf sind deutlich untererforscht.

Auch geschlechterbezogene Unterschiede werden sichtbar: Zhu et al. (2025, LAK '25, ACM) zeigen in einer Interventionsstudie mit einer KI-gestützten Mathematik-Plattform, dass Mädchen signifikant höhere Engagement-Werte und stärkere Lernzuwächse erzielten als Jungen — ein Befund, der die Diskussion um algorithmischen Bias um eine Gender-Dimension erweitert. Gleichzeitig zeigt eine europäische Studie mit 933 italienischen Gymnasiast:innen (Caffaratti et al., 2025, Frontiers in Artificial Intelligence): Jugendliche mit Migrationshintergrund nutzen KI-Tools häufiger als ihre Peers — ein unerwarteter Befund, der einfache Digital-Divide-Narrative kompliziert und auf kontextuelle Adoption hinweist, die durch sozioökonomische Faktoren moderiert wird. Matjie, Nethavhani und Matlakala (2026, Frontiers in Computer Science) fassen den strukturellen Kern zusammen: Sprachbarrieren (englischsprachige Modelle), kulturelle Verzerrungen in Trainingsdaten und ungleiche Infrastruktur lassen Institutionen mit schwacher digitaler Ausstattung systematisch weniger von KI-Lernwerkzeugen profitieren.

Für Österreich: GeoGebra, Khan Academy und die Freemium-Varianten von ChatGPT und Claude bieten eine Basisversorgung. Das BMBWF hat mit der Handreichung KI im Bildungssystem (BMBWF, 2023c) einen ersten nationalen Orientierungsrahmen vorgelegt, der Schulen und Lehrende bei der pädagogisch verantworteten Nutzung von KI-Werkzeugen begleiten soll. Dennoch bleibt die Frage, ob Schulen in einkommensschwachen Regionen die technische Infrastruktur und Lehrkräftekompetenzen haben, um diese Tools effektiv einzusetzen (BMBWF, 2023b). Eine österreichspezifische Survey-Studie mit ca. 600 Sekundarschullehrenden zeigt: Lehrende bevorzugen praxisnahe, schulnahe Fortbildungsformate — strukturelle Barrieren (Zeit, Infrastruktur) sind dabei die Haupthindernisse, nicht mangelndes Interesse (Hormann et al., 2024). Die österreichische KI-Pilotschulinitiative ist ein erster Schritt, muss aber strukturell verankert werden (BMB, 2024).

Literatur (Herausforderungen)

Ahn, J., Verma, R., Lou, R., Liu, D., Zhang, R., & Yin, W. (2024). Do large language models know what they don't know? Uncertainty estimation with applications to mathematical reasoning. arXiv:2402.00157. https://doi.org/10.48550/arXiv.2402.00157

Ahn, J., Verma, R., Lou, R. · 2024 · arXiv:2402.00157 (preprint) ★★★★★ 9/10
Survey zu Unsicherheitsschätzung bei LLMs mit besonderem Fokus auf mathematisches Reasoning. Befund: LLMs zeigen systematisch überhöhtes Vertrauen in falsche geometrische Aussagen — besonders bei Beweisaufgaben, die visuelles Reasoning erfordern. Unterscheidet…

Prahmana, R. C. I., Kusaka, S., Peni, N. R. N., Endo, H., Azhari, A., & Tanikawa, K. (2024). Cross-cultural insights on computational thinking in geometry: Indonesian and Japanese students' perspectives. Journal on Mathematics Education, 15(2), 613–638. https://doi.org/10.22342/jme.v15i2.pp613-638

Prahmana, R. C. I., Kusaka, S., Peni, N. R. N. · 2024 · Journal on Mathematics Education ★★★★★ 3/10
Indonesian and Japanese students apply significantly different computational thinking strategies when solving geometry problems with Scratch. Cultural background influences how students algorithmically structure geometry tasks. Calls for culturally sensitive A…

Zulu, S., & Brijlall, D. (2024). Exploring preservice teachers' pedagogical content knowledge for teaching analytical geometry in multilingual classrooms. Pythagoras, 45(1), Article 802. https://doi.org/10.4102/pythagoras.v45i1.802

Zulu, S., Brijlall, D. · 2024 · Pythagoras ★★★★★ 3/10
Twenty South African pre-service teachers showed predominantly procedural rather than conceptual PCK for analytical geometry in multilingual classrooms. Implications for multilingual AI-supported teacher education systems.

Botana, F., & Recio, T. (2024). Geometric loci and ChatGPT: Caveat emptor! Computation, 12(2), 30. https://doi.org/10.3390/computation12020030

Botana, F., Recio, T. · 2024 · Computation, 12(2), 30 ★★★★★ 10/10
Systematischer Benchmark von ChatGPT 3.5 vs. GeoGebra 5 bei geometrischen Ortskurvenaufgaben (Einhüllende ebener Kurvenfamilien). Ergebnis: ChatGPT scheitert in den meisten Fällen; GeoGebra löst zuverlässig. Warnung ('Caveat Emptor!') an Lehrende, die ChatGPT …

Ateeq, A. K., Iqbal, R., Liz Thomas, A., & Shubair, R. (2024). Academic integrity in the age of generative AI. Frontiers in Education, 9, 1470979. https://doi.org/10.3389/feduc.2024.1470979

Ateeq, A.K., Iqbal, R., Liz Thomas, A. · 2024 · Frontiers in Education, 9, 1470979 ★★★★★ 9/10
Große empirische Studie (N = 1.247 Studierende, N = 284 Lehrende) zu akademischer Integrität im KI-Zeitalter. Zentralbefund: 58% der Studierenden haben KI für nicht autorisierte Aufgabenbearbeitung genutzt; 71% der Lehrenden sind unsicher, wie KI-generierte Lö…

Bastani, H., Bastani, O., Sungu, A., Ge, H., Kabakcı, Ö., & Mariman, R. (2025). Generative AI without guardrails can harm learning. Proceedings of the National Academy of Sciences. https://doi.org/10.1073/pnas.2422633122

Bastani, H., Bastani, O., Sungu, A. · 2025 · Proceedings of the National Academy of Sciences (PNAS) ★★★★★ 10/10
Feldexperiment mit ~1.000 Oberschüler:innen: GPT-4 ohne Guardrails verbesserte Übungsleistung um 48%, GPT Tutor (mit Schutzmaßnahmen) um 127%. Kritischer Befund: Schüler:innen mit uneingeschränktem KI-Zugang schnitten in Prüfungen ohne KI 17% schlechter ab — A…

Botana, F., Recio, T., & Vélez, M. P. (2024). On using GeoGebra and ChatGPT for geometric discovery. Computers, 13(8), 187. https://doi.org/10.3390/computers13080187

Botana, F., Recio, T. · 2024 · Computation, 12(2), 30 ★★★★★ 10/10
Systematischer Benchmark von ChatGPT 3.5 vs. GeoGebra 5 bei geometrischen Ortskurvenaufgaben (Einhüllende ebener Kurvenfamilien). Ergebnis: ChatGPT scheitert in den meisten Fällen; GeoGebra löst zuverlässig. Warnung ('Caveat Emptor!') an Lehrende, die ChatGPT …

Buchholtz, N., Schorcht, S., Baumanns, L., Huget, J., Noster, N., Rott, B., Siller, H.-S., & Sommerhoff, D. (2024). Damit rechnet niemand! Mitteilungen der Gesellschaft für Didaktik der Mathematik, 117, 15–24. https://ojs.didaktik-der-mathematik.de/index.php/mgdm/article/view/1249

Buchholtz, N., Schorcht, S., Baumanns, L. · 2024 · Mitteilungen der Gesellschaft für Didaktik der Mathematik, Nr. 117 ★★★★★ 9/10
Positionspapier von 8 deutschen Mathematikdidaktiker:innen: sechs Leitgedanken zu Implikationen und Forschungsbedarfen für KI-Technologien (generative KI, ChatGPT) im Mathematikunterricht. Behandelt explizit Problemlösen, Beweisen, Modellieren und Assessment. …

Bundesministerium für Bildung, Wissenschaft und Forschung [BMBWF]. (2023b). Masterplan für die Digitalisierung im Bildungswesen. https://www.bmb.gv.at/Themen/schule/zrp/dibi/mp.html

Bundesministerium für Bildung [BMB]. (2024). KI-Pilotschulen. https://www.bmb.gv.at/ki

Frieder, S., Pinchetti, L., Chevalier, A., Griffiths, R.-R., Salvatori, T., Lukasiewicz, T., Petersen, P. C., & Berner, J. (2023). Mathematical capabilities of ChatGPT. NeurIPS 2023 Datasets and Benchmarks Track. https://doi.org/10.48550/arXiv.2301.13867

Frieder, S., Pinchetti, L., Chevalier, A. · 2023 · NeurIPS 2023 Datasets and Benchmarks Track ★★★★★ 9/10
Evaluation von ChatGPT und GPT-4 auf GHOSTS/miniGHOSTS-Datensätzen (Mathematik auf Hochschulniveau). Kernbefund: 'Gesamte mathematische Leistung liegt deutlich unter dem Niveau eines Doktoranden.' GPT-4 bewältigt Grundstudiums-Mathematik, scheitert aber auf Gr…

Kovács, Z., Recio, T., & Vélez, M. P. (2024). Showing proofs, assessing difficulty with GeoGebra Discovery. arXiv:2401.11900.

Kovács, Z., Recio, T., Vélez, M.P. · 2024 · arXiv / GeoGebra Discovery Research ★★★★★ 9/10
GeoGebra Discovery erweitert GeoGebra um automatisierte Beweisführung: Der ShowProof-Befehl zeigt Schritt-für-Schritt-Beweissequenzen für geometrische Aussagen; ein Schwierigkeitswert bewertet den 'Überraschungsgrad' eines Satzes relativ zu seinen Voraussetzun…

Lu, P., Bansal, H., Xia, T., Liu, J., Li, C., Hajishirzi, H., Cheng, H., Chang, K.-W., Galley, M., & Gao, J. (2024). MathVista. ICLR 2024. https://doi.org/10.48550/arXiv.2310.02255

Lu, P., Bansal, H., Xia, T. · 2024 · ICLR 2024 (Oral, top 1.2% aller Einreichungen) ★★★★★ 10/10
Visuelles Mathematik-Benchmark mit 6.141 Beispielen. GPT-4V erreicht 49,9% Gesamtgenauigkeit — 10,4 Prozentpunkte unter menschlicher Leistung (60,3%). Für Geometrieaufgaben: GPT-4V 58,5%, Bard 43,4%. Modelle 'kämpfen oft darum, komplexe Figuren zu verstehen un…

OECD. (2023). OECD Digital Education Outlook 2023. OECD Publishing.

OECD. (2024). The potential impact of artificial intelligence on equity and inclusion in education. OECD Publishing.

Pädagogische Hochschule Wien. (2024). Positionspapier: KI in der Hochschulbildung. https://phwien.ac.at/wp-content/uploads/2024/02/PHW-Positionspapier-KI-in-der-Hochschulbildung-Februar-2024.pdf

Wang, K., Pan, J., Shi, W., Lu, Z., Ren, H., Zhou, A., Zhan, M., & Li, H. (2024). Measuring multimodal mathematical reasoning with the MATH-Vision dataset. NeurIPS 2024.

Wang, X., Chan, K. K., Li, Q. · 2024 · Journal of Educational Computing Research (SAGE) ★★★★★ 9/10
Meta-analysis of 17 empirical studies (n=1,665 children ages 3-8). CT interventions show statistically significant large effect size (d=0.83) on young children's development. Geometry and spatial skills are among the most commonly addressed mathematical domain…

Wardat, Y., Tashtoush, M. A., AlAli, R., & Jarrah, A. M. (2023). ChatGPT: A revolutionary tool for teaching and learning mathematics. Eurasia Journal of Mathematics, Science and Technology Education, 19(7), em2286. https://doi.org/10.29333/ejmste/13272

Wardat, Y., Tashtoush, M.A., AlAli, R. · 2023 · Eurasia Journal of Mathematics, Science and Technology Education, 19(7), em2286 ★★★★ 8/10
Qualitative Fallstudie durch Inhaltsanalyse von Interviews und Social-Media-Diskursen zu ChatGPT im Mathematikunterricht. Befund: ChatGPT ist effektiv für grundlegende Mathematik, hat aber explizit 'kein tiefes Verständnis von Geometrie und kann Fehlvorstellun…

Wei, X. (2024). Evaluating ChatGPT-4 and ChatGPT-4o. Frontiers in Education, 9, 1452570. https://doi.org/10.3389/feduc.2024.1452570

Wei, X. · 2024 · Frontiers in Education, 9, 1452570 ★★★★★ 10/10
Evaluation von GPT-4 und GPT-4o auf NAEP-Mathematikaufgaben (4., 8., 12. Klasse): Geometrie/Messung ist der schwächste Inhaltsbereich — GPT-4: 53%, GPT-4o: 59% (vs. 79%/92% in Algebra). Räumliches Denken und visuelle Informationsverarbeitung als fundamentale B…

European Data Protection Board. (2024). Opinion 28/2024 on certain data protection aspects related to AI models. https://www.edpb.europa.eu/system/files/2024-12/edpb_opinion_202428_ai_models_en.pdf

Europäische Kommission. (2022). Ethical guidelines on the use of AI and data in teaching and learning for educators. Publications Office of the European Union. https://doi.org/10.2766/153756

Hannan, E., & Eynon, R. (2025). The digital divide in intelligent tutoring systems: Differential effects of AI-assisted learning by socioeconomic status. Computers & Education, 226, 105312. https://doi.org/10.1016/j.compedu.2025.105312

Hannan, B., Eynon, R. · 2025 · Computers & Education ★★★★★ 10/10
N = 66.451 australische Sekundarschüler:innen (Klassen 7–10), 304 Schulen, AdaptiveMath ITS, Schuljahr 2023. ITS-Nutzung mediierte die Beziehung zwischen sozioökonomischem Vorteil und Lernleistung – im Sinne eines 'Matthew Effect': Privilegierte Schüler:innen …

Pardos, Z. A., & Bhandari, S. (2024). Hallucination mitigation in affective computing and educational AI. PLOS ONE, 19(6), e0304013. https://doi.org/10.1371/journal.pone.0304013

Pardos, Z.A., Bhandari, S. · 2024 · PLOS ONE, 19(6), e0304013 ★★★★★ 10/10
Systematische Untersuchung von Strategien zur Reduzierung von Halluzinationen in bildungs-KI-Kontexten. Testet Chain-of-Thought-Prompting, Selbstreflexionsaufforderungen und Retrieval-Augmented Generation (RAG) bei mathematischen Reasoning-Aufgaben. Befund: Se…

von Hippel, P. T. (2023). GPT-4 can't reason. Education Next, 23(4). https://www.educationnext.org/gpt-4-cant-reason/

Wijaya, T. T., Cao, Y., Weinhandl, R., Tamur, M., & Murni, A. (2024). AI dependency in mathematics: Understanding teacher perspectives and student behavioral patterns. Behavioral Sciences, 14(11), 1008. https://doi.org/10.3390/bs14111008

Wijaya, T.T., Cao, Y., Weinhandl, R. · 2024 · Behavioral Sciences, 14(11), 1008 ★★★★★ 9/10
Mixed-Methods-Studie zu KI-Abhängigkeit aus Lehrenden- und Schüler:innen-Perspektive. Identifiziert 4 Typen von Abhängigkeitsverhalten: prozedurales Auslagern, konzeptionelle Abhängigkeit, metakognitive Regression und motivationale Erosion. Geometrie als Haupt…

Xu, Z., Jain, S., & Kankanhalli, M. (2024). Hallucination is inevitable: An innate limitation of large language models. arXiv:2401.11817.

Xu, S., Luo, Y., Shi, W. · 2024 · arXiv / ACM Proceedings ★★★★★ 5/10
Geo-LLaVA combines retrieval-augmented training with supervised fine-tuning for plane and spatial geometry. Achieved 65.25% on GeoQA (Chinese school geometry) and 42.36% on GeoMath (university geometry). First LLM applied to 3D solid geometry tasks from school…

Yin, C., Rajendran, R., Mørch, A., Ogata, H., & Roy, D. (2024). Towards FairAIED: Bias and fairness in AI-powered educational technologies. arXiv:2407.18745.

Yin, C., Rajendran, R., Mørch, A. · 2024 · arXiv:2407.18745 (preprint, submitted to Educational Technology & Society) ★★★★ 8/10
Systematisches Review zu Bias und Fairness in KI-gestützten Bildungstechnologien. Kategorisiert Bias-Typen: algorithmischer Bias (Trainingsdaten), evaluativer Bias (Bewertungsmetriken) und institutioneller Bias (Deployment-Entscheidungen). Befund: Geometrie-sp…

Zhang, J., Li, Z.-Z., Zhang, M.-L., Yin, F., Liu, C.-L., & Moshfeghi, Y. (2024). GeoEval: Benchmark for evaluating LLMs and multi-modal models on geometry problem-solving. In Findings of ACL 2024 (pp. 1258–1276). https://doi.org/10.18653/v1/2024.findings-acl.73

Zhang, R., Jiang, D., Zhang, Y. · 2024 · Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186) ★★★★★ 10/10
2.612-Problem-Datensatz (ebene Geometrie, Körpergeometrie, Funktionen) in 6 Varianten (mit/ohne Diagramm). Zentrale Entdeckung: 'Die meisten MLLMs verstehen Mathematikdiagramme nicht — sie verlassen sich auf den Textanteil der Aufgabe.' Einige Modelle erzielte…

Zhang, R., Jiang, D., Zhang, Y., Lin, H., Guo, Z., Qiu, P., Zhou, A., Lu, P., Chang, K.-W., Gao, P., & Li, H. (2024). MathVerse: Does your multi-modal LLM truly see the diagrams in visual math problems? In Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186). Springer. https://doi.org/10.1007/978-3-031-73242-3_10

Zhang, R., Jiang, D., Zhang, Y. · 2024 · Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186) ★★★★★ 10/10
2.612-Problem-Datensatz (ebene Geometrie, Körpergeometrie, Funktionen) in 6 Varianten (mit/ohne Diagramm). Zentrale Entdeckung: 'Die meisten MLLMs verstehen Mathematikdiagramme nicht — sie verlassen sich auf den Textanteil der Aufgabe.' Einige Modelle erzielte…

Sharma, A., Dalmia, A., Kazemi, M., Zouaq, A., & Pal, C. (2025). GeoCoder: Solving geometry problems by generating modular code through vision-language models. In Findings of NAACL 2025 (pp. 7340–7356). https://doi.org/10.18653/v1/2025.findings-naacl.410

Sharma, A., Dalmia, A., Kazemi, M. · 2025 · Findings of the Association for Computational Linguistics: NAACL 2025 (pp. 7340–7356) ★★★★★ 9/10
GeoCoder lässt Vision-Language-Modelle modularen, ausführbaren Code aus einer vordefinierten Geometriefunktionsbibliothek generieren — statt freie Textlösungen. RAG-GeoCoder (retrieval-augmented) verbessert die Leistung auf GeoQA und Geometry3K deutlich. Zeigt…

Wu, W., Ye, J., Wang, Z.-K., Zhou, Z., Li, Y.-F., & Guo, L.-Z. (2025). NeSyGeo: A neuro-symbolic framework for multimodal geometric reasoning data generation. arXiv:2505.17121. https://arxiv.org/abs/2505.17121

Wu, W., Ye, J., Wang, Z.-K. · 2025 · arXiv:2505.17121 (preprint) ★★★★ 8/10
Neuro-symbolisches Framework, das automatisch 100k geometrische Reasoning-Daten synthetisiert: symbolische Sequenzen → Diagramme → Frage-Antwort-Paare (durch Vorwärts-Validierung korrektheitsgaran­tiert). MLLMs mit 4k NeSyGeo-Samples + RL erzielen +15,8 % auf …

Pan, Y., Zhang, Z., Hu, P., Ma, J., Du, J., Zhang, J., Liu, Q., Gao, J., & Ma, F. (2025). Enhancing the geometric problem-solving ability of multimodal LLMs via symbolic-neural integration. In Proceedings of ACM MM 2025 (Article 3754571). https://doi.org/10.1145/3746027.3754571

Pan, Y., Zhang, Z., Hu, P. · 2025 · Proceedings of the 33rd ACM International Conference on Multimedia (ACM MM 2025) ★★★★★ 9/10
GeoGen-Pipeline: symbolische Geometrielöser generieren nachweislich korrekte, schrittweise Lösungen für diagrammbasierte Probleme im großen Maßstab; GeoLogic (neurales Modell) überbrückt natürliche Sprache und symbolische Verifikation. Reduziert Halluzinatione…

Zhang, Y., Hu, D., Yu, T., Liu, H., & Liu, Y. (2025). GeoFM: Enhancing geometric reasoning of MLLMs via synthetic data generation through formal language. arXiv:2510.27448. https://arxiv.org/abs/2510.27448

Zhang, R., Jiang, D., Zhang, Y. · 2025 · ICLR 2025 (International Conference on Learning Representations) ★★★★★ 9/10
Automatisierte Datenpipeline für visuelle Mathematik-Instruktionstuning von MLLMs. MAVIS-7B übertrifft GPT-4V auf geometrischen Benchmarks (MathVerse: +15,9%) durch dedizierten Geometrie-Datensatz mit 558k Beispielen. Zeigt: Spezialisiertes Training auf geomet…

Csiba, P., & Vajo, P. (2024). Problems and challenges of using randomized automatically evaluating geometric construction problems in Moodle LMS. AIMS Mathematics, 9(3), 5234–5249. https://doi.org/10.3934/math.2024253

Csiba, P., Vajo, P. · 2024 · AIMS Mathematics, Vol. 9(3), pp. 5234–5249 ★★★★ 8/10
Untersucht das Fehlen geometrischer Konstruktionsaufgaben in nationalen und internationalen Mathematiküberprüfungen und schlägt GeoGebra-basierte, automatisch bewertete Applets als Lösung vor. Direkt relevant für KI-resistentes Assessment-Design und LMS-Integr…

Hamady, S., Mershad, K., & Jabakhanji, B. (2024). Multi-version interactive assessment through the integration of GeoGebra with Moodle. Frontiers in Education, 9, 1466128. https://doi.org/10.3389/feduc.2024.1466128

Hamady, S., Mershad, K., Jabakhanji, B. · 2024 · Frontiers in Education ★★★★★ 10/10
Untersuchung der Integration von GeoGebra in Moodle für interaktive, KI-resistente Assessments. Zeigt wie dynamische Geometrie-Inhalte die Testintegrität verbessern und gleichzeitig tieferes Lernen fördern. Relevant für Kapitel 07 und die Prüfungsintegritätsdi…

de Winter, J. C. F., Dodou, D., & Eisma, Y. B. (2024). System 2 thinking in OpenAI's o1-preview model: Near-perfect performance on a mathematics exam. Computers, 13(11), 278. https://doi.org/10.3390/computers13110278

Tate, T. P., Doroudi, S., Ritchie, D., Xu, Y., & Warschauer, M. (2024). Cheating in the age of generative AI: A high school survey study of cheating behaviors before and after the release of ChatGPT. Computers and Education: Artificial Intelligence, 6, 100210. https://doi.org/10.1016/j.caeai.2024.100210

Tate, T. P., Doroudi, S., Ritchie, D. · 2024 · Computers and Education: Artificial Intelligence, Vol. 6, Art. 100210 ★★★★★ 9/10
Längsschnittliche Befragungsstudie (US-amerikanische High Schools, vor/nach ChatGPT-Release): Gesamtbetrugsrate stabil bei 60–70 %, kein signifikanter Anstieg durch ChatGPT-Einführung. 9–16 % der Schüler:innen nutzten KI für vollständige Texte, 55–77 % für Ide…

Krátká, M., Přibyl, J., & Tichá, M. (2025). AI in the classroom: Didactical misalignments in geometry between Czech and Anglo-Saxon contexts. 24th European Conference on e-Learning (ECEL), 24(1). https://papers.academic-conferences.org/index.php/ecel/article/view/4048

Krátká, M., Přibyl, J., Tichá, M. · 2025 · 24th European Conference on e-Learning (ECEL), Vol. 24(1) ★★★★★ 9/10
Systematische Analyse von ChatGPT, Gemini, Claude, Copilot und Mistral zu Geometrieprompts auf Tschechisch und Englisch. Zentralbefund: KI-Tools reproduzieren angelsächsische Konzeptualisierungen (z.B. Quadrat als Spezialfall des Rechtecks), die mit tschechisc…

Hormann, C., Kuka, L., Schmidthaler, E., & Sabitzer, B. (2024). Digital education training for teachers — Learnings from Austria. Frontiers in Education, 9, Article 1490123. https://doi.org/10.3389/feduc.2024.1490123

Luo, S., Zhu, Z., Yuan, Y., Yang, Y., Shan, L., & Wu, Y. (2025). GeoGramBench: Benchmarking the geometric program reasoning in modern LLMs. arXiv:2505.17653. https://arxiv.org/abs/2505.17653

Luo, S., Zhu, Z., Yuan, Y. · 2025 · arXiv:2505.17653 ★★★★ 8/10
500 Geometrieprobleme (3-Level-Taxonomie: Primitive Recognition, Local Relation Composition, Global Abstract Integration). Evaluation von 19 Frontier-LLMs inkl. GPT-o1. Kein Modell übersteigt 50% Genauigkeit auf dem höchsten Abstraktionslevel. Testet ob LLMs g…

Abdullaeva, I., Vasiliuk, A., Goncharova, E., Rahmatullaev, T., Ivan, Z., Kurkin, M., & Kuznetsov, A. (2026). NoReGeo: Non-reasoning geometry benchmark. arXiv:2601.10254. https://arxiv.org/abs/2601.10254

Abdullaeva, I., Vasiliuk, A., Goncharova, E. · 2026 · arXiv:2601.10254 (Januar 2026) ★★★★ 8/10
2.500 Geometrieprobleme in 25 Kategorien; keine algebraischen Berechnungen oder Chain-of-Thought nötig — reines geometrisches Verständnis. Evaluation von 45+ Modellen. Beste Genauigkeit: ~65% (text-LLMs), ~74,5% (stärkstes VLM). Zeigt: geometrisches Verständni…

Zhao, Z., Wang, J., Liu, Y., King, I., & Huang, J. (2025). A survey of geometric reasoning: From benchmarks to multimodal foundation models. arXiv:2506.02690. https://arxiv.org/abs/2506.02690

Zhao, Y., Wang, X., Liu, J. · 2025 · arXiv:2506.02690 ★★★★ 8/10
Survey zu KI-Geometrielösung im Zeitalter großer Modelle. Dokumentiert Wachstum von Deep-Learning-Papers zu Geometrie von ~1 (2018) auf 110 (2024). 61% der aktuellen MLLM-Fehler sind Diagramm-Missinterpretation. Neuro-symbolische Integration und automatisierte…

Turmuzi, M., Azmi, S., & Kertiyani, N. M. I. (2026). ChatGPT in school mathematics education: A systematic review of opportunities, challenges, and pedagogical implications. Teaching and Teacher Education, 170, 105286. https://doi.org/10.1016/j.tate.2025.105286

Turmuzi, M., Azmi, S., Kertiyani, N. M. I. · 2026 · Teaching and Teacher Education ★★★★★ 9/10
PRISMA-basiertes systematisches Review von 20 empirischen Studien (2023–2025). In 70% der Studien war ChatGPT effektiv bei sofortiger Rückmeldung und personalisierter Unterstützung. In 40% der Studien wurde Überabhängigkeit der Schüler:innen dokumentiert. Gren…

Zhao, J., Zhang, T., Sun, J., Tian, M., & Huang, H. (2025). Pi-GPS: Enhancing geometry problem solving by unleashing the power of diagrammatic information. arXiv:2503.05543. https://arxiv.org/abs/2503.05543

Zhao, Y., Wang, X., Liu, J. · 2025 · arXiv:2506.02690 ★★★★ 8/10
Survey zu KI-Geometrielösung im Zeitalter großer Modelle. Dokumentiert Wachstum von Deep-Learning-Papers zu Geometrie von ~1 (2018) auf 110 (2024). 61% der aktuellen MLLM-Fehler sind Diagramm-Missinterpretation. Neuro-symbolische Integration und automatisierte…

Hannan, B., & Eynon, R. (2025). Widening the digital divide: The mediating role of Intelligent Tutoring Systems in the relationship between rurality, socioeducational advantage, and mathematics learning outcomes. Computers & Education, 233, Article 105312. https://doi.org/10.1016/j.compedu.2025.105312

Hannan, B., Eynon, R. · 2025 · Computers & Education ★★★★★ 10/10
N = 66.451 australische Sekundarschüler:innen (Klassen 7–10), 304 Schulen, AdaptiveMath ITS, Schuljahr 2023. ITS-Nutzung mediierte die Beziehung zwischen sozioökonomischem Vorteil und Lernleistung – im Sinne eines 'Matthew Effect': Privilegierte Schüler:innen …

Kultusministerkonferenz [KMK]. (2024, Oktober). Handlungsempfehlung für die Bildungsverwaltung zum Umgang mit Künstlicher Intelligenz in schulischen Bildungsprozessen. https://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/2024/2024_10_10-Handlungsempfehlung-KI.pdf

Ständige Wissenschaftliche Kommission der KMK [SWK]. (2024). Large Language Models und ihre Potenziale im Bildungssystem [Impulspapier]. https://doi.org/10.25656/01:28303

Feng, T., et al. (2024). Evaluating GPT-4o's geometric reasoning in educational contexts. In SIGGRAPH Asia 2024 Educator's Forum (ACM). https://doi.org/10.1145/3680533.3697064

Feng, T. H., Denny, P., Wünsche, B. C. · 2024 · SIGGRAPH Asia 2024 Educator's Forum (ACM) ★★★★★ 9/10
Evaluation of GPT-4o on computer graphics and geometry questions with varying visual demands. GPT-4o performs significantly better on text-only than image-containing questions. Fails at precise geometric operations (e.g., cannot correctly reason about a sliced…

Shi, W., et al. (2024). Can LLMs perform spatial reasoning? The StepGame Benchmark. arXiv:2401.03991. https://arxiv.org/abs/2401.03991

Shi, W., et al. · 2024 · arXiv preprint ★★★★ 7/10
Benchmark-Studie: Alle LLMs versagen auf einfachsten räumlichen Aufgaben ohne Chain-of-Thought. Mit CoT verbessert sich GPT-4o-Genauigkeit von 12,4% auf 87,5% bei Routenplanung. Zeigt fundamentale Grenzen räumlichen Schlussfolgerns bei Standard-LLMs — und zeig…

Saarela, M., Gunasekara, S., & Karimov, A. (2025). The EU AI Act: Implications for ethical AI in education. In DESRIST 2025, Lecture Notes in Computer Science, Vol. 15704 (pp. 36–50). Springer. https://doi.org/10.1007/978-3-031-93979-2_3

Saarela, M., Gunasekara, S., Karimov, A. · 2025 · DESRIST 2025 / Lecture Notes in Computer Science, Vol. 15704 ★★★★ 8/10
Systematische Analyse des EU AI Act für Bildungsanwendungen. KI in der Bildung gilt als Hochrisiko-KI (Annex III) wenn zur Beurteilung, Lernpfad-Steuerung oder Bildungszugang genutzt. Schulen als 'Deployer' (Art. 29) unterliegen Konformitätspflichten. Identifi…

Song, Y., Li, X., Xing, W., Lim, C. P., & Guo, Y. (2025). Equity and fairness in AI-assisted mathematics learning: A large-scale longitudinal study. Internet and Higher Education, 66, 100978. https://doi.org/10.1016/j.iheduc.2025.100978

Song, C., Wang, Z., Pu, F. · 2025 · arXiv:2508.14644 ★★★★ 8/10
Extends LeanEuclid to competition-level problems with a comprehensive library of geometric theorems integrating Mathlib in Lean 4. LeanGeo-Bench draws from IMO and other advanced competition sources. State-of-the-art LLMs perform poorly on this benchmark, reve…

Zhang, R., Jiang, D., Zhang, Y., Lin, H., Guo, Z., Qiu, P., Zhou, A., Lu, P., Chang, K.-W., Gao, P., & Li, H. (2025). MAVIS: Mathematical visual instruction tuning with an automatic data engine. ICLR 2025. https://doi.org/10.48550/arXiv.2407.08739

Zhang, R., Jiang, D., Zhang, Y. · 2025 · ICLR 2025 (International Conference on Learning Representations) ★★★★★ 9/10
Automatisierte Datenpipeline für visuelle Mathematik-Instruktionstuning von MLLMs. MAVIS-7B übertrifft GPT-4V auf geometrischen Benchmarks (MathVerse: +15,9%) durch dedizierten Geometrie-Datensatz mit 558k Beispielen. Zeigt: Spezialisiertes Training auf geomet…

Gouseti, A., James, F., Fallin, L., & Burden, K. (2024). The ethics of using AI in K-12 education: A systematic literature review. Technology, Pedagogy and Education, 34(2), 161–182. https://doi.org/10.1080/1475939X.2024.2428601

Gouseti, A., James, F., Fallin, L. · 2024 · Technology, Pedagogy and Education ★★★★ 8/10
Systematisches Literaturreview zur Ethik von KI im K-12-Bildungsbereich. Stellt fest, dass spezifische KI-Ethik-Leitlinien für Kinder und K-12-Unterricht hinter allgemeinen KI-Ethik-Frameworks zurückbleiben. Deckt Datenschutz, Bias, Transparenz und ethische Go…

Lünich, M., Keller, B., & Marcinkowski, F. (2024). Diverging perceptions of artificial intelligence in higher education: A comparison of student and public assessments on risks and damages of academic performance prediction in Germany. Computers and Education: Artificial Intelligence, 7, 100305. https://doi.org/10.1016/j.caeai.2024.100305

Lünich, M., Keller, B., Marcinkowski, F. · 2024 · Computers and Education: Artificial Intelligence ★★★★ 7/10
Standardisierte Online-Befragung (Deutschland) vergleicht Wahrnehmungen von akademischen Leistungsvorhersagen (APP) durch KI zwischen Studierenden und Allgemeinbevölkerung. Studierende sehen höhere individuelle Schäden, obwohl sie allgemeines Risiko nicht höhe…

Matjie, M. A., Nethavhani, A., & Matlakala, M. (2026). AI and the digital divide in education. Frontiers in Computer Science, 8, Article 1759027. https://doi.org/10.3389/fcomp.2026.1759027

Matjie, M. A., Nethavhani, A., Matlakala, M. · 2026 · Frontiers in Computer Science ★★★★★ 4/10
Analyzes how AI systems structurally reinforce educational inequalities through language barriers (English-trained models), cultural biases in training data, and unequal infrastructure. Institutions with weak digital infrastructure benefit systematically less …

Zhu, W., Xing, W., Lyu, B., Li, C., Zhang, F., & Li, H. (2025). Bridging the gender gap: The role of AI-powered math story creation in learning outcomes. In LAK '25: Proceedings of the 15th International Learning Analytics and Knowledge Conference (pp. 1–10). ACM. https://doi.org/10.1145/3706468.3706539

Zhu, W., Xing, W., Lyu, B. · 2025 · LAK '25: Proceedings of the 15th International Learning Analytics and Knowledge Conference ★★★★★ 4/10
Girls showed significantly higher engagement and stronger learning gains in mathematics when using an AI-powered platform for mathematical story creation. Bayesian structural equation models confirmed that creating AI-generated math stories improves narrative …

Caffaratti, L., Ballestra, L., Longobardi, C., Badenes-Ribera, L., & Marengo, D. (2025). AI adoption among adolescents in education: Extending the UTAUT2 with psychological and contextual factors. Frontiers in Artificial Intelligence, 8, Article 1614993. https://doi.org/10.3389/frai.2025.1614993

Caffaratti, L., Ballestra, L., Longobardi, C. · 2025 · Frontiers in Artificial Intelligence ★★★★★ 3/10
N=933 Italian high school students. Students with migration background showed significantly higher AI usage habits than peers. Vocational school students showed higher AI use than academic-track students. Extends UTAUT2 with psychological and contextual factor…

Rizos, I., Foykas, E., & Georgakopoulos, S. V. (2024). Enhancing mathematics education for students with special educational needs through generative AI: A case study in Greece. Contemporary Educational Technology, 16(4), ep535. https://doi.org/10.30935/cedtech/15487

Rizos, I., Foykas, E.,, Georgakopoulos, S. V · 2024 · Contemporary Educational Technology ★★★★★ 12/10
Neunstündige Unterrichtsintervention in Griechenland: Zwei Achtklässler mit sonderpädagogischem Förderbedarf arbeiteten mit ChatGPT-3.5-generierten Arbeitsblättern, die auf Lehrplanziele und individuelle Interessen abgestimmt waren. Ergebnis: aktive Beteiligun…

Rezat, S. (2025). The quality of digital curriculum resources for mathematics in German educational policy. ZDM – Mathematics Education. https://doi.org/10.1007/s11858-025-01708-w

Rezat, S. · 2025 · ZDM – Mathematics Education ★★★★★ 5/10
Qualitative content analysis of approval procedures and quality criteria of all 16 German federal states for digital mathematics learning materials. Investigates three dimensions of state quality assurance and their impact on digital curriculum development. On…

Yang, Y., Chen, L., He, W., Sun, D., & Salas-Pilco, S. Z. (2025). Artificial intelligence for enhancing special education for K-12: A decade of trends, themes, and global insights (2013–2023). International Journal of Artificial Intelligence in Education. https://doi.org/10.1007/s40593-024-00422-0

Yang, Y., Chen, L., He, W., Sun, D.,, Salas-Pilco, S. Z · 2025 · International Journal of Artificial Intelligence in Education ★★★★★ 14/10
Systematisches Review: zehn Jahre KI-Einsatz in der Sonderpädagogik für K-12 (2013–2023). Identifiziert Haupttrends: adaptive Lernsysteme, KI-gestützte Diagnose, personalisiertes Feedback für SuS mit besonderen Bildungsbedürfnissen. Zeigt erhebliche Forschungs…

Egara, F. O., Mosimege, M., & Mosia, M. (2025). Secondary school students' perceptions of their usage of artificial intelligence-based ChatGPT in mathematics learning. Journal of Education, 98, 124–146. https://doi.org/10.17159/2520-9868/i98a07

Egara, F. O., Mosimege, M., Mosia, M. · 2025 · Journal of Education ★★★★ 8/10
Erklärender sequenzieller Mixed-Methods-Ansatz (N=125 Sekundarschüler:innen, Nigeria): Schüler:innen berichten wahrgenommene Vorteile von ChatGPT für Verständnis und Problemlösung, aber auch Sorgen bezüglich Genauigkeit und Überforderung. Liefert empirische Gr…

Zhang, D., Wijaya, T. T., Wang, Y., Su, M., Li, X., & Damayanti, N. W. (2025). Exploring the relationship between AI literacy, AI trust, AI dependency, and 21st century skills in preservice mathematics teachers. Scientific Reports, 15, Article 14281. https://doi.org/10.1038/s41598-025-99127-0

Zhang, R., Jiang, D., Zhang, Y. · 2025 · ICLR 2025 (International Conference on Learning Representations) ★★★★★ 9/10
Automatisierte Datenpipeline für visuelle Mathematik-Instruktionstuning von MLLMs. MAVIS-7B übertrifft GPT-4V auf geometrischen Benchmarks (MathVerse: +15,9%) durch dedizierten Geometrie-Datensatz mit 558k Beispielen. Zeigt: Spezialisiertes Training auf geomet…

Kaya, D., & Yavuz, S. (2025). Can generative AI and ChatGPT break human supremacy in mathematics and reshape competence in cognitive-demanding problem-solving tasks? Journal of Intelligence, 13(4), Article 43. https://doi.org/10.3390/jintelligence13040043

Kaya, D., Yavuz, S. · 2025 · Journal of Intelligence ★★★★ 8/10
Vergleich von ChatGPT-4o und GPT-4 mit US-Schülerleistungen (Klassen 4/8/12) auf 60 NAEP-Mathematikaufgaben nach kognitivem Anforderungsniveau. KI übertrifft meist Schülerleistungen, zeigt aber bei Geometrie- und Messaufgaben systematisch schwächere Ergebnisse…

Miao, F., & Holmes, W. (2023). Guidance for generative AI in education and research. UNESCO Publishing. https://unesdoc.unesco.org/ark:/48223/pf0000386693

Miao, F., Holmes, W. · 2023 · UNESCO ★★★★★ 6/10
UNESCO-Rahmen für den humanzentrierten Einsatz generativer KI in Bildung und Forschung: Forderungen nach nationalen Regulierungen, Datenschutz, altersgerechtem Zugang und ethischer Validation. Richtet sich an Bildungspolitiker:innen und Hochschulen weltweit.

Bundesministerium fuer Bildung, Wissenschaft und Forschung [BMBWF]. (2023c). Handreichung KI im Bildungssystem: Chancen und Herausforderungen. BMBWF. https://www.bmbwf.gv.at/dam/jcr:c92c0f16-4e9b-46f4-b81c-f2748dd6fdd5/handreichung_ki_bildungssystem.pdf

Asiedu Menlah, C. K., & Boateng, F. O. (2025). Examining the effect of AI-based tutoring systems on students' mathematical problem-solving skills: The moderating role of mathematics anxiety. Journal of Pedagogical Sociology and Psychology, 7(3), 5–17. https://doi.org/10.33902/jpsp.202536137

Chen, F., Chen, J., & Xu, Y. (2025). The more anxious, the more dependent? The impact of math anxiety on AI-assisted problem-solving. Psychology in the Schools, 62, 2685–2701. https://doi.org/10.1002/pits.23500

Chen, E., Xu, T., Gao, Q. · 2025 · arXiv preprint ★★★★★ 3/10
Controlled study with 148 students comparing LLM-Tutor (AI proof reviewer + chatbot) to control group. LLM-Tutor significantly improved homework performance but showed no effect on exam grades. Students with low self-efficacy used chatbot more frequently, corr…

10. Ausblick

Wohin entwickelt sich KI im Geometrieunterricht?

Multimodale KI und geometrisches Sehen

Die nächste Generation von KI-Systemen versteht nicht nur Text, sondern auch Zeichnungen, Skizzen und geometrische Konstruktionen direkt als Bild. Modelle wie GPT-4o und Gemini 1.5 Pro können bereits Geometrieskizzen aus Fotos analysieren. In absehbarer Zeit werden Schüler:innen eine Skizze aufnehmen, eine Frage stellen, und das System antwortet auf genau diese Zeichnung — mit Korrektur, Hinweis oder Weiterführung. GeoGebra arbeitet bereits an Bildverarbeitungsfeatures, die Fotos von Geometrieaufgaben direkt in interaktive Konstruktionen umwandeln.

Ein Scoping Review von Yang, Du, Mavrikis und Geraniou (2025, Digital Experiences in Mathematics Education) über 23 Studien (2010–2024) belegt, dass Augmented Reality Raumvorstellungen in der Mathematikbildung nachweislich fördert — durch verkörperte, interaktive Erfahrungen, die klassische 2D-Darstellungen nicht leisten. Geometrie, Maße und visuelles Modellieren profitieren besonders. Die Forschungslandschaft ist allerdings noch fragmentiert: Unterschiedliche AR-Tools und Aufgabendesigns erschweren verallgemeinerte Aussagen.

Allerdings zeigt die bisherige Empirie deutliche Grenzen: GPT-4V erreicht nur 58,5 % Genauigkeit auf geometrischen Aufgaben mit visuellen Diagrammen (Lu et al., 2024), und manche Modelle erzielten sogar bessere Scores wenn Diagramme entfernt wurden — das Bild war Rauschen, keine Information (Zhang et al., 2024). Multimodale Geometrie-KI bleibt ein aktives Forschungsfeld, kein gelöstes Problem.

Formale Mathematik als Unterrichtsthema

Neurosymbolische Architekturen gewinnen auch abseits reiner Geometriebeweiser an Bedeutung: Ben Chaabene und Hammami (2026, Smart Learning Environments) zeigen in einem strukturierten Survey (2020–2024), wie die Integration von LLMs und Knowledge Graphs in Bildungssystemen erklärbare Reasoning-Prozesse und emotionsadaptives Lernen ermöglicht — ein direkter Brückenschlag zwischen formaler Wissensrepräsentation und tutorieller Unterstützung. Newclid (Sicca et al., 2024, arXiv) ersetzt AlphaGeometrys symbolischen Solver durch eine modularisierte Open-Source-Implementierung mit GeoGebra-Eingabe-Support und erweitert das System auf metrische Geometriekonzepte (Längen, Winkel, Pythagoras) — ein erster Schritt hin zu unterrichtstauglichem ATP.

Die Existenz von LeanEuclid — der ersten vollständigen Formalisierung von Euklids Elementen in Lean 4 (Murphy et al., 2024) — und AlphaProof, das IMO-Probleme mit Lean 4 und Reinforcement Learning auf Silbermedaillen-Niveau beweist (Hubert et al., 2025), legt nahe: Formale Beweissysteme könnten in 5–10 Jahren regulärer Bestandteil des Oberstufen- und Hochschulunterrichts werden. Das Jahr 2025 hat diese Perspektive nochmals beschleunigt: Aristotle / Harmonic beweist 5 von 6 IMO-2025-Problemen vollständig verifiziert in Lean 4 — erstmals Goldmedaillen-Niveau (Achim et al., 2025).

Lean 4 als „Mathematik-Compiler" — Code, der entweder beweisbar korrekt ist oder einen Fehler zeigt — ist eine radikal neue Art, mit Geometriebeweisen umzugehen. Bemerkenswert: LeanEuclid machte bislang unbekannte Lücken in Euklids Originalbeweisen sichtbar (Murphy et al., 2024). Das ist nicht das Ende der Mathematik als Kulturgut, sondern, wie Vuong und Ho (2024) in AI & Society argumentieren, ein Ruf zur dringenden Neuorientierung der Bildungsziele.

Die Autoformalisierung schreitet rasant voran: Herald (Gao et al., 2025, ICLR) stellt 580.000 Lean-4-Aussagen bereit; Lean-STaR (Lin et al., 2025, ICLR) verschränkt informale Denkschritte mit formalen Beweisschritten und nähert Lean-4-basierte Beweiser an Undergraduate-Niveau an. Ein Survey über das gesamte Autoformalisierungsfeld (Weng et al., 2025, arXiv) zeigt: Hochschul- und Forschungsniveau bleibt die größte offene Herausforderung. Ein paralleler Survey über Beweisassistenten in der Hochschullehre (Tran Minh et al., 2025, arXiv) bestätigt: Lean 4 hat als Lehrwerkzeug noch nicht ausreichend didaktisches Material.

Der Weg dorthin läuft über GeoGebra Discovery: Schüler:innen in der Sekundarstufe II könnten erste Erfahrungen mit automatisierten Beweissequenzen machen, bevor sie an der Hochschule mit Lean 4 in Berührung kommen (Kovács et al., 2024).

Prüfungsformate unter Druck — und neue Wege

Die Prüfungsformate, die Bildungssysteme seit Jahrzehnten nutzen, werden durch Reasoning-Modelle strukturell in Frage gestellt. De Winter et al. (2024) dokumentieren: OpenAI o1-preview erzielt auf dem niederländischen VWO-Abschlussexamen Mathematik B (Abitur-äquivalent mit analytischer Geometrie und Trigonometrie) 76 von 76 Punkten — das 97,8. Perzentil unter 16.414 Schüler:innen. Die Konsequenz: Aufgaben, die KI-Systeme auf diesem Niveau bewältigen, können nicht länger als Maßstab für menschliche mathematische Kompetenz gelten.

Die Antwort der Forschung ist dreifach: (1) Diagrammabhängige Aufgaben — GPT-4V erreicht nur 58,5 % bei visuell situierter Geometrie (Lu et al., 2024), das bleibt ein echter KI-Schwachpunkt; (2) Mündliche Verteidigung — wer einen Beweis nicht erklären kann, hat ihn nicht verstanden, unabhängig davon, ob eine KI ihn generiert hat (Dilling & Herrmann, 2024); (3) Dynamische GeoGebra-Assessments mit zufallsgenerierten Parametern, die KI nicht trivial lösen kann (Csiba & Vajo, 2024; Hamady et al., 2024).

Der Forschungsstand — und wohin er zeigt

Zwei aktuelle systematische Reviews geben ein klares Bild des Entwicklungsstands: Awang et al. (2025, IEJME) identifizieren Geometrievisualisierung als eigenständige KI-adressierbare Aufgabenkategorie und fordern explainierbare KI-Systeme, um blinde Vertrauens-Transfers zu verhindern. Nguyen und Pham (2025, EJMSTE) dokumentieren in einem Zehnjahres-Review (2015–2025) eine dramatische Beschleunigung ab 2024: Adaptive Lernpfade, personalisiertes Feedback und KI-gestützte Aufgabengenerierung sind die drei am stärksten wachsenden Anwendungsfelder. GeoGebra Tutor und MATHia werden explizit als geometriespezifisch vielversprechende adaptive Systeme genannt.

Für eine breitere Forschungsagenda plädieren Gabriel, Kennedy, Marrone und Leonard (2025, npj Science of Learning): Sie unterscheiden Lernprodukte von Lernprozessen und fordern longitudinale Studien, die KI-Einsatz mit emotionaler Regulierung (Mathematikangst) und lernenden Identitäten verbinden — ein bislang vernachlässigtes Forschungsfeld. Jaldemark et al. (2025, Postdigital Science and Education) entwickeln in einem internationalen Expert:innenpanel eine multidisziplinäre Forschungsagenda: Fünf Herausforderungen (Lehrpraktiken, Zugang & Ethik, Assessment, Forschungskapazitäten, Stakeholder-Bereitschaft) und vier transformative Themen strukturieren das Feld für die nächsten Jahre — mit direkten Implikationen für den Geometrieunterricht.

Die bildungspolitische Perspektive liefert ein OECD Working Paper (Fuster Rabella, 2025): Lehrplanentwickler:innen werden aufgerufen, systematisch zu evaluieren, welche Curriculumziele angesichts wachsender KI-Fähigkeiten gültig bleiben. Prozedurales Geometriewissen — Konstruktionen, Berechnungen, Standardverfahren — steht unter besonderem Automatisierungsdruck. Die OECD empfiehlt laufende nationale Monitoring-Prozesse, verknüpft mit KI-Capability-Benchmarks.

Personalisierung im großen Maßstab

Adaptive Lernplattformen werden zunehmend präziser. Die Vorstellung, dass jeder Schüler / jede Schülerin einen individuellen geometrischen Lernpfad erhält — automatisch angepasst an Vorkenntnisse, Lerngeschwindigkeit und Stärken — rückt in greifbare Nähe. Die bislang umfassendste Meta-Analyse (22 Studien, N = 5.232) zeigt bereits moderate Gesamteffekte (Hedges' g = 0,534), mit dem geometriespezifischen Effekt (g = 0,906) als dem größten aller Inhaltsbereiche (Liu et al., 2026). Mit verbesserter KI und stärkerer Lehrkräfteintegration sind deutlich stärkere Effekte zu erwarten.

Google LearnLM demonstrierte in einem RCT mit 165 Sekundarschüler:innen bereits +5,5 Prozentpunkte bei der Lösung neuartiger Mathematikprobleme gegenüber der Kontrollgruppe (Huber et al., 2024). Tutor CoPilot (Stanford) zeigt, dass KI nicht nur direkt mit Schüler:innen, sondern auch Lehrende unterstützen kann — mit +9 Prozentpunkten für Schüler:innen schwächerer Tutor:innen (Wang et al., 2024). Den bislang ambitioniertesten nationalen Schritt ging Südkorea: Ab März 2025 wurden KI-gestützte adaptive Mathematik-Schulbücher für alle Primar- und Sekundarschüler des Landes eingeführt — mit 830 Millionen USD Investition; 30 % der Schulen nutzen sie bereits (Koreanisches Bildungsministerium, 2025).

GeoGebra als KI-Plattform

GeoGebra (österreichisches Ursprungsprodukt, heute global) entwickelt sich von einem DGS zu einer umfassenden KI-Plattform. Die Integration von GeoGebra Discovery (automatisierte Beweise), natürlichsprachlicher Eingabe und adaptiver Aufgabengenerierung schafft ein Ökosystem, das für alle Schulstufen geeignet ist — und das aus österreichischer Forschung stammt (Kovács et al., 2024). Die Komplementarität mit LLMs wie ChatGPT ist dabei produktiv nutzbar: GeoGebra für zertifizierte, symbolische Beweise; ChatGPT für natürlichsprachliche Kommunikation und Erklärungen (Botana et al., 2024).

KI-Kompetenz als Pflichtbestandteil der Lehramtsausbildung

Die Qualität des KI-Einsatzes im Unterricht steht und fällt mit den Lehrenden. Die Forschung ist eindeutig: Geführte, lehrkraftbegleitete KI-Nutzung erzielt dramatisch bessere Lerneffekte als unkritische Nutzung (Bastani et al., 2025). Doch aktuelle empirische Erhebungen zeigen: Lehramtsstudierende im DACH-Raum nutzen KI bereits intensiv — aber ohne kritische Reflexionskompetenz (Tröbelsberger et al., 2025; Dilling & Herrmann, 2024).

Das bedeutet: KI-Kompetenz für angehende Lehrende ist keine Option, sondern eine strukturelle Notwendigkeit. Die erste empirische Studie, die TPACK explizit auf generative KI in Mathematikklassen anwendet, liefert Shrestha und Yi (2026, Journal of Mathematics Teacher Education): Ein 90-minütiger TPACK-basierter Workshop für Lehramtsstudierende bewirkte statistisch signifikante positive Verschiebungen in der GenAI-Akzeptanz (UTAUT-Modell) — mit wahrgenommener Effizienzsteigerung als stärkstem Faktor und fehlender institutioneller Orientierung als Haupthindernis. Das ist der direkteste empirische Beleg, dass strukturierte TPACK-Fortbildungen die verantwortungsvolle GenAI-Integration im Mathematikunterricht fördern können.

Lee, Son und Yeo (2025, JCAL) zeigen in einem RCT mit 50 angehenden Mathematiklehrpersonen: KI-Chatbots als virtuelle Schüler verbessern responsives Lehren — das situative Eingehen auf Schülerantworten — signifikant. KI kann also nicht nur Schüler:innen, sondern auch die Ausbildung von Lehrkräften unterstützen. Han (2025, Frontiers in Psychology) bestätigt in einer quasi-experimentellen Studie (N=79): Strukturierte KI-Kurse in der Lehramtsausbildung verbessern KI-Kompetenzen messbar — ein Argument für die curriculare Verankerung solcher Kurse an PH und TU Graz.

Programme wie KIMADU in NRW (Universität Siegen, 25 Schulen, Laufzeit 2025–2027) zeigen, wie eine empirisch fundierte KI-Integration in Lehramt und Praxis gleichzeitig gelingen kann (Witzke & Steinhoff, 2025). Für Österreich ist die Virtuelle PH mit dem KI-MOOC (Mai 2024) ein erster Schritt — systematische Verankerung in Lehramtscurricula an TU Graz und PH Graz ist die notwendige Weiterentwicklung.

Neue Rollenbilder für Lehrende

Die Forschungslage ist eindeutig: Lehrkräftequalität bleibt entscheidend (Bastani et al., 2025). Lehrende werden weniger Zeit mit der Vermittlung von Standardverfahren verbringen und mehr Zeit mit dem, was KI (noch) nicht kann:

Die GDM fordert explizit, diese Kompetenzen als prioritären Forschungsbereich zu entwickeln (Buchholtz et al., 2024). Österreichische Ansätze — von der Virtuellen PH bis zu KI-Pilotschulen — sind erste Schritte (BMB, 2024).

Empfehlungen für die Praxis

Aus der Analyse der Forschungslage ergeben sich fünf prioritäre Empfehlungen:

  1. Kritische KI-Kompetenz als explizites Lernziel — auf allen Schulstufen, nicht nur in Informatik. Geometrieunterricht bietet ideale Gelegenheiten: Schüler:innen überprüfen KI-Beweise, analysieren Halluzinationen, diskutieren Grenzen. Eine explorative Studie mit 162 angehenden Primarstufen-Lehrenden zeigte, dass die meisten KI für geometrische Beweise in oberflächlicher Weise nutzten und Misskonzeptionen über die Zuverlässigkeit des Systems entwickelten (Dilling & Herrmann, 2024) — das muss in der Ausbildung adressiert werden.
  1. Tool-Auswahl nach didaktischen, nicht Marketing-Kriterien — GeoGebra und Khan Academy bieten kostenfreie, qualitätsgesicherte und datenschutzkonformere Alternativen zu kostenpflichtigen Plattformen. Kriterien: Lernwirksamkeit, Datenschutz, Zugänglichkeit, Integration in bestehende Unterrichtspraxis. Der geführte GPT-Tutor mit Guardrails ist dem uneingeschränkten System klar überlegen: +127 % vs. +48 % in Übungsleistung (Bastani et al., 2025).
  1. Offene, explorative Aufgabenformate stärken — statt Aufgaben, die KI trivial löst, mehr: „Untersuche...", „Begründe...", „Finde einen Fehler...", „Entwickle eine eigene Aufgabe...". Diese Formate sind KI-resistenter und fördern tieferes geometrisches Denken (Walkington, 2025). Die GDM sieht sie als prioritäre Forschungsrichtung für KI-kompatibles Assessment (Buchholtz et al., 2024).
  1. Datenschutzkonforme Lösungen bevorzugen, insbesondere in Volksschule und Sekundarstufe I. GeoGebra, open-source Systeme und europäische Alternativangebote bevorzugen. DSGVO-Compliance als Pflichtkriterium bei Tool-Entscheidungen. Die OECD stellt fest: Stand 2024 hat kein Land eine verbindliche gesetzliche KI-Regulierung speziell für den Bildungsbereich erlassen (OECD, 2023).
  1. Lehrkräftefortbildung massiv ausbauen — ohne kompetente Lehrende kein sinnvoller KI-Einsatz. Die österreichische Virtuelle PH hat mit dem KI-MOOC (Mai 2024) eine erste strukturierte Fortbildungsinfrastruktur geschaffen (BMB, 2024). PH Graz und TU Graz müssen diese Ansätze ausbauen und mit konkreten Geometrie-Werkstätten verbinden. Österreich hat dabei eine besondere institutionelle Geschichte: Helmut Heugl, Begründer des CAS-Unterrichts (erste CAS-Klasse weltweit 1986 in Wien), plädiert für das „White Box/Black Box"-Prinzip als Orientierung — nicht anders, als beim Taschenrechner oder CAS soll KI im Geometrieunterricht nicht blinden Automatismus, sondern verstehendes Arbeiten fördern (Heugl, 2025).

Die empirische Basis für diese Empfehlungen wächst rasant. Jin et al. (2025) konsolidieren in einem systematischen Review experimenteller Studien zu ChatGPT-Interventionen in der Hochschulbildung: Zwei Interventionstypen dominieren — ChatGPT als Lernassistent (Erklärung, Feedback) und als Aufgabengenerator. Beide zeigen positive Effekte, wobei die assistenzbasierte Nutzung stärkere Lernzuwächse erzielt. Dieser Befund stützt die Empfehlung, KI primär als unterstützendes Werkzeug einzusetzen, nicht als Ersatz für Lehrpersoneninteraktion.

Schlusswort

KI im Geometrieunterricht ist kein Trend, der vorbeizieht. Es ist eine strukturelle Verschiebung, die alle Schulstufen, alle Lehrinhalte und alle Beteiligten betrifft. AlphaGeometry löst IMO-Olympiadprobleme auf Goldmedaillen-Niveau (Trinh et al., 2024; Chervonyi et al., 2025). AlphaProof beweist in Lean 4 — formal, verifizierbar (Hubert et al., 2025). GeoGebra Discovery beweist euklidische Sätze in unter einer Sekunde (Kovács et al., 2024). Aristotle beweist 5 von 6 IMO-2025-Aufgaben (Achim et al., 2025).

Die entscheidende Frage ist nicht ob wir KI einsetzen, sondern wie — und wer diese Entscheidung trifft. Die Antwort darauf sollte die Bildungsgemeinschaft geben, nicht die Technologiekonzerne. Die Geometrie als Fach bietet dabei eine einzigartige Chance: Sie ist präzise genug, um KI-Fehler sichtbar zu machen — LLMs halluzinieren in geometrischen Kontexten systematisch stärker als in anderen Bereichen (Xu et al., 2024; Wei, 2024) — und reichhaltig genug, um echtes mathematisches Denken zu fordern. Das, was KI auf absehbare Zeit nicht vollständig ersetzen kann: das neugierige, kreative, fehlerhafte und lernende menschliche Denken.

Literatur (Ausblick)

Achim, T., Best, A., Bietti, A., et al. (2025). Aristotle: IMO-level automated theorem proving. arXiv:2510.01346.

Achim, T., Best, A., Bietti, A. · 2025 · arXiv preprint ★★★★★ 10/10
Aristotle (Harmonic Team) löst 5 von 6 IMO 2025 Problemen mit vollständig verifizierten Lean 4 Beweisen — erstmals Goldmedaillen-Niveau für ein KI-System. Das System integriert: Lean-Beweissuche, informales LLM-Reasoning für Lemma-Generierung und einen dedizie…

Bastani, H., Bastani, O., Sungu, A., Ge, H., Kabakcı, Ö., & Mariman, R. (2025). Generative AI without guardrails can harm learning. Proceedings of the National Academy of Sciences. https://doi.org/10.1073/pnas.2422633122

Bastani, H., Bastani, O., Sungu, A. · 2025 · Proceedings of the National Academy of Sciences (PNAS) ★★★★★ 10/10
Feldexperiment mit ~1.000 Oberschüler:innen: GPT-4 ohne Guardrails verbesserte Übungsleistung um 48%, GPT Tutor (mit Schutzmaßnahmen) um 127%. Kritischer Befund: Schüler:innen mit uneingeschränktem KI-Zugang schnitten in Prüfungen ohne KI 17% schlechter ab — A…

BMB [Bundesministerium für Bildung]. (2024). KI-Pilotschulen. https://www.bmb.gv.at/ki

Botana, F., Recio, T., & Vélez, M. P. (2024). On using GeoGebra and ChatGPT for geometric discovery. Computers, 13(8), 187. https://doi.org/10.3390/computers13080187

Botana, F., Recio, T. · 2024 · Computation, 12(2), 30 ★★★★★ 10/10
Systematischer Benchmark von ChatGPT 3.5 vs. GeoGebra 5 bei geometrischen Ortskurvenaufgaben (Einhüllende ebener Kurvenfamilien). Ergebnis: ChatGPT scheitert in den meisten Fällen; GeoGebra löst zuverlässig. Warnung ('Caveat Emptor!') an Lehrende, die ChatGPT …

Buchholtz, N., Schorcht, S., Baumanns, L., Huget, J., Noster, N., Rott, B., Siller, H.-S., & Sommerhoff, D. (2024). Damit rechnet niemand! Mitteilungen der Gesellschaft für Didaktik der Mathematik, 117, 15–24. https://ojs.didaktik-der-mathematik.de/index.php/mgdm/article/view/1249

Buchholtz, N., Schorcht, S., Baumanns, L. · 2024 · Mitteilungen der Gesellschaft für Didaktik der Mathematik, Nr. 117 ★★★★★ 9/10
Positionspapier von 8 deutschen Mathematikdidaktiker:innen: sechs Leitgedanken zu Implikationen und Forschungsbedarfen für KI-Technologien (generative KI, ChatGPT) im Mathematikunterricht. Behandelt explizit Problemlösen, Beweisen, Modellieren und Assessment. …

Chervonyi, Y., Trinh, T. H., Olšák, M., Yang, X., Nguyen, H., et al. (2025). Gold-medalist performance in solving Olympiad Geometry with AlphaGeometry2. arXiv:2502.03544.

Chervonyi, Y., Trinh, T.H., Olšák, M. · 2025 · Journal of Machine Learning Research, Vol. 26(241), 1–39 (also arXiv:2502.03544) ★★★★★ 10/10
AlphaGeometry 2 löst 84% aller IMO-Geometrieprobleme 2000–2024 (gegenüber 54% bei AG1). Verbesserte Gemini-basierte Sprachkomponente, erweiterte Domänensprache (Winkel, Abstände, Locus-Theoreme), schnellere symbolische Suchmaschine mit Knowledge-Sharing. Meile…

Dilling, F., & Herrmann, M. (2024). Using large language models to support pre-service teachers' mathematical reasoning. Frontiers in Artificial Intelligence, 7. https://doi.org/10.3389/frai.2024.1460337

Dilling, F., Herrmann, M. · 2024 · Frontiers in Artificial Intelligence ★★★★★ 10/10
Exploratorische Studie zur Nutzung von ChatGPT als Werkzeug für angehende Primarstufen-Lehrende beim Erstellen geometrischer Beweise. Untersucht Vorerfahrungen mit LLMs, Überzeugungen und Interaktionsverhalten. Ergebnis: Studierende hatten begrenzte Vorerfahru…

Huber, M., Koivisto, J., Wanders, F., & Eedi/Google DeepMind Team. (2024). AI tutoring can safely and effectively support students: An exploratory RCT in UK classrooms. arXiv:2512.23633. https://arxiv.org/abs/2512.23633

Huber, M., Koivisto, J., Wanders, F. · 2024 · arXiv:2512.23633 (December 2024) ★★★★★ 9/10
Exploratorische RCT mit N=165 Schüler:innen (Year 9+10, Alter 13-15) in fünf britischen Sekundarschulen. Drei Bedingungen: statische Hinweise, menschliche Tutoren, LearnLM (Google). LearnLM-Gruppe: 66,2% der Folgeaufgaben gelöst; Human-Tutor-Gruppe: 60,7% — +5…

Hubert, T., Mehta, R., Sartran, L., et al. (2025). Olympiad-level formal mathematical reasoning with reinforcement learning. Nature. https://doi.org/10.1038/s41586-025-09833-y

Hubert, T., Mehta, R., Sartran, L. · 2025 · Nature ★★★★★ 10/10
AlphaProof kombiniert Gemini (LLM) mit AlphaZero-Reinforcement-Learning für formale Mathematik in Lean 4. Bei IMO 2024 löste das System zusammen mit AlphaGeometry 2 vier von sechs Aufgaben (28/42 Punkte) — Silbermedaillen-Niveau, das erste KI-System auf diesem…

Liu, B., Zhang, W., & Wang, F. (2026). Can generative artificial intelligence effectively enhance students' mathematics learning outcomes? A meta-analysis of empirical studies from 2023 to 2025. Education Sciences, 16(1), 140. https://doi.org/10.3390/educsci16010140

Liu, B., Zhang, W., Wang, F. · 2026 · Education Sciences (MDPI), 16(1), 140 ★★★★★ 10/10
Meta-Analyse von 22 empirischen Studien (46 Stichproben, N=5.232): GenAI hat moderaten positiven Effekt auf Mathematiklernen (Hedges' g=0,534). Geometrie erzielte den GRÖSSTEN bereichsspezifischen Effekt aller Inhaltsbereiche (g=0,906), vor Zahl & Algebra (g=0…

Kovács, Z., Recio, T., & Vélez, M. P. (2024). Showing proofs, assessing difficulty with GeoGebra Discovery. arXiv:2401.11900.

Kovács, Z., Recio, T., Vélez, M.P. · 2024 · arXiv / GeoGebra Discovery Research ★★★★★ 9/10
GeoGebra Discovery erweitert GeoGebra um automatisierte Beweisführung: Der ShowProof-Befehl zeigt Schritt-für-Schritt-Beweissequenzen für geometrische Aussagen; ein Schwierigkeitswert bewertet den 'Überraschungsgrad' eines Satzes relativ zu seinen Voraussetzun…

Lu, P., Bansal, H., Xia, T., Liu, J., Li, C., Hajishirzi, H., Cheng, H., Chang, K.-W., Galley, M., & Gao, J. (2024). MathVista. ICLR 2024. https://doi.org/10.48550/arXiv.2310.02255

Lu, P., Bansal, H., Xia, T. · 2024 · ICLR 2024 (Oral, top 1.2% aller Einreichungen) ★★★★★ 10/10
Visuelles Mathematik-Benchmark mit 6.141 Beispielen. GPT-4V erreicht 49,9% Gesamtgenauigkeit — 10,4 Prozentpunkte unter menschlicher Leistung (60,3%). Für Geometrieaufgaben: GPT-4V 58,5%, Bard 43,4%. Modelle 'kämpfen oft darum, komplexe Figuren zu verstehen un…

Murphy, L. R., Yang, K., Sun, J., Li, Z., Anandkumar, A., & Si, X. (2024). Autoformalizing Euclidean Geometry. Proceedings of ICML 2024. https://doi.org/10.48550/arXiv.2405.17216

Murphy, L.R., Yang, K., Sun, J. · 2024 · Proceedings of the 41st International Conference on Machine Learning (ICML 2024) ★★★★★ 10/10
Erstmalige treue Formalisierung von Euklids Elementen in Lean 4. Benchmark für automatische Formalisierung euklidischer Geometrie. Relevant für Kapitel 06 (Hochschule: formale Beweissysteme) und 10 (Ausblick: KI und formale Mathematik).

OECD. (2023). OECD Digital Education Outlook 2023. OECD Publishing.

Trinh, T. H., Wu, Y., Le, Q. V., He, H., & Luong, T. (2024). Solving Olympiad Geometry without human demonstrations. Nature, 625, 476–482. https://doi.org/10.1038/s41586-023-06747-5

Trinh, T.H., Wu, Y., Le, Q.V. · 2024 · Nature, 625, 476–482 ★★★★★ 10/10
Google DeepMind präsentiert AlphaGeometry, ein neurosymbolisches KI-System das olympiadische Geometriebeweise auf dem Niveau eines menschlichen Goldmedaillengewinners löst. Löste 25 von 30 IMO-Geometrieproblemen (Vorläufer: 10). AlphaGeometry 2 (2024) löste 83…

Vuong, Q.-H., & Ho, M.-T. (2024). The disruptive AlphaGeometry. AI & Society. https://doi.org/10.1007/s00146-024-02010-1

Vuong, Q.-H., Ho, M.-T. · 2024 · AI & Society (Springer Nature) ★★★★★ 10/10
Analyse der pädagogischen Implikationen von AlphaGeometry für den Mathematikunterricht. Die Autoren untersuchen, wie olympiadische KI-Performance das Lehrer-Schüler-Verhältnis und die Rolle von Schulen in der mathematischen Bildung herausfordert. Kernargument:…

Walkington, C. (2025). Implications of generative AI for secondary mathematics education. School Science and Mathematics. https://doi.org/10.1111/ssm.18356

Walkington, C. · 2025 · School Science and Mathematics (Wiley) ★★★★★ 9/10
Umfassende Analyse der Implikationen generativer KI für den Mathematikunterricht. Untersucht, wie Schüler:innen GenAI als Denkpartner beim mathematischen Modellieren und Beweisen nutzen können. Diskutiert gemischte Ergebnisse beim Einsatz als Tutor sowie die N…

Wang, R. E., Ribeiro, A. T., Robinson, C. D., Loeb, S., & Demszky, D. (2024). Tutor CoPilot: A human-AI approach for scaling real-time expertise. arXiv:2410.03017. https://doi.org/10.48550/arXiv.2410.03017

Wang, X., Chan, K. K., Li, Q. · 2024 · Journal of Educational Computing Research (SAGE) ★★★★★ 9/10
Meta-analysis of 17 empirical studies (n=1,665 children ages 3-8). CT interventions show statistically significant large effect size (d=0.83) on young children's development. Geometry and spatial skills are among the most commonly addressed mathematical domain…

Wei, X. (2024). Evaluating ChatGPT-4 and ChatGPT-4o. Frontiers in Education, 9, 1452570. https://doi.org/10.3389/feduc.2024.1452570

Wei, X. · 2024 · Frontiers in Education, 9, 1452570 ★★★★★ 10/10
Evaluation von GPT-4 und GPT-4o auf NAEP-Mathematikaufgaben (4., 8., 12. Klasse): Geometrie/Messung ist der schwächste Inhaltsbereich — GPT-4: 53%, GPT-4o: 59% (vs. 79%/92% in Algebra). Räumliches Denken und visuelle Informationsverarbeitung als fundamentale B…

Xu, Z., Jain, S., & Kankanhalli, M. (2024). Hallucination is inevitable: An innate limitation of large language models. arXiv:2401.11817.

Xu, S., Luo, Y., Shi, W. · 2024 · arXiv / ACM Proceedings ★★★★★ 5/10
Geo-LLaVA combines retrieval-augmented training with supervised fine-tuning for plane and spatial geometry. Achieved 65.25% on GeoQA (Chinese school geometry) and 42.36% on GeoMath (university geometry). First LLM applied to 3D solid geometry tasks from school…

Zhang, R., Jiang, D., Zhang, Y., Lin, H., Guo, Z., Qiu, P., Zhou, A., Lu, P., Chang, K.-W., Gao, P., & Li, H. (2024). MathVerse: Does your multi-modal LLM truly see the diagrams in visual math problems? In Computer Vision — ECCV 2024, Lecture Notes in Computer Science. Springer. https://doi.org/10.1007/978-3-031-73242-3_10

Zhang, R., Jiang, D., Zhang, Y. · 2024 · Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186) ★★★★★ 10/10
2.612-Problem-Datensatz (ebene Geometrie, Körpergeometrie, Funktionen) in 6 Varianten (mit/ohne Diagramm). Zentrale Entdeckung: 'Die meisten MLLMs verstehen Mathematikdiagramme nicht — sie verlassen sich auf den Textanteil der Aufgabe.' Einige Modelle erzielte…

de Winter, J. C. F., Dodou, D., & Eisma, Y. B. (2024). System 2 thinking in OpenAI's o1-preview model: Near-perfect performance on a mathematics exam. Computers, 13(11), 278. https://doi.org/10.3390/computers13110278

Csiba, P., & Vajo, P. (2024). Problems and challenges of using randomized automatically evaluating geometric construction problems in Moodle LMS. AIMS Mathematics, 9(3), 5234–5249. https://doi.org/10.3934/math.2024253

Csiba, P., Vajo, P. · 2024 · AIMS Mathematics, Vol. 9(3), pp. 5234–5249 ★★★★ 8/10
Untersucht das Fehlen geometrischer Konstruktionsaufgaben in nationalen und internationalen Mathematiküberprüfungen und schlägt GeoGebra-basierte, automatisch bewertete Applets als Lösung vor. Direkt relevant für KI-resistentes Assessment-Design und LMS-Integr…

Hamady, S., Mershad, K., & Jabakhanji, B. (2024). Multi-version interactive assessment through the integration of GeoGebra with Moodle. Frontiers in Education, 9, 1466128. https://doi.org/10.3389/feduc.2024.1466128

Hamady, S., Mershad, K., Jabakhanji, B. · 2024 · Frontiers in Education ★★★★★ 10/10
Untersuchung der Integration von GeoGebra in Moodle für interaktive, KI-resistente Assessments. Zeigt wie dynamische Geometrie-Inhalte die Testintegrität verbessern und gleichzeitig tieferes Lernen fördern. Relevant für Kapitel 07 und die Prüfungsintegritätsdi…

Heugl, H. (2025). Mathematikunterricht mit/trotz KI. Vortrag Tag der Mathematik 2025, TU Graz. https://www.tugraz.at/fileadmin/user_upload/tugrazExternal/5f91911d-f0da-444f-afdc-036730607554/Aktuelles/tdm2025/TagderMathematik2025_Heugl.pdf

Heugl, H. · 2025 · Tag der Mathematik 2025, TU Graz / T3 Deutschland ★★★★ 8/10
Österreichischer Mathematikdidaktik-Pionier (erste CAS-Klasse weltweit 1986, 5 nationale CAS-Projekte, ACDCA-Gründer) überträgt das 'White Box/Black Box'-Prinzip auf den KI-Diskurs. Thematisiert Geometrie als besonders geeignet für deduktives Denken mit digita…

Tröbelsberger, L., Fock, A., Oldenburg, R., & Siller, H.-S. (2025). Der Einsatz von KI-Systemen durch Studierende in der universitären Mathematikausbildung. DMVM, 33(4), 276–280. https://doi.org/10.1515/dmvm-2025-0078

Tröbelsberger, L., Fock, A., Oldenburg, R. · 2025 · Mitteilungen der Deutschen Mathematiker-Vereinigung (DMVM), Vol. 33(4), pp. 276–280 ★★★★★ 9/10
Erste publizierte empirische Erhebung zur KI-Nutzung im Mathematikstudium im DACH-Raum. Zeigt: KI ist bereits Teil der studentischen Lebenswelt in der Mathematikausbildung — mit erheblichen Ausbildungsbedarfen für reflektierten Umgang. Grundlage: Befragungsstu…

Witzke, I., & Steinhoff, T. (2025). KIMADU — KI-Forschungsprojekt der Didaktik der Mathematik und der deutschen Sprache. Universität Siegen / Ministerium für Schule und Bildung NRW. https://kimadu.de/

Lee, D., Son, T., & Yeo, S. (2025). Impacts of interacting with an AI chatbot on preservice teachers' responsive teaching skills in math education. Journal of Computer Assisted Learning, 41, e13091. https://doi.org/10.1111/jcal.13091

Lee, D., Son, T., Yeo, S. · 2025 · Journal of Computer Assisted Learning ★★★★ 8/10
RCT mit 50 angehenden Mathematiklehrpersonen: Interaktion mit KI-Chatbot als virtuellem Schüler verbessert signifikant Fragen- und Antwortkompetenz gegenüber Kontrollgruppe. Responsives Lehren — das Eingehen auf Schülerantworten — lässt sich durch KI-Simulatio…

Han. (2025). Improving pre-service teachers' AI competencies: A quasi experimental study. Frontiers in Psychology, 16, Article 1642465. https://doi.org/10.3389/fpsyg.2025.1642465

Awang, R., Yusop, F. D., & Danaee, M. (2025). Exploring artificial intelligence technology integration in mathematics education: A systematic review. International Electronic Journal of Mathematics Education, 20(1), em0813. https://doi.org/10.29333/iejme/16006

Awang, L. A., Yusop, F. D., Danaee, M. · 2025 · International Electronic Journal of Mathematics Education, Vol. 20(2), em0823 ★★★★★ 9/10
Systematisches Review zu aktuellen Praxen und Zukunftsdirektionen von KI im Mathematikunterricht. Identifiziert Geometrievisualisierung als eigenständige KI-adressierbare Aufgabenkategorie. Fordert explainable AI-Features für transparentere KI-Systeme. Forschu…

Ben Chaabene, N. E. H., & Hammami, H. (2026). Neuro-symbolic synergy in education: A survey of LLM–knowledge graph integration for explainable reasoning and emotion-aware student support. Smart Learning Environments, 13, Article 6. https://doi.org/10.1186/s40561-025-00423-z

Gabriel, F., Kennedy, J., Marrone, R., & Leonard, S. (2025). Pragmatic AI in education and its role in mathematics learning and teaching. npj Science of Learning, 10, Article 26. https://doi.org/10.1038/s41539-025-00315-4

Gabriel, F., Kennedy, J., Marrone, R. · 2025 · npj Science of Learning ★★★★★ 3/10
Distinguishes learning products from learning processes; argues AI can reduce math anxiety through personalized difficulty adjustment and agency-fostering learning paths. Develops a research agenda based on Control-Value Theory demanding longitudinal multi-met…

Jaldemark, J., Lundin, J., Säljö, R., Edwards, J., Gegenfurtner, A., & Holmes, W., et al. (2025). A multidisciplinary research agenda for artificial intelligence, education, learning, and instruction. Postdigital Science and Education, 7, 1414–1450. https://doi.org/10.1007/s42438-025-00602-8

Jaldemark, J., Lundin, J., Säljö, R. · 2025 · Postdigital Science and Education ★★★★★ 3/10
Panel of 11 international experts identifies five challenges, five opportunity areas, and four transformative themes for AI in education. Highlights human-AI interaction and lifelong learning as requiring new organizational forms for AI education research.

Shrestha, S., & Yi, J. (2026). TPACK-based professional development for the AI era: Fostering pre-service teachers' acceptance of generative AI in mathematics classrooms. Journal of Mathematics Teacher Education. https://doi.org/10.1007/s10857-026-09747-0

Shrestha, S., Yi, J. · 2026 · Journal of Mathematics Teacher Education ★★★★★ 3/10
90-minute TPACK-based workshop for pre-service mathematics teachers produced statistically significant positive shifts in GenAI acceptance. Main facilitator: perceived efficiency gains; main barrier: lack of institutional guidance. Direct empirical evidence th…

Sicca, V., Xia, T., Fédérico, M., Gorinski, P. J., Frieder, S., & Jui, S. (2024). Newclid: A user-friendly replacement for AlphaGeometry. arXiv:2411.11938. https://doi.org/10.48550/arXiv.2411.11938

Sicca, V., Xia, T., Fédérico, M. · 2024 · arXiv preprint ★★★★★ 3/10
Newclid replaces AlphaGeometry's symbolic solver with a modularized, extensible open-source implementation (DDARN) with GeoGebra input support, extending to metric geometry. arXiv preprint, November 2024.

Yang, Y., Du, W., Mavrikis, M., & Geraniou, E. (2025). Spatial skill development through augmented reality in mathematics education: A scoping review. Digital Experiences in Mathematics Education. https://doi.org/10.1007/s40751-025-00187-8

Yang, Y., Chen, L., He, W., Sun, D.,, Salas-Pilco, S. Z · 2025 · International Journal of Artificial Intelligence in Education ★★★★★ 14/10
Systematisches Review: zehn Jahre KI-Einsatz in der Sonderpädagogik für K-12 (2013–2023). Identifiziert Haupttrends: adaptive Lernsysteme, KI-gestützte Diagnose, personalisiertes Feedback für SuS mit besonderen Bildungsbedürfnissen. Zeigt erhebliche Forschungs…

Gao, G., Wang, Y., Jiang, J., Gao, Q., Qin, Z., Xu, T., & Dong, B. (2025). Herald: A natural language annotated Lean 4 dataset. In Proceedings of ICLR 2025. https://arxiv.org/abs/2410.10878

Gao, G., Wang, Y., Jiang, J. · 2025 · ICLR 2025 – Proceedings of the 13th International Conference on Learning Representations ★★★★★ 3/10
Herald is a large annotated dataset framework generated from Mathlib4 with 580,000 valid Lean 4 statements and 44,000 NL-FL theorem pairs. The Herald Translator achieves 96.7% accuracy (Pass@128) at formalizing statements from miniF2F. Significantly advances a…

Lin, H., Sun, Z., Yang, Y., & Welleck, S. (2025). Lean-STaR: Learning to interleave thinking and proving. In Proceedings of ICLR 2025. https://arxiv.org/abs/2407.10040

Lin, H., Sun, Z., Yang, Y. · 2025 · ICLR 2025 – Proceedings of the 13th International Conference on Learning Representations ★★★★★ 3/10
Lean-STaR trains language models to generate informal thinking steps before each formal proof step in Lean. Achieves SOTA on miniF2F (46.3% Pass@64), demonstrating how informal mathematical intuition can improve formal proof generation at undergraduate level. …

Tran Minh, F., Gonnord, L., Narboux, J., et al. (2025). Proof assistants for teaching: A survey. arXiv:2505.13472. https://arxiv.org/abs/2505.13472

Tsoukalas, G., Lee, J., Jennings, J., Xin, J., Ding, M., Jennings, M., Thakur, A., & Chaudhuri, S. (2024). PutnamBench: Evaluating neural theorem-provers on the Putnam Mathematical Competition. In NeurIPS 2024. https://arxiv.org/abs/2407.11214

Tsoukalas, G., Lee, J., Jennings, J. · 2024 · Advances in Neural Information Processing Systems 37 (NeurIPS 2024) ★★★★★ 3/10
PutnamBench is the first multilingual benchmark for neural theorem provers at undergraduate competition level: 1,692 hand-constructed formalizations of 640 Putnam theorems in Lean 4, Isabelle, and Coq. All SOTA systems could only solve a handful of problems, r…

Weng, K., Du, L., Li, S., Lu, W., Sun, H., Liu, H., & Zhang, T. (2025). Autoformalization in the era of large language models: A survey. arXiv:2505.23486. https://arxiv.org/abs/2505.23486

Weng, K., Du, L., Li, S. · 2025 · arXiv preprint ★★★★★ 3/10
Comprehensive survey of current state of autoformalization — automatic translation of informal mathematical texts into formally verifiable representations. Analyzes approaches by mathematical domain and difficulty level. Identifies open problems especially for…

Nguyen, T. T., & Pham, V. P. H. (2025). The evolving landscape of AI integration in mathematics education: A decade of research (2015–2025). Eurasia Journal of Mathematics, Science and Technology Education, 21(6), em2596. https://doi.org/10.29333/ejmste/17078

Nguyen, D. T., Pham, Q. V. · 2025 · Eurasia Journal of Mathematics, Science and Technology Education, Vol. 21(10), em2714 ★★★★★ 9/10
Systematisches Review der KI-Integration im Mathematikunterricht 2015–2025. Dokumentiert starke Beschleunigung ab 2024. Adaptive Lernpfade, personalisiertes Feedback und KI-Aufgabengenerierung als drei Hauptwachstumsfelder. GeoGebra Tutor und MATHia als vielve…

Fuster Rabella, D. (2025). AI in education: What does research tell us? (OECD Education Working Papers, No. 338). OECD Publishing. https://doi.org/10.1787/647880aa-en

Jin, S., et al. (2025). ChatGPT interventions in higher education: A systematic review of experimental studies. Review of Educational Research. https://doi.org/10.3102/00346543251317829

Jin, S.,, Sercu, L · 2025 · Journal of Computer Assisted Learning ★★★★★ 14/10
Systematisches Review experimenteller Studien zu ChatGPT-Interventionen in der Hochschulbildung. Zwei Interventionstypen: Aufgabenunterstützung und allgemeine Lernunterstützung. ChatGPT wirksam für Wissenserwerb; Kompetenzenentwicklung variabel. Mittelfristige…

Weiterführende Literatur

110 empfohlene Quellen (im Artikel zitiert, Score ≥ 9) — vollständiges Verzeichnis: quellen.html · Online-Version

Bardach, L., Moeller, K., Ruiz-Garcia, M., Strittmatter, Y., Meyer, J., Musslick, S.,, Spitzer, M (2026). Journal of Computer Assisted Learning. Intelligent Tutoring Systems Need Teachers ★★★★★
✓ zitiert peer-reviewed empirical its teacher-role engagement

Bardach, L., Moeller, K., Ruiz-Garcia, M., Strittmatter, Y., Meyer, J., Musslick, S.,, Spitzer, M · 2026 · Journal of Computer Assisted Learning ★★★★★ 15/10
Untersucht Schülerengagement bei ITS-Nutzung im Mathematikunterricht. Befund: ITS-Systeme zeigen starke Abhängigkeit von Lehrkraftbegleitung für nachhaltige Lerneffekte; ohne Lehrkraftunterstützung sinkt Engagement signifikant. Direkte Implikation: ITS ersetze…

Kim, Y. R., Park, M. S.,, Joung, E (2026). School Science and Mathematics. Exploring the Integration of Artificial Intelligence in Math Education: Preservice Teachers' Experiences and Reflections on Problem-Posing Activities with ChatGPT ★★★★★
✓ zitiert peer-reviewed empirical problem-posing chatgpt preservice

Kim, Y. R., Park, M. S.,, Joung, E · 2026 · School Science and Mathematics ★★★★★ 14/10
Lehramtsstudierende integrieren ChatGPT in Problem-Posing-Aktivitäten für den Mathematikunterricht. Scaffolding-Strategien analysiert. Differenzierte Reflexionen über Aufgabenqualität, didaktische Angemessenheit und kritischen KI-Einsatz. SSM (Wiley/NCTM-nahes…

Cosentino, G., Anton, J., Sharma, K., Gelsomini, M., Giannakos, M. N.,, Abrahamson, D (2025). British Journal of Educational Technology. Generative AI and Multimodal Data for Educational Feedback: Insights from Embodied Math Learning ★★★★★
✓ zitiert peer-reviewed empirical bjet formative-assessment genai

Cosentino, G., Anton, J., Sharma, K., Gelsomini, M., Giannakos, M. N.,, Abrahamson, D · 2025 · British Journal of Educational Technology ★★★★★ 14/10
Untersucht, wie generative KI formatives Feedback im Mathematikunterricht bereitstellt bei körperbasiertem Zahlengeraden-Lernen. Eye-Tracking und Systemlogs messen kognitive Belastung; KI-generiertes Feedback verglichen mit Lehrendenfeedback. Ergebnis: verglei…

Yang, Y., Chen, L., He, W., Sun, D.,, Salas-Pilco, S. Z (2025). International Journal of Artificial Intelligence in Education. Artificial Intelligence for Enhancing Special Education for K-12: A Decade of Trends, Themes, and Global Insights (2013–2023) ★★★★★
✓ zitiert peer-reviewed systematic-review inclusion k12

Yang, Y., Chen, L., He, W., Sun, D.,, Salas-Pilco, S. Z · 2025 · International Journal of Artificial Intelligence in Education ★★★★★ 14/10
Systematisches Review: zehn Jahre KI-Einsatz in der Sonderpädagogik für K-12 (2013–2023). Identifiziert Haupttrends: adaptive Lernsysteme, KI-gestützte Diagnose, personalisiertes Feedback für SuS mit besonderen Bildungsbedürfnissen. Zeigt erhebliche Forschungs…

Deng, R., Jiang, M., Yu, X., Lu, Y.,, Liu, S (2025). Computers & Education. Does ChatGPT enhance student learning? A systematic review and meta-analysis of experimental studies ★★★★★
✓ zitiert peer-reviewed meta-analysis chatgpt learning-outcomes

Deng, R., Jiang, M., Yu, X., Lu, Y.,, Liu, S · 2025 · Computers & Education ★★★★★ 14/10
Systematisches Review und Meta-Analyse experimenteller Studien über ChatGPT-Wirkungen auf Lernleistung. Computers & Education (Q1 Elsevier). Untersucht Bedingungen, unter denen ChatGPT Lernleistungen verbessert oder beeinträchtigt.

Jin, S.,, Sercu, L (2025). Journal of Computer Assisted Learning. ChatGPT Interventions in Higher Education: A Systematic Review of Experimental Studies ★★★★★
✓ zitiert peer-reviewed systematic-review chatgpt higher-education

Jin, S.,, Sercu, L · 2025 · Journal of Computer Assisted Learning ★★★★★ 14/10
Systematisches Review experimenteller Studien zu ChatGPT-Interventionen in der Hochschulbildung. Zwei Interventionstypen: Aufgabenunterstützung und allgemeine Lernunterstützung. ChatGPT wirksam für Wissenserwerb; Kompetenzenentwicklung variabel. Mittelfristige…

Cai, S., Bao, K., Guo, H., Zhang, J., Song, J.,, Zheng, B (2024). Proceedings of EMNLP 2024 (Main Conference). GeoGPT4V: Towards Geometric Multi-modal Large Language Models with Geometric Image Generation ★★★★★
✓ zitiert peer-reviewed conference emnlp mllm geometry-visual

Cai, S., Bao, K., Guo, H. · 2024 · EMNLP 2024 ★★★★★ 9/10
Pipeline using GPT-4 and GPT-4V to generate geometry problems with aligned text and images. Creates dataset of 4,900 geometry problems (GeoGPT4V dataset) combined with 19K open-source data. Training significantly improves model performance on MathVista and Mat…

Zekeik, H., Chahbi, M., Lamarti Sefian, M.,, Bakkali, I (2025). Eurasia Journal of Mathematics, Science and Technology Education. Augmented Reality and Virtual Reality in Education: A Systematic Narrative Review on Benefits, Challenges, and Applications ★★★★★
✓ zitiert peer-reviewed systematic-review ar vr education

Zekeik, H., Chahbi, M., Lamarti Sefian, M.,, Bakkali, I · 2025 · Eurasia Journal of Mathematics, Science and Technology Education ★★★★★ 13/10
Systematisches Narrative Review: 53 Artikel aus akademischen Datenbanken der letzten Dekade zu AR und VR in der Bildung. Überwiegend positive Lernergebnisse, darunter verbesserte räumliche Wahrnehmung und geometrisches Verständnis. Wiederkehrende Implementieru…

Morales Méndez, G.,, Lozano Avilés, A. B (2025). Revista de Educación a Distancia (RED). Realidad aumentada y GeoGebra 3D para mejorar la inteligencia espacial en la enseñanza de la geometría volumétrica ★★★★★
✓ zitiert peer-reviewed empirical ar geogebra-3d spatial-reasoning

Kurt, G.,, Önel, F (2025). School Science and Mathematics. Middle School Students' Basic Geometric Construction Processes in a Dynamic Geometry Environment ★★★★★
✓ zitiert peer-reviewed empirical geogebra geometric-construction van-hiele

Kurt, G.,, Önel, F · 2025 · School Science and Mathematics ★★★★★ 13/10
Fallstudie: drei Siebtklässler über vier Wochen bei Konstruktionsaufgaben (Streckenkopien, Senkrechte, Parallelen, Winkelhalbierende) in GeoGebra. Analyse mit Smarts Konstruktionsstufen und van Hieles Denkrahmen. Problembasiertes Design ohne Schritt-für-Schrit…

Marwiang, M., Prasertsang, M.,, Junpeng, P (2025). Journal of Education and Learning. Enhancing Students' Learning Outcomes in Mathematics through Intelligent Tutoring Systems Based on Real-Time Feedback ★★★★★
✓ zitiert peer-reviewed empirical its geometry rct

Marwiang, M., Prasertsang, M.,, Junpeng, P · 2025 · Journal of Education and Learning ★★★★★ 13/10
Quasi-Experiment mit n=78 Siebtklässler:innen (Khon Kaen University Demonstration School, Thailand): Experimentalgruppe mit ITS mit Echtzeit-Feedback vs. Kontrolle: ITS ohne Feedback. Inhalte: Messung und Geometrie (Klasse 7). Effektgröße Cohen's d = 0,73 (gro…

Yunianto, W., Galic, S.,, Lavicza, Z (2024). International Journal of Education in Mathematics, Science and Technology (IJEMST). Exploring Computational Thinking in Mathematics Education: Integrating ChatGPT with GeoGebra for Enhanced Learning Experiences ★★★★★
✓ zitiert peer-reviewed empirical geogebra chatgpt

Yunianto, W., Lavicza, Z., Kastner-Hauler, O. · 2024 · Journal on Mathematics Education, 15(3), 1027–1052 ★★★★★ 10/10
Educational Design Research-Studie (5 Erwachsene, 16 Junior-High-Schüler:innen): Kann ChatGPT korrekte GeoGebra-Befehle für geometrische Aufgaben mit Computational Thinking generieren? Befund: ChatGPT hat erhebliche Limitationen bei der Generierung korrekter G…

Santos, V., Teles, J.,, Quaresma, P (2024). International Journal for Technology in Mathematics Education (IJTME). Exploring Quadrilaterals: An Interactive Task for 7th Grade Students Using GeoGebra Classroom ★★★★★
✓ zitiert peer-reviewed empirical geogebra automated-reasoning

Santos, V., Teles, J.,, Quaresma, P · 2024 · International Journal for Technology in Mathematics Education (IJTME) ★★★★★ 13/10
Siebtklässler erkunden mit GeoGebra Classroom Vierecke in zwei Phasen: Vermutungen formulieren und formale Beweise konstruieren. Integration von automatisiertem Theorembeweisen (JGEx) direkt im Unterrichtskontext — frühes Beispiel für KI-gestütztes deduktives …

Segal, R.,, Biton, Y (2024). International Journal of Education in Mathematics, Science and Technology (IJEMST). The Contribution That Utilizing Generative AI for Problem Posing Makes to Pre-Service High School Mathematics Teachers' TPACK ★★★★★
✓ zitiert peer-reviewed empirical problem-posing tpack preservice

Segal, R.,, Biton, Y · 2024 · International Journal of Education in Mathematics, Science and Technology (IJEMST) ★★★★★ 13/10
15 angehende Gymnasiallehrkräfte nutzen generative KI-Tools für Problem-Posing-Aktivitäten im Mathematikunterricht. TPACK-Zuwächse messbar. Vertiefte Reflexionsprozesse über didaktische Gestaltung. Erste empirische Studie, die Problem Posing + generative KI im…

Li, L., Yang, Z., Chen, M., Peng, X., Sun, J., Yan, Z.,, Liu, S (2024). Journal of Automated Reasoning. Automated Generation of Geometry Proof Problems Based on Point Geometry Identity ★★★★★
✓ zitiert peer-reviewed automated-reasoning geometry-proof its

Li, M. · 2024 · International Journal of Science and Mathematics Education (Springer) ★★★★★ 9/10
Untersuchung der Faktoren, die Lehrende bei der Adoption von KI in der Primarstufe-Mathematik beeinflussen (interne: Überzeugungen, Kompetenz; externe: Ressourcen, Unterstützung). Wichtig für Kapitel 08 (Didaktik) und 10 (Ausblick: Lehrkräftefortbildung).

Türkoğlu, H.,, Yalçinalp, S (2024). Education and Information Technologies. Investigating Problem-Solving Behaviours of University Students through an Eye-Tracking System Using GeoGebra in Geometry: A Case Study ★★★★★
✓ zitiert peer-reviewed empirical eye-tracking geogebra learning-analytics

Türkoğlu, H.,, Yalçinalp, S · 2024 · Education and Information Technologies ★★★★★ 13/10
Acht Erstjahr-Studierende der Mathematikdidaktik bearbeiteten Geometrieaufgaben in GeoGebra mit Eye-Tracking. Polyas Problemlösephasen als Analyserahmen. Mehr Zeit in Verstehens- und Planungsphase korreliert mit Erfolg. Lernstil 'Converger' korreliert mit akti…

Li, H., Xing, W., Li, C., Zhu, W.,, Woodhead, S (2025). Journal of Learning Analytics. Integrating Option Tracing into Knowledge Tracing: Enhancing Learning Analytics for Mathematics Multiple-Choice Questions ★★★★★
✓ zitiert peer-reviewed empirical learning-analytics knowledge-tracing

Li, S., Zeng, C., Liu, H. · 2025 · International Journal of STEM Education, Vol. 12, Article 58 ★★★★★ 9/10
Meta-Analyse von 99 Effektgrößen aus 32 RCT-Studien (K-12 STEM). Signifikante Moderatoren: Schulstufe (Sekundarstufe profitiert stärker), KI-Typ (AR/VR zeigt stärkste Effekte), Lernmodell (Hybridansätze > rein digital). Springer International Journal of STEM E…

Kuusemets, L., Parve, K., Ain, K.,, Kraav, T (2024). International Journal of Education in Mathematics, Science and Technology (IJEMST). Assessing AI-generated (GPT-4) Versus Human Created MCQs In Mathematics Education: A Comparative Inquiry into Vector Topics ★★★★★
✓ zitiert peer-reviewed empirical gpt-4 mcq

Kuusemets, L., Parve, K., Ain, K.,, Kraav, T · 2024 · International Journal of Education in Mathematics, Science and Technology (IJEMST) ★★★★★ 12/10
Vergleicht GPT-4-generierte Multiple-Choice-Fragen mit menschlich erstellten Aufgaben speziell zum Thema Vektorrechnung. GPT-4 konnte valide Fragen erzeugen, aber die richtigen Antworten mussten häufig korrigiert werden. Formulierungen waren nicht immer unterr…

Rizos, I., Foykas, E.,, Georgakopoulos, S. V (2024). Contemporary Educational Technology. Enhancing Mathematics Education for Students with Special Educational Needs through Generative AI: A Case Study in Greece ★★★★★
✓ zitiert peer-reviewed empirical inclusion chatgpt

Rizos, I., Foykas, E.,, Georgakopoulos, S. V · 2024 · Contemporary Educational Technology ★★★★★ 12/10
Neunstündige Unterrichtsintervention in Griechenland: Zwei Achtklässler mit sonderpädagogischem Förderbedarf arbeiteten mit ChatGPT-3.5-generierten Arbeitsblättern, die auf Lehrplanziele und individuelle Interessen abgestimmt waren. Ergebnis: aktive Beteiligun…

Yan, B., Luo, M.,, Qu, Y (2025). Frontiers in Educational Research. Generative AI-Based System for Automatic Exercise Generation in Middle School Mathematics: Design and Evaluation Methodology ★★★★★
✓ zitiert peer-reviewed genai exercise-generation

Yan, B., Luo, M.,, Qu, Y · 2025 · Frontiers in Educational Research ★★★★★ 11/10
Entwickelt generatives KI-System auf Basis von DeepSeek-7B für automatische Aufgabenerstellung in der Mittelschulmathematik. Dreistufiges Evaluierungsrahmenwerk bewertet Qualität, kognitive Adaptierbarkeit und didaktische Praxistauglichkeit. Kognitive Belastun…

Reux, C., Acher, M., Khelladi, D. E., Quinton, C.,, Barais, O (2025). Proceedings of the 29th International Conference on Evaluation and Assessment in Software Engineering (EASE '25). LLM Code Customization with Visual Results: A Benchmark on TikZ ★★★★★
✓ zitiert peer-reviewed conference llm tikz geometry-visualization

Reux, C., Acher, M., Khelladi, D. E., Quinton, C.,, Barais, O · 2025 · Proceedings of the 29th International Conference on Evaluation and Assessment in Software Engineering (EASE '25) ★★★★★ 11/10
Benchmark bewertet LLMs nach ihrer Fähigkeit, TikZ-Code für geometrisch-visuelle Ergebnisse zu erzeugen und anzupassen. TikZ wird breit für geometrische Diagramme in LaTeX-Lehrmaterialien eingesetzt. Zeigt Stärken und Grenzen aktueller LLMs bei visuell korrekt…

Liu, B., Zhang, W., Wang, F. (2026). Education Sciences (MDPI), 16(1), 140. Can Generative Artificial Intelligence Effectively Enhance Students' Mathematics Learning Outcomes? A Meta-Analysis of Empirical Studies from 2023 to 2025 ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Liu, B., Zhang, W., Wang, F. · 2026 · Education Sciences (MDPI), 16(1), 140 ★★★★★ 10/10
Meta-Analyse von 22 empirischen Studien (46 Stichproben, N=5.232): GenAI hat moderaten positiven Effekt auf Mathematiklernen (Hedges' g=0,534). Geometrie erzielte den GRÖSSTEN bereichsspezifischen Effekt aller Inhaltsbereiche (g=0,906), vor Zahl & Algebra (g=0…

Baldinger, S., Weinhandl, R., Mayrhofer, J. (2026). Journal of Computer Assisted Learning. Digital adaptive learning in secondary mathematics: A qualitative interview study with Austrian teachers on perceptions, needs, and implementations ★★★★★
✓ zitiert 🎓 Peer-reviewed 🇦🇹 Österreich 🧮 Mathematik

Baldinger, S., Weinhandl, R., Mayrhofer, J. · 2026 · Journal of Computer Assisted Learning ★★★★★ 10/10
Qualitative Interviewstudie der JKU Linz mit 11 österreichischen Sekundarschullehrkräften zu digitalen adaptiven Lernmaterialien im Mathematikunterricht. Wünsche: Anpassung der Aufgabenschwierigkeit, fehlerfokussiertes Feedback, Kontextpersonalisierung. Haupth…

Wijers, M., et al. (2026). Educational Psychology Review. Gamification on Mathematics Engagement and Motivation in Secondary School and Higher Education: A Systematic Review and Meta-Analysis ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Wijers, M., et al. · 2026 · Educational Psychology Review ★★★★★ 10/10
Systematisches Review und Meta-Analyse (45 Studien qualitativ, 11 quantitativ, N=4.345, Sekundarstufe + Hochschule): Gamification hat einen signifikant kleinen bis mittleren positiven Effekt auf Mathematikmotivation (g=0,38). Digitale Plattformen wie Kahoot! u…

Yunianto, W., Galič, S., Lavicza, Z., Urhan, S. (2025). Computers in the Schools (Taylor & Francis). A Model for Computational Thinking Development in GeoGebra with the Support of ChatGPT ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Yunianto, W., Galič, S., Lavicza, Z. · 2025 · Computers in the Schools (Taylor & Francis) ★★★★★ 10/10
Entwicklung eines Modells zur Förderung von Computational Thinking durch die Kombination von GeoGebra und ChatGPT. Untersucht die Schnittstelle zwischen KI, Computational Thinking und Mathematikdidaktik. Sehr relevant für Kapitel 07 und 08.

Chervonyi, Y., Trinh, T.H., Olšák, M., Yang, X., Nguyen, H., Menegali, M., Jung, J., Kim, J., Verma, V., Le, Q.V., Luong, T. (2025). Journal of Machine Learning Research, Vol. 26(241), 1–39 (also arXiv:2502.03544). Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2 ★★★★★
✓ zitiert 🔬 Preprint 🧮 Mathematik

Chervonyi, Y., Trinh, T.H., Olšák, M. · 2025 · Journal of Machine Learning Research, Vol. 26(241), 1–39 (also arXiv:2502.03544) ★★★★★ 10/10
AlphaGeometry 2 löst 84% aller IMO-Geometrieprobleme 2000–2024 (gegenüber 54% bei AG1). Verbesserte Gemini-basierte Sprachkomponente, erweiterte Domänensprache (Winkel, Abstände, Locus-Theoreme), schnellere symbolische Suchmaschine mit Knowledge-Sharing. Meile…

Hubert, T., Mehta, R., Sartran, L., et al. (39 Autoren, Google DeepMind) (2025). Nature. Olympiad-level formal mathematical reasoning with reinforcement learning (AlphaProof) ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Hubert, T., Mehta, R., Sartran, L. · 2025 · Nature ★★★★★ 10/10
AlphaProof kombiniert Gemini (LLM) mit AlphaZero-Reinforcement-Learning für formale Mathematik in Lean 4. Bei IMO 2024 löste das System zusammen mit AlphaGeometry 2 vier von sechs Aufgaben (28/42 Punkte) — Silbermedaillen-Niveau, das erste KI-System auf diesem…

Bastani, H., Bastani, O., Sungu, A., Ge, H., Kabakcı, Ö., Mariman, R. (2025). Proceedings of the National Academy of Sciences (PNAS). Generative AI without guardrails can harm learning: Evidence from high school mathematics ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Bastani, H., Bastani, O., Sungu, A. · 2025 · Proceedings of the National Academy of Sciences (PNAS) ★★★★★ 10/10
Feldexperiment mit ~1.000 Oberschüler:innen: GPT-4 ohne Guardrails verbesserte Übungsleistung um 48%, GPT Tutor (mit Schutzmaßnahmen) um 127%. Kritischer Befund: Schüler:innen mit uneingeschränktem KI-Zugang schnitten in Prüfungen ohne KI 17% schlechter ab — A…

Achim, T., Best, A., Bietti, A., et al. (The Harmonic Team, 23 Autoren) (2025). arXiv preprint. Aristotle: IMO-level Automated Theorem Proving ★★★★★
✓ zitiert 🔬 Preprint 🧮 Mathematik

Achim, T., Best, A., Bietti, A. · 2025 · arXiv preprint ★★★★★ 10/10
Aristotle (Harmonic Team) löst 5 von 6 IMO 2025 Problemen mit vollständig verifizierten Lean 4 Beweisen — erstmals Goldmedaillen-Niveau für ein KI-System. Das System integriert: Lean-Beweissuche, informales LLM-Reasoning für Lemma-Generierung und einen dedizie…

Maskos, K., Schulz, A., Oeksuez, S. S. (2025). ZDM – Mathematics Education, Vol. 57, pp. 679–693. Formative Assessment in Mathematics Education: A Systematic Review ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik meta

Maskos, K., Schulz, A., Oeksuez, S. S. · 2025 · ZDM – Mathematics Education, Vol. 57, pp. 679–693 ★★★★★ 10/10
Systematisches Review von 45 Studien (2015–2023) zu formativem Assessment in der Mathematik. Findet besonderes Potenzial für computerbasierte Assessments in interaktiven Lernumgebungen — Basisevidenz für die Debatte formativ vs. summativ in der Sekundarmathema…

Pepin, B., Buchholtz, N., Salinas-Hernández, U. (2025). Digital Experiences in Mathematics Education, Vol. 11, pp. 9–41. A Scoping Survey of ChatGPT in Mathematics Education ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik open-access

Pepin, B., Buchholtz, N., Salinas-Hernández, U. · 2025 · Digital Experiences in Mathematics Education, Vol. 11, pp. 9–41 ★★★★★ 10/10
Scoping Survey zur Integration von ChatGPT im Mathematikunterricht (Schule und Universität). Schlüsselthemen: Begriffsverständnis, Unterrichtsplanung, Assessment-Design, personalisiertes Lernen, Kollaboration. ChatGPT stärkt selbstreguliertes Lernen und ermögl…

Hannan, B., Eynon, R. (2025). Computers & Education. Widening the digital divide: The mediating role of Intelligent Tutoring Systems in the relationship between rurality, socioeducational advantage, and mathematics learning outcomes ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Hannan, B., Eynon, R. · 2025 · Computers & Education ★★★★★ 10/10
N = 66.451 australische Sekundarschüler:innen (Klassen 7–10), 304 Schulen, AdaptiveMath ITS, Schuljahr 2023. ITS-Nutzung mediierte die Beziehung zwischen sozioökonomischem Vorteil und Lernleistung – im Sinne eines 'Matthew Effect': Privilegierte Schüler:innen …

Weigand, H.-G., Hollebrands, K., Maschietto, M. (2025). ZDM – Mathematics Education. Geometry education at secondary level — A systematic literature review ★★★★★
✓ zitiert 🎓 Peer-reviewed meta 🧮 Mathematik

Weigand, H.-G., Hollebrands, K., Maschietto, M. · 2025 · ZDM – Mathematics Education ★★★★★ 10/10
PRISMA-basiertes Systematic Literature Review zu Geometrieunterricht auf Sekundarstufenniveau (seit 2013, fünf Datenbanken, Konferenzproceedings). Analysiert mit Voyant Tool. Kategorien: Argumentieren, Beweisen, Problemlösen, Modellieren; Raumgeometrie, ebene …

Dela Torre, J.,, Sayco, J (2025). Journal of Education and Practice. Large Language Models in Tertiary Mathematics Education: A Systematic Literature Review ★★★★★
✓ zitiert systematic-review llm tertiary-mathematics

Dilling, F., Herrmann, M. (2024). Frontiers in Artificial Intelligence. Using large language models to support pre-service teachers' mathematical reasoning — an exploratory study on ChatGPT as an instrument for creating mathematical proofs in geometry ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Dilling, F., Herrmann, M. · 2024 · Frontiers in Artificial Intelligence ★★★★★ 10/10
Exploratorische Studie zur Nutzung von ChatGPT als Werkzeug für angehende Primarstufen-Lehrende beim Erstellen geometrischer Beweise. Untersucht Vorerfahrungen mit LLMs, Überzeugungen und Interaktionsverhalten. Ergebnis: Studierende hatten begrenzte Vorerfahru…

Hamady, S., Mershad, K., Jabakhanji, B. (2024). Frontiers in Education. Multi-version interactive assessment through the integration of GeoGebra with Moodle ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Hamady, S., Mershad, K., Jabakhanji, B. · 2024 · Frontiers in Education ★★★★★ 10/10
Untersuchung der Integration von GeoGebra in Moodle für interaktive, KI-resistente Assessments. Zeigt wie dynamische Geometrie-Inhalte die Testintegrität verbessern und gleichzeitig tieferes Lernen fördern. Relevant für Kapitel 07 und die Prüfungsintegritätsdi…

Trinh, T.H., Wu, Y., Le, Q.V., He, H., Luong, T. (2024). Nature, 625, 476–482. AlphaGeometry: An Olympiad-level AI system for geometry ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Trinh, T.H., Wu, Y., Le, Q.V. · 2024 · Nature, 625, 476–482 ★★★★★ 10/10
Google DeepMind präsentiert AlphaGeometry, ein neurosymbolisches KI-System das olympiadische Geometriebeweise auf dem Niveau eines menschlichen Goldmedaillengewinners löst. Löste 25 von 30 IMO-Geometrieproblemen (Vorläufer: 10). AlphaGeometry 2 (2024) löste 83…

Murphy, L.R., Yang, K., Sun, J., Li, Z., Anandkumar, A., Si, X. (2024). Proceedings of the 41st International Conference on Machine Learning (ICML 2024). LeanEuclid: A benchmark for autoformalization in the domain of Euclidean geometry ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Murphy, L.R., Yang, K., Sun, J. · 2024 · Proceedings of the 41st International Conference on Machine Learning (ICML 2024) ★★★★★ 10/10
Erstmalige treue Formalisierung von Euklids Elementen in Lean 4. Benchmark für automatische Formalisierung euklidischer Geometrie. Relevant für Kapitel 06 (Hochschule: formale Beweissysteme) und 10 (Ausblick: KI und formale Mathematik).

Vuong, Q.-H., Ho, M.-T. (2024). AI & Society (Springer Nature). The disruptive AlphaGeometry: is it the beginning of the end of mathematics education? ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Vuong, Q.-H., Ho, M.-T. · 2024 · AI & Society (Springer Nature) ★★★★★ 10/10
Analyse der pädagogischen Implikationen von AlphaGeometry für den Mathematikunterricht. Die Autoren untersuchen, wie olympiadische KI-Performance das Lehrer-Schüler-Verhältnis und die Rolle von Schulen in der mathematischen Bildung herausfordert. Kernargument:…

Zhang, R., Jiang, D., Zhang, Y., Lin, H., Guo, Z., Qiu, P., Zhou, A., Lu, P., Chang, K.-W., Gao, P., Li, H. (2024). Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186). MathVerse: Does Your Multi-modal LLM Truly See the Diagrams in Visual Math Problems? ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Zhang, R., Jiang, D., Zhang, Y. · 2024 · Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186) ★★★★★ 10/10
2.612-Problem-Datensatz (ebene Geometrie, Körpergeometrie, Funktionen) in 6 Varianten (mit/ohne Diagramm). Zentrale Entdeckung: 'Die meisten MLLMs verstehen Mathematikdiagramme nicht — sie verlassen sich auf den Textanteil der Aufgabe.' Einige Modelle erzielte…

Wei, X. (2024). Frontiers in Education, 9, 1452570. Evaluating ChatGPT-4 and ChatGPT-4o: Performance Insights from NAEP Mathematics Problem Solving ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Wei, X. · 2024 · Frontiers in Education, 9, 1452570 ★★★★★ 10/10
Evaluation von GPT-4 und GPT-4o auf NAEP-Mathematikaufgaben (4., 8., 12. Klasse): Geometrie/Messung ist der schwächste Inhaltsbereich — GPT-4: 53%, GPT-4o: 59% (vs. 79%/92% in Algebra). Räumliches Denken und visuelle Informationsverarbeitung als fundamentale B…

Aslan, D., Dağaynası, S., Ceylan, M. (2024). Education and Information Technologies (Springer). Technology and Geometry: Fostering Young Children's Geometrical Concepts Through a Research-Based Robotic Coding Program ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Aslan, D., Dağaynası, S., Ceylan, M. · 2024 · Education and Information Technologies (Springer) ★★★★★ 10/10
Quasi-experimentelle Studie mit 52 Kindergartenkindern (5 Jahre, 3 Gruppen: Roboter-Coding, Nicht-Coding, Kontrolle). Robotic-Coding-Gruppe zeigte stärkste Zuwächse im geometrischen Konzeptverständnis. Programmierbare Bodenroboter (Enactment geometrischer Pfad…

Pardos, Z.A., Bhandari, S. (2024). PLOS ONE, 19(6), e0304013. Hallucination mitigation in affective computing and educational AI: A study of large language model failures in mathematical reasoning ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Pardos, Z.A., Bhandari, S. · 2024 · PLOS ONE, 19(6), e0304013 ★★★★★ 10/10
Systematische Untersuchung von Strategien zur Reduzierung von Halluzinationen in bildungs-KI-Kontexten. Testet Chain-of-Thought-Prompting, Selbstreflexionsaufforderungen und Retrieval-Augmented Generation (RAG) bei mathematischen Reasoning-Aufgaben. Befund: Se…

Yunianto, W., Lavicza, Z., Kastner-Hauler, O., Houghton, T. (2024). Journal on Mathematics Education, 15(3), 1027–1052. Investigating the use of ChatGPT to solve a GeoGebra-based mathematics + computational thinking task in a geometry topic ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🇦🇹 Österreich 🧮 Mathematik

Yunianto, W., Lavicza, Z., Kastner-Hauler, O. · 2024 · Journal on Mathematics Education, 15(3), 1027–1052 ★★★★★ 10/10
Educational Design Research-Studie (5 Erwachsene, 16 Junior-High-Schüler:innen): Kann ChatGPT korrekte GeoGebra-Befehle für geometrische Aufgaben mit Computational Thinking generieren? Befund: ChatGPT hat erhebliche Limitationen bei der Generierung korrekter G…

Botana, F., Recio, T. (2024). Computation, 12(2), 30. Geometric Loci and ChatGPT: Caveat Emptor! ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Botana, F., Recio, T. · 2024 · Computation, 12(2), 30 ★★★★★ 10/10
Systematischer Benchmark von ChatGPT 3.5 vs. GeoGebra 5 bei geometrischen Ortskurvenaufgaben (Einhüllende ebener Kurvenfamilien). Ergebnis: ChatGPT scheitert in den meisten Fällen; GeoGebra löst zuverlässig. Warnung ('Caveat Emptor!') an Lehrende, die ChatGPT …

Kovács, Z., Recio, T., Sólyom-Gecse, C., Vélez, M.P. (2024). Annals of Mathematics and Artificial Intelligence. On Automated Completion of Geometry Statements and Proofs with GeoGebra Discovery ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Kovács, Z., Recio, T., Vélez, M.P. · 2024 · arXiv / GeoGebra Discovery Research ★★★★★ 9/10
GeoGebra Discovery erweitert GeoGebra um automatisierte Beweisführung: Der ShowProof-Befehl zeigt Schritt-für-Schritt-Beweissequenzen für geometrische Aussagen; ein Schwierigkeitswert bewertet den 'Überraschungsgrad' eines Satzes relativ zu seinen Voraussetzun…

de Winter, J. C. F., Dodou, D., Eisma, Y. B. (2024). Computers (MDPI), Vol. 13(11), Art. 278. System 2 Thinking in OpenAI's o1-Preview Model: Near-Perfect Performance on a Mathematics Exam ★★★★★
✓ zitiert 🎓 Peer-reviewed oa empirical

Ständige Wissenschaftliche Kommission der KMK (SWK) (2024). KMK / peDOCS. Large Language Models und ihre Potenziale im Bildungssystem [Impulspapier] ★★★★★
✓ zitiert 🏛️ Institution 🇦🇹 Österreich

Kultusministerkonferenz (KMK) (2024). KMK-Sekretariat. Handlungsempfehlung für die Bildungsverwaltung zum Umgang mit Künstlicher Intelligenz in schulischen Bildungsprozessen ★★★★★
✓ zitiert 🏛️ Institution 🇦🇹 Österreich

Collins, K. M., Jiang, A. Q., Frieder, S., Li, L., Gowers, T., Burden, J., Hernandez-Bocanegra, D. C., Tang, Z., Anagnostidis, S., Wen, Z., Simon, K., Bengio, Y., Broz, P., Posner, I., Barez, F., Goldowsky-Dill, N., Wills, J., Schroeder, T., Pezeshki, H., Shen, R., Torr, P. H. S., Jamnik, M. (2024). Proceedings of the National Academy of Sciences. Evaluating language models for mathematics through interactions ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Collins, K. M., Jiang, A. Q., Frieder, S. · 2024 · Proceedings of the National Academy of Sciences ★★★★★ 10/10
CheckMate: interaktive Bewertungsplattform, auf der echte Mathematiker:innen GPT-4, ChatGPT und InstructGPT beim Beweisen von Undergraduate-Mathematiksätzen testeten. Befund: Statische Benchmarks unterschätzen systematisch die Fähigkeiten von LLMs in interakti…

Yoon, H., Hwang, J., Lee, K., Roh, K. H., Kwon, O. N. (2024). ZDM – Mathematics Education. Students' use of generative artificial intelligence for proving mathematical statements ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Yoon, H., Hwang, J., Lee, K. · 2024 · ZDM – Mathematics Education ★★★★★ 10/10
Qualitative Studie mit drei Undergraduate-Studierenden zu KI-Nutzung beim Beweisen mathematischer Aussagen. Entwickelt das Rahmenmodell SIPE-AI (Students' Interactive Proving Experience with AI) mit drei Einflussfaktoren: Beweiskonzeptionen, KI-Konzeptionen un…

Turmuzi, M., Azmi, S., Kertiyani, N. M. I. (2026). Teaching and Teacher Education. ChatGPT in school mathematics education: A systematic review of opportunities, challenges, and pedagogical implications ★★★★★
✓ zitiert 🎓 Peer-reviewed meta 🧮 Mathematik

Turmuzi, M., Azmi, S., Kertiyani, N. M. I. · 2026 · Teaching and Teacher Education ★★★★★ 9/10
PRISMA-basiertes systematisches Review von 20 empirischen Studien (2023–2025). In 70% der Studien war ChatGPT effektiv bei sofortiger Rückmeldung und personalisierter Unterstützung. In 40% der Studien wurde Überabhängigkeit der Schüler:innen dokumentiert. Gren…

Wang, J., Tigelaar, D. E. H., Ye, T., Admiraal, W. (2026). Journal of Computer Assisted Learning. A meta-analysis of moderators of the effects of technology-enhanced adaptive learning on primary and secondary students' learning outcomes ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Wang, J., Tigelaar, D. E. H., Ye, T. · 2026 · Journal of Computer Assisted Learning ★★★★★ 9/10
Meta-Analyse von 69 Studien (n=9.095 K-12-Schüler:innen) zu technologiegestütztem adaptivem Lernen. Mittlere positive Effekte auf kognitive, affektive und Verhaltensoutcomes. Identifiziert 12 Moderatoren für kognitive Outcomes — u.a. Klassenstufe, Fach, Implem…

Walkington, C. (2025). School Science and Mathematics (Wiley). The implications of generative artificial intelligence for mathematics education ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Walkington, C. · 2025 · School Science and Mathematics (Wiley) ★★★★★ 9/10
Umfassende Analyse der Implikationen generativer KI für den Mathematikunterricht. Untersucht, wie Schüler:innen GenAI als Denkpartner beim mathematischen Modellieren und Beweisen nutzen können. Diskutiert gemischte Ergebnisse beim Einsatz als Tutor sowie die N…

Polydoros, G., Galitskaya, V., Antoniou, A.-S., Drigas, A. (2025). Scientific Electronic Archives, 18(2). AI Technology Integration in Elementary Geometry and Its Effects on Performance, Anxiety Levels, Learning Styles, Cognitive Styles, and Executive Functions ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Polydoros, G., Galitskaya, V., Antoniou, A.-S. · 2025 · Scientific Electronic Archives, 18(2) ★★★★★ 9/10
Quasi-experimentelle Studie mit 436 griechischen Drittklässler:innen (9–10 Jahre, Piaget/Van-Hiele-Theorie). Experimentalgruppe nutzte ChatGPT integriert im traditionellen Geometrieunterricht zu Symmetrie und ebenen Figuren. Signifikant besseres geometrisches …

Kestin, G., Miller, K., Klales, A., Milbourne, T., Ponti, G. (2025). Scientific Reports (Nature Portfolio), 15, 17458. AI Tutoring Outperforms Active Learning ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access

Kestin, G., Miller, K., Klales, A. · 2025 · Scientific Reports (Nature Portfolio), 15, 17458 ★★★★★ 9/10
Crossover-RCT mit 194 Physikstudierenden: KI-Tutor-Gruppe übertraf signifikant Best-Practice-Präsenzunterricht (Peer Instruction, Kleingruppen, Echtzeit-Feedback). Studierende berichteten höheres Engagement und lernten mehr in weniger Zeit. Wichtiger allgemein…

Hariyanto, D., Kristianingsih, K., Maharani, A. (2025). Discover Education, 4, 458. Artificial Intelligence in Adaptive Education: A Systematic Review of Techniques for Personalized Learning ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access

Hariyanto, D., Kristianingsih, K., Maharani, A. · 2025 · Discover Education, 4, 458 ★★★★★ 9/10
PRISMA-compliant analysis of 142 peer-reviewed empirical studies (2015–2025) from Scopus, Web of Science, IEEE Xplore. Identifies key AI techniques in adaptive education: knowledge tracing, Bayesian networks, reinforcement learning, and LLMs. Geometry and math…

Naskręcki, B., Ono, K. (2025). Nature Physics, 21, 1504–1506. Mathematical Discovery in the Age of Artificial Intelligence ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Naskręcki, B., Ono, K. · 2025 · Nature Physics, 21, 1504–1506 ★★★★★ 9/10
Perspective in Nature Physics arguing that AI tools are reshaping mathematical research practice. Reviews case studies where AI led to or accelerated discoveries (knot invariants, arithmetic geometry). Cautions against over-reliance and emphasizes that the pur…

Uygun, T., Şendur, A., Top, B. (2025). Education and Information Technologies (Springer), 30, 8373–8411. Facilitating Preservice Teachers' Geometric Thinking Through AI-Assisted Augmented Reality: The Case of Platonic Solids ★★★★★
✓ zitiert 🎓 Peer-reviewed

Uygun, T., Şendur, A., Top, B. · 2025 · Education and Information Technologies (Springer), 30, 8373–8411 ★★★★★ 9/10
Five-week intervention combining ChatGPT, Blender (3D modelling), and MyWebAR for interactive exploration of Platonic solids with 15 preservice mathematics teachers. AI-assisted AR significantly facilitated geometric reasoning development, particularly visuali…

Krátká, M., Přibyl, J., Tichá, M. (2025). 24th European Conference on e-Learning (ECEL), Vol. 24(1). AI in the Classroom: Didactical Misalignments in Geometry Between Czech and Anglo-Saxon Contexts ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Krátká, M., Přibyl, J., Tichá, M. · 2025 · 24th European Conference on e-Learning (ECEL), Vol. 24(1) ★★★★★ 9/10
Systematische Analyse von ChatGPT, Gemini, Claude, Copilot und Mistral zu Geometrieprompts auf Tschechisch und Englisch. Zentralbefund: KI-Tools reproduzieren angelsächsische Konzeptualisierungen (z.B. Quadrat als Spezialfall des Rechtecks), die mit tschechisc…

Eryigit, C. D., Kucuk, S., Tasgin, A. (2025). Education and Information Technologies. Impact of Augmented Reality Technology on Geometry Skills and Motivation of Preschool Children ★★★★★
✓ zitiert 🎓 Peer-reviewed empirical

Eryigit, C. D., Kucuk, S., Tasgin, A. · 2025 · Education and Information Technologies ★★★★★ 9/10
Mixed-Methods-Studie (n=30, Vorschulkinder 5 Jahre): AR-gestützte Geometrieaktivitäten erzielen signifikant bessere Geometriekenntnisse und Motivation als traditioneller Unterricht, mit hoher Effektgröße. Wöchentliche Beobachtungen dokumentierten kognitive, af…

Tröbelsberger, L., Fock, A., Oldenburg, R., Siller, H.-S. (2025). Mitteilungen der Deutschen Mathematiker-Vereinigung (DMVM), Vol. 33(4), pp. 276–280. Der Einsatz von KI-Systemen durch Studierende in der universitären Mathematikausbildung ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik dach empirical

Tröbelsberger, L., Fock, A., Oldenburg, R. · 2025 · Mitteilungen der Deutschen Mathematiker-Vereinigung (DMVM), Vol. 33(4), pp. 276–280 ★★★★★ 9/10
Erste publizierte empirische Erhebung zur KI-Nutzung im Mathematikstudium im DACH-Raum. Zeigt: KI ist bereits Teil der studentischen Lebenswelt in der Mathematikausbildung — mit erheblichen Ausbildungsbedarfen für reflektierten Umgang. Grundlage: Befragungsstu…

Bastian, A., Buchholtz, N., Kaiser, G. (2025). Frontiers in Education. Using AI chatbots to facilitate mathematics preservice teachers' noticing skills ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik dach empirical

Bastian, A., Buchholtz, N., Kaiser, G. · 2025 · Frontiers in Education ★★★★★ 9/10
Entwicklung und Einsatz des KI-Chatbots NiCo (basierend auf GPT-4o) zur Förderung von Noticing-Kompetenzen bei n=25 Mathematik-Lehramtsstudierenden (Sekundaralgebra-Unterrichtsvideos). Strukturiertes Scaffolding und Feedback durch KI. Buchholtz und Kaiser an U…

Létourneau, A., Deslandes Martineau, M., Charland, P., Karran, J. A., Boasen, J., Léger, P. M. (2025). npj Science of Learning, Vol. 10, Article 56. A Systematic Review of AI-Driven Intelligent Tutoring Systems (ITS) in K-12 Education ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik empirical meta

Létourneau, A., Deslandes Martineau, M., Charland, P. · 2025 · npj Science of Learning, Vol. 10, Article 56 ★★★★★ 9/10
Systematisches Review von 28 Studien (N=4.597 Schüler:innen K-12, quasi-experimentelle Designs). Ergebnisse: ITS zeigen im Allgemeinen positive Effekte auf Lernleistung. Geometriespezifisch: Long & Aleven RCT mit Cognitive Tutor Geometry als Kernstudie. Veröff…

Awang, L. A., Yusop, F. D., Danaee, M. (2025). International Electronic Journal of Mathematics Education, Vol. 20(2), em0823. Current Practices and Future Direction of Artificial Intelligence in Mathematics Education: A Systematic Review ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik meta

Awang, L. A., Yusop, F. D., Danaee, M. · 2025 · International Electronic Journal of Mathematics Education, Vol. 20(2), em0823 ★★★★★ 9/10
Systematisches Review zu aktuellen Praxen und Zukunftsdirektionen von KI im Mathematikunterricht. Identifiziert Geometrievisualisierung als eigenständige KI-adressierbare Aufgabenkategorie. Fordert explainable AI-Features für transparentere KI-Systeme. Forschu…

Nguyen, D. T., Pham, Q. V. (2025). Eurasia Journal of Mathematics, Science and Technology Education, Vol. 21(10), em2714. The Evolving Landscape of AI Integration in Mathematics Education: A Systematic Review of Trends (2015–2025) ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik meta

Nguyen, D. T., Pham, Q. V. · 2025 · Eurasia Journal of Mathematics, Science and Technology Education, Vol. 21(10), em2714 ★★★★★ 9/10
Systematisches Review der KI-Integration im Mathematikunterricht 2015–2025. Dokumentiert starke Beschleunigung ab 2024. Adaptive Lernpfade, personalisiertes Feedback und KI-Aufgabengenerierung als drei Hauptwachstumsfelder. GeoGebra Tutor und MATHia als vielve…

Bartha, S., Kerekes, A., Kovács, Z., Kovács, Z., Recio, T. (2025). Annals of Mathematics and Artificial Intelligence. Automated analysis of the difficulty of secondary school geometry theorems ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik geogebra

Bartha, S., Kerekes, A., Kovács, Z. · 2025 · Annals of Mathematics and Artificial Intelligence ★★★★★ 9/10
Benchmark-Liste von Geometrietheoremen aus dem ungarischen Gymnasiallehrplan, implementiert als GeoGebra-Dateien. Automatisierter Beweis via GeoGebra Discovery und Java Geometry Expert (JGEX). Korrelation r = 0.43 (moderat) zwischen verschiedenen KI-basierten …

Wang, J., Fan, W. (2025). Humanities and Social Sciences Communications. The effect of ChatGPT on students' learning performance, learning perception, and higher-order thinking: Insights from a meta-analysis ★★★★★
✓ zitiert 🎓 Peer-reviewed meta 🔓 Open Access

Wang, J., Fan, W. · 2025 · Humanities and Social Sciences Communications ★★★★★ 9/10
Meta-Analyse von 51 Studien (Nov. 2022 – Feb. 2025). Lernleistung: Hedges' g = 0,867 (großer positiver Effekt). Lernwahrnehmung: g = 0,456 (mittlerer Effekt). Höherstufiges Denken: g = 0,457 (mittlerer Effekt). Stärkste quantitative Evidenz für Lernwirksamkeit…

Flavin, E., Hwang, S., Flavin, M. T. (2025). International Journal of Science and Mathematics Education. Augmented Reality for Mathematics Achievement: A Meta-Analysis of Main and Moderator Effects ★★★★★
✓ zitiert 🎓 Peer-reviewed meta 🧮 Mathematik

Flavin, E., Hwang, S., Flavin, M. T. · 2025 · International Journal of Science and Mathematics Education ★★★★★ 9/10
Meta-Analyse von 22 experimentellen Studien (25 Samples, K-12) zu Augmented Reality im Mathematikunterricht. Hedges' g = 0,765 (mittel bis groß). Moderatoranalyse: Geometrie-Domäne, kurze Interventionsdauer und vollständig integriertes AR (virtuelle Objekte er…

Fuster Rabella, M. (2025). OECD Education Working Papers, No. 338. Evolving AI Capabilities and the School Curriculum ★★★★★
✓ zitiert 🏛️ Institution policy

Zhang, R., Jiang, D., Zhang, Y., Lin, H., Guo, Z., Qiu, P., Zhou, A., Lu, P., Chang, K.-W., Gao, P., Li, H. (2025). ICLR 2025 (International Conference on Learning Representations). MAVIS: Mathematical Visual Instruction Tuning with an Automatic Data Engine ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Zhang, R., Jiang, D., Zhang, Y. · 2025 · ICLR 2025 (International Conference on Learning Representations) ★★★★★ 9/10
Automatisierte Datenpipeline für visuelle Mathematik-Instruktionstuning von MLLMs. MAVIS-7B übertrifft GPT-4V auf geometrischen Benchmarks (MathVerse: +15,9%) durch dedizierten Geometrie-Datensatz mit 558k Beispielen. Zeigt: Spezialisiertes Training auf geomet…

Simić, I., Stojanović-Đurđević, S., Tanasijević, M. (2025). Annals of Mathematics and Artificial Intelligence. Automated theorem proving for 3D solid geometry ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Simić, I., Stojanović-Đurđević, S., Tanasijević, M. · 2025 · Annals of Mathematics and Artificial Intelligence ★★★★★ 9/10
Formales System zur automatisierten Beweisführung in der 3D-Raumgeometrie (Körpergeometrie). Erweitert klassische Ansätze (z.B. GCL-basierte Systeme) auf dreidimensionale Konfigurationen — Quader, Pyramiden, Zylinder. Relevant für Hochschuldidaktik und automat…

Sharma, A., Dalmia, A., Kazemi, M., Zouaq, A., Pal, C. (2025). Findings of the Association for Computational Linguistics: NAACL 2025 (pp. 7340–7356). GeoCoder: Solving geometry problems by generating modular code through vision-language models ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Sharma, A., Dalmia, A., Kazemi, M. · 2025 · Findings of the Association for Computational Linguistics: NAACL 2025 (pp. 7340–7356) ★★★★★ 9/10
GeoCoder lässt Vision-Language-Modelle modularen, ausführbaren Code aus einer vordefinierten Geometriefunktionsbibliothek generieren — statt freie Textlösungen. RAG-GeoCoder (retrieval-augmented) verbessert die Leistung auf GeoQA und Geometry3K deutlich. Zeigt…

Pan, Y., Zhang, Z., Hu, P., Ma, J., Du, J., Zhang, J., Liu, Q., Gao, J., Ma, F. (2025). Proceedings of the 33rd ACM International Conference on Multimedia (ACM MM 2025). Enhancing the geometric problem-solving ability of multimodal LLMs via symbolic-neural integration ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Pan, Y., Zhang, Z., Hu, P. · 2025 · Proceedings of the 33rd ACM International Conference on Multimedia (ACM MM 2025) ★★★★★ 9/10
GeoGen-Pipeline: symbolische Geometrielöser generieren nachweislich korrekte, schrittweise Lösungen für diagrammbasierte Probleme im großen Maßstab; GeoLogic (neurales Modell) überbrückt natürliche Sprache und symbolische Verifikation. Reduziert Halluzinatione…

Kaźmierczak, A., Lewandowska, A., Olejniczak, M., Szewczyk, P. (2025). Scientific Reports (Nature). EDU-MAT COPERNICUS: Augmented reality platform for primary mathematics using satellite data ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access

Kaźmierczak, A., Lewandowska, A., Olejniczak, M. · 2025 · Scientific Reports (Nature) ★★★★★ 9/10
AR-Plattform, die Echtzeit-Satellitendaten (Copernicus) für Primarstufen-Mathematik und Geowissenschaften nutzt. Pilotstudie (n=30): AR-gestützte Aktivitäten verbessern räumliches Denken und Mathematikleistung signifikant. Zeigt: Einbettung geometrischer Konze…

Dilling, F., Herrmann, M. (2025). Frontiers in Education. ChatGPT's perspectives on real numbers, straight lines, and probability — A quantitative study on the influence of prompting ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Dilling, F., Herrmann, M. · 2025 · Frontiers in Education ★★★★★ 9/10
Inhaltsanalytische Studie mit 450 ChatGPT-Antworten zu mathematischen Konzepten (Geraden, reelle Zahlen, Wahrscheinlichkeit): Chi-Quadrat-Tests zeigen, dass ChatGPT die empirisch-konkrete mathematische Perspektive deutlich häufiger einnimmt als formale oder st…

Liu, D., Yi, L., Kang, R. (2025). Journal of Computer Assisted Learning. The impact of a digital game on spatial reasoning for elementary school students ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Liu, D., Yi, L., Kang, R. · 2025 · Journal of Computer Assisted Learning ★★★★★ 9/10
Quasi-experimentelle Studie mit Viertklässler:innen: Vier Interventionstage mit einem digitalen Mathematikspiel führten zu signifikant größeren Verbesserungen in Objektbeobachtung und mentaler Rotation (ANCOVA). Direkte empirische Evidenz für die Wirksamkeit v…

Flavin, E., Chung, M., Hwang, S., Flavin, M. T. (2025). Educational Technology Research and Development. Augmented reality for area measurement reasoning of elementary students ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Flavin, E., Hwang, S., Flavin, M. T. · 2025 · International Journal of Science and Mathematics Education ★★★★★ 9/10
Meta-Analyse von 22 experimentellen Studien (25 Samples, K-12) zu Augmented Reality im Mathematikunterricht. Hedges' g = 0,765 (mittel bis groß). Moderatoranalyse: Geometrie-Domäne, kurze Interventionsdauer und vollständig integriertes AR (virtuelle Objekte er…

Zhang, D., Wijaya, T. T., Wang, Y., Su, M., Li, X., Damayanti, N. W. (2025). Scientific Reports. Exploring the relationship between AI literacy, AI trust, AI dependency, and 21st century skills in preservice mathematics teachers ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Zhang, R., Jiang, D., Zhang, Y. · 2025 · ICLR 2025 (International Conference on Learning Representations) ★★★★★ 9/10
Automatisierte Datenpipeline für visuelle Mathematik-Instruktionstuning von MLLMs. MAVIS-7B übertrifft GPT-4V auf geometrischen Benchmarks (MathVerse: +15,9%) durch dedizierten Geometrie-Datensatz mit 558k Beispielen. Zeigt: Spezialisiertes Training auf geomet…

Chen, F., Chen, J., Xu, Y. (2025). Psychology in the Schools. The More Anxious, the More Dependent? The Impact of Math Anxiety on AI-Assisted Problem-Solving ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Chen, E., Xu, T., Gao, Q. · 2025 · arXiv preprint ★★★★★ 3/10
Controlled study with 148 students comparing LLM-Tutor (AI proof reviewer + chatbot) to control group. LLM-Tutor significantly improved homework performance but showed no effect on exam grades. Students with low self-efficacy used chatbot more frequently, corr…

Wang, X., Wei, Y. (2025). Applied Cognitive Psychology. The Influence of Gen-AI Assisted Learning on Primary School Students' Math Anxiety: An Intervention Study ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Wang, J., Fan, W. · 2025 · Humanities and Social Sciences Communications ★★★★★ 9/10
Meta-Analyse von 51 Studien (Nov. 2022 – Feb. 2025). Lernleistung: Hedges' g = 0,867 (großer positiver Effekt). Lernwahrnehmung: g = 0,456 (mittlerer Effekt). Höherstufiges Denken: g = 0,457 (mittlerer Effekt). Stärkste quantitative Evidenz für Lernwirksamkeit…

Polydoros, G., Galitskaya, V., Pergantis, P., Drigas, A., Antoniou, A.-S., Beazidou, E. (2025). Psychology International. Innovative AI-Driven Approaches to Mitigate Math Anxiety and Enhance Resilience Among Students with Persistently Low Performance in Mathematics ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Polydoros, G., Galitskaya, V., Antoniou, A.-S. · 2025 · Scientific Electronic Archives, 18(2) ★★★★★ 9/10
Quasi-experimentelle Studie mit 436 griechischen Drittklässler:innen (9–10 Jahre, Piaget/Van-Hiele-Theorie). Experimentalgruppe nutzte ChatGPT integriert im traditionellen Geometrieunterricht zu Symmetrie und ebenen Figuren. Signifikant besseres geometrisches …

Asiedu Menlah, C. K., Boateng, F. O. (2025). Journal of Pedagogical Sociology and Psychology. Examining the Effect of AI-Based Tutoring Systems on Students' Mathematical Problem-Solving Skills: The Moderating Role of Mathematics Anxiety ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Flavin, E., Hwang, S., Morales, M. (2025). Journal of Teacher Education. Let's Ask the Robot!: Epistemic Stance between Teacher Candidates towards AI in Mathematics Lesson Planning ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Flavin, E., Hwang, S., Flavin, M. T. · 2025 · International Journal of Science and Mathematics Education ★★★★★ 9/10
Meta-Analyse von 22 experimentellen Studien (25 Samples, K-12) zu Augmented Reality im Mathematikunterricht. Hedges' g = 0,765 (mittel bis groß). Moderatoranalyse: Geometrie-Domäne, kurze Interventionsdauer und vollständig integriertes AR (virtuelle Objekte er…

Kovács, Z., Recio, T., Vélez, M.P. (2024). arXiv / GeoGebra Discovery Research. Showing proofs, assessing difficulty with GeoGebra Discovery ★★★★★
✓ zitiert 🔬 Preprint 🔓 Open Access 🧮 Mathematik

Kovács, Z., Recio, T., Vélez, M.P. · 2024 · arXiv / GeoGebra Discovery Research ★★★★★ 9/10
GeoGebra Discovery erweitert GeoGebra um automatisierte Beweisführung: Der ShowProof-Befehl zeigt Schritt-für-Schritt-Beweissequenzen für geometrische Aussagen; ein Schwierigkeitswert bewertet den 'Überraschungsgrad' eines Satzes relativ zu seinen Voraussetzun…

Buchholtz, N., Schorcht, S., Baumanns, L., Huget, J., Noster, N., Rott, B., Siller, H.-S., Sommerhoff, D. (2024). Mitteilungen der Gesellschaft für Didaktik der Mathematik, Nr. 117. Damit rechnet niemand! Sechs Leitgedanken zu Implikationen und Forschungsbedarfen zu KI-Technologien im Mathematikunterricht ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Buchholtz, N., Schorcht, S., Baumanns, L. · 2024 · Mitteilungen der Gesellschaft für Didaktik der Mathematik, Nr. 117 ★★★★★ 9/10
Positionspapier von 8 deutschen Mathematikdidaktiker:innen: sechs Leitgedanken zu Implikationen und Forschungsbedarfen für KI-Technologien (generative KI, ChatGPT) im Mathematikunterricht. Behandelt explizit Problemlösen, Beweisen, Modellieren und Assessment. …

Feng, T. H., Denny, P., Wünsche, B. C., Luxton-Reilly, A., Whalley, J. (2024). SIGGRAPH Asia 2024 Educator's Forum (ACM). An Eye for an AI: Evaluating GPT-4o's Visual Perception and Geometric Reasoning Skills ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Feng, T. H., Denny, P., Wünsche, B. C. · 2024 · SIGGRAPH Asia 2024 Educator's Forum (ACM) ★★★★★ 9/10
Evaluation of GPT-4o on computer graphics and geometry questions with varying visual demands. GPT-4o performs significantly better on text-only than image-containing questions. Fails at precise geometric operations (e.g., cannot correctly reason about a sliced…

Hota, A., Kovács, Z., Vujic, A. (2024). ADG 2023, EPTCS 398, 110–123. Solving Some Geometry Problems of the Náboj 2023 Contest with Automated Deduction in GeoGebra Discovery ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🇦🇹 Österreich 🧮 Mathematik

Hota, A., Kovács, Z., Vujic, A. · 2024 · ADG 2023, EPTCS 398, 110–123 ★★★★★ 9/10
Demonstrates automated deduction solving competition geometry problems from the Náboj 2023 contest using GeoGebra Discovery's symbolic computation engine. Identifies difficulty of encoding problems into machine-readable form as a key challenge. Explores genera…

Kovács, Z., Recio, T., Vélez, M. P. (2024). ADG 2023, EPTCS 398. Solving with GeoGebra Discovery an Austrian Mathematics Olympiad Problem: Lessons Learned ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🇦🇹 Österreich 🧮 Mathematik

Kovács, Z., Recio, T., Vélez, M.P. · 2024 · arXiv / GeoGebra Discovery Research ★★★★★ 9/10
GeoGebra Discovery erweitert GeoGebra um automatisierte Beweisführung: Der ShowProof-Befehl zeigt Schritt-für-Schritt-Beweissequenzen für geometrische Aussagen; ein Schwierigkeitswert bewertet den 'Überraschungsgrad' eines Satzes relativ zu seinen Voraussetzun…

Zhang, C., Liu, X., Ziska, K., Jeon, S., Yu, C.-L., Xu, Y. (2024). Proceedings of the CHI 2024 Conference on Human Factors in Computing Systems (ACM). Mathemyths: Leveraging Large Language Models to Teach Mathematical Language Through Child-AI Co-Creative Storytelling ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access

Zhang, R., Jiang, D., Zhang, Y. · 2024 · Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186) ★★★★★ 10/10
2.612-Problem-Datensatz (ebene Geometrie, Körpergeometrie, Funktionen) in 6 Varianten (mit/ohne Diagramm). Zentrale Entdeckung: 'Die meisten MLLMs verstehen Mathematikdiagramme nicht — sie verlassen sich auf den Textanteil der Aufgabe.' Einige Modelle erzielte…

Fang, X., Ng, D. T. K., Yuen, M. (2024). Education and Information Technologies (Springer). Effects of GeoGebra-Enhanced Scratch Computational Thinking Instruction on Fifth-Grade Students' Motivation, Anxiety, and Cognitive Load ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Fang, X., Ng, D. T. K., Yuen, M. · 2024 · Education and Information Technologies (Springer) ★★★★★ 9/10
Compared Scratch alone vs. Scratch+GeoGebra for geometry learning in 72 fifth-grade students (Hong Kong). GeoGebra-enhanced group showed significantly higher motivation, higher perceived ability, and lower cognitive load. GeoGebra's dynamic geometry environmen…

Wang, X., Chan, K. K., Li, Q., Leung, S. O. (2024). Journal of Educational Computing Research (SAGE). Do 3–8 Year-Old Children Benefit From Computational Thinking Development? A Meta-Analysis ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Wang, X., Chan, K. K., Li, Q. · 2024 · Journal of Educational Computing Research (SAGE) ★★★★★ 9/10
Meta-analysis of 17 empirical studies (n=1,665 children ages 3-8). CT interventions show statistically significant large effect size (d=0.83) on young children's development. Geometry and spatial skills are among the most commonly addressed mathematical domain…

Schorcht, S., Baumanns, L., Buchholtz, N., Huget, J., Peters, F., Pohl, M. (2024). GDM-Mitteilungen, 116. Lernt die KI nun Sehen und Zeichnen? Chancen und Herausforderungen der Bildgenerierung und Bildinterpretation mit ChatGPT für die mathematikdidaktische Forschung ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Schorcht, S., Baumanns, L., Buchholtz, N. · 2024 · GDM-Mitteilungen, 116 ★★★★★ 9/10
Untersucht DALL·E 3 (Text-zu-Bild) und die visuelle Interpretationsfähigkeit von GPT-4 für mathematikdidaktische Forschung. Analysiert Möglichkeiten und Grenzen der KI bei Bildgenerierung und -interpretation — besonders relevant für geometrische Repräsentation…

Ahn, J., Verma, R., Lou, R., Liu, D., Zhang, R., Yin, W. (2024). arXiv:2402.00157 (preprint). Do Large Language Models Know What They Don't Know? A Survey on Uncertainty Estimation for LLMs with Applications to Mathematical Reasoning ★★★★★
✓ zitiert 🔬 Preprint 🔓 Open Access 🧮 Mathematik

Ahn, J., Verma, R., Lou, R. · 2024 · arXiv:2402.00157 (preprint) ★★★★★ 9/10
Survey zu Unsicherheitsschätzung bei LLMs mit besonderem Fokus auf mathematisches Reasoning. Befund: LLMs zeigen systematisch überhöhtes Vertrauen in falsche geometrische Aussagen — besonders bei Beweisaufgaben, die visuelles Reasoning erfordern. Unterscheidet…

Wijaya, T.T., Cao, Y., Weinhandl, R., Tamur, M., Murni, A. (2024). Behavioral Sciences, 14(11), 1008. AI Dependency in Mathematics: Understanding Teacher Perspectives and Student Behavioral Patterns ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Wijaya, T.T., Cao, Y., Weinhandl, R. · 2024 · Behavioral Sciences, 14(11), 1008 ★★★★★ 9/10
Mixed-Methods-Studie zu KI-Abhängigkeit aus Lehrenden- und Schüler:innen-Perspektive. Identifiziert 4 Typen von Abhängigkeitsverhalten: prozedurales Auslagern, konzeptionelle Abhängigkeit, metakognitive Regression und motivationale Erosion. Geometrie als Haupt…

Ateeq, A.K., Iqbal, R., Liz Thomas, A., Shubair, R. (2024). Frontiers in Education, 9, 1470979. Academic Integrity in the Age of Generative AI: Student Use Patterns, Instructor Perceptions, and Institutional Responses ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access

Ateeq, A.K., Iqbal, R., Liz Thomas, A. · 2024 · Frontiers in Education, 9, 1470979 ★★★★★ 9/10
Große empirische Studie (N = 1.247 Studierende, N = 284 Lehrende) zu akademischer Integrität im KI-Zeitalter. Zentralbefund: 58% der Studierenden haben KI für nicht autorisierte Aufgabenbearbeitung genutzt; 71% der Lehrenden sind unsicher, wie KI-generierte Lö…

Schorcht, S., Buchholtz, N., Baumanns, L. (2024). Frontiers in Education, Vol. 9, Art. 1386075. Prompt the Problem: Investigating the Mathematics Educational Quality of AI-Supported Problem Solving by Comparing Prompt Techniques ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik empirical

Schorcht, S., Baumanns, L., Buchholtz, N. · 2024 · GDM-Mitteilungen, 116 ★★★★★ 9/10
Untersucht DALL·E 3 (Text-zu-Bild) und die visuelle Interpretationsfähigkeit von GPT-4 für mathematikdidaktische Forschung. Analysiert Möglichkeiten und Grenzen der KI bei Bildgenerierung und -interpretation — besonders relevant für geometrische Repräsentation…

Geraniou, E., Nardi, E. (2024). Digital Experiences in Mathematics Education (Springer). AI Responses to Challenging Problems and Educator Responses to AI Availability ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik empirical

Geraniou, E., Nardi, E. · 2024 · Digital Experiences in Mathematics Education (Springer) ★★★★★ 9/10
Untersucht KI-Antworten auf kognitiv anspruchsvolle Sekundarmathematikaufgaben (inkl. Geometrie) und wie Lehrende auf KI-Verfügbarkeit reagieren. Argumentiert gegen Verbote und schlägt pädagogische Strategien vor — zentral für die Debatte um Assessment-Design …

Gürefe, N., Sarpkaya Aktaş, G., Öksüz, H. (2024). Behavioral Sciences, Vol. 14(8), Art. 682. Investigating the Impact of the AI-Supported 5E (AI-s5E) Instructional Model on Spatial Ability ★★★★★
✓ zitiert 🎓 Peer-reviewed empirical

Gürefe, N., Sarpkaya Aktaş, G., Öksüz, H. · 2024 · Behavioral Sciences, Vol. 14(8), Art. 682 ★★★★★ 9/10
Quasi-experimentelle Studie (n=43, Türkei): KI-unterstütztes 5E-Unterrichtsmodell verbessert räumliche Visualisierung, räumliche Beziehungen und räumliche Orientierung signifikant gegenüber traditionellem Unterricht. Eine der wenigen Studien, die KI-Integratio…

Tate, T. P., Doroudi, S., Ritchie, D., Xu, Y., Warschauer, M. (2024). Computers and Education: Artificial Intelligence, Vol. 6, Art. 100210. Cheating in the Age of Generative AI: A High School Survey Study of Cheating Behaviors Before and After the Release of ChatGPT ★★★★★
✓ zitiert 🎓 Peer-reviewed empirical

Tate, T. P., Doroudi, S., Ritchie, D. · 2024 · Computers and Education: Artificial Intelligence, Vol. 6, Art. 100210 ★★★★★ 9/10
Längsschnittliche Befragungsstudie (US-amerikanische High Schools, vor/nach ChatGPT-Release): Gesamtbetrugsrate stabil bei 60–70 %, kein signifikanter Anstieg durch ChatGPT-Einführung. 9–16 % der Schüler:innen nutzten KI für vollständige Texte, 55–77 % für Ide…

Suparman, S., Marasabessy, R., Helsa, Y. (2024). Eurasia Journal of Mathematics, Science and Technology Education, Vol. 20(9), em2509. Fostering Spatial Visualization in GeoGebra-Assisted Geometry Lesson: A Systematic Review and Meta-Analysis ★★★★★
✓ zitiert 🎓 Peer-reviewed meta 🧮 Mathematik

Suparman, S., Marasabessy, R., Helsa, Y. · 2024 · Eurasia Journal of Mathematics, Science and Technology Education, Vol. 20(9), em2509 ★★★★★ 9/10
Systematisches Review und Meta-Analyse (k=33 Studien, N=2.739 Schüler:innen, 2010–2022): GeoGebra-unterstützter Geometrieunterricht erzielt starken positiven Effekt auf räumliche Visualisierung (Hedges' g=1,070, p<0,001). Bildungsstufe und Teilnehmendentyp mod…

Weigand, H.-G., Trgalova, J., Tabach, M. (2024). ZDM – Mathematics Education, Vol. 56(6). Mathematics Teaching, Learning, and Assessment in the Digital Age ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Weigand, H.-G., Trgalova, J., Tabach, M. · 2024 · ZDM – Mathematics Education, Vol. 56(6) ★★★★★ 9/10
Lead-Paper eines ZDM-Sonderhefts zu Lehren, Lernen und Beurteilen mit Technologie im Mathematikunterricht. Drei Forschungslinien: (1) Lehren mit Technologie, (2) Lernen mit Technologie, (3) Beurteilen mit Technologie. Prognostiziert KI-gestützte adaptive Tests…

Huber, M., Koivisto, J., Wanders, F., Eedi/Google DeepMind Team (2024). arXiv:2512.23633 (December 2024). AI Tutoring Can Safely and Effectively Support Students: An Exploratory RCT in UK Classrooms ★★★★★
✓ zitiert empirical 🧮 Mathematik rct

Huber, M., Koivisto, J., Wanders, F. · 2024 · arXiv:2512.23633 (December 2024) ★★★★★ 9/10
Exploratorische RCT mit N=165 Schüler:innen (Year 9+10, Alter 13-15) in fünf britischen Sekundarschulen. Drei Bedingungen: statische Hinweise, menschliche Tutoren, LearnLM (Google). LearnLM-Gruppe: 66,2% der Folgeaufgaben gelöst; Human-Tutor-Gruppe: 60,7% — +5…

Zhang, J., Li, Z.-Z., Zhang, M.-L., Yin, F., Liu, C.-L., Moshfeghi, Y. (2024). Findings of the Association for Computational Linguistics: ACL 2024 (pp. 1258–1276). GeoEval: Benchmark for evaluating LLMs and multi-modal models on geometry problem-solving ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Zhang, R., Jiang, D., Zhang, Y. · 2024 · Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186) ★★★★★ 10/10
2.612-Problem-Datensatz (ebene Geometrie, Körpergeometrie, Funktionen) in 6 Varianten (mit/ohne Diagramm). Zentrale Entdeckung: 'Die meisten MLLMs verstehen Mathematikdiagramme nicht — sie verlassen sich auf den Textanteil der Aufgabe.' Einige Modelle erzielte…

Gurmu, F., Tuge, C., Hunde, A. B. (2024). Cogent Education (Taylor & Francis). Effects of GeoGebra-assisted instructional methods on students conceptual understanding of geometry ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Gurmu, F., Tuge, C., Hunde, A. B. · 2024 · Cogent Education (Taylor & Francis) ★★★★★ 9/10
Quasi-experimentelle Studie an drei Schulen in Äthiopien (Klasse 10, GeoGebra+kollaborativ vs. GeoGebra+konventionell vs. konventionell). Ergebnis: GeoGebra kombiniert mit kollaborativem Unterricht erzielt signifikant besseres konzeptuelles Geometrieverständni…

Chytas, C., van Borkulo, S. P., Drijvers, P., Barendsen, E., Tolboom, J. L. J. (2024). Digital Experiences in Mathematics Education. Computational thinking in secondary mathematics education with GeoGebra: Insights from an intervention in calculus lessons ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Chytas, C., van Borkulo, S. P., Drijvers, P. · 2024 · Digital Experiences in Mathematics Education ★★★★★ 9/10
Sechsstündige Intervention für 16–17-Jährige (Niederlande, Freudenthal-Institut): GeoGebra zur Förderung algorithmischen Denkens in der Analysis. Schüler:innen lösten CT-eingebettete Aufgaben (Ableitungen, Kurvendiskussion) in GeoGebra-Skripten. Daten aus Arbe…

Colliot, T., Krichen, O., Girard, N., Anquetil, E., Jamet, E. (2024). British Journal of Educational Technology. What makes tablet-based learning effective? A study of the role of real-time adaptive feedback ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Colliot, T., Krichen, O., Girard, N. · 2024 · British Journal of Educational Technology ★★★★★ 9/10
3-Gruppen-Vergleich (Siebtklasse, Geometrieunterricht): Papier vs. Tablet ohne Feedback vs. Tablet mit KI-Echtzeit-Adaptivfeedback. Nicht das Medium, sondern das intelligente tutorielle Feedback steigerte Lernleistung signifikant. Starke Evidenz fuer adaptives…

Walkington, C., Nathan, M. J., Hunnicutt, J., Washington, J., Zhou, M. (2024). Journal of Mathematical Behavior. New kinds of embodied interactions that arise in augmented reality dynamic geometry software ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Walkington, C., Nathan, M. J., Hunnicutt, J. · 2024 · Journal of Mathematical Behavior ★★★★★ 9/10
28 Oberstufenschueler:innen nutzten AR-Version von GeoGebra (Microsoft HoloLens 2). Neue verkoerperte Interaktionen dokumentiert: Perspektive/Orientierung, Massstaeb, Dreidimensionalitaet. Designimplikationen fuer dynamische Geometriesoftware der naechsten Gen…

Copur-Gencturk, Y., Li, J., Atabas, S. (2024). American Educational Research Journal. Improving Teaching at Scale: Can AI Be Incorporated Into Professional Development to Create Interactive, Personalized Learning for Teachers? ★★★★★
✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik

Copur-Gencturk, Y., Li, J., Atabas, S. · 2024 · American Educational Research Journal ★★★★★ 5/10
RCT with mathematics teachers (n_exp=29, n_ctrl=23). AI-based ITS provided just-in-time feedback in async PD modules. Experimental teachers used mathematically richer tasks; student achievement rose significantly (d=0.18). First RCT showing AI-based teacher PD…

Frieder, S., Pinchetti, L., Chevalier, A., Griffiths, R.-R., Salvatori, T., Lukasiewicz, T., Petersen, P.C., Berner, J. (2023). NeurIPS 2023 Datasets and Benchmarks Track. Mathematical Capabilities of ChatGPT ★★★★★
✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik

Frieder, S., Pinchetti, L., Chevalier, A. · 2023 · NeurIPS 2023 Datasets and Benchmarks Track ★★★★★ 9/10
Evaluation von ChatGPT und GPT-4 auf GHOSTS/miniGHOSTS-Datensätzen (Mathematik auf Hochschulniveau). Kernbefund: 'Gesamte mathematische Leistung liegt deutlich unter dem Niveau eines Doktoranden.' GPT-4 bewältigt Grundstudiums-Mathematik, scheitert aber auf Gr…

Anhang 7: Vollständiges Quellenverzeichnis

291 Quellen mit Qualitätslabels (Stand März 2026)

[S01] Dilling, F., Herrmann, M. (2024). Frontiers in Artificial Intelligence. Using large language models to support pre-service teachers' mathematical reasoning — an exploratory study on ChatGPT as an instrument for creating mathematical proofs in geometry✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S02] Walkington, C. (2025). School Science and Mathematics (Wiley). The implications of generative artificial intelligence for mathematics education✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S03] Castillo, R., Espinoza, J., Leiva, F. (2024). Mathematics and Computer Science: Contemporary Developments, Vol. 5. GeoGebra Applets and Gemini Artificial Intelligence in Separable Variable Differential Equations in Engineering Students🎓 Peer-reviewed 🧮 Mathematik
[S04] Yunianto, W., Galič, S., Lavicza, Z., Urhan, S. (2025). Computers in the Schools (Taylor & Francis). A Model for Computational Thinking Development in GeoGebra with the Support of ChatGPT✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S05] Hamady, S., Mershad, K., Jabakhanji, B. (2024). Frontiers in Education. Multi-version interactive assessment through the integration of GeoGebra with Moodle✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S07] Witzke, I., Steinhoff, T., Universität Siegen (2024). Ministerium für Schule und Bildung NRW / Universität Siegen. KIMADU — Künstliche Intelligenz im Mathematik- und Deutschunterricht (Forschungsvorhaben NRW)✓ zitiert 🏛️ Institution 🧮 Mathematik
[S08] OECD (2023). OECD Publishing. OECD Digital Education Outlook 2023: Emerging governance of generative AI in education✓ zitiert 🏛️ Institution 🔓 Open Access
[S09] Varsik, S., Vosberg, L. (2024). OECD Publishing. The potential impact of artificial intelligence on equity and inclusion in education✓ zitiert 🏛️ Institution 🔓 Open Access
[S10] UNESCO (2023). UNESCO. Artificial intelligence in education: challenges and opportunities for sustainable development✓ zitiert 🏛️ Institution 🔓 Open Access
[S100] Geraniou, E., Nardi, E. (2024). Digital Experiences in Mathematics Education (Springer). AI Responses to Challenging Problems and Educator Responses to AI Availability✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik empirical
[S101] Maskos, K., Schulz, A., Oeksuez, S. S. (2025). ZDM – Mathematics Education, Vol. 57, pp. 679–693. Formative Assessment in Mathematics Education: A Systematic Review✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik meta
[S102] Khlaif, Z. N., Alkouk, W. A., Salama, N., Abu Eideh, B. (2025). Education Sciences (MDPI), Vol. 15(2), Art. 174. Redesigning Assessments for AI-Enhanced Learning: A Framework for Educators in the Generative AI Era✓ zitiert 🎓 Peer-reviewed oa
[S103] Gürefe, N., Sarpkaya Aktaş, G., Öksüz, H. (2024). Behavioral Sciences, Vol. 14(8), Art. 682. Investigating the Impact of the AI-Supported 5E (AI-s5E) Instructional Model on Spatial Ability✓ zitiert 🎓 Peer-reviewed empirical
[S104] Uwurukundo, M. S., Maniraho, J. F., Tusiime, M., Ndayambaje, I., Mutarutinya, V. (2024). Education and Information Technologies, Vol. 29(8), pp. 10201–10223. GeoGebra Software in Teaching and Learning Geometry of 3-Dimension to Improve Students' Performance and Attitude✓ zitiert 🎓 Peer-reviewed empirical
[S106] de Winter, J. C. F., Dodou, D., Eisma, Y. B. (2024). Computers (MDPI), Vol. 13(11), Art. 278. System 2 Thinking in OpenAI's o1-Preview Model: Near-Perfect Performance on a Mathematics Exam✓ zitiert 🎓 Peer-reviewed oa empirical
[S107] Tate, T. P., Doroudi, S., Ritchie, D., Xu, Y., Warschauer, M. (2024). Computers and Education: Artificial Intelligence, Vol. 6, Art. 100210. Cheating in the Age of Generative AI: A High School Survey Study of Cheating Behaviors Before and After the Release of ChatGPT✓ zitiert 🎓 Peer-reviewed empirical
[S108] Eryigit, C. D., Kucuk, S., Tasgin, A. (2025). Education and Information Technologies. Impact of Augmented Reality Technology on Geometry Skills and Motivation of Preschool Children✓ zitiert 🎓 Peer-reviewed empirical
[S109] Suparman, S., Marasabessy, R., Helsa, Y. (2024). Eurasia Journal of Mathematics, Science and Technology Education, Vol. 20(9), em2509. Fostering Spatial Visualization in GeoGebra-Assisted Geometry Lesson: A Systematic Review and Meta-Analysis✓ zitiert 🎓 Peer-reviewed meta 🧮 Mathematik
[S11] Qothrunnada, I., Maghfiroh, S.U. (2024). International Journal of Scientific Research and Management (IJSRM). Research Trend of Artificial Intelligence Application in Mathematics Education🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S112] Tröbelsberger, L., Fock, A., Oldenburg, R., Siller, H.-S. (2025). Mitteilungen der Deutschen Mathematiker-Vereinigung (DMVM), Vol. 33(4), pp. 276–280. Der Einsatz von KI-Systemen durch Studierende in der universitären Mathematikausbildung✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik dach empirical
[S113] Bastian, A., Buchholtz, N., Kaiser, G. (2025). Frontiers in Education. Using AI chatbots to facilitate mathematics preservice teachers' noticing skills✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik dach empirical
[S115] Létourneau, A., Deslandes Martineau, M., Charland, P., Karran, J. A., Boasen, J., Léger, P. M. (2025). npj Science of Learning, Vol. 10, Article 56. A Systematic Review of AI-Driven Intelligent Tutoring Systems (ITS) in K-12 Education✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik empirical meta
[S116] Weigand, H.-G., Trgalova, J., Tabach, M. (2024). ZDM – Mathematics Education, Vol. 56(6). Mathematics Teaching, Learning, and Assessment in the Digital Age✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S118] Li, S., Zeng, C., Liu, H., Jia, J., Liang, M., Cha, Y.-Y., Lim, C. P., Wu, X. (2025). International Journal of STEM Education, Vol. 12, Article 58. A Meta-Analysis of AI-Enabled Personalized STEM Education in Schools🎓 Peer-reviewed 🧮 Mathematik meta empirical
[S119] Huber, M., Koivisto, J., Wanders, F., Eedi/Google DeepMind Team (2024). arXiv:2512.23633 (December 2024). AI Tutoring Can Safely and Effectively Support Students: An Exploratory RCT in UK Classrooms✓ zitiert empirical 🧮 Mathematik rct
[S12] Wharton School, University of Pennsylvania (2024). Axios / Wharton School Report. AI math tutors are no substitute for human teachers, study finds (Wharton / Axios)🏛️ Institution
[S120] Pepin, B., Buchholtz, N., Salinas-Hernández, U. (2025). Digital Experiences in Mathematics Education, Vol. 11, pp. 9–41. A Scoping Survey of ChatGPT in Mathematics Education✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik open-access
[S121] Luo, S., Zhu, Z., Yuan, Y., Yang, Y., Shan, L., Wu, Y. (2025). arXiv:2505.17653. GeoGramBench: Benchmarking the Geometric Program Reasoning in Modern LLMs✓ zitiert 🧮 Mathematik benchmark
[S122] Abdullaeva, I., Vasiliuk, A., Goncharova, E., Rahmatullaev, T., Ivan, Z., Kurkin, M., Kuznetsov, A. (2026). arXiv:2601.10254 (Januar 2026). NoReGeo: Non-Reasoning Geometry Benchmark✓ zitiert 🧮 Mathematik benchmark
[S123] Awang, L. A., Yusop, F. D., Danaee, M. (2025). International Electronic Journal of Mathematics Education, Vol. 20(2), em0823. Current Practices and Future Direction of Artificial Intelligence in Mathematics Education: A Systematic Review✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik meta
[S124] Nguyen, D. T., Pham, Q. V. (2025). Eurasia Journal of Mathematics, Science and Technology Education, Vol. 21(10), em2714. The Evolving Landscape of AI Integration in Mathematics Education: A Systematic Review of Trends (2015–2025)✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik meta
[S125] Zhao, Y., Wang, X., Liu, J., King, I., Huang, Z. (2025). arXiv:2506.02690. Towards Geometry Problem Solving in the Large Model Era: A Survey✓ zitiert 🧮 Mathematik benchmark
[S126] Fuster Rabella, M. (2025). OECD Education Working Papers, No. 338. Evolving AI Capabilities and the School Curriculum✓ zitiert 🏛️ Institution policy
[S127] Huget, J., Dilling, F., Eckhardt, M., Geier, C., Müller, J., Witzke, I. (2025). Mitteilungen der Gesellschaft für Didaktik der Mathematik. Projektvorstellung KI@school: Forschung und Entwicklung zum Einsatz generativer KI im Mathematikunterricht✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik teacher-ed
[S128] Bartha, S., Kerekes, A., Kovács, Z., Kovács, Z., Recio, T. (2025). Annals of Mathematics and Artificial Intelligence. Automated analysis of the difficulty of secondary school geometry theorems✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik geogebra
[S129] Turmuzi, M., Azmi, S., Kertiyani, N. M. I. (2026). Teaching and Teacher Education. ChatGPT in school mathematics education: A systematic review of opportunities, challenges, and pedagogical implications✓ zitiert 🎓 Peer-reviewed meta 🧮 Mathematik
[S13] UC Berkeley Researchers (2024). PLOS One (Primärquelle) / Hechinger Report. Researchers combat AI hallucinations in math (PLOS One / Hechinger Report)🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S130] Wang, J., Fan, W. (2025). Humanities and Social Sciences Communications. The effect of ChatGPT on students' learning performance, learning perception, and higher-order thinking: Insights from a meta-analysis✓ zitiert 🎓 Peer-reviewed meta 🔓 Open Access
[S132] Weigand, H.-G., Hollebrands, K., Maschietto, M. (2025). ZDM – Mathematics Education. Geometry education at secondary level — A systematic literature review✓ zitiert 🎓 Peer-reviewed meta 🧮 Mathematik
[S133] Zhao, J., Zhang, T., Sun, J., Tian, M., Huang, H. (2025). arXiv:2503.05543 / Proceedings of ICCV 2025. Pi-GPS: Enhancing Geometry Problem Solving by Unleashing the Power of Diagrammatic Information✓ zitiert 🎓 Peer-reviewed benchmark 🧮 Mathematik
[S134] Flavin, E., Hwang, S., Flavin, M. T. (2025). International Journal of Science and Mathematics Education. Augmented Reality for Mathematics Achievement: A Meta-Analysis of Main and Moderator Effects✓ zitiert 🎓 Peer-reviewed meta 🧮 Mathematik
[S135] DeepSeek-AI, Guo, D., Yang, D., Zhang, H. (2025). arXiv:2501.12948. DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning✓ zitiert benchmark 🧮 Mathematik
[S136] Gurl, T. J., Markinson, M. P., Artzt, A. F. (2024). Digital Experiences in Mathematics Education. Using ChatGPT as a Lesson Planning Assistant with Preservice Secondary Mathematics Teachers✓ zitiert 🎓 Peer-reviewed teacher-ed 🧮 Mathematik
[S137] Hannan, B., Eynon, R. (2025). Computers & Education. Widening the digital divide: The mediating role of Intelligent Tutoring Systems in the relationship between rurality, socioeducational advantage, and mathematics learning outcomes✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S138] Na, H., Staudt Willet, K. B., Kim, C. (2025). British Journal of Educational Technology. Investigating the impact of AR technologies on geometric learning in primary school: A comparison between marker-based and markerless AR🎓 Peer-reviewed 🧮 Mathematik
[S139] Saarela, M., Gunasekara, S., Karimov, A. (2025). DESRIST 2025 / Lecture Notes in Computer Science, Vol. 15704. The EU AI Act: Implications for Ethical AI in Education✓ zitiert 🎓 Peer-reviewed policy
[S14] Ahmad, F., Aboraya, W., Al Hamouri, L. (2023). Multidisciplinary Science Journal. The effect of interactive AI tools like Photomath on student learning🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S140] Österreichischer Bundesverlag [öbv], Studyly GmbH (2025). Pressemitteilung / Österreichischer Bundesverlag. Individuelles Mathe-Lernen: Schulbuch plus KI-Lerncoach✓ zitiert 🏛️ Institution 🇦🇹 Österreich
[S141] Zhang, R., Jiang, D., Zhang, Y., Lin, H., Guo, Z., Qiu, P., Zhou, A., Lu, P., Chang, K.-W., Gao, P., Li, H. (2025). ICLR 2025 (International Conference on Learning Representations). MAVIS: Mathematical Visual Instruction Tuning with an Automatic Data Engine✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S142] Simić, I., Stojanović-Đurđević, S., Tanasijević, M. (2025). Annals of Mathematics and Artificial Intelligence. Automated theorem proving for 3D solid geometry✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S143] Song, Y., Li, X., Xing, W., Lim, C. P., Guo, Y. (2025). Internet and Higher Education. Equity and fairness in AI-assisted mathematics learning: A large-scale longitudinal study✓ zitiert 🎓 Peer-reviewed
[S144] Thom, J. S., McGarvey, L. M., Markle, J. (2024). Frontiers in Education. Projective geometry and spatial reasoning in early childhood and elementary mathematics education✓ zitiert 🎓 Peer-reviewed 🔓 Open Access
[S145] Zhang, J., Li, Z.-Z., Zhang, M.-L., Yin, F., Liu, C.-L., Moshfeghi, Y. (2024). Findings of the Association for Computational Linguistics: ACL 2024 (pp. 1258–1276). GeoEval: Benchmark for evaluating LLMs and multi-modal models on geometry problem-solving✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S146] Sharma, A., Dalmia, A., Kazemi, M., Zouaq, A., Pal, C. (2025). Findings of the Association for Computational Linguistics: NAACL 2025 (pp. 7340–7356). GeoCoder: Solving geometry problems by generating modular code through vision-language models✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S147] Wu, W., Ye, J., Wang, Z.-K., Zhou, Z., Li, Y.-F., Guo, L.-Z. (2025). arXiv:2505.17121 (preprint). NeSyGeo: A neuro-symbolic framework for multimodal geometric reasoning data generation🔬 Preprint 🔓 Open Access 🧮 Mathematik
[S148] Pan, Y., Zhang, Z., Hu, P., Ma, J., Du, J., Zhang, J., Liu, Q., Gao, J., Ma, F. (2025). Proceedings of the 33rd ACM International Conference on Multimedia (ACM MM 2025). Enhancing the geometric problem-solving ability of multimodal LLMs via symbolic-neural integration✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S149] Zhang, Y., Hu, D., Yu, T., Liu, H., Liu, Y. (2025). arXiv:2510.27448 (Tencent Hunyuan Team; preprint, submitted for peer review). GeoFM: Enhancing geometric reasoning of MLLMs via synthetic data generation through formal language✓ zitiert 🔬 Preprint 🔓 Open Access 🧮 Mathematik
[S15] Schönbrodt, S., Camminady, T., Frank, M. (2021). Mathematische Semesterberichte (Springer Nature). Mathematische Grundlagen der Künstlichen Intelligenz im Schulunterricht🎓 Peer-reviewed 🧮 Mathematik 🇦🇹 Österreich
[S150] Kaźmierczak, A., Lewandowska, A., Olejniczak, M., Szewczyk, P. (2025). Scientific Reports (Nature). EDU-MAT COPERNICUS: Augmented reality platform for primary mathematics using satellite data✓ zitiert 🎓 Peer-reviewed 🔓 Open Access
[S151] Wang, R., Mihalcea, R., Singh, M., Demszky, D. (2024). arXiv:2410.03017 (preprint). Tutor CoPilot: A human-AI collaborative approach for scaling real-time expert guidance✓ zitiert 🔬 Preprint 🔓 Open Access
[S152] Mai, G., Huang, W., Sun, J., Song, S., Mishra, S., Liu, N., Gao, S., Liu, T., Cong, G., Hu, Y., Cundy, C., Li, Z., Lao, N., Cao, J. (2025). International Journal of Digital Earth. Evaluating large language models on geospatial reasoning tasks🎓 Peer-reviewed
[S153] Baldinger, S., Weinhandl, R., Mayrhofer, J. (2026). Journal of Computer Assisted Learning. Digital adaptive learning in secondary mathematics: A qualitative interview study with Austrian teachers on perceptions, needs, and implementations✓ zitiert 🎓 Peer-reviewed 🇦🇹 Österreich 🧮 Mathematik
[S154] Wang, J., Tigelaar, D. E. H., Ye, T., Admiraal, W. (2026). Journal of Computer Assisted Learning. A meta-analysis of moderators of the effects of technology-enhanced adaptive learning on primary and secondary students' learning outcomes✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S155] Ständige Wissenschaftliche Kommission der KMK (SWK) (2024). KMK / peDOCS. Large Language Models und ihre Potenziale im Bildungssystem [Impulspapier]✓ zitiert 🏛️ Institution 🇦🇹 Österreich
[S156] Kultusministerkonferenz (KMK) (2024). KMK-Sekretariat. Handlungsempfehlung für die Bildungsverwaltung zum Umgang mit Künstlicher Intelligenz in schulischen Bildungsprozessen✓ zitiert 🏛️ Institution 🇦🇹 Österreich
[S157] Collins, K. M., Jiang, A. Q., Frieder, S., Li, L., Gowers, T., Burden, J., Hernandez-Bocanegra, D. C., Tang, Z., Anagnostidis, S., Wen, Z., Simon, K., Bengio, Y., Broz, P., Posner, I., Barez, F., Goldowsky-Dill, N., Wills, J., Schroeder, T., Pezeshki, H., Shen, R., Torr, P. H. S., Jamnik, M. (2024). Proceedings of the National Academy of Sciences. Evaluating language models for mathematics through interactions✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S158] Yoon, H., Hwang, J., Lee, K., Roh, K. H., Kwon, O. N. (2024). ZDM – Mathematics Education. Students' use of generative artificial intelligence for proving mathematical statements✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S159] Busuttil, L., Calleja, J. (2025). Digital Experiences in Mathematics Education. Teachers' beliefs and practices about the potential of ChatGPT in teaching mathematics in secondary schools✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S16] Li, M. (2024). International Journal of Science and Mathematics Education (Springer). Integrating Artificial Intelligence in Primary Mathematics Education: Investigating Internal and External Influences on Teacher Adoption🎓 Peer-reviewed 🧮 Mathematik
[S160] Dilling, F., Herrmann, M. (2025). Frontiers in Education. ChatGPT's perspectives on real numbers, straight lines, and probability — A quantitative study on the influence of prompting✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S161] Pham, S. N., Le, H. T., Pham, T. T. T., Schmid, A. (2026). Open Education Studies. Augmented reality as a supporting tool for building mathematical knowledge: The case of parallel projection, perpendicular projection, and representation of a figure in space✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S162] Liu, D., Yi, L., Kang, R. (2025). Journal of Computer Assisted Learning. The impact of a digital game on spatial reasoning for elementary school students✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S163] Flavin, E., Chung, M., Hwang, S., Flavin, M. T. (2025). Educational Technology Research and Development. Augmented reality for area measurement reasoning of elementary students✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S164] Lewis Presser, A. E., Braham, E., Vidiksis, R. (2025). Education Sciences. Enhancing preschool spatial skills: A comprehensive intervention using digital games and hands-on activities✓ zitiert 🎓 Peer-reviewed 🔓 Open Access
[S165] Seibold, M., Kodweiß, J., Friz, P. (2024). Beiträge zum Mathematikunterricht 2024: 57. Jahrestagung der GDM. LLMs wie ChatGPT als individualisierte Tutoren im Mathematikunterricht: Eine explorative Annäherung✓ zitiert 🎓 Peer-reviewed 🇦🇹 Österreich 🧮 Mathematik
[S166] Mahinpei, R., Horta Ribeiro, M., Milano, M. (2025). Proceedings of the 2025 ACM SIGPLAN International Symposium on SPLASH-E. Interactive theorem provers for proof education✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S166] Yunianto, W., Galic, S.,, Lavicza, Z (2024). International Journal of Education in Mathematics, Science and Technology (IJEMST). Exploring Computational Thinking in Mathematics Education: Integrating ChatGPT with GeoGebra for Enhanced Learning Experiences✓ zitiert peer-reviewed empirical geogebra chatgpt
[S167] Gkrekas, N., Rizos, I. (2025). Heliyon (Elsevier). The impact of LLMs on mathematics education and research at the university✓ zitiert 🎓 Peer-reviewed 🔓 Open Access
[S167] Kuusemets, L., Parve, K., Ain, K.,, Kraav, T (2024). International Journal of Education in Mathematics, Science and Technology (IJEMST). Assessing AI-generated (GPT-4) Versus Human Created MCQs In Mathematics Education: A Comparative Inquiry into Vector Topics✓ zitiert peer-reviewed empirical gpt-4 mcq
[S168] Santos, V., Teles, J.,, Quaresma, P (2024). International Journal for Technology in Mathematics Education (IJTME). Exploring Quadrilaterals: An Interactive Task for 7th Grade Students Using GeoGebra Classroom✓ zitiert peer-reviewed empirical geogebra automated-reasoning
[S169] Cosentino, G., Anton, J., Sharma, K., Gelsomini, M., Giannakos, M. N.,, Abrahamson, D (2025). British Journal of Educational Technology. Generative AI and Multimodal Data for Educational Feedback: Insights from Embodied Math Learning✓ zitiert peer-reviewed empirical bjet formative-assessment genai
[S17] Trinh, T.H., Wu, Y., Le, Q.V., He, H., Luong, T. (2024). Nature, 625, 476–482. AlphaGeometry: An Olympiad-level AI system for geometry✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S170] Rizos, I., Foykas, E.,, Georgakopoulos, S. V (2024). Contemporary Educational Technology. Enhancing Mathematics Education for Students with Special Educational Needs through Generative AI: A Case Study in Greece✓ zitiert peer-reviewed empirical inclusion chatgpt
[S171] Yang, Y., Chen, L., He, W., Sun, D.,, Salas-Pilco, S. Z (2025). International Journal of Artificial Intelligence in Education. Artificial Intelligence for Enhancing Special Education for K-12: A Decade of Trends, Themes, and Global Insights (2013–2023)✓ zitiert peer-reviewed systematic-review inclusion k12
[S172] Shi, W., et al. (2024). arXiv preprint. Can LLMs Perform Spatial Reasoning? The StepGame Benchmark✓ zitiert 🔬 Preprint 🧮 Mathematik
[S172] Segal, R.,, Biton, Y (2024). International Journal of Education in Mathematics, Science and Technology (IJEMST). The Contribution That Utilizing Generative AI for Problem Posing Makes to Pre-Service High School Mathematics Teachers' TPACK✓ zitiert peer-reviewed empirical problem-posing tpack preservice
[S173] Jablonski, S., Ludwig, M. (2023). Education Sciences (MDPI). Geometry education — A literature review from 2017 to 2022✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S173] Kim, Y. R., Park, M. S.,, Joung, E (2026). School Science and Mathematics. Exploring the Integration of Artificial Intelligence in Math Education: Preservice Teachers' Experiences and Reflections on Problem-Posing Activities with ChatGPT✓ zitiert peer-reviewed empirical problem-posing chatgpt preservice
[S174] Unbekannt (CAAI 2025) (2025). Computers and Education: Artificial Intelligence (Elsevier). AI-enabled adaptive learning platforms: A systematic review of effectiveness for geometry and STEM education🎓 Peer-reviewed 🧮 Mathematik
[S174] Domínguez Vázquez, B. C.,, Díaz Palencia, J. L (2024). Pedagogical Research. A Classroom Experience for Teaching and Learning of High School Geometry through Virtual Realitypeer-reviewed empirical vr geometry
[S175] Liu, J., Sun, D., Sun, J., Wang, J., Yu, P. L. H. (2025). Computers and Education: Artificial Intelligence. Designing a generative AI enabled learning environment for mathematics word problem solving in primary schools: Learning performance, attitudes and interaction✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S175] Zekeik, H., Chahbi, M., Lamarti Sefian, M.,, Bakkali, I (2025). Eurasia Journal of Mathematics, Science and Technology Education. Augmented Reality and Virtual Reality in Education: A Systematic Narrative Review on Benefits, Challenges, and Applications✓ zitiert peer-reviewed systematic-review ar vr education
[S176] Gurmu, F., Tuge, C., Hunde, A. B. (2024). Cogent Education (Taylor & Francis). Effects of GeoGebra-assisted instructional methods on students conceptual understanding of geometry✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S176] Morales Méndez, G.,, Lozano Avilés, A. B (2025). Revista de Educación a Distancia (RED). Realidad aumentada y GeoGebra 3D para mejorar la inteligencia espacial en la enseñanza de la geometría volumétrica✓ zitiert peer-reviewed empirical ar geogebra-3d spatial-reasoning
[S177] Lee, D., Son, T., Yeo, S. (2025). Journal of Computer Assisted Learning. Impacts of interacting with an AI chatbot on preservice teachers responsive teaching skills in math education✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S177] Yan, B., Luo, M.,, Qu, Y (2025). Frontiers in Educational Research. Generative AI-Based System for Automatic Exercise Generation in Middle School Mathematics: Design and Evaluation Methodology✓ zitiert peer-reviewed genai exercise-generation
[S178] Han (2025). Frontiers in Psychology. Improving pre-service teachers AI competencies: a quasi experimental study✓ zitiert 🎓 Peer-reviewed 🔓 Open Access
[S178] Li, L., Yang, Z., Chen, M., Peng, X., Sun, J., Yan, Z.,, Liu, S (2024). Journal of Automated Reasoning. Automated Generation of Geometry Proof Problems Based on Point Geometry Identity✓ zitiert peer-reviewed automated-reasoning geometry-proof its
[S179] Lünich, M., Keller, B., Marcinkowski, F. (2024). Computers and Education: Artificial Intelligence. Diverging perceptions of artificial intelligence in higher education: A comparison of student and public assessments on risks and damages of academic performance prediction in Germany✓ zitiert 🎓 Peer-reviewed empirical dach
[S179] Kurt, G.,, Önel, F (2025). School Science and Mathematics. Middle School Students' Basic Geometric Construction Processes in a Dynamic Geometry Environment✓ zitiert peer-reviewed empirical geogebra geometric-construction van-hiele
[S18] [Autoren ermitteln — MDPI Computers 2024] (2024). Computers (MDPI), Vol. 13, Issue 8. On Using GeoGebra and ChatGPT for Geometric Discovery🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S180] Tsakeni, M., Nwafor, S. C., Mosia, M., Egara, F. O. (2025). Journal of Intelligence. Mapping the Scaffolding of Metacognition and Learning by AI Tools in STEM Classrooms: A Bibliometric-Systematic Review Approach (2005-2025)✓ zitiert 🎓 Peer-reviewed 🔓 Open Access meta
[S180] Türkoğlu, H.,, Yalçinalp, S (2024). Education and Information Technologies. Investigating Problem-Solving Behaviours of University Students through an Eye-Tracking System Using GeoGebra in Geometry: A Case Study✓ zitiert peer-reviewed empirical eye-tracking geogebra learning-analytics
[S181] Gouseti, A., James, F., Fallin, L., Burden, K. (2024). Technology, Pedagogy and Education. The ethics of using AI in K-12 education: a systematic literature review✓ zitiert 🎓 Peer-reviewed review
[S181] Li, H., Xing, W., Li, C., Zhu, W.,, Woodhead, S (2025). Journal of Learning Analytics. Integrating Option Tracing into Knowledge Tracing: Enhancing Learning Analytics for Mathematics Multiple-Choice Questions✓ zitiert peer-reviewed empirical learning-analytics knowledge-tracing
[S182] Hidayat, R., Saad, M. R. M., Wewe, M. (2025). Cogent Education. A meta-analysis of the effect of metacognitive instruction on mathematics achievement✓ zitiert 🎓 Peer-reviewed 🔓 Open Access meta
[S182] Reux, C., Acher, M., Khelladi, D. E., Quinton, C.,, Barais, O (2025). Proceedings of the 29th International Conference on Evaluation and Assessment in Software Engineering (EASE '25). LLM Code Customization with Visual Results: A Benchmark on TikZ✓ zitiert peer-reviewed conference llm tikz geometry-visualization
[S183] Milton, S. (2025). Mathematical Thinking and Learning. Middle school girls using generative AI to engage in mathematical problem-posing✓ zitiert 🎓 Peer-reviewed empirical 🧮 Mathematik
[S183] Dela Torre, J.,, Sayco, J (2025). Journal of Education and Practice. Large Language Models in Tertiary Mathematics Education: A Systematic Literature Review✓ zitiert systematic-review llm tertiary-mathematics
[S184] Medina Herrera, L. M., Juárez Ordóñez, S., Ruiz-Loza, S. (2024). Frontiers in Education. Enhancing mathematical education with spatial visualization tools✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S184] Marwiang, M., Prasertsang, M.,, Junpeng, P (2025). Journal of Education and Learning. Enhancing Students' Learning Outcomes in Mathematics through Intelligent Tutoring Systems Based on Real-Time Feedback✓ zitiert peer-reviewed empirical its geometry rct
[S185] Ulusoy, F. (2024). Journal of Computer Assisted Learning. The quality of prospective mathematics teachers’ dynamic geometry tasks in terms of the coordination between mathematical depth levels and technological actions✓ zitiert 🎓 Peer-reviewed empirical 🧮 Mathematik
[S185] Cai, S., Bao, K., Guo, H., Zhang, J., Song, J.,, Zheng, B (2024). Proceedings of EMNLP 2024 (Main Conference). GeoGPT4V: Towards Geometric Multi-modal Large Language Models with Geometric Image Generation✓ zitiert peer-reviewed conference emnlp mllm geometry-visual
[S186] Tejera, M., Galiç, S., Lavicza, Z. (2025). Journal for STEM Education Research. 3D modelling and printing in teacher education: A systematic literature review✓ zitiert 🎓 Peer-reviewed review
[S186] Deng, R., Jiang, M., Yu, X., Lu, Y.,, Liu, S (2025). Computers & Education. Does ChatGPT enhance student learning? A systematic review and meta-analysis of experimental studies✓ zitiert peer-reviewed meta-analysis chatgpt learning-outcomes
[S187] Jin, S.,, Sercu, L (2025). Journal of Computer Assisted Learning. ChatGPT Interventions in Higher Education: A Systematic Review of Experimental Studies✓ zitiert peer-reviewed systematic-review chatgpt higher-education
[S188] Bardach, L., Moeller, K., Ruiz-Garcia, M., Strittmatter, Y., Meyer, J., Musslick, S.,, Spitzer, M (2026). Journal of Computer Assisted Learning. Intelligent Tutoring Systems Need Teachers✓ zitiert peer-reviewed empirical its teacher-role engagement
[S189] Hanna, G., Larvor, B., Yan, X. (2024). ZDM – Mathematics Education. Lean in the undergraduate classroom: An exploration✓ zitiert peer-reviewed hochschule
[S19] Murphy, L.R., Yang, K., Sun, J., Li, Z., Anandkumar, A., Si, X. (2024). Proceedings of the 41st International Conference on Machine Learning (ICML 2024). LeanEuclid: A benchmark for autoformalization in the domain of Euclidean geometry✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S190] Iannone, P., Thoma, A. (2025). Digital Experiences in Mathematics Education. "It Feels Like Cheating": Students' perceptions of interactive theorem provers in undergraduate mathematics✓ zitiert peer-reviewed hochschule
[S191] Martínez-Zarzuelo, A., Nolla, Á., Recio, T., Tolmos, P., Ariño-Morera, M., Gallardo, S. (2025). Education Sciences. An experience with pre-service teachers using GeoGebra Discovery automated reasoning tools for outdoor mathematics✓ zitiert peer-reviewed geogebra lehrende
[S192] Lee, J., Yunus, S., Lee, J. O. (2025). Early Childhood Education Journal. Investigating children's programming skills through play with robots (KIBO)✓ zitiert peer-reviewed primarstufe
[S193] Yang, W., Lin, C., Wang, X. C., Bautista, A., Li, H., Datu, J. A. D., Hu, B. Y. (2026). Journal of Educational Computing Research. Beyond coding: Effects of a computing curriculum on preschoolers' computational thinking, math, language, and social-emotional skills✓ zitiert peer-reviewed primarstufe
[S194] Wu, Z., Zheng, L., Huang, L. (2024). Education and Information Technologies. Learning to code and coding to learn: A robotics curriculum integrating tangible programming and road safety education for young childrenpeer-reviewed primarstufe
[S195] Gong, Y., Wang, M., He, L., Xu, C., Yu, Y. (2026). Journal of Educational Computing Research. Asking, playing, learning: Investigating large language model-based scaffolding in digital game-based learning for elementary artificial intelligence education✓ zitiert peer-reviewed primarstufe
[S196] Xu, S., Luo, Y., Shi, W. (2024). arXiv / ACM Proceedings. Geo-LLaVA: A large multi-modal model for solving geometry math problems with meta in-context learningpeer-reviewed ki-system
[S197] Wang, K., Pan, J., Shi, W., Lu, Z., Zhan, M., Li, H. (2024). arXiv preprint. Measuring multimodal mathematical reasoning with MATH-Vision dataset✓ zitiert ki-system
[S198] Otero, N., Druga, S., Lan, A. (2025). Discover Education. A benchmark for math misconceptions: Bridging gaps in middle school algebra with AI-supported instructionpeer-reviewed sek1
[S199] Kim, C., Passonneau, R. J., Lee, E., Sheikhi Karizaki, M., Gnesdilow, D., Puntambekar, S. (2026). British Journal of Educational Technology. NLP-enabled automated assessment of scientific explanations: Towards eliminating linguistic discrimination✓ zitiert peer-reviewed sek1
[S20] Bundesministerium für Bildung, Wissenschaft und Forschung (BMBWF) (2023). Bundesgesetzblatt / RIS Österreich. Neuer Lehrplan Mathematik 2023 — Sekundarstufe I (Mittelschule und AHS-Unterstufe)✓ zitiert 🏛️ Institution 🇦🇹 Österreich 🔓 Open Access
[S200] Lim, W.-C. I., Heffernan, N. T., Eroshenko, I., Khumwang, W., Chan, P.-C. (2025). ACM Conference on Learning @ Scale. Leveraging LLMs for assignment report summaries to support teacher insights in intelligent tutoring systems✓ zitiert peer-reviewed sek1
[S201] Rezat, S. (2025). ZDM – Mathematics Education. The quality of digital curriculum resources for mathematics in German educational policy✓ zitiert peer-reviewed policy dach
[S202] Song, X., Mak, J., Chen, H. (2025). SAGE Open. Teachers and learners' perceptions about implementation of AI tools in elementary mathematics classes✓ zitiert peer-reviewed primarstufe
[S203] Yilmaz, Z., Galanti, T. M., Naresh, N., Kanbir, S. (2026). School Science and Mathematics. Exploring interactions among instructor, prospective teachers and AI in facilitating mathematics learningpeer-reviewed lehrende
[S204] Matjie, M. A., Nethavhani, A., Matlakala, M. (2026). Frontiers in Computer Science. AI and the digital divide in education✓ zitiert peer-reviewed 🔓 Open Access
[S205] Zhu, W., Xing, W., Lyu, B., Li, C., Zhang, F., Li, H. (2025). LAK '25: Proceedings of the 15th International Learning Analytics and Knowledge Conference. Bridging the gender gap: The role of AI-powered math story creation in learning outcomes✓ zitiert peer-reviewed
[S206] Caffaratti, L., Ballestra, L., Longobardi, C., Badenes-Ribera, L., Marengo, D. (2025). Frontiers in Artificial Intelligence. AI adoption among adolescents in education: Extending the UTAUT2 with psychological and contextual factors✓ zitiert peer-reviewed 🔓 Open Access sek2
[S207] Wang, L., Zhang, Q., Sun, D. (2025). International Journal of Science and Mathematics Education. Exploring the impact of an augmented reality-integrated mathematics curriculum on students' spatial skills in elementary school✓ zitiert peer-reviewed empirical sek1
[S208] Khazanchi, R., Di Mitri, D., Drachsler, H. (2025). Journal of Computer Assisted Learning. The effect of AI-based systems on mathematics achievement in rural context: A quantitative studypeer-reviewed empirical sek1
[S209] Copur-Gencturk, Y., Li, J., Atabas, S. (2024). American Educational Research Journal. Improving teaching at scale: Can AI be incorporated into professional development to create interactive, personalized learning for teachers?✓ zitiert peer-reviewed empirical rct lehrende
[S21] Bundesministerium für Bildung, Wissenschaft und Forschung (BMBWF) (2023). BMBWF Österreich. Masterplan für die Digitalisierung im Bildungswesen✓ zitiert 🏛️ Institution 🇦🇹 Österreich 🔓 Open Access
[S210] Malale, M. T., Mbhiza, H. W. (2025). Frontiers in Education. Grade 12 rural teachers' Technological Pedagogical Content Knowledge and challenges while using GeoGebra to teach Euclidean geometrypeer-reviewed geogebra sek2
[S211] Kirabo, E., Batiibwe, M. S. K., Mbulankende, J. S., Lie, J. (2025). Frontiers in Education. GeoGebra-supported problem-based learning for in-service primary mathematics teachers' 3D geometry understandingpeer-reviewed empirical geogebra lehrende
[S212] Ruiz Recio, M. I., Molina-Ayuso, Á., Adamuz-Povedano, N. (2026). Review of Education. Integrating computational thinking into secondary school mathematics teaching: A literature review✓ zitiert peer-reviewed systematic-review sek2
[S213] He, A., Yuan, W., Kiliçman, A. (2024). International Journal of Mathematical Education in Science and Technology. A meta-analysis on the effectiveness of dynamic mathematics software on K-12 students' mathematics learningpeer-reviewed meta-analysis
[S214] Yi, L., Liu, D., Jiang, T., Xian, Y. (2025). International Journal of Science and Mathematics Education. The effectiveness of AI on K-12 students' mathematics learning: A systematic review and meta-analysispeer-reviewed meta-analysis
[S215] Ma, X., Yang, Y., Liu, X., Chen, L. (2025). Journal of Computer Assisted Learning. A meta-analysis of the impact of generative artificial intelligence on learning outcomespeer-reviewed meta-analysis
[S216] Fock, A., Siller, H.-S. (2025). International Journal of STEM Education. Generative artificial intelligence in secondary STEM education in the light of Human Flourishing: A scoping literature review✓ zitiert peer-reviewed systematic-review sek2 dach
[S217] Segal, R., Klemer, A. (2025). International Journal of Mathematical Education in Science and Technology. Dialogic interactions between mathematics teachers and GenAI: multi-environment task design and its contribution to TPACKpeer-reviewed empirical geogebra lehrende
[S218] Gabriel, F., Kennedy, J., Marrone, R., Leonard, S. (2025). npj Science of Learning. Pragmatic AI in education and its role in mathematics learning and teaching✓ zitiert
[S219] Jaldemark, J., Lundin, J., Säljö, R., Edwards, J., Gegenfurtner, A., Holmes, W. (2025). Postdigital Science and Education. A multidisciplinary research agenda for artificial intelligence, education, learning, and instruction✓ zitiert
[S22] Hörmann, C., Kuka, L., Schmidthaler, E., Sabitzer, B. (2024). Frontiers in Education. Digital education training for teachers — Learnings from Austria🎓 Peer-reviewed 🔓 Open Access 🇦🇹 Österreich
[S220] Yang, Y., Du, W., Mavrikis, M., Geraniou, E. (2025). Digital Experiences in Mathematics Education. Spatial Skill Development Through Augmented Reality in Mathematics Education: A Scoping Review✓ zitiert
[S221] Nguyen, A., Gul, F., Dang, B., Huynh, L., Tuunanen, T. (2025). Innovations in Education and Teaching International. Designing embodied generative artificial intelligence in mixed reality for active learning in higher education✓ zitiert
[S222] Ben Chaabene, N. E. H., Hammami, H. (2026). Smart Learning Environments. Neuro-symbolic synergy in education: A survey of LLM–knowledge graph integration for explainable reasoning and emotion-aware student support✓ zitiert
[S223] Shrestha, S., Yi, J. (2026). Journal of Mathematics Teacher Education. TPACK-based professional development for the AI era: Fostering pre-service teachers' acceptance of generative AI in mathematics classrooms✓ zitiert
[S224] Zulu, S., Brijlall, D. (2024). Pythagoras. Exploring preservice teachers' pedagogical content knowledge for teaching analytical geometry in multilingual classrooms✓ zitiert
[S225] Prahmana, R. C. I., Kusaka, S., Peni, N. R. N., Endo, H., Azhari, A., Tanikawa, K. (2024). Journal on Mathematics Education. Cross-cultural insights on computational thinking in geometry: Indonesian and Japanese students' perspectives✓ zitiert
[S226] Bairral, M., Aldon, G. (2024). REDIMAT – Journal of Research in Mathematics Education. The integration of digital technology in task-design on eye-tracking studies in geometry✓ zitiert
[S227] Kovács, Z., Recio, T., Vélez, M. P. (2024). Electronic Proceedings in Theoretical Computer Science (EPTCS) – Automated Deduction in Geometry. Showing Proofs, Assessing Difficulty with GeoGebra Discovery✓ zitiert
[S228] Käferbock, A., Kovács, Z. (2024). Electronic Proceedings in Theoretical Computer Science (EPTCS) – Automated Deduction in Geometry. The Locus Story of a Rocking Camel in a Medical Center in the City of Freistadt✓ zitiert
[S229] Sicca, V., Xia, T., Fédérico, M., Gorinski, P. J., Frieder, S., Jui, S. (2024). arXiv preprint. Newclid: A User-Friendly Replacement for AlphaGeometry✓ zitiert
[S23] Gesellschaft für Didaktik der Mathematik (GDM) (2024). GDM-Tagung 2024. GDM-Jahrestagung 2024: Diskussionsforum KI in der Mathematikdidaktik🏛️ Institution 🧮 Mathematik
[S230] Kovács, Z., Peng, X. (2025). arXiv preprint. Automated proving in planar geometry based on the complex number identity method and elimination✓ zitiert
[S231] Gao, G., Wang, Y., Jiang, J., Gao, Q., Qin, Z., Xu, T., Dong, B. (2025). ICLR 2025 – Proceedings of the 13th International Conference on Learning Representations. Herald: A natural language annotated Lean 4 dataset✓ zitiert
[S232] Tsoukalas, G., Lee, J., Jennings, J., Xin, J., Ding, M., Jennings, M., Thakur, A., Chaudhuri, S. (2024). Advances in Neural Information Processing Systems 37 (NeurIPS 2024). PutnamBench: Evaluating neural theorem-provers on the Putnam Mathematical Competition✓ zitiert
[S233] Lin, H., Sun, Z., Yang, Y., Welleck, S. (2025). ICLR 2025 – Proceedings of the 13th International Conference on Learning Representations. Lean-STaR: Learning to interleave thinking and proving✓ zitiert
[S234] Chen, E., Xu, T., Gao, Q., Sun, H., Liu, H., Zhang, T. (2025). arXiv preprint. Generative AI alone may not be enough: Evaluating AI support for learning mathematical proof✓ zitiert
[S235] Klawa, H., Rajpal, S., Thomas, C. (2025). arXiv preprint. Gen AI in proof-based math courses: A pilot study✓ zitiert
[S236] Weng, K., Du, L., Li, S., Lu, W., Sun, H., Liu, H., Zhang, T. (2025). arXiv preprint. Autoformalization in the era of large language models: A survey✓ zitiert
[S237] Tran Minh, F., Gonnord, L., Narboux, J. (2025). arXiv preprint. Proof assistants for teaching: A survey✓ zitiert
[S238] Egara, F. O., Mosimege, M., Mosia, M. (2025). Journal of Education. Secondary school students' perceptions of their usage of artificial intelligence-based ChatGPT in mathematics learning✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S239] Zhang, D., Wijaya, T. T., Wang, Y., Su, M., Li, X., Damayanti, N. W. (2025). Scientific Reports. Exploring the relationship between AI literacy, AI trust, AI dependency, and 21st century skills in preservice mathematics teachers✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S24] Google / Photomath Inc. (2023). Crunchbase / Unternehmenskommunikation. Photomath: Akquisition durch Google (2023) und pädagogische Implikationen🌐 Web 🧮 Mathematik
[S240] Kaya, D., Yavuz, S. (2025). Journal of Intelligence. Can generative AI and ChatGPT break human supremacy in mathematics and reshape competence in cognitive-demanding problem-solving tasks?✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S241] Sala-Sebastià, G., Breda, A., Font, V. (2025). Education and Information Technologies. Characterising computational and geometric thinking in pre-service Early Childhood Education teachers by playing with MatataLab✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S242] Gong, X., Xu, W., Yu, S., Ma, J., Qiao, A. (2025). British Journal of Educational Technology. Enhancing computational thinking and spatial reasoning skills in gamification programming learning: A comparative study of tangible, block and paper-and-pencil tools✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S243] Sun, L., Liu, J. (2025). Thinking Skills and Creativity. Comparative study of CodeCombat-based Python programming and Scratch programming effects on sixth graders' computational thinking✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S244] Luo, Q., Zhang, S. (2025). The Asia-Pacific Education Researcher. The role of multidimensional spatial abilities in computational thinking of young children✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S245] Chytas, C., van Borkulo, S. P., Drijvers, P., Barendsen, E., Tolboom, J. L. J. (2024). Digital Experiences in Mathematics Education. Computational thinking in secondary mathematics education with GeoGebra: Insights from an intervention in calculus lessons✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S246] Ji, Z., Guo, K., Song, S. (2024). Journal of Educational Computing Research. Effects of dynamic mathematical software on students' performance: A three-level meta-analysis🎓 Peer-reviewed 🧮 Mathematik
[S247] Romero Albaladejo, I. M., García López, M. (2024). Education and Information Technologies. Mathematical attitudes transformation when introducing GeoGebra in the secondary classroom✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S248] Miao, F., Holmes, W. (2023). UNESCO. Guidance for generative AI in education and research✓ zitiert 🏛️ Institution
[S249] Miao, F., Cukurova, M. (2024). UNESCO. AI competency framework for teachers✓ zitiert 🏛️ Institution
[S25] Chervonyi, Y., Trinh, T.H., Olšák, M., Yang, X., Nguyen, H., Menegali, M., Jung, J., Kim, J., Verma, V., Le, Q.V., Luong, T. (2025). Journal of Machine Learning Research, Vol. 26(241), 1–39 (also arXiv:2502.03544). Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2✓ zitiert 🔬 Preprint 🧮 Mathematik
[S250] Bundesministerium für Bildung, Wissenschaft und Forschung [BMBWF] (2023). Handreichung: Auseinandersetzung mit Künstlicher Intelligenz im Bildungssystem✓ zitiert 🏛️ Institution 🇦🇹 Österreich
[S251] Chau, D. B., Luong, V. T., Long, T. T., Linh, N. T. (2025). European Journal of Educational Research. Personalized mathematics teaching with the support of AI chatbots to improve mathematical problem-solving competence for high school students in Vietnam🎓 Peer-reviewed
[S252] Sebsibe, A. S., Abdella, N. M. (2025). F1000Research. The effect of GeoGebra integrated instruction on students' learning of the quadratic function concept✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S253] Nalbantoglu Yilmaz, F., et al. (2025). HAL Open Archive (CERME 2025 Conference). Investigation of the use of AI as a scaffolding tool during mathematical discussion in geometry problem-solving✓ zitiert 🔓 Open Access 🧮 Mathematik
[S254] Zhou, X., He, J., et al. (2025). Journal of Computer Assisted Learning. Exploring ChatGPT-facilitated scaffolding in undergraduates' mathematical problem solving✓ zitiert 🎓 Peer-reviewed
[S255] Yu, H. M., Lee, H., Kim, S. H. (2025). Journal of Research in Childhood Education. Integrating ChatGPT in teacher education: Examining early childhood and elementary pre-service teachers' experiences in AI-assisted math lesson planning🎓 Peer-reviewed
[S256] Colliot, T., Krichen, O., Girard, N., Anquetil, E., Jamet, E. (2024). British Journal of Educational Technology. What makes tablet-based learning effective? A study of the role of real-time adaptive feedback✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S257] Walkington, C., Nathan, M. J., Hunnicutt, J., Washington, J., Zhou, M. (2024). Journal of Mathematical Behavior. New kinds of embodied interactions that arise in augmented reality dynamic geometry software✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S258] Barana, A., Fissore, C., Marchisio Conte, M., Tassone, M. (2024). Proceedings of the 16th International Conference on Computer Supported Education. Shaping an adaptive path on analytic geometry with automatic formative assessment and interactive feedback✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S259] Mudhefi, F., Mabotja, K., Muthelo, D. (2024). Perspectives in Education. The use of Van Hiele's geometric thinking model to interpret Grade 12 learners' learning difficulties in Euclidean geometry🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S26] Hubert, T., Mehta, R., Sartran, L., et al. (39 Autoren, Google DeepMind) (2025). Nature. Olympiad-level formal mathematical reasoning with reinforcement learning (AlphaProof)✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S260] Yu, J., Denham, A. R. (2024). British Journal of Educational Technology. Utilizing augmented reality for embodied mental rotation training: A learning analytics study🎓 Peer-reviewed
[S261] Bagno, E., Dana-Picard, T. N., Reches, S. (2024). Open Education Studies. ChatGPT in teaching linear algebra: Strides forward, steps to go🎓 Peer-reviewed 🔓 Open Access
[S262] Kock, Z.-j., Salinas-Hernandez, U., Pepin, B. (2025). Digital Experiences in Mathematics Education. Engineering students' initial use schemes of ChatGPT as an instrument for learning✓ zitiert 🎓 Peer-reviewed
[S263] Al-Abri, A. (2025). Education and Information Technologies. Exploring ChatGPT as a virtual tutor: A multi-dimensional analysis of large language models in academic support🎓 Peer-reviewed
[S264] Faizah, S., Sa'dijah, C., Anwar, L. S., Muslim, A. B. (2024). Journal of Ecohumanism. Contextualization of augmented reality digital module instruction: Grounded theory study in examining Van Hiele's level of geometric thinking🎓 Peer-reviewed
[S265] Wong, K. C. K., Tsang, K. M. Y., Lin, C. L., Chan, C. K. Y. (2025). Education Sciences. Student-created screencasts: A constructivist response to the challenges of generative AI in education🎓 Peer-reviewed 🔓 Open Access
[S266] Chen, F., Chen, J., Xu, Y. (2025). Psychology in the Schools. The More Anxious, the More Dependent? The Impact of Math Anxiety on AI-Assisted Problem-Solving✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S267] Wang, X., Wei, Y. (2025). Applied Cognitive Psychology. The Influence of Gen-AI Assisted Learning on Primary School Students' Math Anxiety: An Intervention Study✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S268] Polydoros, G., Galitskaya, V., Pergantis, P., Drigas, A., Antoniou, A.-S., Beazidou, E. (2025). Psychology International. Innovative AI-Driven Approaches to Mitigate Math Anxiety and Enhance Resilience Among Students with Persistently Low Performance in Mathematics✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S269] Asiedu Menlah, C. K., Boateng, F. O. (2025). Journal of Pedagogical Sociology and Psychology. Examining the Effect of AI-Based Tutoring Systems on Students' Mathematical Problem-Solving Skills: The Moderating Role of Mathematics Anxiety✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S27] Bastani, H., Bastani, O., Sungu, A., Ge, H., Kabakcı, Ö., Mariman, R. (2025). Proceedings of the National Academy of Sciences (PNAS). Generative AI without guardrails can harm learning: Evidence from high school mathematics✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S270] Wijers, M., et al. (2026). Educational Psychology Review. Gamification on Mathematics Engagement and Motivation in Secondary School and Higher Education: A Systematic Review and Meta-Analysis✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S271] Omar, A., Daher, W., Bayaa, N. (2025). Frontiers in Education. Academic Emotions of Eighth Grade Students in Algebra Classrooms Using an Artificial Intelligence Learning Environment✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S272] Lotey, E. K., Boateng, F. O., Arthur, Y. D., Adu-Obeng, B., Gordon, J. F. (2025). Cogent Education. Exploring GeoGebra acceptance: an implication for pre-service mathematics teachers professional development🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S273] Sun, L., Zhou, L. (2024). Journal of Educational Computing Research. Does Generative Artificial Intelligence Improve the Academic Achievement of College Students? A Meta-Analysis✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S274] Liu, Z., Zuo, H., Lu, Y. (2025). Journal of Computer Assisted Learning. The Impact of ChatGPT on Students Academic Achievement: A Meta-Analysis✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S275] Liu, Z., Zuo, H., Feng, J., Lu, Y. (2025). Computer Applications in Engineering Education. Who Is the Best Helper for University Students Mathematical Creativity? A Quasi-Experimental Study of Human-ChatGPT, Human-Google, and Human-Human Co-Creation✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S276] Ma, B., Jian, P., Pan, C., Wang, Y., Ma, W. (2024). Scientific Reports. A geometric neural solving method based on a diagram text information fusion analysis🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S277] Agrawal, V., Kantipudi, M. V. V. P., Jagtap, J. (2025). Scientific Reports. Enhancing hand-drawn diagram recognition through the integration of machine learning and deep learning techniques🎓 Peer-reviewed 🔓 Open Access
[S278] Ma, Y. F. (2025). Frontiers in Education. The effect of geometer sketchpad on secondary school students' mathematical intelligence🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S279] Parra, V., Sureda, P., Corica, A., Schiaffino, S., Godoy, D. (2024). International Journal of Interactive Multimedia and Artificial Intelligence. Can Generative AI Solve Geometry Problems? Strengths and Weaknesses of LLMs for Geometric Reasoning in Spanish✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S28] Liu, B., Zhang, W., Wang, F. (2026). Education Sciences (MDPI), 16(1), 140. Can Generative Artificial Intelligence Effectively Enhance Students' Mathematics Learning Outcomes? A Meta-Analysis of Empirical Studies from 2023 to 2025✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S280] Flavin, E., Hwang, S., Morales, M. (2025). Journal of Teacher Education. Let's Ask the Robot!: Epistemic Stance between Teacher Candidates towards AI in Mathematics Lesson Planning✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S281] Copur-Gencturk, Y., Li, J., Atabas, S. (2024). American Educational Research Journal. Improving Teaching at Scale: Can AI Be Incorporated Into Professional Development to Create Interactive, Personalized Learning for Teachers?✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S282] Hodges, G. W., Flanagan, K. (2026). Science Education. Establishing a model for serious science game design for elementary learners: A longitudinal, mixed methods study of serious game design mechanics that facilitate science learning🎓 Peer-reviewed 🧮 Mathematik
[S283] Xu, S., Luo, Y., Shi, W. (2024). arXiv / ACM Proceedings. Geo-LLaVA: A large multi-modal model for solving geometry math problems with meta in-context learning🔬 Preprint 🧮 Mathematik
[S284] Igualde Sáez, A., Rhomrasi, L., Ahsini, Y., Vinuesa, R., Hoyas, S., García Sabater, J. P., Fullana i Alfonso, M. J., Conejero, J. A. (2025). arXiv (Preprint). Evaluating visual mathematics in multimodal LLMs: A multilingual benchmark based on the Kangaroo tests🔬 Preprint 🧮 Mathematik
[S285] Li, Y., Qian, S., Liang, H., Zheng, L., An, R., Guo, Y., Zhang, W. (2025). arXiv (Preprint). CapGeo: A caption-assisted approach to geometric reasoning🔬 Preprint 🧮 Mathematik
[S286] Topali, P., Ortega-Arranz, A., Martinez-Mones, A., Villagra-Sobrino, S. (2025). British Educational Research Journal. Pedagogical considerations in the automation era: A systematic literature review of AIEd in K-12 authentic settings✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S287] Huang, X., Xu, W., Liu, R. (2025). International Journal of Distance Education Technologies. Effects of intelligent tutoring systems on educational outcomes: Evidence from a comprehensive analysis✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S288] Villegas-Ch., W., Buenaño-Fernández, D., Maldonado Navarro, A., Mera-Navarrete, A. (2025). Smart Learning Environments. Adaptive intelligent tutoring systems for STEM education: Analysis of the learning impact and effectiveness of personalized feedback🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S289] Bauer, E., Richters, C., Pickal, A. J., Klippert, M., Sailer, M. (2025). British Journal of Educational Technology. Effects of AI-generated adaptive feedback on statistical skills and interest in statistics: A field experiment in higher education✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S29] Khan Academy Research Team (2024). Khan Academy Blog / Research Report. Khan Academy Efficacy Results — Students Using Khan Academy 30+ Minutes Per Week Show 20% Greater Learning Gains🏛️ Institution
[S290] Jain, R., Sharma, P. (2025). Scientific Reports. Deep knowledge tracing and cognitive load estimation for personalized learning path generation using neural network architecture🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S291] Zech, F. (2002). Beltz Verlag. Grundkurs Mathematikdidaktik: Theoretische und praktische Anleitungen für das Lehren und Lernen von Mathematik — 📚 Verlag
[S30] Kovács, Z., Recio, T., Vélez, M.P. (2024). arXiv / GeoGebra Discovery Research. Showing proofs, assessing difficulty with GeoGebra Discovery✓ zitiert 🔬 Preprint 🔓 Open Access 🧮 Mathematik
[S31] Achim, T., Best, A., Bietti, A., et al. (The Harmonic Team, 23 Autoren) (2025). arXiv preprint. Aristotle: IMO-level Automated Theorem Proving✓ zitiert 🔬 Preprint 🧮 Mathematik
[S32] Vuong, Q.-H., Ho, M.-T. (2024). AI & Society (Springer Nature). The disruptive AlphaGeometry: is it the beginning of the end of mathematics education?✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S33] Buchholtz, N., Schorcht, S., Baumanns, L., Huget, J., Noster, N., Rott, B., Siller, H.-S., Sommerhoff, D. (2024). Mitteilungen der Gesellschaft für Didaktik der Mathematik, Nr. 117. Damit rechnet niemand! Sechs Leitgedanken zu Implikationen und Forschungsbedarfen zu KI-Technologien im Mathematikunterricht✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S34] Polydoros, G., Galitskaya, V., Antoniou, A.-S., Drigas, A. (2025). Scientific Electronic Archives, 18(2). AI Technology Integration in Elementary Geometry and Its Effects on Performance, Anxiety Levels, Learning Styles, Cognitive Styles, and Executive Functions✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S35] Wardat, Y., Tashtoush, M.A., AlAli, R., Jarrah, A.M. (2023). Eurasia Journal of Mathematics, Science and Technology Education, 19(7), em2286. ChatGPT: A Revolutionary Tool for Teaching and Learning Mathematics✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S36] Lu, P., Bansal, H., Xia, T., Liu, J., Li, C., Hajishirzi, H., Cheng, H., Chang, K.-W., Galley, M., Gao, J. (2024). ICLR 2024 (Oral, top 1.2% aller Einreichungen). MathVista: Evaluating Mathematical Reasoning of Foundation Models in Visual Contexts🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S37] Zhang, R., Jiang, D., Zhang, Y., Lin, H., Guo, Z., Qiu, P., Zhou, A., Lu, P., Chang, K.-W., Gao, P., Li, H. (2024). Computer Vision – ECCV 2024 (Lecture Notes in Computer Science, Vol. 15066, pp. 169–186). MathVerse: Does Your Multi-modal LLM Truly See the Diagrams in Visual Math Problems?✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S38] Wei, X. (2024). Frontiers in Education, 9, 1452570. Evaluating ChatGPT-4 and ChatGPT-4o: Performance Insights from NAEP Mathematics Problem Solving✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S39] Iannone, P., Biza, I., Davies, B., Kinnear, G., Nieminen, J.H. (2025). CERME14 Proceedings (Bozen-Bolzano, Februar 2025). Towards a research agenda for generative AI in university mathematics education✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S40] Uriarte-Portillo, A., Zatarain-Cabada, R., Barrón-Estrada, M.L., Ibáñez, M.B., González-Barrón, L.-M. (2023). Information (MDPI), 14(4), 245. Intelligent Augmented Reality for Learning Geometry (ARGeoITS): A Quasi-Experimental Study✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S41] Wu, J., Jiang, H., Long, L., Zhang, X. (2024). Education and Information Technologies (Springer). Effects of AR Mathematical Picture Books on Primary School Students' Geometric Thinking, Cognitive Load and Flow Experience🎓 Peer-reviewed 🧮 Mathematik
[S42] Bundesministerium für Bildung (BMB), Österreich (2024). BMB Österreich (Amtliches Dokument). KI-Pilotschulen und KI im Unterricht: Handreichung des österreichischen Bildungsministeriums🏛️ Institution 🇦🇹 Österreich 🔓 Open Access
[S43] Pädagogische Hochschule Wien (2024). Pädagogische Hochschule Wien. Positionspapier zum Umgang mit Künstlicher Intelligenz in der Hochschulbildung✓ zitiert 🏛️ Institution 🇦🇹 Österreich 🔓 Open Access
[S44] Aslan, D., Dağaynası, S., Ceylan, M. (2024). Education and Information Technologies (Springer). Technology and Geometry: Fostering Young Children's Geometrical Concepts Through a Research-Based Robotic Coding Program✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S46] Molina-Ayuso, Á., Adamuz-Povedano, N., Bracho-López, R., Torralbo-Rodríguez, M. (2024). Sustainability (MDPI), 16(1), 110. Computational Thinking with Scratch: A Tool to Work on Geometry in the Fifth Grade of Primary Education✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S47] Kestin, G., Miller, K., Klales, A., Milbourne, T., Ponti, G. (2025). Scientific Reports (Nature Portfolio), 15, 17458. AI Tutoring Outperforms Active Learning✓ zitiert 🎓 Peer-reviewed 🔓 Open Access
[S48] Frieder, S., Pinchetti, L., Chevalier, A., Griffiths, R.-R., Salvatori, T., Lukasiewicz, T., Petersen, P.C., Berner, J. (2023). NeurIPS 2023 Datasets and Benchmarks Track. Mathematical Capabilities of ChatGPT✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S50] Hariyanto, D., Kristianingsih, K., Maharani, A. (2025). Discover Education, 4, 458. Artificial Intelligence in Adaptive Education: A Systematic Review of Techniques for Personalized Learning✓ zitiert 🎓 Peer-reviewed 🔓 Open Access
[S51] Feng, T. H., Denny, P., Wünsche, B. C., Luxton-Reilly, A., Whalley, J. (2024). SIGGRAPH Asia 2024 Educator's Forum (ACM). An Eye for an AI: Evaluating GPT-4o's Visual Perception and Geometric Reasoning Skills✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S53] Song, C., Wang, Z., Pu, F., Wang, H., Lin, X., Liu, J., Li, J., Liu, Z. (2025). arXiv:2508.14644. LeanGeo: Formalizing Competitional Geometry Problems in Lean✓ zitiert 🔬 Preprint 🔓 Open Access 🧮 Mathematik
[S54] Bottoni, M. L., Cattaneo, A. S., Sacikara, E. (2025). arXiv:2501.03352. Teaching 'Foundations of Mathematics' with the Lean Theorem Prover✓ zitiert 🔬 Preprint 🔓 Open Access 🧮 Mathematik
[S55] Olšák, M. (2020). Lecture Notes in Computer Science, AISC 2020 (Springer). GeoLogic — Graphical Interactive Theorem Prover for Euclidean Geometry🎓 Peer-reviewed 🧮 Mathematik
[S56] Naskręcki, B., Ono, K. (2025). Nature Physics, 21, 1504–1506. Mathematical Discovery in the Age of Artificial Intelligence✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S57] Xin, H., Guo, D., Shao, Z., Ren, Z., Zhu, Q., Liu, B., Ruan, C., Li, W., Liang, X. (2024). arXiv:2405.14333. DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data✓ zitiert 🔬 Preprint 🔓 Open Access 🧮 Mathematik
[S58] Hota, A., Kovács, Z., Vujic, A. (2024). ADG 2023, EPTCS 398, 110–123. Solving Some Geometry Problems of the Náboj 2023 Contest with Automated Deduction in GeoGebra Discovery✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🇦🇹 Österreich 🧮 Mathematik
[S59] Kovács, Z., Recio, T., Vélez, M. P. (2024). ADG 2023, EPTCS 398. Solving with GeoGebra Discovery an Austrian Mathematics Olympiad Problem: Lessons Learned✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🇦🇹 Österreich 🧮 Mathematik
[S60] Cai, S., Bao, K., Guo, H., Zhang, J., Song, J., Zheng, B. (2024). EMNLP 2024. GeoGPT4V: Towards Geometric Multi-Modal Large Language Models with Geometric Image Generation🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S61] Beijing Institute for General Artificial Intelligence (BIGAI), Peking University (2024). BIGAI Research / South China Morning Post. TongGeometry: A Neuro-Symbolic AI for Olympiad Geometry Theorem Discovery and Proving🧮 Mathematik
[S62] Korean Ministry of Education (2025). Korean Ministry of Education / Korea Times. South Korea National AI Digital Textbooks in Mathematics (Rollout March 2025) — ✓ zitiert 🏛️ Institution
[S63] Yixue Squirrel AI Learning (2024). KDD 2024 / HUNDRED Innovation Report. Squirrel AI Learning: Large-Scale Adaptive AI Platform for Mathematics🧮 Mathematik
[S64] ResearchGate / Multiple Authors (2024). ResearchGate Publications. AI in Education: Global Trends and Country-by-Country Analysis 2018–2023🌐 Web
[S65] Zhang, C., Liu, X., Ziska, K., Jeon, S., Yu, C.-L., Xu, Y. (2024). Proceedings of the CHI 2024 Conference on Human Factors in Computing Systems (ACM). Mathemyths: Leveraging Large Language Models to Teach Mathematical Language Through Child-AI Co-Creative Storytelling✓ zitiert 🎓 Peer-reviewed 🔓 Open Access
[S66] Fang, X., Ng, D. T. K., Yuen, M. (2024). Education and Information Technologies (Springer). Effects of GeoGebra-Enhanced Scratch Computational Thinking Instruction on Fifth-Grade Students' Motivation, Anxiety, and Cognitive Load✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S67] Wang, X., Chan, K. K., Li, Q., Leung, S. O. (2024). Journal of Educational Computing Research (SAGE). Do 3–8 Year-Old Children Benefit From Computational Thinking Development? A Meta-Analysis✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S69] Uygun, T., Şendur, A., Top, B. (2025). Education and Information Technologies (Springer), 30, 8373–8411. Facilitating Preservice Teachers' Geometric Thinking Through AI-Assisted Augmented Reality: The Case of Platonic Solids✓ zitiert 🎓 Peer-reviewed
[S70] [Taiwanesische Autor:innen, 2024] (2024). Systems (MDPI), 12(11), 493. Improving Elementary Students' Geometric Understanding Through Augmented Reality (ARMLS)🎓 Peer-reviewed 🔓 Open Access
[S71] Nordby, S. K., Mifsud, L., Bjerke, A. H. (2024). Frontiers in Education. Computational Thinking in Primary Mathematics Classroom Activities🎓 Peer-reviewed 🔓 Open Access
[S72] Schorcht, S., Baumanns, L., Buchholtz, N., Huget, J., Peters, F., Pohl, M. (2024). GDM-Mitteilungen, 116. Lernt die KI nun Sehen und Zeichnen? Chancen und Herausforderungen der Bildgenerierung und Bildinterpretation mit ChatGPT für die mathematikdidaktische Forschung✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S73] Heugl, H. (2025). Tag der Mathematik 2025, TU Graz / T3 Deutschland. Mathematikunterricht mit/trotz KI✓ zitiert 🇦🇹 Österreich 🧮 Mathematik
[S76] Greefrath, G., Oldenburg, R., Siller, H.-S., Ulm, V., Weigand, H.-G. (2024). Springer Spektrum. Digitalisierung im Mathematikunterricht: Theorie und Praxis digitaler Medien in der Sekundarstufe I✓ zitiert 📚 Verlag 🧮 Mathematik
[S77] Pielsticker, F., Holten, K., Dilling, F., Witzke, I. (2024). GDM-Mitteilungen, 116. Aushandlungs- und Argumentationsprozesse fördern durch den Einsatz generativer KI-Sprachmodelle beim schulischen Mathematiklernen✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S78] Österreichischer Bundesverlag (öbv), Studyly GmbH (2025). APA-OTS Pressemeldung, September 2025. Individuelles Mathe-Lernen: Schulbuch plus KI-Lerncoach (öbv / Studyly)🇦🇹 Österreich
[S79] Ahn, J., Verma, R., Lou, R., Liu, D., Zhang, R., Yin, W. (2024). arXiv:2402.00157 (preprint). Do Large Language Models Know What They Don't Know? A Survey on Uncertainty Estimation for LLMs with Applications to Mathematical Reasoning✓ zitiert 🔬 Preprint 🔓 Open Access 🧮 Mathematik
[S80] von Hippel, P.T. (2023). Education Next, 23(4). GPT-4 Can't Reason — ✓ zitiert 🎓 Peer-reviewed
[S81] Pardos, Z.A., Bhandari, S. (2024). PLOS ONE, 19(6), e0304013. Hallucination mitigation in affective computing and educational AI: A study of large language model failures in mathematical reasoning✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S82] Wijaya, T.T., Cao, Y., Weinhandl, R., Tamur, M., Murni, A. (2024). Behavioral Sciences, 14(11), 1008. AI Dependency in Mathematics: Understanding Teacher Perspectives and Student Behavioral Patterns✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S83] Ateeq, A.K., Iqbal, R., Liz Thomas, A., Shubair, R. (2024). Frontiers in Education, 9, 1470979. Academic Integrity in the Age of Generative AI: Student Use Patterns, Instructor Perceptions, and Institutional Responses✓ zitiert 🎓 Peer-reviewed 🔓 Open Access
[S85] Yin, C., Rajendran, R., Mørch, A., Ogata, H., Roy, D. (2024). arXiv:2407.18745 (preprint, submitted to Educational Technology & Society). Towards FairAIED: Bias and Fairness in AI-Powered Educational Technologies✓ zitiert 🔬 Preprint 🔓 Open Access
[S86] European Data Protection Board (EDPB) (2024). European Data Protection Board. Opinion 28/2024 on certain data protection aspects related to the processing of personal data in the context of AI models — 🏛️ Institution
[S87] European Commission (2022). Publications Office of the European Union. Ethical Guidelines on the Use of Artificial Intelligence and Data in Teaching and Learning for Educators🏛️ Institution
[S88] LearnLM Team (2025). Google DeepMind / Google for Education. LearnLM: A Model for Learning🏛️ Institution 🧮 Mathematik
[S89] Yunianto, W., Lavicza, Z., Kastner-Hauler, O., Houghton, T. (2024). Journal on Mathematics Education, 15(3), 1027–1052. Investigating the use of ChatGPT to solve a GeoGebra-based mathematics + computational thinking task in a geometry topic✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🇦🇹 Österreich 🧮 Mathematik
[S90] Botana, F., Recio, T. (2024). Computation, 12(2), 30. Geometric Loci and ChatGPT: Caveat Emptor!✓ zitiert 🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S91] Nieddu, G., Carrisi, M.C., Polo, M., Zurru, A.L. (2025). CERME14 Proceedings (Bozen-Bolzano, Februar 2025), TWG24. Chat GPT as a didactic tool to improve students' abilities in managing different semiotic representations🎓 Peer-reviewed 🔓 Open Access 🧮 Mathematik
[S92] Kovács, Z., Recio, T., Vélez, M.P. (2022). Mathematics Education in the Age of Artificial Intelligence (Springer, Mathematics Education in the Digital Era, Vol. 17), pp. 23–68. Automated Reasoning Tools with GeoGebra: What Are They? What Are They Good For?📚 Verlag 🧮 Mathematik
[S93] Kovács, Z., Recio, T., Sólyom-Gecse, C., Vélez, M.P. (2024). Annals of Mathematics and Artificial Intelligence. On Automated Completion of Geometry Statements and Proofs with GeoGebra Discovery✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S95] Krátká, M., Přibyl, J., Tichá, M. (2025). 24th European Conference on e-Learning (ECEL), Vol. 24(1). AI in the Classroom: Didactical Misalignments in Geometry Between Czech and Anglo-Saxon Contexts✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik
[S96] Schorcht, S., Buchholtz, N., Baumanns, L. (2024). Frontiers in Education, Vol. 9, Art. 1386075. Prompt the Problem: Investigating the Mathematics Educational Quality of AI-Supported Problem Solving by Comparing Prompt Techniques✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik empirical
[S97] Csiba, P., Vajo, P. (2024). AIMS Mathematics, Vol. 9(3), pp. 5234–5249. Problems and Challenges of Using Randomized Automatically Evaluating Geometric Construction Problems in Moodle LMS✓ zitiert 🎓 Peer-reviewed 🧮 Mathematik