Wir freuen uns sehr, die Annahme des Artikels "MAMUT: A Novel Framework for Modifying Mathematical Formulas for the Generation of Specialized Datasets for Language Model Training" im Journal Transactions on Machine Learning Research (TMLR; 06/2025) bekannt zu geben.
In der Arbeit stellen wir Math Mutator (MAMUT) vor - eine neuartige Methode zur automatischen Anreicherung mathematischer Datensätze. Ausgehend von einer gegebenen LaTeX Formel (z.B. (a+b)^2=a^2+2ab+b^2) erzeugt MAMUT neue, mathematisch equivalente Varianten mit veränderter Notation und Variablen (z.B. c^2+a^2+2ac=(a+c)^2). Zusätzlich kann MAMUT gezielt fehlerhafte Varianten generieren, indem einzelne Terme subtil verändert werden (z.B. b^2 durch 2^b ersetzen), sodass eine formal ähnliche, aber mathematische inkorrekte Formel entseht. Unsere Experimente zeigen, dass Sprachmodelle, die mit den MAMUT erzeugten Daten trainiert werden, ein besseres mathematischen Verständnis entwickeln.
Den vollständigen Artikel finden Sie hier: https://openreview.net/forum?id=khODmRpQEx