Minerva – specjalistka od zadań matematycznych z treścią
Rozwiązywanie zadań matematycznych to dla modeli AI duży problem. Modele językowe takie jak BERT, GPT-3 czy PaLM wykazują dużą skuteczność w różnych zadaniach językowych jednak w matematyce nie są już tak dobre. W ostatnich miesiącach nastąpił znaczny przełom w tej dziedzinie którego dokonała firma OpenAI poprzez ich model Lean, który jest w stanie rozwiązywać zadania z olimpiady matematycznej ze szkoły średniej z dość znaczącą skutecznością, jednak wg. OpenAI nadal modelowi Lean daleko jest od najlepszych wyników uczniów w tych zawodach, tylko sporadycznie im dorównując.
Jeszcze większym problemem są tekstowe zadania matematyczne rozwiązywane krok po kroku. Rozwiązywanie problemów matematycznych w formie zadań z treścią wymaga kombinacji wielu umiejętności: poprawnego zrozumienia danych tekstowych, wybór odpowiednich formuł matematycznych oraz poprawna manipulacja symbolami w celu rozwiązywania zadania z odpowiednim rozpisaniem poszczególnych kroków.
W końcu i w tej dziedzinie nastąpił postęp, Google poinformowało, że wyszkoliło nowy model AI Minerva opierający się na modelu Pathways Language Model (PaLM) który został doszkolony za pomocą 118 GB zestawu danych z artykułów naukowych i stron internetowych.
Minerva używa technik, takich jak łańcuch myśli, aby ocenić kilka rozwiązań krok po kroku. Model tworzy kilka rozwiązań dla danego zadania, następnie przeprowadza głosowanie, aby uzyskać najczęstszą i ostateczną odpowiedź.
Skuteczność Minervy w rozwiązywaniu zadań matematycznych robi wrażenie, jednak to nie wszystko co potrafi nowy model. Oprócz matematyki Minerva wykazała się niesamowitą biegłością w rozwiązywaniu problemów z innych dziedzin naukowych, takich jak fizyka, biologa czy chemia. Mamy nadzieje, że może kiedyś model zostanie udostępniony publicznie.