OpenAI “o1”: Neues Sprachmodell mit weitaus besseren Fähigkeiten in den Naturwissenschaften als Vorgänger

OpenAI hat mit nun mit “o1-preview” und “o1-mini” eine Serie von Sprachmodellen gestartet, die im Vergleich zum Top-Modell GPT-4o weitaus bessere Fähigkeiten in den naturwissenschaftlichen Bereichen etwa der Mathematik, Physik und des Codings aufweisen soll. Bislang hatten alle großen LLMs Probleme bei der Lösung von mathematischen Aufgaben und Ähnlichem bzw. die Fehlerquote war bei dieser Thematik zu hoch. Dies ändert sich wohl nun.

Siehe hierzu auch den offiziellen Blogbeitrag von OpenAI

o1
Modelle “o1” für Premium-User verfügbar

Die neuen Language Models sind jetzt schon für Premium-Nutzer von ChatGPT verfügbar. Dazu oben links einfach das LLM wechseln. Im Gegensatz zu GPT-4o sind die Sprachmodelle bislang nicht multimodal, also ohne Upload-Funktion ausgestattet, aber dies wird sich wohl im Laufe der Zeit ändern.

In our tests, the next model update performs similarly to PhD students on challenging benchmark tasks in physics, chemistry, and biology. We also found that it excels in math and coding. In a qualifying exam for the International Mathematics Olympiad (IMO), GPT-4o correctly solved only 13% of problems, while the reasoning model scored 83%. Their coding abilities were evaluated in contests and reached the 89th percentile in Codeforces competitions. You can read more about this in our technical research post. Quelle: OpenAI

Im offiziellen Blogpost gibt OpenAI an, dass “o1” etwa viel besser die Aufgaben im Rahmen der Mathematik-Olympiade lösen konnte, eine satte Steigerung von 13 % auf 83 %.

Im oberen Video demonstriert der Forscher Dr. Mario Krenn vom Max-Planck-Institut für die Physik des Lichts in Erlangen, wie sich mit dem LLM komplexe Berechnungen durchführen lassen. Gerne präsentieren die Anbieter von Large Language Models bestimmte Benchmarks, die das Modell erzielt, aber schlussendlich kommt es auf die Praxis an und da sind  Meinungen von Experten hinsichtlich eines umfangreichen Testen weitaus wichtiger und aussagekräftiger. Nun soll also das neue OpenAI Modell “o1” auch im Rahmen der Quantenphysik zuverlässig eingesetzt werden, obwohl trotzdem noch eine nicht unerhebliche Fehlerquote bestehen bleibt, aber diese wird wohl bei den nächsten Updates auch immer geringer werden.

Im Folgenden sind noch weitere Beispiel-Videos eingebunden, die die besseren “AI-Skills” in Mathe oder Coding zeigen sollen.

Ein Beitrag erstellt von

Ähnliche Beiträge