LLM-Vergleich: Kostenlos Sprachmodelle mit Output, Kosten und Benchmarks testen

Veröffentlicht am 11. Juli 202411. Juli 2024 von Matthias Kindt

Bei der Stuttgarter Digitalagentur Buzzwoo lassen sich nun über den KI-Kompass mehr als 50 Large Language Models kostenlos und ohne Anmeldung vergleichen, auch Top-Sprachmodelle wie GPT-4o oder Claude-3.5-Sonnet sind verfügbar. Zwei Models auswählen, einen Prompt setzen und dann einfach den Output beider LLMs durchgehen und kontrollieren, welches besser abschneidet.

Textoutput von zwei LLMs vergleichen

Im oberen Screenshot ist sichtbar wie die beiden Top-Chatbots von OpenAI (GPT) und Anthropic (Claude) nach dem Prompt “GenAI und AGI” simultan ihren Text als Output präsentieren. Unter jedem Output stehen zusätzlich die verursachten Kosten, die über eine API-Anbindung fällig werden, sowie die Gesamtzeit für den Textinhalt. User bekommen so ein Gefühl dafür, wie hoch die Kosten im Rahmen der Tokenisierung sind und wie lange solch ein Output durchschnittlich dauert. Dies sorgt für maximale Transparenz im Vergleichscheck. Der Wechsel der Sprachmodelle erfolgt sehr einfach im Drop-Down-Menü. Zudem können Nutzer auch in den Single-Modus switchen, um ausschließlich einen Chatbot zu testen.

Vergleich von Kosten und Benchmarks

Input- und Output-Kosten, Benchmarks und mehr

Daneben lassen sich die Language Models in einem weiteren Vergleich neben der Test-Arena gezielt hinsichtlich der Input- und Output-Kosten darstellen, auch mit der Anzeige von Open Source oder geschlossenem Model, API-Anbindung oder wichtigen Benchmarks wie dem viel beachteten “MMLU Score”. Für User stehen also diverse Kennzahlen zur Verfügung, um ganz allgemein ein LLM zu testen.

Der KI-Kompass von Buzzwoo “Made in Stuttgart” eignet sich gut für Einsteiger als auch fortgeschrittene User, denn es lassen sich neben den Top-Marken wie ChatGPT, Gemini und Claude auch eher unbekannte Modelle wie Qwen von chinesischem Tech-Konzern Alibaba oder die Open-Source-Anwendung Cohere aus Kanada verwenden. Der Kompass ist zudem eine tolle Alternative zu US-Anbietern wie LMSYS Chatbot Arena, die mittlerweile sehr stark im Fokus sind, da auf solchen Plattformen gezielt KI-Chatbots gegeneinander antreten, um dann zu zeigen, was sie können und welche Künstliche Intelligenz besser abschneidet und schlussendlich auch userfreundlicher bedienbar ist.