DeutschlandGPT: Large Language Model “Made in Germany” gemeinsam mit Langenscheidt Verlag und Deutsche Telekom

Nun gibt es mit dem DeutschlandGPT ein Sprachmodell “Made in Germany”, das von der Titanom Technologies GmbH aus Germering in Bayern trainiert wurde. Im Vordergrund bei diesem LLM steht ganz klar die Datensouveränität, heißt es fließen keinerlei Daten aus Deutschland ab und es werden auch keine im Rahmen des KI-Trainings erhoben.

deutschlandgpt
Ein kurzer Test ist möglich, dann wird es für User kostenpflichtig

Based on Open Source und Betrieb via Telekom Cloud

Ohne Anmeldung und Auswahl eines Tarifs können Nutzer wie im oberen Screenshot sichtbar einen Prompt setzen und den Output von DeutschlandGPT kurz testen. Mehr geht leider kostenlos nicht! Auch die Eingabe über die Voice-Funktion per Stimme ist möglich. Eingesetzt für das KI-Training wurden diverse Open-Source-Modelle wie Llama-3-70b-InstructMixtral-8x22b-Instruct, Qwen1.5-110B-Chat, Starling-LM-7B-beta. Solche LLMs stehen allen kostenfrei, etwa via GitHub oder auch HuggingFace & Co zur Verfügung.

„Unser Sprachmodell wurde in Deutschland entwickelt und setzt auf unterschiedlichen Open-Source-Technologien. Durch eine physikalische Dezentralität und technologische Diversifizierung wird eine maximale Unabhängigkeit von externen Unternehmen gewährleistet.”. Quelle: DeutschlandGPT

Das Besondere an dem Sprachmodell ist, dass es in Deutschland trainiert und betrieben wird, u.a. über die Server der Deutschen Telekom im Rahmen der Telekom Cloud. Vor allem der Datenschutz spielt hier eine Rolle, der v.a. in Deutschland eine große Bedeutung hat bzw. viele Akteure sehen es eher kritisch, wenn ihre Daten z.B. in die USA abwandern oder dort kurzfristig verarbeitet werden, wie dies bei ChatGPT mit OpenAI Servern in San Francisco (USA) der Fall ist.

„DeutschlandGPT wird auf der Open Telekom Cloud und anderen deutschen Anbietern betrieben. Die Intelligenzkerne von DeutschlandGPT werden ausschließlich auf Rechenzentren deutscher Anbieter gehostet. Ihre persönlichen Daten werden nicht an ausländische Firmen übergeben.” Quelle: DeutschlandGPT

deutschlandgpt
LLM mithilfe von Unternehmen wie Langenscheidt und der Deutschen Telekom erstellt

Sprachtraining: Gemeinsam mit Langenscheidt Verlag

Das Model ist speziell auf die deutsche Sprache ausgelegt, wodurch die Outputeffizienz bei deutschen Text- und Sprachinputs wohl höherer sein soll als bei vergleichbaren LLMS. Eine Zusammenarbeit mit dem Langenscheidt Verlag, einem renommierter Verlag für Wörterbücher und Sprachlernmaterialien, ist hierfür ganz entscheidend.

Gemeinsam wurden grammatikalische, syntaktische und semantische Besonderheiten der deutschen Sprache identifiziert und in die Regelwerke integriert, um einen optimalen Textzerleger zu entwickeln. Quelle: DeutschlandGPT

deutschlandgpt
Preismodell zum DeutschlandGPT

Fazit

Genauere Angaben kann/möchte ich an dieser Stelle rund um das Large Language Model DeutschlandGPT, “based on” Open Source LLMs nicht machen, da ich es kaum testen konnte und ein Premium-Zugang für mich nicht infrage kam. Die Konstellation insgesamt hinsichtlich von KI-Training, Betrieb und Partnerschaften mit dem Langenscheidt Verlag und der Deutschen Telekom im Rahmen von Sprachtraining & Cloud-Kapazitäten, ist eher ungewöhnlich, aber nicht weniger spannend, ganz im Gegenteil. Eventuell führen eher unkonventionelle Wege zum Ziel bzw. zum Erreichen bestimmter Marktanteile im Segment der Large Language Models, vor allem mit Blick auf den deutschen Markt.

Ich persönlich finde es super, dass ein Traditionsunternehmen wie Langenscheidt nun beim Top-Thema der künstlichen Intelligenz die eigene Expertise teilt und so womöglich Open-Source LLM “Made in Germany” ein stückweit voranbringt. Aber des Testzugang ist mir dann doch zu “schmal”. Da geht doch mehr, oder 😉

Ein Beitrag erstellt von

Ähnliche Beiträge