STORM: Tool der Stanford University ermöglicht mit LLM das Erstellen von Wikipedia-ähnlichen Beiträgen mit Quellenangaben

Veröffentlicht am 25. September 202425. September 2024 von Matthias Kindt

Mit der Open-Source-Anwendung STORM, die Entwickler der US-Hochschule Stanford University entwickelt haben, können User nun kostenfrei mithilfe eines Language Models zu beliebigen Themen mit einem Prompt einen professionell strukturierten Beitrag mit Quellen im Stile von Wikipedia-Artikeln generieren. Hierfür wurden im Vorfeld ausgewählte Quellen verwendet, die als seriös gelten.

Webseite: https://storm.genie.stanford.edu

Zu Beginn steht wieder einmal ein simpler Prompt, um das Thema kurz zu erfassen, Z.B. “Unterschiede zwischen GenAI und AGI” und dann noch unter darunter im Feld ein wenig näher erläutern, falls gewünscht, wie denn die Struktur des Beitrags so ungefähr aussehen soll. Nach Button-Klick dauert es nun wenige Minuten, bis alle seriösen Quellen mit simulierten Gesprächen durchgegangen sind und das Tool STORM auf dieser Grundlage den fertigen Artikel präsentiert.

Der obere Screenshot zeigt den ersten Output mit Überschrift und Summary und ermöglicht per Button-Klick “see BrainSTORMing Process” den Ablauf der Beitragsgenerierung einzusehen. Hier werden dann die vom ausgewähltem Large Language Model simulierten Gespräche angezeigt, die in einem fiktiven Dialog entstanden. Mit Button-Klick unten lässt sich der Artikel auch direkt als PDF einsehen und speichern. In der linken Navigation ist die Struktur des Beitrags sichtbar und Nutzer können sich da einfach durchklicken. Zudem werden alle Artikel in der Library gespeichert und sind jederzeit einsehbar.

Quellen & RAG-Technik

Wirklich gut bei STORM ist die regelmäßige Angabe von Quellen in den eckigen Klammern. Klickt man dort drauf, dann ploppt ein Fenster mit Titel, Website-URL und externer Verlinkung sowie Highlights und kurzen Zusammenfassungen auf. Dies zeigt dann den Charakter des wissenschaftlichen Arbeitens im Gegensatz zu aktuellem Output von Chatbots wie z.B. ChatGPT. Die Quellen werden dem Language Model im Rahmen der Technik Retrieval Augmented Generation (RAG) zugeführt, die es ermöglicht, das LLM anzuweisen, sich auf bestimmte Quellen zu fokussieren und diese dann durchzugehen, um schlussendlich auf dieser Grundlage Text zu generieren. Zu den Quellen zählen unter anderem fertige Wikipedia-Artikel und weitere Webseiten. So kann eine bestimmte Hochwertigkeit bzw. Verlässlichkeit an Output garantiert werden. RAG ist notwendig, da solch ein Sprachmodell wie ChatGPT geschlossen ist und man dementsprechend über diesen “Umweg” Anweisungen erteilt.

Code auf GitHub verfügbar – Anbindung über API

Der Code der Anwendung STORM ist für alle auf der Basis von Open Source frei verfügbar und kann über GitHub heruntergeladen werden. Da die Grundlage von solchen KI-Tools stets Large Language Models sind, müssen User dieses Skript nun über eine API mit einem Sprachmodell wie ChatGPT. Claude oder Llama connecten, um auf dieser Basis dann den Text schreiben zu lassen. Hierfür ist zum Beispiel eine OpenAI API notwendig, wodurch jeder Prompt etwas Kosten verursacht.

Webseite: https://github.com/stanford-oval/storm

Offizielle Darstellung der Entwickler von STORM

„Wir untersuchen, wie man große Sprachmodelle anwendet, um fundierte und strukturierte Langformartikel von Grund auf zu schreiben, die in Breite und Tiefe mit Wikipedia-Seiten vergleichbar sind. Dieses wenig erforschte Problem stellt uns vor neue Herausforderungen in der Vorschreibphase, darunter die Recherche des Themas und die Erstellung einer Gliederung vor dem Schreiben. Wir schlagen STORM vor, ein Schreibsystem zur Synthese von Themengliederungen durch Abfrage und multiperspektivisches Fragenstellen. STORM modelliert die Vorschreibphase, indem es (1) verschiedene Perspektiven bei der Recherche des gegebenen Themas entdeckt, (2) Gespräche simuliert, in denen Autoren mit unterschiedlichen Perspektiven einem Themenexperten Fragen stellen, die auf vertrauenswürdigen Internetquellen basieren, und (3) die gesammelten Informationen kuratiert, um eine Gliederung zu erstellen.” Quelle: Team der Stanford University auf Arxiv.org

„Zur Bewertung kuratieren wir FreshWiki, einen Datensatz mit aktuellen, hochwertigen Wikipedia-Artikeln, und formulieren Gliederungsbewertungen, um die Vorschreibphase zu bewerten. Darüber hinaus sammeln wir Feedback von erfahrenen Wikipedia-Redakteuren. Im Vergleich zu Artikeln, die mit einer durch Gliederung und Abfrage erweiterten Basis erstellt wurden, gelten STORM-Artikel als besser organisiert (absolute Steigerung um 25 %) und umfassender (um 10 %). Das Expertenfeedback hilft auch dabei, neue Herausforderungen bei der Erstellung fundierter langer Artikel zu erkennen, wie z. B. die Übertragung von Quellenverzerrungen und die übermäßige Verknüpfung nicht zusammenhängender Fakten.” Quelle: Team der Stanford University auf Arxiv.org