Audio Overview: Aus einem PDF einen interessanten Podcast mit “KI-Hosts” erstellen lassen

Ein Forschungspapier hochladen, nur einen Button drücken und nach wenigen Minuten wird daraus automatisch ein englischsprachiger Podcast mit süffisant-kritischer Diskussion etwa zum Thema “Custom Chatbots in der Hochschullehre” generiert? Und das alles kostenlos? Ja, dies geht aktuell über NotebookLM basierend auf dem Language Model Gemini von Google und dem neuen Feature Audio Overview und zwar unglaublich einfach!

Das obere Audio wurde aus der Veröffentlichung Tailoring Chatbots for Higher Education: Some Insights and Experiences von Gerd Kortemeyer generiert, dem “AI-Chef-Designer” der ETH Zürich und Verantwortlicher für die Custom Bots, die über Microsoft Azure laufen und über die Technik RAG kontextbezogenen Inhalt für Studierende ausgeben können.

Die beiden “Hosts” des Podcasts, eine weibliche und männliche Stimme, erfassen die Thematik gleich zu Beginn recht gut, starten korrekt in das Thema und stellen auch direkt einen kritischen Bezug zu Generativer KI im Rahmen der Hochschullehre her. Eine Diskussion auf der Grundlage von KI-generierten Moderatoren beginnt und diese regt definitiv zum Nachdenken, da sie interessant aufgebaut ist, auch bezüglich der Tonlagen der beiden Hosts. Ebenfalls wird nach ein paar Minuten der Verfasser des Papers Gerd Kortemeyer kurz präsentiert. Die Angaben etwa zu den Tätigkeiten des “Chef Designers” hinsichtlich der “Swiss Al Alliance” sind korrekt und ich finde diesen spontanen Wechsel hin zur Vorstellung des Publishers und auch der kurzen Präsentation dieser Schweizer Initiative mehr als gelungen. Die neue Funktion Audio Overviews scheint zu überzeugen.

Oben rechts den Button “Generieren” klicken und schon wird eine fiktive Unterhaltung erzeugt

Und so geht es:

1) Die Webseite https://notebooklm.google.com/ aufrufen, über ein Google-Konto anmelden und dann ein PDF in den Workspace hochladen
2) Falls noch nicht geöffnet, dann rechts unten auf “Notebook Leitfaden” klicken. 
3) Oben rechts im Feld “Detaillierte Unterhaltung” auf “Generieren” klicken. Das war’s!
4) Audio abspielen und herunterladen in MP3-Format.

Es ist wirklich sehr einfach und zudem kostenlos, solch eine KI-generierte Unterhaltung auf der Grundlage eines Forschungspapiers zu erstellen. Mit einer Länge von knapp 15 Minuten finde ich den Output schon sehr üppig, was mir in diesem Zusammenhang richtig gut gefällt. 1-2 Minuten wären zu wenig, um diese Thematik vernünftig zu diskutieren.

Nach wenigen Miunten kann das Audio dann in NotebookLM abgespielt werden

Im oberen Screenshot aus NotebookLM ist sichtbar, wie User nun einfach den Play-Button klicken können, um ihren ganz eigenen und einzigartigen Podcast abspielen zu können. Es gab via Audio Overview keine Möglichkeiten, den Output mittels Prompteingabe zu steuern, sondern ausschließlich diesen einen Button-Klick, womit Google wohl auch schädliche Outputs vermeiden möchte, denn Forschungspapiere ließen sich dann auch “zerreißen”, falls Nutzer potenziell alles generieren könnten. 

PDF, Slides, URL und kopierter Text als Input möglich

Übrigens, neben dem Upload von PDFs oder Slides ist ebenfalls ist simple Einfügen einer Website-URL oder eines kopierten Textes möglich. Es bieten sich also vielfältige Möglichkeiten der Nutzung, um KI-generierte Diskussionen zu erzeugen und etwa entspannt in Bus & Bahn auf dem Weg zur Arbeit und auch wieder zurück anzuhören.

Ein Beitrag erstellt von

Ähnliche Beiträge