ElevenLabs: Ein Must-Have-Tool für die Bildung

Gastbeitrag von Christine Stoltz

Vorbei sind die Zeiten, wo für ein Erklärvideo aufwendiges Equipment nötig war oder ein Text gar mehrmals eingesprochen werden musste. ElevenLabs bietet fortschrittliche Text-to-Speech  und KI-Sprachtechnologien an, welche in der Bildung vielfältig eingesetzt werden können.

Die Möglichkeiten von ElevenLabs im Überblick

ElevenLabs ist ein führendes Unternehmen im Bereich der KI-Sprachgenerierung. Mit der kostenlosen Version bieten sich folgende Funktionen für verschiedene Anwendungsbereiche:

  • Text-to-Speech (TTS): Konvertiert Texte in 29 natürliche und realistische Sprachen
  • AI-Dubbing: Übersetzt Videos in über 25 Sprachen
  • AI-Soundeffekte:  Soundeffekte für Audio- und Videoprojekte
  • Voice-Isolator: Entfernt Hintergrundgeräusche von Audios

Pro Monat lassen sich damit ca. 10 min. Audio generieren. Mit einem bezahlten Starterprogramm für 5 Dollar pro Monat lassen sich 30 min. Audio pro Monat generieren und es gibt zusätzlich dieses Feature:

  • KI-Voice Cloning: Möglichkeit, die eigene Stimme zu klonen

In meinem Beitrag stelle ich dir die verschiedenen Anwendungen vor.

Text-to-Speech (TTS)

Die Funktion ermöglicht es, Texte schnell und effizient in Sprache umzuwandeln, wodurch lange Aufnahmen überflüssig werden.

Die Qualität der Sprachwiedergabe  bleibt konstant und die Stimmen klingen sehr natürlich. Die Audios können heruntergeladen und in verschiedene Plattformen und Anwendungen integriert werden, um Inhalte wie Videos, E-Learning-Module und Präsentationen zu vertonen.

TTS kann Menschen mit Sehbeeinträchtigungen oder Leseschwierigkeiten den Zugang zu schriftlichen Inhalten erleichtern.

AI Dubbing

Videodateien können direkt hochgeladen oder YouTube-Videos mit einem Link automatisch in über 25 verschiedene Sprachen übersetzt und synchronisiert werden. Dabei bleibt die Qualität und Intonation der Synchronisation konsistent über alle Sprachen hinweg.

Quelle: Megabauten (YouTube): Ausschnitt aus dem Originalvideo auf Deutsch

Quelle: Megabauten (YouTube) : Ausschnitt “Dubbed”mit ElevenLabs auf Englisch

ElevenLabs AI Dubbing kann genutzt werden, um Lernmaterialien unabhängig von der Ausgangssprache in jeder gewünschten Sprache bereitzustellen.

Das gezeigte Originalvideo auf Deutsch wurde so auf Englisch übersetzt. Dabei gilt es natürlich, die Datenrechte zu beachten. Obwohl die Dubbing-Funktion bereits erstaunlich gut funktioniert, steht auch dieses KI-Videofeature noch in den Kinderschuhen und es kann gelegentlich zu Verzögerungen im Audio kommen. Mein Tipp: ausprobieren!

Voice-Isolator

Der Voice-Isolator von ElevenLabs wurde speziell entwickelt, um Hintergrundgeräusche zu eliminieren und so die Stimme des Sprechers oder der Sprecherin hervorzuheben.
So können Lehrende qualitativ gute Audioinhalte erstellen, ohne auf eine absolut ruhige Umgebung angewiesen zu sein.

Quelle: Loi sur l’intelligence artificielle de l’UE 

In meinem selbst erstellten Testvideo habe ich einen Sprach-Beitrag mit störenden Zirkaden-Geräuschen (lautes Zirpen) im Hintergrund aufgenommen und das Audio (1 Tonspur) bei ElevenLabs hochgeladen. Die Zirkaden-Geräusche wurden KI-gestützt perfekt herausgefiltert.

Instant Voice Cloning

ElevenLabs bietet fortschrittliche Technologien im Bereich des KI-basierten Voice Clonings an, die es ermöglichen, Stimmen mit hoher Genauigkeit synthetisch zu replizieren.

Eleven Labs Voice Generator

Quelle: ElevenLabs.io

Nachdem ich einen beliebigen Text auf Hochdeutsch selbst laut vorgelesen und aufgenommen habe, steht mir nun mein eigener Voice Clone zur Verfügung. Tonhöhe, Tonfall und Intonation werden dabei identifiziert und es wird eine KI generierte Stimme erstellt (wobei die Funktion entgegen der Hersteller-Angabe, auch Akzente zu erkennen, bisher meinen Schweizer Akzent merklich abschwächt).

Hier die hochdeutsche Version:

Hier ein mit meinem Voice Clone generiertes Audio in englischer Sprache:

Und hier auf Französisch:

Wann immer ich ein Audio in guter Qualität brauche, steht mir nun mein Voice Clone zur Verfügung, ohne dass ich den gesprochenen Text in meiner Muttersprache oder in einer Fremdsprache üben und mehrmals einspielen muss: schriftlichen Text einfügen und das Audio wird mit meiner Stimme in einer der 25 zur Verfügung stehenden Sprachen generiert.

Einsatzmöglichkeiten in der Lehre

ElevenLabs bietet zahlreiche Anwendungsmöglichkeiten für den Lehr- und Lernprozess:

  1. Individuelle Lernunterstützung: Mit der Text-to-Speech-Technologie können Lehrende Lernmaterialien zusätzlich in Audioform bereitstellen. Im Multimodalitäts-Prinzip beschreibt Mayer (2001), dass ein gesprochener Text zur Verständigung eines Bildes wirksamer ist.
  2. Multilinguale Vorlesungen: Mit der AI-Dubbing-Funktion können Vorlesungen und Lehrmaterialien in verschiedene Sprachen übersetzt werden. Dies ist besonders nützlich für internationale Studierende und fördert die Inklusion und das Verständnis.
  3. Konsistente und zeitsparende Inhalte: Durch das Klonen der eigenen Stimme können Lehrende ihre Präsenz in digitalem Lernmaterial verstärken, ohne jedes Mal neu aufnehmen zu müssen. Dies spart Zeit und stellt sicher, dass die Inhalte immer dieselbe Qualität und Vertrautheit aufweisen.
  4. Interaktive Lernumgebungen: Die realistischen Sprachausgaben von ElevenLabs können in interaktive Lernplattformen integriert werden, um dynamischere und ansprechendere Lernumgebungen zu schaffen. Dies kann beispielsweise bei der Erstellung von Quizfragen oder interaktiven Videos helfen.

Preview

Die ElevenLabs Reader-App, welche schriftliche Texte in Vorleseaudios verwandelt, ist in der englischen Version in den USA, in Kanada und in Großbritannien bereits erhältlich und wird nächstens bei uns in verschiedenen Sprachen auch zur Verfügung stehen.

Ich durfte die App in einer Betaversion in den letzten Wochen testen und befand die Reader-App sehr nützlich, um meine schriftlichen Texte als Audio zu hören. Texte können hineinkopiert werden, ein Dokument kann hochgeladen werden oder einen Link kann eingefügt werden. Danach wählt man eine Stimme aus und dann wird einem der Text als “Reader” vorgelesen.

Quelle: Wikipedia 

Zur Autorin

Christine Stoltz bietet Referate, Schulungen und Beratungen zu Künstlicher Intelligenz, digitalen Lernumgebungen, digitalen Tools und kompetenzorientiertem Lehren und Lernen in der Bildung. Sie ist Gastreferentin an der Pädagogischen Hochschule Zug für “KI in der Bildung”. Sie unterrichtet Teilzeit als Primarlehrerin in der 5. & 6. Klasse in Baar/ Schweiz.

Christine Stoltz ist Mitglied des “Think Tank KI und Schule” des VK:KIWA, Virtuelles Kompetenzzentrum: Künstliche Intelligenz und wissenschaftliches Arbeiten. Zudem ist sie in verschiedenen Fokusgruppen zu KI in der Bildung beratend tätig.

Christine Stoltz

Ähnliche Beiträge