Wie du Live-Untertitel zu jedem Video in Chrome hinzufügst (Kostenloses KI-Tool)
Füge Echtzeit-Untertitel zu jedem Video in Chrome hinzu — YouTube, Netflix, Twitch oder jede Website. Vergleiche Chromes eingebaute Untertitel mit KI-gestützten Alternativen.
Ob du eine fremdsprachige Vorlesung schaust, in einer lauten Umgebung mithörst oder Hörprobleme hast — Live-Untertitel transformieren das Video-Erlebnis. Aber Chromes eingebaute Untertitel-Funktion hat erhebliche Einschränkungen, die die meisten Nutzer auf die harte Tour entdecken.
Dieser Leitfaden behandelt jeden Weg, Echtzeit-Untertitel zu jedem Video in Chrome hinzuzufügen — von der kostenlosen eingebauten Option bis zu KI-gestützten Tools, die mehrere Sprachen beherrschen, und erklärt, wann welcher Ansatz am besten funktioniert.
Chromes eingebaute Live-Untertitel-Funktion
Chrome liefert seit Version 89 (2021) eine native Live-Untertitel-Funktion. Sie nutzt ein On-Device-Spracherkennungsmodell, um englisches Audio in Echtzeit zu transkribieren.
So aktivierst du sie
- Öffne die Chrome-Einstellungen (chrome://settings)
- Klicke auf Bedienungshilfen in der linken Seitenleiste
- Schalte Live-Untertitel ein
- Chrome lädt ein kleines Spracherkennungsmodell herunter (ca. 100 MB)
- Eine Untertitelleiste erscheint unten in jedem Tab, der Audio abspielt
Was sie gut macht
- Datenschutz: Die gesamte Verarbeitung findet auf dem Gerät statt. Kein Audio wird an Googles Server gesendet.
- Funktioniert auf jeder Website: Wenn Audio im Tab läuft, wird es untertitelt. YouTube, Netflix, Twitch, zufällige eingebettete Videos — alles funktioniert.
- Null Kosten: Komplett kostenlos, keine Erweiterung nötig.
- Niedrige Latenz: Untertitel erscheinen innerhalb von 500 ms-1 s nach dem Sprechen.
Wo sie Schwächen zeigt
Chromes Live-Untertitel haben mehrere Einschränkungen, die schnell offensichtlich werden:
Nur Englisch (auf den meisten Plattformen). Während Google auf ChromeOS und Android ein paar zusätzliche Sprachen hinzugefügt hat, unterstützt die Desktop-Chrome-Version primär Englisch. Wenn du eine deutsche Vorlesung, einen spanischen Podcast oder einen japanischen Stream schaust, gibt Chrome Live-Untertitel nichts Brauchbares aus — es versucht, fremdsprachige Sprache als Englisch zu transkribieren und produziert Kauderwelsch.
Keine Interpunktion oder Formatierung. Die Ausgabe ist ein kontinuierlicher Strom von Kleinbuchstaben mit minimaler Interpunktion. Lange Sätze laufen zusammen, was es schwer macht, komplexen Inhalten wie akademischen Vorlesungen oder technischen Präsentationen zu folgen.
Keine Export- oder Speicheroption. Du kannst die Untertitel nicht als SRT- oder VTT-Datei speichern. Der Text erscheint in einer schwebenden Leiste und verschwindet. Wenn du ein Transkript für Notizen, Lernen oder Barrierefreiheits-Compliance brauchst, hilft Chrome Live-Untertitel nicht.
Keine Sprecheridentifikation. Bei Inhalten mit mehreren Sprechern — Interviews, Podiumsdiskussionen, Podcasts — erscheint alle Sprache als einzelner, undifferenzierter Strom. Es gibt keinen Hinweis, wer spricht.
Genauigkeit sinkt bei Akzenten und Hintergrundgeräuschen. Das Modell kommt mit Standard-Amerikanischem-Englisch gut zurecht, kämpft aber mit starken Akzenten, schneller Sprache, überlappenden Sprechern und Hintergrundmusik.
KI-gestützte Live-Untertitel mit Hearably
Hearablys Live-Untertitel-Funktion verfolgt einen anderen Ansatz, indem ein viel größeres KI-Modell direkt in deinem Browser läuft.
Wie es funktioniert
Hearably verwendet ein 4-Milliarden-Parameter-Spracherkennungsmodell (basierend auf Voxtral Mini), das komplett clientseitig über WebGPU läuft. Das Modell ist deutlich leistungsfähiger als Chromes eingebaute Spracherkennung:
- 150 Millionen Parameter (Chrome) vs. 4 Milliarden Parameter (Hearably) — ungefähr 26x größer
- 13 unterstützte Sprachen: Englisch, Deutsch, Französisch, Spanisch, Russisch, Chinesisch, Japanisch, Italienisch, Portugiesisch, Niederländisch, Arabisch, Hindi, Koreanisch
- Korrekte Interpunktion und Großschreibung durch das Sprachverständnis des Modells
- Bessere Akzentbehandlung durch breitere Trainingsdaten
Das Modell wird einmal heruntergeladen (ca. 2,5 GB über mehrere Shards) und im Browser gecacht. Nach dem initialen Download funktionieren Untertitel offline ohne Serverabhängigkeit.
Feature-Vergleich
| Feature | Chrome Live-Untertitel | Hearably KI-Untertitel |
|---|---|---|
| Sprachen | Englisch (Desktop) | 13 Sprachen |
| Modellgröße | ~100 MB | ~2,5 GB (gecacht) |
| Interpunktion | Minimal | Volle Interpunktion + Großschreibung |
| Genauigkeit (Englisch) | Gut (Standardakzente) | Sehr gut (alle Akzente) |
| Genauigkeit (andere Sprachen) | Nicht unterstützt | Gut bis sehr gut |
| Export als SRT/VTT | Nein | Ja |
| Sprecheridentifikation | Nein | Geplant |
| Funktioniert offline (nach Download) | Ja | Ja |
| Datenschutz | On-Device | On-Device |
| Systemanforderungen | Jeder Chrome 89+ | Chrome 113+ mit WebGPU |
| Kosten | Kostenlos | Kostenlos (Beta) |
Systemanforderungen für KI-Untertitel
Die KI-Untertitel-Engine nutzt WebGPU für die Inferenz, was erfordert:
- Chrome 113 oder neuer (oder Edge 113+)
- Eine GPU mit mindestens 4 GB VRAM (die meisten modernen Laptops erfüllen das)
- macOS 12.3+, Windows 10+ oder ChromeOS 113+
- Der initiale Modell-Download von ca. 2,5 GB (nach dem ersten Mal gecacht)
Auf einem Apple M1 oder neueren MacBook läuft das Modell mit ca. 1-2 Sekunden Latenz. Auf einem modernen Windows-Laptop mit dedizierter GPU ist die Leistung ähnlich. Integrierte Grafik auf älteren Maschinen kann höhere Latenz (3-5 Sekunden) erfahren.
Anwendungsfall: Fremdsprachige Inhalte
Eine der wertvollsten Anwendungen von KI-gestützten Untertiteln ist das Schauen von Inhalten in einer Sprache, die du lernst oder gar nicht sprichst. Chrome Live-Untertitel helfen hier nicht, aber mehrsprachige KI-Untertitel eröffnen komplett neue Inhalte.
Szenario: Eine deutsche Universitätsvorlesung schauen
- Aktiviere Hearablys Live-Untertitel
- Wähle Deutsch als Quellsprache
- Das KI-Modell transkribiert die deutsche Sprache mit korrekter deutscher Interpunktion und Rechtschreibung
- Optional: Aktiviere Übersetzung für englische Untertitel (Übersetzungsfunktion in Entwicklung)
Das funktioniert auf jeder Website — nicht nur auf Plattformen mit eingebauter Untertitel-Unterstützung. Eine live gestreamte deutsche Konferenz auf einer Uni-Website, ein französischer Podcast, der in einem Blog eingebettet ist, ein japanisches VOD auf einer Nischenplattform — alle bekommen genaue Untertitel.
Szenario: Akzentiertem Englisch folgen
Viele Nutzer aktivieren Untertitel nicht, weil sie die Sprache nicht verstehen, sondern weil akzentierte Sprache in Echtzeit schwerer zu verarbeiten ist, besonders in lauten Umgebungen. Das größere KI-Modell kommt mit indischem Englisch, schottischem Englisch, nigerianischem Englisch und anderen akzentierten Varianten deutlich besser zurecht als Chromes kleineres Modell, weil es auf einem vielfältigeren Datensatz trainiert wurde.
Anwendungsfall: Barrierefreiheit und Hörprobleme
Für Nutzer, die taub oder schwerhörig sind, beeinflusst die Untertitelqualität direkt das Verständnis. Die Unterschiede zwischen einfachen und KI-gestützten Untertiteln sind erheblich:
Interpunktion beeinflusst die Bedeutung. „Lass uns Oma essen” vs. „Lass uns, Oma, essen.” Chromes einfache Untertitel lassen häufig Kommas, Punkte und Fragezeichen weg, was den Leser zwingt, Satzgrenzen aus dem Kontext abzuleiten. KI-Untertitel liefern volle Interpunktion.
Großschreibung signalisiert Eigennamen. Spricht der Sprecher über „apple” (die Frucht) oder „Apple” (das Unternehmen)? Ohne Großschreibung ist Kontext der einzige Hinweis. KI-Untertitel schreiben korrekt groß.
Wortgenauigkeit ist nicht optional. Für jemanden, der das Originalaudio gar nicht hören kann, ist ein falsch erkanntes Wort kein kleines Ärgernis — es ist fehlende Information. Die höhere Genauigkeit eines größeren Modells übersetzt sich direkt in besseres Verständnis.
Anwendungsfall: Notizen machen und Lernen
Studenten, die aufgezeichnete Vorlesungen schauen, profitieren enorm von Live-Untertiteln, die sie exportieren können. Hearablys Auto-Untertitel-Generator erstellt SRT- oder VTT-Dateien aus jedem Video, die dann:
- In Notiz-Apps neben Zeitstempeln importiert werden können
- Nach bestimmten Begriffen durchsucht werden können, die in der Vorlesung erwähnt wurden
- Zum Erstellen von Lernleitfäden aus dem Transkripttext verwendet werden können
- Mit Kommilitonen geteilt werden können, die die Vorlesung verpasst haben
Die Fähigkeit, Untertitel zu exportieren, verwandelt ein passives Seherlebnis in ein durchsuchbares Textdokument.
Wie du die beste Untertitelgenauigkeit bekommst
Unabhängig davon, welches Untertitel-Tool du verwendest, verbessern diese Tipps die Genauigkeit:
Verwende wenn möglich Kopfhörer
Wenn du Audio über Lautsprecher abspielst, werden Raumecho und Umgebungsgeräusche zurück in den Audio-Stream gemischt. Kopfhörer eliminieren diese Rückkopplungsschleife und geben dem Untertitel-Modell ein saubereres Eingangssignal.
Aktiviere Rauschunterdrückung
Hearablys Lautstärkeverstärker enthält eine Rauschunterdrückungsfunktion, die den Audio-Stream bereinigt, bevor er das Untertitel-Modell erreicht. Hintergrundgeräusche zu reduzieren verbessert die Wortfehlerrate um 15-30 % bei verrauschten Inhalten.
Wähle die richtige Quellsprache
Wenn du die gesprochene Sprache kennst, verbessert die explizite Auswahl (statt auf Auto-Erkennung zu vertrauen) die Genauigkeit. Automatische Spracherkennung funktioniert für die meisten Inhalte, kann aber in den ersten Sekunden zwischen ähnlichen Sprachen (Spanisch/Portugiesisch, Niederländisch/Deutsch) schwanken.
Vermeide extremes Lautstärke-Boosting beim Untertiteln
Während Hearablys Lautstärkeverstärker und KI-Untertitel gleichzeitig funktionieren, kann Boosting über 400 % Kompressionsartefakte einführen, die die Transkriptionsgenauigkeit leicht verschlechtern. Für Untertitel-Zwecke produziert ein moderater Boost (100-200 %) mit EQ-Anpassungen bessere Ergebnisse als extreme Verstärkung.
Beginne, jedes Video in Chrome zu untertiteln
Chromes eingebaute Live-Untertitel sind ein guter Startpunkt für rein englische Inhalte. Für mehrsprachige Unterstützung, bessere Genauigkeit, korrekte Formatierung und exportierbare Transkripte sind KI-gestützte Untertitel der nächste Schritt.
Installiere Hearably aus dem Chrome Web Store und aktiviere KI-Untertitel für jedes Video. Das Modell lädt einmal im Hintergrund herunter, während du weiter surfst, und Untertitel sind von da an auf jeder Seite verfügbar — keine seitenspezifische Konfiguration, keine Abos bei einzelnen Plattformen, keine Abhängigkeit davon, dass Content-Creator Untertitel hinzufügen.
Jedes Video. Jede Sprache. Jedes Wort.
Hearably kostenlos testen
Lautstärke-Boost, Live-Untertitel, Rauschunterdrückung und mehr — direkt im Browser.
Zu Chrome hinzufügen — Kostenlos