DeepScript

Use Case

Video Untertitel — automatisch generiert in SRT, VTT und YouTube-Format

MP4, MOV, MKV hochladen — fertige Untertitel in 99+ Sprachen, ab 0,18 €/Stunde Video.

Untertitel verdoppeln die Reichweite jedes Videos: Stumm-Konsum auf LinkedIn/Instagram, Barrierefreiheit, SEO-Indexierung des gesprochenen Inhalts. DeepScript akzeptiert MP4, MOV, MKV, WebM direkt und liefert SRT + VTT mit wort-genauen Timestamps — die kannst du in YouTube hochladen oder in deinem Video-Editor importieren.

Empfohlene Konfiguration

Modell
Standard (0,18 €/Stunde)
Sprache
Sprache der Sprecher setzen, oder Auto-Detect bei mehrsprachigen Videos.
Export
SRT (gängigster Standard, von allen NLEs gelesen), VTT (HTML5/YouTube nativ), JSON wenn du Wort-Highlighting in deinem Player brauchst.

So funktioniert's

  1. 1

    Video hochladen

    MP4, MOV, MKV, WebM bis 5 GB. Wir extrahieren den Audio-Track automatisch, das Video selbst wird nicht modifiziert oder gespeichert.

  2. 2

    Sprache setzen oder Auto-Detect

    Mehrsprachige Videos: Auto-Detect rechnet Segment-weise und liefert ein Misch-Transkript.

  3. 3

    SRT/VTT herunterladen

    Sofort hochladen zu YouTube (Untertitel-Tab) oder in dein NLE (Adobe Premiere, DaVinci Resolve, Final Cut) importieren.

Konkretes Beispiel

Beispiel: 12-Minuten LinkedIn-Erklärvideo, DE, Standard-Modell. Kosten: 0,04 € (Mindestbetrag 0,01 € — hier nur 12 Min). Bearbeitungszeit: ~45 Sek. Output: 80 Untertitel-Cues in SRT + VTT, wort-genau getimt.

Häufige Fragen

Welche Video-Formate werden unterstützt?

MP4, MOV, MKV, WebM, AVI. Wir extrahieren den Audio-Track per ffmpeg — alles was ffmpeg lesen kann geht.

Kann ich die Untertitel-Cue-Länge konfigurieren?

Standard sind 2-7 Sekunden pro Cue (gängige Lesegeschwindigkeit). Wenn du engere oder weitere Grenzen brauchst, kannst du das JSON-Output nehmen und mit deinem eigenen Tool re-segmentieren.

Kann ich Untertitel automatisch übersetzen lassen?

Wir bieten keine eigene Übersetzungs-API mehr — stattdessen exponieren wir einen MCP-Endpoint, sodass Claude oder ChatGPT direkt auf dem Transkript übersetzen können (deutlich besser als generische MT-Services). Alternativ: DeepL/Google nach Export.

Wie wirken sich Hintergrundgeräusche aus?

Premium-Modell hat besseres Denoising. Bei sehr lauten Hintergrundgeräuschen (Musik, Crowd Noise) empfehlen wir ein kurzes Preprocessing in Audacity oder iZotope RX vor dem Upload — verbessert die Genauigkeit deutlich.

Direkt ausprobieren?

Drei Transkriptionen kostenlos, ohne Kreditkarte. Daten bleiben in Deutschland. Drei Minuten von Sign-up bis fertigem Transkript.

Video Untertitel automatisch erstellen — SRT, VTT, YouTube-kompatibel | DeepScript