Wie füge ich Zeitstempel zu einem Transkript hinzu?
Kurzantwort
Moderne KI-Transkription liefert Zeitstempel pro Wort automatisch mit; für Lesefluss reichen Marker alle 30-60 Sekunden oder bei Sprecherwechsel.
Zeitstempel sind kleine Anker, die jeden Textabschnitt mit der genauen Zeit in der Audiodatei verknüpfen. Sie machen Transkripte navigierbar — du kannst zu jeder Stelle springen, ein Zitat im Originalton überprüfen oder Untertitel exakt timen.
Welche Tiefe brauchst du?
1. Wort-Zeitstempel (jedes Wort einzeln). Format wie `[00:01:23.450] Hallo`. Notwendig für Untertitel, Voice-Editor, Karaoke-Style Highlighting. Generiert von KI-Modellen automatisch — bei DeepScript steht das pro Wort im JSON-Export.
2. Satz- oder Phrasen-Zeitstempel. Format wie `[00:01:23] Hallo, willkommen zur Sendung.` Sinnvoll für Caption-Erstellung (SRT/VTT) und für interaktive Player, in denen man auf Sätze klicken kann.
3. Block-Zeitstempel (alle 30-60 Sekunden). Format wie `[00:01:00] (Themenwechsel) Jetzt sprechen wir über …`. Üblich in qualitativer Forschung und Journalismus — gut für menschliche Leser, ohne dass das Transkript überladen wirkt.
4. Sprecherwechsel-Zeitstempel. Format wie `[00:01:23] Interviewer: …` und `[00:01:35] Maria: …`. Sinnvoll für Interviews mit klarer Wechsel-Struktur.
Format-Konventionen - HH:MM:SS (Stunden:Minuten:Sekunden) ist Standard. Bei kurzen Aufnahmen reicht MM:SS. - Trennzeichen: Doppelpunkt zwischen Einheiten, Punkt oder Komma vor Millisekunden (SRT nutzt Komma, VTT nutzt Punkt — das verwechseln viele Tools). - Klammer-Format `[00:01:23]` für Reintext; `00:00:01,500 --> 00:00:05,000` für SRT.
Automatisch generieren
Manuell Zeitstempel zu setzen ist Knochenarbeit — vergiss es. Jedes moderne Transkriptions-Tool liefert sie mit. Bei DeepScript: - TXT-Export: Block-Zeitstempel alle 30 Sekunden - SRT/VTT-Export: Satz-Zeitstempel mit Start/Ende - JSON-Export: Wort-Zeitstempel mit `start`, `end`, `confidence` pro Wort
Nachbearbeitung KI-Zeitstempel sind in ±200ms genau. Bei Untertiteln für TV/Streaming wird oft ±50ms verlangt — dafür gibt es Tools wie Aegisub oder Subtitle Edit, mit denen du final justieren kannst. Für Forschung und Journalismus reicht die KI-Genauigkeit unverändert.
Tipp Für Interviews ist die beste Lösung: Block-Zeitstempel im sichtbaren Transkript + parallel ein JSON mit Wort-Stempeln, falls du später feiner navigieren musst.
Verwandte Fragen
Frage offen geblieben?
Drei Transkriptionen kostenlos zum Ausprobieren. Oder schreib uns eine Mail — wir antworten innerhalb von 24 Stunden, auch zu Compliance-Fragen.