Transkription in 99 Sprachen — mit echtem DACH-Fokus
Auto-Detect, Code-Switching mitten im Satz und Dialekt-Erkennung — alles auf einer Engine.
3 Transkriptionen gratis · keine Kreditkarte · Daten in Deutschland
99+ Sprachen · Auto-Detect
DeepScript nutzt eine Whisper-kompatible Engine und unterstützt 99 Sprachen — von Deutsch und Englisch über Französisch, Italienisch, Niederländisch, Spanisch, Polnisch, Portugiesisch, Russisch, Mandarin, Japanisch, Koreanisch, Arabisch, Hebräisch und Hindi bis zu Swahili, Norwegisch, Schwedisch, Finnisch, Griechisch, Türkisch und Tschechisch. Auto-Detect erkennt die Sprache typischerweise in den ersten 5–10 Sekunden Audio. Wer mehrsprachige Meetings führt — etwa ein deutsch-englisches Geschäftsgespräch — bekommt Code-Switching mitten im Satz korrekt transkribiert. DACH-Sprachen profitieren zusätzlich von unserer Spezial-Feinjustierung; kleinere Sprachen liegen näher am generischen Whisper-Niveau.
Belege
Woran wir das festmachen
99 Sprachen via Whisper-Basis
Vollständige Whisper-Sprach-Abdeckung. Genauigkeit pro Sprache hängt vom Trainings-Anteil ab — die großen Sprachen sind exzellent, exotische gut.
Auto-Detect in 5–10 Sekunden
Du musst die Sprache nicht angeben. Das Modell hört kurz rein und entscheidet — bei mehrsprachigen Aufnahmen auch mehrmals.
Code-Switching nativ
„Lass uns das im Q3-Review aligned bekommen, ja?“ — Mischsätze deutsch-englisch werden korrekt transkribiert, ohne Sprachwechsel-Glitches.
DACH-Dialekte feinjustiert
Schwiizerdütsch, Bairisch, Wienerisch, Plattdeutsch — wo generisches Whisper stolpert, fängt unser Premium-Modell weiter.
In der Praxis
Was das konkret heißt
Auto-Detect, Code-Switching mitten im Satz und Dialekt-Erkennung — alles auf einer Engine.
- Top-Tier-Qualität (≤ 5 % WER bei klaren Aufnahmen) für Deutsch, Englisch, Spanisch, Französisch und Italienisch.
- Solide Qualität für Niederländisch, Portugiesisch, Polnisch, Russisch, Mandarin, Japanisch und Arabisch.
- Kleinere Sprachen (Hindi, Swahili, Tamilisch, Walisisch …) sind verfügbar, WER kann je nach Audio-Qualität deutlich höher liegen.
- Erkannte Sprache wird in der Transkription gespeichert (`detectedLanguage`), du kannst sie nachträglich überschreiben.
- Übersetzung ist nicht mehr direkt eingebaut — wer aus dem Transkript eine andere Sprache braucht, nutzt MCP mit einem AI-Client (Claude, ChatGPT).
99+ Sprachen · Auto-Detect
So nutzt du es
In wenigen Schritten startklar
- 1
1. Sprache wählen oder Auto-Detect
Im Upload-Formular: Dropdown mit 99 Sprachen plus „Automatisch erkennen“ als Standard. Wenn du es weißt, ist explizites Setzen minimal genauer.
- 2
2. Hochladen — Auto-Detect läuft beim Start
Die Engine hört die ersten Sekunden ab und legt fest, welcher Decoder läuft. Bei mehrsprachigen Aufnahmen wechselt sie nahtlos.
- 3
3. Erkannte Sprache prüfen
Im Ergebnis-Header steht die erkannte Sprache. Wenn falsch — du sprichst z. B. Schweizer Mundart, das Modell tippt auf Deutsch — kannst du neu transkribieren mit expliziter Sprachwahl.
- 4
4. Exportieren oder weiterverarbeiten
Originalsprache → TXT/SRT/VTT/JSON. Für Übersetzung in andere Sprachen: Transkript an deinen AI-Client (Claude, ChatGPT) übergeben — via MCP oder Copy & Paste.
FAQ
Häufige Fragen
Welche Sprachen sind genau unterstützt?+
Die vollständige Liste der 99 Sprachen findest du unter `GET /v1/languages` in der API. Die wichtigsten: Deutsch, Englisch, Französisch, Italienisch, Niederländisch, Spanisch, Polnisch, Portugiesisch, Russisch, Mandarin, Japanisch, Koreanisch, Arabisch, Türkisch, Hindi, Schwedisch, Norwegisch, Finnisch, Griechisch, Tschechisch und viele mehr.
Wie genau ist Hindi oder Arabisch im Vergleich zu Deutsch?+
Auf klaren Aufnahmen liegen Hindi und Arabisch typischerweise bei 8–12 % WER, Deutsch bei 3–5 % (Premium) bzw. 5–8 % (Standard). Der Unterschied stammt daher, dass Whisper-Basis-Training mehr Stunden europäischer Sprachen enthielt. Trotzdem brauchbar für Notizen, Vorbereitung und maschinelle Weiterverarbeitung.
Auto-Detect — wie schnell ist das?+
Die Sprachidentifikation läuft in den ersten 5–10 Sekunden Audio. Du merkst keine spürbare Verzögerung — der Gesamtprozess (Upload → Transkription) startet sofort nach dem Upload.
Code-Switching — geht das wirklich?+
Ja, vor allem für die häufigsten Sprach-Paare (Deutsch ↔ Englisch, Spanisch ↔ Englisch). Bei „Lass uns das ASAP bouncen“ erkennt das Modell beide Sprachen und transkribiert sie nativ. Exotische Mixe (Mandarin ↔ Französisch) sind möglich, aber weniger zuverlässig.
Kann ich das Transkript automatisch übersetzen lassen?+
Nicht direkt von uns — wir haben die Server-seitigen AI-Endpoints (Summarize, Translate) im Mai 2026 entfernt. Stattdessen reichst du das Transkript an deinen AI-Client durch (Claude, ChatGPT, …) — am elegantesten über MCP, sodass der Client direkt auf deine Transkriptionen zugreift.
Überzeug dich selbst
Lade eine Datei hoch und sieh das Ergebnis in Minuten. Drei Transkriptionen kostenlos, ohne Kreditkarte.