Question 1

¿DeepScript usa Whisper internamente?

Accepted Answer

Partes de nuestro motor se basan en modelos derivados de Whisper, con nuestros propios ajustes finos para dialectos DACH y una canalización de diarización interna. Whisper es un buen bloque de construcción, pero nosotros entregamos todo el stack de producción a su alrededor.

Question 2

¿Por qué no alojar Whisper uno mismo y obtener el cumplimiento de la UE?

Accepted Answer

Es posible – pero cuesta: infraestructura GPU (al menos una A10 o L40S), capa de servicio de inferencia (vLLM, Triton, Faster-Whisper), canalización de diarización (pyannote o similar), gestión de vocabulario, almacenamiento, conversión de formatos de audio, cola de trabajos, monitorización, auditorías de cumplimiento. El coste efectivo por hora llega rápido a 1-3 € – antes de la inversión. DeepScript lo entrega todo listo por 0,18 €.

Question 3

¿Whisper es más preciso que DeepScript Premium?

Accepted Answer

En audio en inglés: comparable (Whisper Large-v3 y nuestros modelos Premium superan ambos el 95 % de WER). En dialectos DACH: no, ahí Whisper es claramente peor porque su conjunto de entrenamiento está dominado por el inglés estadounidense. DeepScript Premium está entrenado específicamente en alemán suizo, austriaco y bajo alemán.

Question 4

¿Qué pasa con un audio de 3 hablantes si uso la API de Whisper?

Accepted Answer

La API de Whisper devuelve un único flujo de texto sin etiquetas de hablante. Tendrías que diarizar tú mismo después (pyannote, NeMo, etc.) y fusionar las salidas – un desarrollo nada trivial. DeepScript lo hace en una sola llamada y te devuelve enunciados con IDs de hablante + marcas de tiempo.

Dimensión	DeepScript	OpenAI Whisper API
Precio por hora	0,18 €	aprox. 0,36 $ (≈ 0,33 €)
Separación de hablantes	Incluida	No ofrecida
Ubicación de los datos	Núremberg, DE	Infraestructura de OpenAI en EE. UU.
Política de retención para empresas	30 días (Pro: permanente)	Registros de 30 días, por lo demás sin definir
Dialectos DACH	Optimizado (CH/AT/DE)	Alemán estándar
Custom Vocabulary	Por transcripción o guardado	Pista de prompt (limitada)
Transcripción en directo	Streaming por WebSocket	API Realtime (producto aparte)
Webhooks	Sí, firmados con HMAC	No (sondeo)
Editor web	Sí, con sincronización de audio	No ofrecido
DPA RGPD (UE-UE)	Sí, firmable en línea	CCT / DPA con OpenAI Inc.

DeepScript vs OpenAI Whisper API – stack de producción vs. motor en bruto

Elige DeepScript si ...

Elige OpenAI Whisper API si ...

Preguntas frecuentes

¿Prefieres probarlo tú mismo?