Transcribir Audio a Texto Gratis — Las 4 Opciones Realmente Gratis en 2026
Comparamos honestamente las 4 categorías de transcripción gratuita en 2026: Whisper local (gratis para siempre, técnico), funciones nativas (WhatsApp, Google Docs, YouTube), pruebas sin tarjeta de crédito (VexaScribe, HappyScribe), y pruebas con tarjeta o anuncios (TurboScribe, etc.). Te decimos qué te da realmente cada una.
Formatos compatibles:
En resumen
Hay cuatro categorías de transcripción «gratis» en 2026: (1) Whisper instalado localmente (gratis para siempre, sin límites, requiere Python y conocimientos técnicos); (2) funciones nativas (Google Docs dictado, WhatsApp nativo, marcas de YouTube — gratis pero limitadas); (3) pruebas gratuitas sin tarjeta (VexaScribe 30 min, HappyScribe 90 min); (4) pruebas con tarjeta o anuncios (TurboScribe, Otter Free). Elige según necesites volumen, calidad o exportación.
Las 4 categorías de «gratis» comparadas
Una vista rápida para elegir según tu volumen, tu nivel técnico y lo que necesites exportar.
| Categoría | Coste real | Volumen | Calidad | Exportar | Para quién |
|---|---|---|---|---|---|
| Whisper local | 100% gratis sin límite | Ilimitado | 92-97% | Sí (todos los formatos) | Usuarios técnicos con archivos confidenciales |
| Funciones nativas | Gratis | Limitado por plataforma | Media (70-85%) | Generalmente no | Casos puntuales, uso doméstico |
| Pruebas sin tarjeta | 30-90 min gratis, después de pago | 30-90 min total | 92-97% | Sí (DOCX/SRT/PDF/TXT) | Probar la herramienta sin compromiso |
| Pruebas con tarjeta o anuncios | «Gratis» pero limitado | 90 min — 3 archivos/día | Variable | Generalmente sí | Volumen ocasional con tolerancia a anuncios |
Opción 1: Whisper instalado localmente (genuinamente gratis para siempre)
Whisper es el modelo de transcripción de OpenAI lanzado en 2022. Su código está disponible bajo licencia MIT — es decir, gratis para uso personal y comercial. Instalado en tu propio ordenador, no hay límites, ni cobros, ni envío de datos a terceros.
Lo que necesitas: Python 3.8+, unos 5 GB de espacio, idealmente una GPU NVIDIA para velocidad (con CPU funciona pero tarda 5-10× más). Tiempo de configuración: 20-30 minutos si nunca has usado Python. Recomendado para: usuarios técnicos, archivos confidenciales que no quieres subir a un servidor externo, volumen alto (cientos de horas). No recomendado para: usuarios no técnicos, casos puntuales (la configuración no merece la pena para un solo audio).
Opción 2: Funciones nativas gratuitas
Google Docs Dictado por voz
Herramientas → Dictado. Funciona con micrófono en directo, no acepta archivos subidos. Gratis para siempre. Calidad media (80-85%). Para apuntes rápidos en directo.
WhatsApp transcripción nativa
Desde noviembre 2024: Ajustes → Chats → Transcripciones de mensajes de voz. Solo para audios dentro de WhatsApp. Calidad media, no se puede exportar. Para notas de voz cortas del día a día.
Marcas automáticas de YouTube
En cualquier vídeo de YouTube, click en «...» → «Mostrar transcripción». Calidad variable (60-85% según idioma y calidad de audio). No se puede descargar como SRT desde la interfaz pública.
Reconocimiento de voz de Android/iOS
Apps de notas con dictado integrado (Apple Notes, Samsung Voice Recorder). Solo dictado en directo, no procesa archivos.
Opción 3: Pruebas gratuitas sin tarjeta de crédito
Aquí nos incluimos a nosotros mismos sin maquillar — VexaScribe tiene el plan más pequeño en minutos. Mira la tabla y decide según tu caso.
| Herramienta | Plan gratis | Tarjeta requerida | Exportar incluido | Comentario |
|---|---|---|---|---|
| VexaScribe | 30 min, todas las funciones | ✗ No | DOCX, SRT, PDF, TXT | Plan pequeño pero todas las funciones, sin marca de agua |
| HappyScribe | 90 min | ✗ No (verificar plan vigente) | ✓ Sí | Más minutos, también orientado a subtítulos |
| Sonix | 30 min | ✓ Sí (algunos planes) | ✓ Sí | Calidad alta, interfaz profesional |
| Otter Free | 300 min/mes pero 30 min/sesión, solo inglés | ✗ No | Limitado | Solo inglés — no recomendado para español |
¿Cuál elegir? Si quieres simplemente probar con un audio o vídeo de menos de 30 minutos, VexaScribe te da el flujo completo sin tarjeta. Si tienes más volumen para probar, HappyScribe ofrece 90 min. Si solo te interesa inglés y volumen mensual modesto, Otter Free.
Opción 4: «Gratis» con tarjeta de crédito o anuncios
- •TurboScribe Free — 3 transcripciones/día de hasta 30 min cada una. Sin tarjeta, pero con anuncios y a veces marca de agua. Bueno para volumen moderado si toleras la publicidad.
- •Transcri.io / SpeakApp — «Free, no registration» — funcionan, pero con límites de longitud y sin garantías de privacidad. Lee la política antes de subir audio sensible.
- •Apps móviles «gratis» — Muchas apps de transcripción en Play Store / App Store son gratis pero con anuncios intrusivos o compras dentro de la app que aparecen rápido.
Cuándo merece la pena pagar
Volumen. Más de 1-2 horas al mes te llevan al plan de pago. Cuesta menos de un café al mes ($2 en VexaScribe Starter por 200 minutos) y dejas de cambiar de herramienta cada vez que se agota la prueba.
Calidad consistente. Las herramientas gratuitas no garantizan el mismo modelo de IA siempre — pueden degradar la calidad en horas pico, ofrecer modelos antiguos, o limitar funciones (exportar, marcas de tiempo, hablantes). Los planes de pago dan acceso a los modelos más recientes y todas las funciones.
Preguntas frecuentes sobre transcripción gratuita
¿Qué herramienta gratuita es realmente la mejor para transcribir en español en 2026?
Depende del caso: para uso técnico sin límites y sin enviar datos, Whisper instalado localmente (gratis para siempre, requiere Python). Para uso ocasional sin instalar nada, VexaScribe (30 min gratis sin tarjeta, todas las funciones) o HappyScribe (90 min, también sin tarjeta). Para notas de voz cortas de WhatsApp, la función nativa de WhatsApp (gratis y suficiente). Para apuntes en directo, Google Docs dictado por voz (gratis, solo micrófono).
¿Whisper es difícil de instalar para alguien no técnico?
Para usuarios sin experiencia con Python, sí — la configuración inicial son 20-30 minutos (instalar Python, instalar dependencias, descargar el modelo, escribir comandos en la terminal). Existen interfaces gráficas como WhisperX o MacWhisper que simplifican el proceso. Si nunca has usado la terminal, considera mejor un servicio web con plan gratuito.
¿Las marcas automáticas de YouTube se pueden descargar gratis?
Desde la interfaz pública de YouTube no se descargan directamente como archivo SRT. Puedes copiar el texto desde «Mostrar transcripción». Si necesitas SRT con marcas de tiempo, herramientas como yt-dlp pueden extraer los subtítulos auto-generados oficialmente, o puedes descargar el vídeo y transcribirlo con una herramienta dedicada que exporte SRT directamente.
¿Por qué no recomendáis Otter para usuarios en español?
El plan Free de Otter (300 minutos/mes) es generoso, pero solo funciona en inglés. Si tu audio es en español, la transcripción será inutilizable. Para usuarios en español, mejores opciones gratuitas: VexaScribe (30 min, multilingüe), HappyScribe (90 min, multilingüe), o Whisper local (ilimitado, 99 idiomas).
¿Hay alguna herramienta gratuita con etiquetas de hablante?
Sí — el plan gratis de VexaScribe (30 min) incluye etiquetas de hablante (hasta 50 hablantes). HappyScribe también incluye diarización en su plan gratis (90 min). Whisper instalado localmente no incluye diarización por defecto, pero puedes añadirla con un módulo extra como WhisperX o pyannote.audio (requiere configuración técnica adicional).
¿Cuál es el límite real del plan gratuito de VexaScribe?
30 minutos de transcripción totales (no por mes — son 30 minutos para evaluar la herramienta). Sin tarjeta de crédito, sin marca de agua, con todas las funciones (99 idiomas, hablantes, exportación a DOCX/SRT/PDF/TXT, editor integrado). Después del límite, plan Starter desde $2/mes por 200 minutos.
Prueba VexaScribe gratis durante 30 minutos sin tarjeta de crédito. Sube tu primer audio, recibe el texto con marcas de tiempo y hablantes, y decide si merece la pena seguir. Si necesitas más minutos sin pagar, prueba HappyScribe (90 min) o instala Whisper localmente.
Empezar gratis — 30 minutos sin tarjeta