Transcribir Audio a Texto Gratis — Las 4 Opciones Realmente Gratis en 2026

Comparamos honestamente las 4 categorías de transcripción gratuita en 2026: Whisper local (gratis para siempre, técnico), funciones nativas (WhatsApp, Google Docs, YouTube), pruebas sin tarjeta de crédito (VexaScribe, HappyScribe), y pruebas con tarjeta o anuncios (TurboScribe, etc.). Te decimos qué te da realmente cada una.

Sin tarjeta de créditoComparativa honestaWhisper local incluido

Formatos compatibles:

MP3WAVM4AOGGMP4

En resumen

Hay cuatro categorías de transcripción «gratis» en 2026: (1) Whisper instalado localmente (gratis para siempre, sin límites, requiere Python y conocimientos técnicos); (2) funciones nativas (Google Docs dictado, WhatsApp nativo, marcas de YouTube — gratis pero limitadas); (3) pruebas gratuitas sin tarjeta (VexaScribe 30 min, HappyScribe 90 min); (4) pruebas con tarjeta o anuncios (TurboScribe, Otter Free). Elige según necesites volumen, calidad o exportación.

Las 4 categorías de «gratis» comparadas

Una vista rápida para elegir según tu volumen, tu nivel técnico y lo que necesites exportar.

CategoríaCoste realVolumenCalidadExportarPara quién
Whisper local100% gratis sin límiteIlimitado92-97%Sí (todos los formatos)Usuarios técnicos con archivos confidenciales
Funciones nativasGratisLimitado por plataformaMedia (70-85%)Generalmente noCasos puntuales, uso doméstico
Pruebas sin tarjeta30-90 min gratis, después de pago30-90 min total92-97%Sí (DOCX/SRT/PDF/TXT)Probar la herramienta sin compromiso
Pruebas con tarjeta o anuncios«Gratis» pero limitado90 min — 3 archivos/díaVariableGeneralmente síVolumen ocasional con tolerancia a anuncios

Opción 1: Whisper instalado localmente (genuinamente gratis para siempre)

Whisper es el modelo de transcripción de OpenAI lanzado en 2022. Su código está disponible bajo licencia MIT — es decir, gratis para uso personal y comercial. Instalado en tu propio ordenador, no hay límites, ni cobros, ni envío de datos a terceros.

Lo que necesitas: Python 3.8+, unos 5 GB de espacio, idealmente una GPU NVIDIA para velocidad (con CPU funciona pero tarda 5-10× más). Tiempo de configuración: 20-30 minutos si nunca has usado Python. Recomendado para: usuarios técnicos, archivos confidenciales que no quieres subir a un servidor externo, volumen alto (cientos de horas). No recomendado para: usuarios no técnicos, casos puntuales (la configuración no merece la pena para un solo audio).

Opción 2: Funciones nativas gratuitas

Google Docs Dictado por voz

Herramientas → Dictado. Funciona con micrófono en directo, no acepta archivos subidos. Gratis para siempre. Calidad media (80-85%). Para apuntes rápidos en directo.

WhatsApp transcripción nativa

Desde noviembre 2024: Ajustes → Chats → Transcripciones de mensajes de voz. Solo para audios dentro de WhatsApp. Calidad media, no se puede exportar. Para notas de voz cortas del día a día.

Marcas automáticas de YouTube

En cualquier vídeo de YouTube, click en «...» → «Mostrar transcripción». Calidad variable (60-85% según idioma y calidad de audio). No se puede descargar como SRT desde la interfaz pública.

Reconocimiento de voz de Android/iOS

Apps de notas con dictado integrado (Apple Notes, Samsung Voice Recorder). Solo dictado en directo, no procesa archivos.

Opción 3: Pruebas gratuitas sin tarjeta de crédito

Aquí nos incluimos a nosotros mismos sin maquillar — VexaScribe tiene el plan más pequeño en minutos. Mira la tabla y decide según tu caso.

HerramientaPlan gratisTarjeta requeridaExportar incluidoComentario
VexaScribe30 min, todas las funciones NoDOCX, SRT, PDF, TXTPlan pequeño pero todas las funciones, sin marca de agua
HappyScribe90 min No (verificar plan vigente)Más minutos, también orientado a subtítulos
Sonix30 min Sí (algunos planes)Calidad alta, interfaz profesional
Otter Free300 min/mes pero 30 min/sesión, solo inglés NoLimitadoSolo inglés — no recomendado para español

¿Cuál elegir? Si quieres simplemente probar con un audio o vídeo de menos de 30 minutos, VexaScribe te da el flujo completo sin tarjeta. Si tienes más volumen para probar, HappyScribe ofrece 90 min. Si solo te interesa inglés y volumen mensual modesto, Otter Free.

Opción 4: «Gratis» con tarjeta de crédito o anuncios

  • TurboScribe Free — 3 transcripciones/día de hasta 30 min cada una. Sin tarjeta, pero con anuncios y a veces marca de agua. Bueno para volumen moderado si toleras la publicidad.
  • Transcri.io / SpeakApp — «Free, no registration» — funcionan, pero con límites de longitud y sin garantías de privacidad. Lee la política antes de subir audio sensible.
  • Apps móviles «gratis» — Muchas apps de transcripción en Play Store / App Store son gratis pero con anuncios intrusivos o compras dentro de la app que aparecen rápido.

Cuándo merece la pena pagar

Volumen. Más de 1-2 horas al mes te llevan al plan de pago. Cuesta menos de un café al mes ($2 en VexaScribe Starter por 200 minutos) y dejas de cambiar de herramienta cada vez que se agota la prueba.

Calidad consistente. Las herramientas gratuitas no garantizan el mismo modelo de IA siempre — pueden degradar la calidad en horas pico, ofrecer modelos antiguos, o limitar funciones (exportar, marcas de tiempo, hablantes). Los planes de pago dan acceso a los modelos más recientes y todas las funciones.

Preguntas frecuentes sobre transcripción gratuita

¿Qué herramienta gratuita es realmente la mejor para transcribir en español en 2026?

Depende del caso: para uso técnico sin límites y sin enviar datos, Whisper instalado localmente (gratis para siempre, requiere Python). Para uso ocasional sin instalar nada, VexaScribe (30 min gratis sin tarjeta, todas las funciones) o HappyScribe (90 min, también sin tarjeta). Para notas de voz cortas de WhatsApp, la función nativa de WhatsApp (gratis y suficiente). Para apuntes en directo, Google Docs dictado por voz (gratis, solo micrófono).

¿Whisper es difícil de instalar para alguien no técnico?

Para usuarios sin experiencia con Python, sí — la configuración inicial son 20-30 minutos (instalar Python, instalar dependencias, descargar el modelo, escribir comandos en la terminal). Existen interfaces gráficas como WhisperX o MacWhisper que simplifican el proceso. Si nunca has usado la terminal, considera mejor un servicio web con plan gratuito.

¿Las marcas automáticas de YouTube se pueden descargar gratis?

Desde la interfaz pública de YouTube no se descargan directamente como archivo SRT. Puedes copiar el texto desde «Mostrar transcripción». Si necesitas SRT con marcas de tiempo, herramientas como yt-dlp pueden extraer los subtítulos auto-generados oficialmente, o puedes descargar el vídeo y transcribirlo con una herramienta dedicada que exporte SRT directamente.

¿Por qué no recomendáis Otter para usuarios en español?

El plan Free de Otter (300 minutos/mes) es generoso, pero solo funciona en inglés. Si tu audio es en español, la transcripción será inutilizable. Para usuarios en español, mejores opciones gratuitas: VexaScribe (30 min, multilingüe), HappyScribe (90 min, multilingüe), o Whisper local (ilimitado, 99 idiomas).

¿Hay alguna herramienta gratuita con etiquetas de hablante?

Sí — el plan gratis de VexaScribe (30 min) incluye etiquetas de hablante (hasta 50 hablantes). HappyScribe también incluye diarización en su plan gratis (90 min). Whisper instalado localmente no incluye diarización por defecto, pero puedes añadirla con un módulo extra como WhisperX o pyannote.audio (requiere configuración técnica adicional).

¿Cuál es el límite real del plan gratuito de VexaScribe?

30 minutos de transcripción totales (no por mes — son 30 minutos para evaluar la herramienta). Sin tarjeta de crédito, sin marca de agua, con todas las funciones (99 idiomas, hablantes, exportación a DOCX/SRT/PDF/TXT, editor integrado). Después del límite, plan Starter desde $2/mes por 200 minutos.

Prueba VexaScribe gratis durante 30 minutos sin tarjeta de crédito. Sube tu primer audio, recibe el texto con marcas de tiempo y hablantes, y decide si merece la pena seguir. Si necesitas más minutos sin pagar, prueba HappyScribe (90 min) o instala Whisper localmente.

Empezar gratis — 30 minutos sin tarjeta