Fonctionnalités de VexaScribe
Transcription IA en 99 langues. Détection des locuteurs, horodatages, résumés IA et traduction intégrée (133 langues). Importez des fichiers ou envoyez un bot à vos réunions. Dès 2 $/mois.
What VexaScribe is, in 80 words
VexaScribe is a web app that turns audio and video into searchable, timestamped, speaker-labeled transcripts using OpenAI Whisper. Drop a file (up to 5 GB) or send a bot to your Zoom, Google Meet, or Teams meeting. Get a transcript in 99 languages in ~5–10 minutes per hour of audio, optional AI summary with action items, and exports to TXT, DOCX, SRT, VTT, or JSON. 30 minutes free, then $2–$20/month. No credit card to start.
What VexaScribe doesn't do
Five things VexaScribe is genuinely not built for, with the tool we'd actually recommend in each case. If your use case is on this list, save yourself the trial signup.
No real-time live captioning
Transcripts are generated after upload, not as you speak. A 1-hour file takes 5–10 minutes to process — fine for meetings you watch back, wrong for live events.
Use instead: Otter Live, Google Meet's built-in captions, or Web Captioner for free browser-based live captions.
No public REST API
VexaScribe is a web app for humans, not a backend service. There's no developer API, no SDK, no webhook for programmatic uploads.
Use instead: OpenAI Whisper API ($0.006/min), Deepgram Nova-3 (~$0.0043/min), or AssemblyAI (~$0.012/min).
No video editing
You can export SRT/VTT subtitles to drop into your editor, but VexaScribe won't cut clips, remove filler words, or burn captions onto video.
Use instead: Descript or Vrew for transcript-based video editing; Premiere/Final Cut/DaVinci for traditional NLE workflows.
No custom vocabulary tuning
You can't upload a dictionary of brand names, drug names, or technical jargon to bias the model toward. Whisper is used as-is, with no per-account fine-tuning.
Use instead: AssemblyAI's “word boost” or Deepgram's “keywords” param for proper-noun-heavy domains.
No on-premise / enterprise self-hosting
Audio is processed in our cloud — there's no air-gapped or HIPAA-BAA-signed deployment available. For attorney-client, clinical therapy, or classified content where a breach creates direct legal liability, no cloud tool (ours included) is the right call.
Use instead: install OpenAI Whisper locally (free, runs on your machine, audio never leaves), or for legal-grade 100% accuracy use human transcription (Rev, GoTranscript) at $1.25–$1.99/min.
Honest accuracy — what the numbers really mean
VexaScribe uses OpenAI Whisper (specifically large-v3 class models). Marketing pages love to say “99% accuracy” — that's not honest. Real-world Whisper accuracy depends heavily on audio quality, accent, and number of speakers. Here's what to expect.
Transcription accuracy (Whisper)
- Clean studio English, single speaker~92–97%
- Accented English (non-native, regional)~85–92%
- Noisy environments (cafes, phone, outdoor)~80–90%
- Clean Spanish, French, German, Italian, Portuguese, Dutch~88–94%
- Korean, Japanese, Indonesian, Turkish, Arabic, Polish~85–92%
Source: Open ASR Leaderboard + Whisper paper benchmarks (LibriSpeech, FLEURS, Common Voice).
Speaker diarization accuracy
- 2 speakers, no overlap95%+
- 3–4 speakers, occasional overlap~88–94%
- 5–6 speakers, meeting dynamics~80–90%
- 7–15 speakers, panel or focus group~70–82%
- Up to 50 speakers (max supported)variable
Best accuracy with 2–6 distinct speakers. You can rename Speaker 1/2/3 in the editor after.
What moves the needle
Three things that matter more than picking the “best” transcription tool:
- A decent mic (USB headset or lapel beats laptop built-in by 5–15 accuracy points).
- One speaker at a time — overlap kills both transcription and diarization.
- Low background noise. Record in a closed room, not next to a fan or HVAC vent.
If you need legal-grade 100% accuracy (court filings, regulated research), use human transcription services like Rev or GoTranscript at $1.25–$1.99/min. AI gets you to ~95% at 1–2% the cost — fine for most use cases, wrong for some.
Fonctionnalités principales
99 langues prises en charge
Transcrivez audio et vidéo en 99 langues avec détection automatique de la langue.
Détection des locuteurs
La diarisation automatique identifie et étiquette les différentes voix. Idéal pour les entretiens et réunions.
Horodatages
Chaque transcription inclut des horodatages précis. Cliquez pour accéder à ce moment dans votre audio.
5 formats d'export
Exportez en TXT, DOCX, SRT, VTT ou JSON. Choisissez le format adapté à votre flux de travail.
Traitement rapide
La transcription IA s’effectue en minutes. Un enregistrement d’une heure est traité en 5–10 minutes.
Éditeur intégré
Révisez et modifiez vos transcriptions directement dans le navigateur. Corrigez les erreurs et renommez les locuteurs.
Bot de réunion
Envoyez un bot IA dans Zoom, Meet ou Teams. Il enregistre, transcrit et génère des résumés structurés. Utilise 3× les crédits.
Résumés IA
Transformez n'importe quelle transcription en points clés, tâches et décisions structurés. Inclus dans tous les abonnements payants.
Traduction de transcriptions
Traduisez n'importe quelle transcription en 133 langues via Google Translate — sans frais supplémentaires.
Bulk Upload — 50 Files at Once
Upload up to 50 audio or video files in one go. All processed in parallel — not one at a time. Mix formats freely and download everything as a ZIP.
Formats pris en charge
Formats audio
Formats vidéo
Formats d’export (5)
Texte brut
Document Word
Sous-titres
Sous-titres web
Données structurées
Cas d’usage
Transcription de réunions
Bot IA dans Zoom, Meet ou Teams
Transcription de podcasts
Convertissez des épisodes en notes et articles
Transcription d’entretiens
Transcrivez avec détection des locuteurs
Transcription de cours
Convertissez des enregistrements en notes
Vidéo en texte
Extrayez des transcriptions et créez des sous-titres
MP3 en texte
Convertissez des fichiers audio en documents
Transcription audio
Conversion audio en texte générale
Propulsé par l’IA
VexaScribe utilise des modèles de reconnaissance vocale de pointe entraînés sur des millions d’heures audio.
Précision sur audio clair
Langues prises en charge
Temps de traitement par heure
Disponibilité des fonctionnalités par abonnement
Tous les abonnements incluent un essai gratuit. Aucune carte bancaire requise.
| Fonctionnalité | Essai gratuit | Starter (2 $/mois) | Pro (10 $/mois) |
|---|---|---|---|
| Transcription audio et vidéo | ✓ | ✓ | ✓ |
| 99 langues | ✓ | ✓ | ✓ |
| Détection des locuteurs | ✓ | ✓ | ✓ |
| Horodatages | ✓ | ✓ | ✓ |
| Export : TXT, DOCX, SRT, VTT, JSON | ✓ | ✓ | ✓ |
| Traduction de transcriptions (133 langues) | ✓ | ✓ | ✓ |
| Éditeur intégré | ✓ | ✓ | ✓ |
| Résumés IA | — | ✓ | ✓ |
| Bot de réunion (Zoom, Meet, Teams) | — | ✓ | ✓ |
| Transcription en masse | ✓ | ✓ | ✓ |
Questions fréquentes
Prêt à transcrire ?
Essayez VexaScribe gratuitement avec 30 minutes de transcription. Sans carte bancaire.