ویژگیهای VexaScribe
AI transcription in 99 languages. Speaker detection, timestamps, AI summaries, and built-in translation (133 languages). Upload files or send a meeting bot to Zoom, Meet, or Teams. From $2/month.
What VexaScribe is, in 80 words
VexaScribe is a web app that turns audio and video into searchable, timestamped, speaker-labeled transcripts using OpenAI Whisper. Drop a file (up to 5 GB) or send a bot to your Zoom, Google Meet, or Teams meeting. Get a transcript in 99 languages in ~5–10 minutes per hour of audio, optional AI summary with action items, and exports to TXT, DOCX, SRT, VTT, or JSON. 30 minutes free, then $2–$20/month. No credit card to start.
What VexaScribe doesn't do
Five things VexaScribe is genuinely not built for, with the tool we'd actually recommend in each case. If your use case is on this list, save yourself the trial signup.
No real-time live captioning
Transcripts are generated after upload, not as you speak. A 1-hour file takes 5–10 minutes to process — fine for meetings you watch back, wrong for live events.
Use instead: Otter Live, Google Meet's built-in captions, or Web Captioner for free browser-based live captions.
No public REST API
VexaScribe is a web app for humans, not a backend service. There's no developer API, no SDK, no webhook for programmatic uploads.
Use instead: OpenAI Whisper API ($0.006/min), Deepgram Nova-3 (~$0.0043/min), or AssemblyAI (~$0.012/min).
No video editing
You can export SRT/VTT subtitles to drop into your editor, but VexaScribe won't cut clips, remove filler words, or burn captions onto video.
Use instead: Descript or Vrew for transcript-based video editing; Premiere/Final Cut/DaVinci for traditional NLE workflows.
No custom vocabulary tuning
You can't upload a dictionary of brand names, drug names, or technical jargon to bias the model toward. Whisper is used as-is, with no per-account fine-tuning.
Use instead: AssemblyAI's “word boost” or Deepgram's “keywords” param for proper-noun-heavy domains.
No on-premise / enterprise self-hosting
Audio is processed in our cloud — there's no air-gapped or HIPAA-BAA-signed deployment available. For attorney-client, clinical therapy, or classified content where a breach creates direct legal liability, no cloud tool (ours included) is the right call.
Use instead: install OpenAI Whisper locally (free, runs on your machine, audio never leaves), or for legal-grade 100% accuracy use human transcription (Rev, GoTranscript) at $1.25–$1.99/min.
Honest accuracy — what the numbers really mean
VexaScribe uses OpenAI Whisper (specifically large-v3 class models). Marketing pages love to say “99% accuracy” — that's not honest. Real-world Whisper accuracy depends heavily on audio quality, accent, and number of speakers. Here's what to expect.
Transcription accuracy (Whisper)
- Clean studio English, single speaker~92–97%
- Accented English (non-native, regional)~85–92%
- Noisy environments (cafes, phone, outdoor)~80–90%
- Clean Spanish, French, German, Italian, Portuguese, Dutch~88–94%
- Korean, Japanese, Indonesian, Turkish, Arabic, Polish~85–92%
Source: Open ASR Leaderboard + Whisper paper benchmarks (LibriSpeech, FLEURS, Common Voice).
Speaker diarization accuracy
- 2 speakers, no overlap95%+
- 3–4 speakers, occasional overlap~88–94%
- 5–6 speakers, meeting dynamics~80–90%
- 7–15 speakers, panel or focus group~70–82%
- Up to 50 speakers (max supported)variable
Best accuracy with 2–6 distinct speakers. You can rename Speaker 1/2/3 in the editor after.
What moves the needle
Three things that matter more than picking the “best” transcription tool:
- A decent mic (USB headset or lapel beats laptop built-in by 5–15 accuracy points).
- One speaker at a time — overlap kills both transcription and diarization.
- Low background noise. Record in a closed room, not next to a fan or HVAC vent.
If you need legal-grade 100% accuracy (court filings, regulated research), use human transcription services like Rev or GoTranscript at $1.25–$1.99/min. AI gets you to ~95% at 1–2% the cost — fine for most use cases, wrong for some.
ویژگیهای اصلی
پشتیبانی از ۹۹ زبان
صوت و ویدیو را در ۹۹ زبان با تشخیص خودکار زبان رونویسی کنید. از انگلیسی تا ژاپنی، از اسپانیایی تا عربی.
تشخیص گوینده
تفکیک خودکار گویندگان، صداهای مختلف را شناسایی و برچسبگذاری میکند. برای مصاحبهها، پادکستها و جلسات عالی است.
مهر زمانی
هر رونویسی شامل مهرهای زمانی دقیق است. روی هر مهر زمانی کلیک کنید تا به آن لحظه در صوت خود بپرید.
۵ فرمت صدور
به صورت TXT، DOCX، SRT، VTT یا JSON صادر کنید. فرمتی را که با گردش کار شما تناسب دارد انتخاب کنید.
پردازش سریع
رونویسی مبتنی بر هوش مصنوعی در عرض چند دقیقه تکمیل میشود، نه چند ساعت. یک ضبط ۱ ساعته معمولاً در ۵ تا ۱۰ دقیقه پردازش میشود.
ویرایشگر داخلی
رونویسیهای خود را مستقیماً در مرورگر بررسی و ویرایش کنید. خطاها را اصلاح کنید، نام گویندگان را تغییر دهید و رونویسی خود را پیش از صدور بهخوبی تنظیم کنید.
ربات جلسه
یک ربات هوش مصنوعی را به جلسات Zoom، Google Meet یا Teams خود بفرستید. ضبط میکند، رونویسی مینماید و خلاصههای ساختاریافته با موارد اقدام و تصمیمات تولید میکند. ۳× اعتبار رونویسی مصرف میکند.
خلاصههای هوش مصنوعی
هر رونویسی را به نکات کلیدی ساختاریافته، موارد اقدام، نشانگرهای فصل و تصمیمات تبدیل کنید. در همه طرحهای پولی گنجانده شده است.
ترجمه رونویسی
هر رونویسی را به ۱۳۳ زبان از طریق Google Translate ترجمه کنید — بدون هزینه اضافی و بدون نیاز به حساب شخص ثالث.
Bulk Upload — 50 Files at Once
Upload up to 50 audio or video files in one go. All processed in parallel — not one at a time. Mix formats freely and download everything as a ZIP.
فرمتهای پشتیبانیشده
فرمتهای صوتی
فرمتهای ویدیویی
فرمتهای صدور (۵)
متن ساده
سند Word
زیرنویس
زیرنویس وب
دادههای ساختاریافته
موارد استفاده
رونویسی جلسات
ربات هوش مصنوعی به جلسات Zoom، Meet یا Teams میپیوندد
رونویسی پادکست
اپیزودها را به یادداشتهای نمایش و پستهای وبلاگ تبدیل کنید
رونویسی مصاحبه
با تشخیص گوینده رونویسی کنید
رونویسی سخنرانی
ضبطهای کلاس را به یادداشتهای مطالعه تبدیل کنید
ویدیو به متن
رونویسیها را استخراج کنید و زیرنویس بسازید
MP3 به متن
فایلهای صوتی را به اسناد متنی تبدیل کنید
رونویسی صوتی
تبدیل کلی صوت به متن
با هوش مصنوعی پیشرفته
VexaScribe از پیشرفتهترین مدلهای تشخیص گفتار که با میلیونها ساعت صوت آموزش دیدهاند استفاده میکند.
دقت برای صوت واضح
زبانهای پشتیبانیشده
زمان پردازش در هر ساعت
در دسترس بودن ویژگیها بر اساس طرح
همه طرحها شامل دوره آزمایشی رایگان هستند. برای شروع نیازی به کارت اعتباری نیست.
| ویژگی | آزمایش رایگان | Starter ($2/ماه) | Pro ($10/ماه) |
|---|---|---|---|
| رونویسی صوت و ویدیو | ✓ | ✓ | ✓ |
| پشتیبانی از ۹۹ زبان | ✓ | ✓ | ✓ |
| تشخیص گوینده | ✓ | ✓ | ✓ |
| مهر زمانی | ✓ | ✓ | ✓ |
| صدور: TXT، DOCX، SRT، VTT، JSON | ✓ | ✓ | ✓ |
| ترجمه رونویسی (۱۳۳ زبان) | ✓ | ✓ | ✓ |
| ویرایشگر داخلی | ✓ | ✓ | ✓ |
| خلاصههای هوش مصنوعی | — | ✓ | ✓ |
| ربات جلسه (Zoom، Meet، Teams) | — | ✓ | ✓ |
| رونویسی انبوه | ✓ | ✓ | ✓ |
سؤالات متداول ویژگیها
آماده شروع رونویسی هستید؟
VexaScribe را با ۳۰ دقیقه رونویسی رایگان امتحان کنید. نیازی به کارت اعتباری نیست.