ارفع ملفاً ← احصل على نسخة مع تسميات المتحدثين ← صدّر كـ TXT أو DOCX أو SRT أو VTT أو JSON.
الحدود والمواصفات
| الحد الأقصى لحجم الملف | 2 جيجابايت |
| الحد الأقصى للمدة | 10 ساعات لكل ملف |
| وقت المعالجة | ~دقيقة واحدة لكل 10 دقائق من الصوت |
| كشف المتحدثين | حتى 10 متحدثين مختلفين |
| اللغات | 99 (كشف تلقائي أو اختيار يدوي) |
| صيغ الإدخال | MP3، WAV، M4A، FLAC، OGG، MP4، MOV، WEBM |
| صيغ التصدير | TXT، DOCX، SRT، VTT، JSON |
ما هو Whisper؟
Whisper هو نموذج التعرف على الكلام مفتوح المصدر من OpenAI، صدر في 2022. مُدرّب على 680,000 ساعة من البيانات الصوتية متعددة اللغات ويقدم دقة مثيرة للإعجاب عبر 99 لغة.
النموذج متاح لأي شخص للاستخدام، لكن تشغيله بنفسك يتطلب إعداداً تقنياً: برمجة Python، وأجهزة GPU، وصيانة مستمرة. لمعظم المستخدمين، هذا يخلق حاجزاً كبيراً للوصول.
VexaScribe يزيل هذا الحاجز. نحن نشغّل Whisper على بنيتنا التحتية، ونضيف كشف المتحدثين (الذي لا يتضمنه Whisper افتراضياً)، ونوفر واجهة بسيطة للرفع والتحميل.
اعرف المزيد عن تحويل الصوت العام أو استكشف ميزاتنا.
المصادر: OpenAI Whisper GitHub · بحث OpenAI Whisper
Whisper API مقابل VexaScribe
استخدام Whisper مباشرة
- ✗يتطلب معرفة برمجة Python
- ✗تحتاج لإعداد مفاتيح API والفوترة
- ✗لا كشف متحدثين مدمج
- ✗لا واجهة مستخدم - سطر أوامر فقط
- ✗يجب التعامل مع حدود حجم الملف بنفسك
- ✗المخرجات الخام تحتاج تنسيق
استخدام VexaScribe
- ✓ارفع الملفات في متصفحك
- ✓لا حاجة لمفاتيح API أو إعداد
- ✓كشف المتحدثين مضمّن
- ✓محرر ومعاين نصوص مدمج
- ✓الملفات الكبيرة تُعالج تلقائياً
- ✓صدّر كـ TXT، DOCX، SRT، VTT، JSON
مقارنة التكلفة: VexaScribe مقابل Whisper API
VexaScribe | واجهة ويسبر (افعلها بنفسك) | |
|---|---|---|
| تكلفة الدقيقة | ~$0.005 | $0.006 + setup |
| الإعداد مطلوب | Not Included | Extra Work |
| كشف المتحدث | Included | Not Included |
| واجهة المستخدم | Included | Extra Work |
* تكلفة VexaScribe بناءً على الخطة الأساسية ($5/1000 دقيقة = $0.005/دقيقة). أسعار OpenAI API اعتباراً من يناير 2026؛ لا تشمل وقت التطوير وتكاليف البنية التحتية. المصدر
كيف يعمل كشف المتحدثين
يضيف VexaScribe فصل المتحدثين فوق تحويل Whisper، حيث يحدد ويسمي الأصوات المختلفة كمتحدث 1 ومتحدث 2 وهكذا. يمكنك إعادة تسمية المتحدثين في المحرر قبل التصدير.
المواصفات
- •يدعم حتى 10 متحدثين مختلفين لكل ملف
- •يعمل بشكل أفضل مع تناوب واضح في الكلام (أقل تداخل ممكن)
- •تسميات المتحدثين مضمّنة في صادرات SRT وVTT وJSON
أفضل الممارسات
- ✓استخدم ميكروفونات عالية الجودة للحصول على أوضح النتائج
- ✓قلل من الضوضاء الخلفية والكلام المتداخل
- ✓للمقابلات: ميكروفونات الطية تنتج أفضل فصل للمتحدثين
القيود المعروفة
قد يدمج كشف المتحدثين الأصوات عندما يكون للمتحدثين خصائص صوتية متشابهة أو عند وجود تداخل كبير في الكلام. يمكنك تعديل التسميات يدوياً في المحرر.
عرض نموذج مخرجات التحويل
[00:00:00] المتحدث 1: مرحباً بكم في البودكاست... [00:00:05] المتحدث 2: شكراً لاستضافتي...
الخصوصية ومعالجة البيانات
- التشفير: الملفات مشفرة أثناء النقل (TLS 1.3) وفي حالة السكون (AES-256)
- الاحتفاظ: تُحذف الملفات تلقائياً بعد 30 يوماً؛ الحذف اليدوي متاح في أي وقت
- التدريب: لا نستخدم صوتك لتدريب النماذج
- منطقة المعالجة: الاتحاد الأوروبي (فرانكفورت)
راجع سياسة الخصوصية و شروط الخدمة للتفاصيل.
تطبيق تحويل Whisper
VexaScribe هو بالأساس تطبيق Whisper بواجهة سهلة الاستخدام. تحصل على قوة التعرف على الكلام في Whisper بدون الحاجة لمهارات تقنية. ارفع صوتك، احصل على نسختك، صدّر بالصيغة المفضلة لديك.
كيف يعمل تحويل Whisper
ارفع صوتك
اسحب وأفلت أي ملف صوت أو فيديو. نتعامل مع التحويل والمعالجة المسبقة تلقائياً.
Whisper + كشف المتحدثين
يُعالج ملفك باستخدام Whisper للتحويل، بالإضافة إلى طبقة كشف المتحدثين لدينا لتحديد الأصوات المختلفة.
راجع وصدّر
حرر نسختك في المحرر المدمج. صدّر كنص عادي أو مستند Word أو ملفات ترجمة.
ميزات VexaScribe Whisper
دقة Whisper مع ميزات إضافية للاستخدام الواقعي
دقة مستوى Whisper
مبني على نفس التقنية التي تشغّل تحويل OpenAI. مُدرّب على مصادر صوتية متنوعة لنتائج موثوقة.
لا حاجة للبرمجة
تخطّى سكربتات Python ووثائق API. فقط ارفع ملفك واحصل على نسختك.
99 لغة
Whisper يدعم 99 لغة بدقة قوية. يُكتشف اللغة تلقائياً.
كشف المتحدثين مُضاف
Whisper وحده لا يحدد المتحدثين. VexaScribe يضيف كشف المتحدثين لتعرف من قال ماذا.
معالجة سحابية
لا حاجة لشراء GPU أو تشغيل مهام معالجة ليلية. خوادمنا تتولى العمل الثقيل.
معالجة آمنة
ملفاتك مشفرة ومعالجة بأمان. احذف في أي وقت. لا ندرّب على صوتك.
الأسئلة الشائعة حول تحويل Whisper
ما هو Whisper وكيف يعمل للتفريغ؟
Whisper نموذج تعرف تلقائي على الكلام (ASR) طورته OpenAI. تدرّب على 680,000 ساعة من البيانات الصوتية المتعددة اللغات، مما يتيح دقة عالية في لغات ولهجات كثيرة. Whisper يحوّل الصوت إلى نص بمعالجته عبر شبكة عصبية تعلمت أنماط الكلام. يستطيع التعامل مع جودات صوت مختلفة، الضوضاء الخلفية ومتحدثين متعددين. VexaScribe يستخدم تقنية مبنية على Whisper لتوفير تفريغ دقيق بدون الحاجة لإعداد أو تشغيل النموذج بنفسك.
ما مدى دقة تفريغ Whisper؟
Whisper يُعتبر من أدق نماذج تحويل الصوت إلى نص المتاحة. للصوت الواضح بالإنجليزية، يحقق معدلات خطأ كلمات منخفضة جداً مماثلة للتفريغ البشري الاحترافي. الدقة تختلف حسب اللغة — الإنجليزية والإسبانية والألمانية وبعض اللغات الأخرى تُظهر أداءً ممتازاً، بينما اللغات الأقل شيوعاً قد تكون معدلات الخطأ فيها أعلى. جودة الصوت تؤثر بشكل كبير على الدقة؛ التسجيلات الواضحة بأقل ضوضاء خلفية تعطي أفضل النتائج.
ما اللغات التي يدعمها Whisper؟
Whisper يدعم التفريغ بـ 99 لغة. يُظهر أفضل أداء بالعربية والإنجليزية والإسبانية والفرنسية والألمانية والهولندية والبولندية ولغات أخرى شائعة. يستطيع أيضاً تفريغ الصينية واليابانية والكورية والهندية ولغات أخرى كثيرة. النموذج يستطيع اكتشاف اللغة المنطوقة تلقائياً، أو يمكنك تحديدها يدوياً لدقة أعلى.
هل أحتاج مهارات تقنية لاستخدام تفريغ Whisper؟
استخدام Whisper مباشرة يتطلب معرفة تقنية — تحتاج تثبيت Python، إعداد المتطلبات، إدارة موارد GPU وكتابة كود لمعالجة ملفات الصوت. هذا صعب لغير المطورين. VexaScribe يزيل هذا التعقيد تماماً. نتعامل مع كل البنية التحتية التقنية، أنت فقط ترفع ملف الصوت عبر واجهة الويب وتستلم التفريغ. بدون برمجة، بدون إعداد، بدون إدارة خوادم.
كيف يختلف VexaScribe عن استخدام Whisper مباشرة؟
استخدام Whisper مباشرة يعني إعداد بنيتك التحتية الخاصة: تثبيت النموذج (يتطلب مساحة قرص كبيرة وذاكرة GPU)، كتابة كود لمعالجة الملفات، إدارة الأخطاء وموارد الحوسبة. VexaScribe يقدم حلاً كاملاً مبنياً على تقنية Whisper: واجهة رفع بسيطة، معالجة تلقائية، محرر مدمج للتصحيحات، تعرف على المتحدثين، صيغ تصدير متعددة وتخزين سحابي لتفريغاتك. فكر فيه كالفرق بين شراء محرك وشراء سيارة.
هل VexaScribe تابع لـ OpenAI؟
لا، VexaScribe شركة مستقلة. لسنا تابعين أو معتمدين أو شركاء لـ OpenAI. بنينا خدمة التفريغ باستخدام تقنية تحويل صوت إلى نص مبنية على أو تشبه معمارية Whisper من OpenAI. هدفنا جعل تقنية التفريغ القوية متاحة للجميع عبر تطبيق ويب بسيط وميسور التكلفة.
ملاحظة: VexaScribe يستخدم تقنية مبنية على Whisper للتحويل. قد تختلف النتائج بناءً على جودة الصوت ونوع المحتوى.
VexaScribe يجعل تحويل Whisper متاحاً للجميع. استكشف أدواتنا ذات الصلة لحالات استخدام محددة.