لو عندك ساعة محاضرة وتحتاج نصّها مكتوباً، سواء للبحث أو للاقتباس أو لأنّ أُذنك تعبت من إعادة الاستماع، فأنت تعرف الحكاية. التفريغ اليدوي يأكل أربع إلى ستّ ساعات من وقتك. الدفع لمفرّغ بشري يكلّفك من دولار إلى ثلاثة لكلّ دقيقة. أرقام لا تصلح لباحث عنده ٣٠ ساعة من التسجيلات.
تغيّر هذا في السنوات الأخيرة، لكن بشكل غير ملحوظ لأغلب الناس. الأدوات الذكية صارت تتعامل مع العربية بشكل معقول، والكلفة هبطت إلى مستوى لم نكن نتخيّله، لكنّ النتائج تتفاوت بحسب الأداة والطريقة والصوت نفسه.
أنا أبني نـصّ، وهو أداة عربية للكتابة والتفريغ والبحث، منذ أكثر من سنة. خلال هذه المدّة جرّبت كلّ ما يخطر في البال من أدوات تفريغ. هذه الصفحة هي خلاصة ما تعلّمته: الخيارات المتاحة، أيّها يناسب أيّ حالة، والأشياء التي تحتاج إلى الانتباه لها قبل أن تستثمر ساعات في مادّة لن تنفعك.
الطرق المتاحة اليوم
١. الأدوات الجاهزة (مثل نـصّ)
ترفع ملفّاً صوتياً (MP3، WAV، M4A، أو ما شابه)، أو تلصق رابط يوتيوب، وتنتظر بضع دقائق. يخرج لك نصّ عربيّ كامل مع طوابع زمنية تربط كلّ مقطع بمكانه في التسجيل. تنقر على أيّ سطر فينقلك إلى الصوت في موضعه. تحرّر مباشرة. تصدّر إلى مستند أو PDF.
هذا الخيار يناسبك إن كنت لا تريد أن تفكّر في API ولا في إعدادات ولا في حدود الملفّ. نـصّ يقدّم ١٨٠ دقيقة شهرياً في الباقة المجّانية، وهذا يكفي لمحاضرة طويلة كلّ أسبوع.
٢. استخدام Whisper مباشرة عبر API
Whisper، نموذج OpenAI مفتوح المصدر، هو الأساس وراء أغلب أدوات التفريغ الذكية اليوم. تستطيع أن تستخدمه مباشرة عبر API: ترفع الصوت، يردّ بنصّ. تكلفته على واجهة OpenAI الرسمية حوالي ٠.٠٠٦ دولار للدقيقة، أي ٠.٣٦ دولار للساعة.
هذا الخيار للمطوّرين. لا واجهة، لا تحرير، لا طوابع زمنية تفاعلية. مجرّد نصّ خام.
من بدائل OpenAI الذكيّة: Groq تستضيف نفس النموذج (Whisper Large v3) على عتاد مخصّص يشغّله أسرع بكثير وبكلفة أقلّ. النموذج نفسه، الجودة نفسها، الفرق في السرعة والسعر.
٣. خدمات التفريغ البشري
Rev أو GoTranscript أو مستقلّون على Upwork. الجودة ممتازة لو وجدت مفرّغاً عربياً أصلياً (يهمّ كثيراً)، لكنّك تدفع ما بين دولار وثلاثة لكلّ دقيقة، والوقت ٢٤ إلى ٤٨ ساعة في الأقلّ.
تناسبك حين تكون الدقّة الكاملة شرطاً لا يقبل المساومة: ملفّات قانونية، طبية، أو محاضرات لعلماء سيُحاسَبون على كلّ كلمة. لكنّها لا تناسب باحثاً عنده مكتبة كاملة من التسجيلات.
ما الذي يخفق فيه التفريغ الذكي عادةً
الأدوات الحالية وصلت إلى مستوى دقّة جيّد على الفصحى الإعلامية النظيفة، أي ٩٠٪ وما فوق في ظروف معقولة. لكنّ هذا الرقم يخدع. هناك أربعة مواضع تخفق فيها أغلب الأدوات، تحتاج إلى أن تعرفها قبل أن تعتمد على أيّ تفريغ:
اللهجة تتحوّل إلى فصحى بصمت
أكبر مشكلة، وأخطرها على من يفرّغ كلام علماء أو شيوخ يتكلّمون بلهجاتهم. لو طلبت من نموذج ذكيّ أن "يصقل" تفريغاً عاميّاً، فاحتمال كبير أن يعيد كتابته بالفصحى دون أن يخبرك. "بيدور على المعنى" تصير "يبحث عن المعنى". "اللي" تصير "الذي". "كده" تصير "كذلك".
هذا تزييف. لو كنت تستشهد بكلام عالم في بحث، الكلمات التي قالها هي ما يهمّ، لا "ترجمة" تقريبيّة لها بالفصحى. تأكّد دائماً أنّ الأداة التي تستخدمها تحفظ اللهجة، أو على الأقلّ اطلب منها صراحةً ألّا تستبدل العامية بالفصحى.
الكلمات الأولى تختفي أحياناً
نمط متكرّر في تسجيلات كثيرة: المتكلّم يفتتح بالسلام، يذكر موضوع المحاضرة، ثمّ يبدأ الكلام، والنصّ المفرَّغ يبدأ من منتصف الجملة الثانية. أوّل ٨ إلى ١٢ ثانية تختفي.
السبب التقنيّ في حدود ما رأيت مرتبط بكيفية تعامل النماذج مع "السياق الافتتاحي" الذي تمرّره معها. لو راجعت تفريغاً لمحاضرة وشعرت أنّ بدايته مفاجئة، عُد للصوت من ثانية الصفر وتأكّد.
مقاطع كاملة تعود فارغة
النماذج الذكيّة تقسّم التسجيلات الطويلة إلى مقاطع، عادةً ٣٠ ثانية لكلّ مقطع. أحياناً يعود مقطع فيه كلام حقيقيّ كنصّ فارغ تماماً. بلا تحذير. ثقب صامت في وسط النصّ.
نسبة الحدوث ليست عالية، تقدّر بحوالي ١٪-٢٪ في تسجيلات عاديّة. لكنّها كافية لتُربك مراجعة آليّة. تأكّد قبل أن تعتمد التفريغ أنّك ألقيت نظرة على المقاطع وأنّها لا تحتوي على ثقوب.
أسماء الأعلام والمصطلحات النادرة
التفريغ الذكي ممتاز في الشائع، سيّء في النادر. أسماء العلماء وأسماء المدن وعناوين الكتب والمصطلحات المتخصّصة هي مصدر تسعين بالمئة من الأخطاء التي ستجدها. لا تعتمد على المراجعة الآليّة لها أبداً؛ راجعها بنفسك.
كم تكلّفك كلّ طريقة
أرقام عامّة، بناءً على الأسعار المعلنة في منتصف ٢٠٢٦:
| الطريقة | الكلفة لساعة صوت |
|---|---|
| OpenAI Whisper API مباشرة | ~٠.٣٦ دولار |
| Groq Whisper Large v3 | كسر دولار (أرخص بكثير من OpenAI) |
| تفريغ بشري (Rev أو شبيه) | ٦٠-١٨٠ دولار |
| الأدوات الجاهزة (نـصّ، وآخرون) | باقات مجانية متاحة، باقات مدفوعة تبدأ من بضعة دولارات شهرياً |
الفجوة بين الذكاء والإنسان كبيرة جداً. لاستخدامات لا تطلب الدقّة الكاملة، تأتيك الأدوات الذكية بنحو ٩٠-٩٥٪ من الدقّة بأجزاء من ألف من الكلفة، وفي زمن لا يقارَن.
نصائح عملية للتفريغ الأفضل
ما لاحظت أنّه يصنع فرقاً فعلياً:
- سجّل في مكان هادئ كلّما أمكن. ضوضاء الخلفية تربك النموذج أكثر ممّا قد تتخيّل. لو السبيل غير متاح، فحاول على الأقلّ أن يكون المتكلّم قريباً من الميكروفون.
- تجنّب التداخل بين متحدّثين. فصل المتحدّثين (diarization) لا يزال نقطة ضعف في العربية. لو عندك مقابلة فيها أكثر من صوت، حاول أن يكون كلّ متحدّث في مسار منفصل لو استطعت.
- اقطع الصمت الطويل. سكوت أطول من ثلاث ثوانٍ في وسط التسجيل يجعل بعض النماذج "تهلوس" محتوى لتملأ الفراغ. لو تستطيع التقطيع قبل الرفع، افعل.
- راجع الأسماء بنفسك بعد التفريغ. كنت أتمنّى أن أقول غير ذلك، لكنّ هذه نقطة ثابتة. الأداة لن تعرف اسم شيخك أو كتابك أو قريتك.
ما يكرّره الناس بلا فائدة:
- التحويل إلى WAV. Whisper الحديث يتعامل مع MP3 مباشرة بلا فقدان. لا تضيع وقتك.
- تمرير "إشارة لغة" Arabic. اكتشاف اللغة الافتراضي دقيق بما يكفي.
- استخدام نسخ "Turbo" المسرّعة من Whisper على العربية. الجودة تنزل بشكل ملموس. ابقَ على Large v3 القياسي.
ماذا تفعل بالتفريغ بعد أن يجهز
نقطة الفصل بين أداة تفريغ وأداة عمل: ماذا تفعل بالنصّ بعد أن يخرج؟ نـصّ بُني بحيث:
- تحادث التفريغ مباشرةً: "لخّص لي حجّة المتكلّم الرئيسية"، أو "ماذا قال عن موضوع كذا؟". المساعد الذكي يرى النصّ مع الطوابع الزمنية، فيستطيع الإحالة إلى موضع التفريغ.
- تبحث في مكتبتك كاملةً. لو فرّغت ٢٠ محاضرة وكنت تذكر مصطلحاً معيناً قيل في إحداها، تبحث وتجده.
- تُدرج آيات قرآنية. أمر
/quranيدرج الآية بنصّها الموثَّق إذا احتجت الاستشهاد بها أثناء تنظيم التفريغ. - تصدّر التفريغ إلى Markdown أو PDF أو Word لتُلحقه بورقة بحث أو تشاركه.
النسخة الموسّعة لكيفية ربط التفريغ بالكتابة الأكاديمية كاملةً في الذكاء الاصطناعي في البحث الأكاديمي العربي.
الخلاصة الصريحة
التفريغ الصوتي العربيّ في ٢٠٢٦ صار من الأمور التي تستطيع أن تنجزها بكلفة بسيطة ووقت قصير. الذي يأخذ الوقت اليوم هو السير من "عندي ثلاثون ساعة من المادّة" إلى "عندي مستند بحثيّ قابل للاستشهاد". وهذا السير ليس عن التفريغ نفسه، بل عمّا تفعله به بعد ذلك.
إن كانت هذه مشكلتك، جرّب nuss.ink مجّاناً بلا بطاقة ائتمان. وإن كنت تبني خطّك البرمجيّ الخاصّ، فـ Groq هي الإجابة الأرخص. وإن كنت تحتاج دقّة كاملة لا تساوم، فالتفريغ البشريّ لا يزال له مكانه.