bdaudey

التعليق الصوتي والدبلجة الآلية الاحترافية

يزداد اليوم، استخدام الدبلجة الآلية بالتزامن مع نمو استخدام الذكاء الاصطناعي ووسائل التواصل السمعي-البصري. فتتقدم التقنيات التي اعتبرت شبه مستحيلة منذ بضعة سنوات، لتصبح تدريجياً القاعدة الأساسية للعمل. من كان يتصور، أن يكون بوسعنا إنجاز تعليق صوتي أو دبلجة بجودة عالية، واحترافية، مقابل بضع مئات من اليورو؟ لكن حذار، لأن النتائج قد تكون كارثية من دون بذل الجهد المطلوب ومراقبة جودة العمل. إذاً، كيف نتمكن من إنشاء محتوى بجودة عالية بتكلفة أقل؟ اكتشفوا جميع التفاصيل في هذا المقال.

وسائل التواصل…في عصرها الذهبي

شكلت الفيديوهات في عام ٢٠٢٢، ٨٢٪ من نسبة الحركة العالمية لاستخدام شبكات الانترنت، أي نمو بقدر ١٥ ضعف مقارنة بعام ٢٠١٧، ولا تظهر هذه الظاهرة أي علامات تباطؤ. فقد دمج المعلنون ووكالات الإعلان وتسويق المواقع الإلكترونية الفيديوهات في استراتيجيات التواصل الخاصة بهم، والنتائج إيجابية.

فسواء كنا نتكلم عن المنصات أو مواقع الويب أو الأحداث أو رسائل البريد الإلكتروني أو الإعلانات المدفوعة، يظهر الفيديو كأداة رئيسية لجذب انتباه المستهلك. فتم إطلاق TikTok، المنصة المخصصة للفيديوهات، في عام ٢٠١٦. أما منصة Instagram(Meta) التي انتقلت مؤخرًا من الصورة إلى الفيديو، باتت الخوارزمية الخاصة بها تفضل الفيديوهات المباشرة أو حتى الReels. تظهر منصات Facebook (Meta)، X (ex Twitter) ، وLinkedIn معدلات مشاركة متزايدة باستمرار على مقاطع الفيديو. فخلال الأعوام الخمس الماضية وبهدف الوصول إلى جمهور دولي، تعين على ناشري المحتوى، إما تسجيل الفيديوهات باللغة الإنجليزية، أو ترجمة المحتوى إلى جميع اللغات الخاصة بالدول والجماهير الهدف. مثال على ذلك، نجم يوتيوب Mr Beast، الذي لطالما ترجم محتواه إلى عدد كبير من اللغات، وذلك حتى قدّمت منصة يوتيوب ميزة الدبلجة للمرة الأولى. تجدر الإشارة أن Atenao هي أول وكالة ترجمة فرنسية استخدمت ميزة الدبلجة من يوتيوب لدبلجة فيديوهات Amixem.

ما هو الاستنساخ الصوتي؟

إنّ الاستنساخ الصوتي أو voice cloning هو تكنولوجيا تعتمد على خوارزميات الذكاء الاصطناعي لاستنساخ وإعادة تكوين صوت الإنسان. تحلل هذه الخوارزميات نماذج صوتية ولغوية لصوتٍ مسجّل ما يسمح استخدام الصوت المستنسخ لإنتاج خطابات معدّلة آلياً، كما وأنها تنتمي لشخصٍ حقيقي.

تتضمن عملية الاستنساخ الصوتي تسجيل عدد كبير من البيانات الصوتية العائدة إلى الصوت الهدف، ثم استخدام تقنيات التعلم الآلي، مثل الشبكات العصبية العميقة، لمحاكاة هذا الصوت وإعادة إنتاجه بدقة. فكلما تنوعت وازدادت كمية البيانات المستخدمة لتصميم الصوت، كلما تحسنت جودة الاستنساخ الصوتي.

تتعدد تطبيقات الاستنساخ الصوتي، انطلاقاً من تركيب الخطابات لبرامج المساعدة الصوتية، مروراً بأنظمة الملاحة، والكتب الصوتية، وألعاب الفيديو، وصولاً إلى عالم الترفيه حيث بات بإمكاننا إعادة تكوين أصوات المشاهير المتوفين أو حتى دبلجة الشخصيات الخيالية.

الدبلجة الآلية عبر الاستنساخ الصوتي؟ نعم، لكن وفق منهجية دقيقة

بدأت معظم منصات الترجمة الآلية للأفلام تعمل في الاستنساخ الصوتي، وهي في منافسة مباشرة مع مواقع الويب، والمؤسسات والمشاريع المرتبطة بالذكاء الاصطناعي. تحتدم المنافسة بين المؤسسات من مختلف أنحاء العالم، من الفرنسيين Checksub و lipitt (التي أحدثت ضجةً على الويب عبر منشورها على LinkedIn مع الممثلة Zendaya)، وVexub، مروراً بالأميركيين مثل Lovo أو Rask، وصولاً إلى المؤسسات الصينية التي تدخل مؤخراً على الأسواق.

لنتمكن من ضمان نجاح عملية الدبلجة الآلية، من الضروري اتباع منهجية عمل معينة. فلطالما تعيّن، علينا تصحيح مقاطع فيديو مدبلجة آلياً ذوات جودة ترجمة ركيكة جداً. فيما يلي، الخطوات السبع الأساسية لأفضل النتائج.

الخطوة ١: التفريغ الصوتي

وقع اختيارنا لهذه الخطوة على Checksub، البرنامج الأكثر فعالية والذي يتغلب، برأينا، على منافسيه Rask أو Lovo وفق حاجاتنا. يقوم التفريغ الصوتي الموقوت الآلي للنصوص على الحصول على ملف بصيغة SRT مقطّع إلى أقسام معدّة لصيغة ترجمة الأفلام ومقاطع الفيديو. تخولنا الإعدادات تعديل ملف الSRT ليتوافق مع التعليق الصوتي أو الدبلجة.

الخطوة ٢: الترجمة

لم ينبغي استخدام باقة Pro من برنامج الترجمة الآلية DeepL لدى اللجوء للترجمة الآلية للمحتوى الخاص بكم؟ لأنه لا يتم تسجيل البيانات أي النصوص والملفات الخاصة بكم بشكلٍ دائم، بل فقط لمدة إنجاز العمل المطلوب، ويتم حذفها بعد إنجاز الخدمات التي تم التعاقد عليها. لدى استخدامكم DeepL Pro، لا يتم استخدام نصوصكم لتحسين جودة خدمات الترجمة الخاصة بالبرنامج. إذ تختلف حقوق الاستخدام عن Google Translate وحتى عن الباقة المجانية من DeepL.

 

الخطوة ٣: تصحيح وضبط جودة الترجمة

يتم إنجاز، عملية تنقيح وتصحيح للترجمة لضبط أخطاء الترجمة، وأخطاء الإملاء، والتهجئة والقواعد. لكن يحبّذ المرور بعملية تنقيح احترافي كاملة، يكلّف بها مترجم احترافي.

عوضاً عن العمل على النصوص ثم على الفيديو، نصحح النصوص فيما نشاهد الفيديو بدقة وعناية لضبط أخطاء النطق ونقارنها بالفيديو الأصلي بالتزامن مع الخطوات المذكورة.

إن كنتم أنجزتم أعمال الترجمة، نطلب منكم إرسال النصوص في ملف بشكل جداول مزدوجة (عمود نص أصلي/ عمود النص المترجم) يحتوي على العلامات الوقتية كما في الصورة أدناه.

إن كنتم ترغبون بإنجاز التسجيل بأنفسكم، من الضروري تزويدنا بالنص لإنجاز التدقيق قبل تكوين الصوت.

الخطوة ٤: التسجيل

وضع وتسجيل الصوت على الفيديو (استنساخ صوتي أو اختيار الصوت).

الخطوة ٥: ضبط جودة الصوت

الحرص على ضبط جوة الصوت والنطق، والتأكد من جودة النص واللفظ، والصياغة الصحيحة.

الخطوة ٦: اللمسات الأخيرة

الحرص على المعايرة الصحيحة والتزامن الشفوي مع التسجيل النهائي. تنطوي اللمسات الأخيرة على أن يستمع المترجم الاحترافي، لمرّة أخيرة، إلى التسجيل خلال مشاهدة الفيديو، للقيام بأي تعديلات نهائية.

الخطوة ٧: التأكيد والإرسال للعميل

إرسال العمل النهائي للعميل والحصول على تأكيده.

أهمية جودة تحرير النص الأصلي

تنتج برامج الترجمة الآلية، نصوصاً مترجمةً بحرفيةٍ وهي لا تحسّن من جودة النص في معظم الأحيان. ما يعني أن نصاً ذو جودة تحرير ركيكة ينتج نصاً مترجماً ذو جودة أسوء. لذلك، ينبغي الحرص على جودة نصكم الأصلي للحصول على ترجمة آلية مقبولة.

إذ لن تحول عملية التنقيح الاحترافي نصكم الأصلي إلى أعجوبةٍ أدبية، لكنها تصحح المصطلحات الخاطئة وخيارات بناء الجملة الناتجة عن الترجمة الآلية.

حدود الدبلجة عبر الذكاء الاصطناعي

يثير الاستنساخ الصوتي مخاوف أخلاقية، بما فيها، قابلية نشر بيانات كاذبة أو خطابات مضللة، بالإضافة إلى مسائل الخصوصية المتعلقة بجمع واستخدام البيانات الصوتية للأفراد. تتطلب هذه المسائل تفكيراً مطولاً ووضع قوانين مخصصة لضمان استخدام هذه التكنولوجيا بمسؤولية وأخلاقية.

لا يمكن غض النظر عن حدود هذه التكنولوجيا من الناحية التقنية أيضاً. إذا أخذنا مقطع Lipitt في مقابلة Zendaya وTimothée Chalamet على LinkedIn على سبيل المثال، يبدو من الواضح أنه يقلل من صعوبة العمل المطلوب لمطابقة حركات الشفاه مع الترجمة. إذ من دون عملية تصحيح الصورة، يكون التزامن الشفوي الأساسي في مشروع دبلجة، فقير الجودة عبر الذكاء الاصطناعي. للحد من هذه المشكلة، يتعين علينا تحسين التزامن الشفوي منذ البداية خلال مرحلة الترجمة، وذلك عبر خيارات المصطلحات الملائمة. في Atenao، نكلّف المترجمين الاحترافيين الخاصين بنا بهذه الخطوة.

آخر موضوع ينبغي تناوله هي مسألة الغاية. ما هي غاية الاستنساخ الصوتي؟ لم نشاهد الفيديوهات؟ لأنها توقظ حواسنا عبر مشاهدة شخصٍ حقيقي ومراقبة سلوكه وشخصيته. إذ يتفوق الفيديو على التسجيلات الصوتية من حيث الأصالة والإبداع. فندمّر أصالة الفيديو وفرديته عبر إضافة صوتٍ، وكلماتٍ، وحركات شفاه لا تعود للشخص الموجود على الشاشة حتى ولو كان الاختلاف لا يذكر. بذلك، هل من الضروري فعلاً أن نشاهد مقطع فيديو لا يظهر أصالة الفرد الحقيقي وشخصيته؟ في نهاية المطاف، لم لا نقوم باستبدال الشخص بأكمله بالذكاء الاصطناعي؟ فعاجلاً أم آجلاً سيبدأ عالم السينما باستخدام هذه التكنولوجيا لإنتاج دبلجة الأفلام بشكلٍ آلي ولن تشكل طبقة من التأثيرات الاصطناعية أي مسائل أخلاقية لمنتجي أفلام هوليوود. كيف يسعنا التمييز إذاً، بين الأفلام المصورة والأفلام المتحركة؟

عندما اختار HugoDécrypte أن يستخدم التعليق الصوتي عوضاً عن الدبلجة في مقابلة Zendaya وTimothée Chalamet، نلاحظ أنه احتفظ بصوت الممثلين الأصلي في الخلفية. أليس ذلك شهادة على احترام الممثلين وأكثر متعةً لحواسنا؟ أليس من الأفضل أن نستمتع بكلام وصوت الممثل وأن يسعنا قراءة تعابير وجهه الفعلية؟ بالنسبة لنا، لطالما تغلبت قيمة الأصالة وتأثيرها على “التزييف”.

سرعةٌ وجودةٌ وأسعارٌ تنافسية!

لا نجد خدمة أفضل من الاستنساخ الصوتي من حيث سرعة التنفيذ وخفض الكلفة. فإن كنتم تجدون أنّ دبلجة عالية الجودة، باهظة السعر، يمكنكم بسعرٍ منخفضٍ، إنتاج تعليق صوتي آلي عالي الجودة.

تواصلوا معنا اليوم لجميع مشاريع الدبلجة الآلية أو التعليق الصوتي الخاصة بكم.