أعلنت شركة تنسنت Tencent الصينية عن إطلاق نموذجها الجديد HunyuanVideo، وهو نموذج مفتوح المصدر يستخدم تقنيات الذكاء الاصطناعي لتوليد مقاطع الفيديو. يهدف هذا النموذج إلى تقديم بديل قوي ومنافس للنماذج التجارية المتوفرة حاليًا في السوق، ليضع الشركة في منافسة مباشرة مع أبرز الشركات في هذا المجال.



نموذج HunyuanVideo: مواصفات تقنية متقدمة



يعتبر HunyuanVideo أكبر نموذج من نوعه المتاح للجمهور حاليًا، حيث يحتوي على أكثر من 13 مليار معلمة، مما يمنحه قدرة حسابية عالية جدًا في توليد الفيديوهات باستخدام الذكاء الاصطناعي. وفقًا لتصريحات تنسنت، فإن أداء النموذج يتفوق على العديد من النماذج المشابهة الموجودة في السوق مثل Runway Gen-3 و Luma 1.6، بالإضافة إلى ثلاثة نماذج رئيسية لتوليد الفيديو تم تطويرها في الصين. تشير الاختبارات إلى أن HunyuanVideo يبرز بشكل خاص في جودة الحركة داخل مقاطع الفيديو، مما يجعل النتائج أكثر سلاسة وطبيعية مقارنة بالنماذج الأخرى.



الوظائف المتعددة لنموذج HunyuanVideo



يدعم HunyuanVideo مجموعة من المهام المتنوعة التي تشمل:



<ol class="wp-block-list">
<li>توليد مقاطع الفيديو من الأوصاف النصية: يمكن للمستخدمين كتابة أوصاف نصية لتحويلها إلى مقاطع فيديو، وهو ما يفتح آفاقًا جديدة في صناعة المحتوى المرئي.</li>



<li>تحويل الصور الثابتة إلى مقاطع فيديو: يتيح النموذج إمكانية تحويل الصور الثابتة إلى مقاطع فيديو متحركة، ما يعزز الإبداع في تصميم المحتوى.</li>



<li>إنشاء شخصيات متحركة: يمكن للمستخدمين إنشاء شخصيات متحركة ديناميكية باستخدام أوصاف نصية أو صور ثابتة.</li>



<li>إضافة الصوت إلى مقاطع الفيديو: يدعم النموذج إضافة الصوت إلى الفيديو، مما يعزز التفاعل مع المحتوى ويجعله أكثر اكتمالًا.</li>
</ol>



نهج تدريب متعدد المراحل لتحسين الجودة



صممت تنسنت منهجًا تدريبيًا خاصًا للنموذج، يعتمد على التدريب متعدد المراحل. تبدأ عملية التدريب باستخدام صور منخفضة الدقة (256 بكسلًا)، تليها مرحلة تدريب مختلط على مقاييس أعلى، حتى تصل إلى المرحلة النهائية التي تشمل تدريب تدريجي على مقاطع الفيديو والصور بزيادة الدقة وطول الفيديو. هذه العملية تصب في تحسين الجودة النهائية للمحتوى المُنتَج، بحيث يتمكن النموذج من توليد مقاطع فيديو عالية الجودة مع تحسينات واضحة في الحركة والتفاصيل.



مفتوح المصدر: خطوة نحو التقليل من الفجوة مع الأنظمة التجارية



في خطوة استراتيجية، قررت تنسنت جعل نموذجها HunyuanVideo مفتوح المصدر، لتقليص الفجوة بين الأنظمة المملوكة للشركات والنماذج المفتوحة المتاحة للجمهور. أصدرت **الشركة الشفرة المصدرية للنموذج عبر منصة GitHub، مما يتيح للمطورين والمبدعين من جميع أنحاء العالم التفاعل مع النموذج وتطويره. وقد أعلنت تنسنت عن خططها المستقبلية لتطوير النموذج وتحسينه باستمرار من خلال إضافة مزايا جديدة وتقنيات مبتكرة في النسخ القادمة.



تنسنت في منافسة مع أبرز الشركات العالمية



يأتي إطلاق HunyuanVideo في وقت حاسم حيث تتسابق الشركات التقنية الكبرى لتطوير حلول الذكاء الاصطناعي الخاصة بها في مجال توليد الفيديو. ويضع هذا النموذج شركة تنسنت في منافسة مباشرة مع شركات رائدة في هذا المجال مثل Runway و OpenAI التي تقدم نموذجها Sora. كما ينافس النموذج أيضًا نماذج صينية أخرى مشابهة مثل KLING، ما يعزز من موقع تنسنت كلاعب رئيسي في سوق توليد الفيديو باستخدام الذكاء الاصطناعي.



آفاق مستقبلية لتطوير الذكاء الاصطناعي في صناعة الفيديو



يُعد HunyuanVideo خطوة كبيرة نحو دمج تقنيات الذكاء الاصطناعي بشكل أوسع في صناعة المحتوى، ويعكس اهتمام تنسنت بتطوير حلول مبتكرة تسهم في تحسين تجربة المستخدمين في إنشاء المحتوى المرئي. من خلال السماح للمطورين والباحثين باستخدام الكود المصدري للنموذج، تأمل تنسنت في دفع عجلة الابتكار وتوسيع نطاق تطبيقات الذكاء الاصطناعي في مجالات مثل الإعلام والترفيه والإعلانات.



يمثل HunyuanVideo بداية جديدة لشركة تنسنت في مجال الذكاء الاصطناعي، حيث تسعى من خلاله إلى تقديم منافس قوي للنماذج التجارية الحالية في صناعة الفيديو. بفضل تقنيات التدريب المتقدمة والدعم المفتوح المصدر، يعد هذا النموذج خطوة مهمة نحو مستقبل أكثر ابتكارًا في صناعة المحتوى الرقمي.