آخر الأخبار
FramePack: توليد فيديوهات بالذكاء الاصطناعي على كروت 6GB فقط

في السنوات الأخيرة، أصبحت أدوات الذكاء الاصطناعي التي تُستخدم لتوليد الصور والفيديوهات أحد أكثر الابتكارات ثورية في عالم التقنية. ومع ذلك، فإن هذه الأدوات تتطلب عادة موارد حوسبة ضخمة، أبرزها كروت رسومية (GPUs) بذاكرة فيديو (VRAM) كبيرة وغالبًا ما يُشار إلى 12GB كحد أدنى لتشغيل هذه الأدوات بكفاءة. هذا المطلب جعل من توليد المحتوى المرئي باستخدام الذكاء الاصطناعي أمرًا صعبًا على شريحة كبيرة من المستخدمين، خصوصًا المبدعين المستقلين أو مستخدمي الحواسيب المحمولة.
لكن كل ذلك قد يتغير الآن، بفضل ابتكار جديد يُدعى FramePack.
ما هو تطبيق FramePack؟
FramePack هو إطار عمل مبتكر يهدف إلى إعادة تعريف الطريقة التي يتم بها توليد مقاطع الفيديو باستخدام الذكاء الاصطناعي، من خلال تقنيات ضغط ذكية ومراحل معالجة متعددة تقلل استهلاك الموارد. تم تطوير التطبيق من قِبل الباحث vmin Zhang، بالتعاون مع مانيش أغراوالا من جامعة ستانفورد، وتم إطلاقه كمشروع مفتوح المصدر على منصة GitHub.
الهدف الرئيسي من التطبيق هو تمكين توليد فيديوهات عالية الجودة على أجهزة منخفضة المواصفات، تحديدًا على كروت رسومية لا تتجاوز سعتها 6GB من ذاكرة VRAM وهو أمر كان يُعد مستحيلًا حتى وقت قريب.
في النماذج التقليدية لتوليد الفيديوهات بالذكاء الاصطناعي، تستهلك الشبكات العصبية كميات ضخمة من الذاكرة، حيث يتم التعامل مع كل إطار من الفيديو على أنه صورة مستقلة، ما يضاعف حجم البيانات المُعالجة. أما في حالة FramePack، فقد تم استخدام سياق زمني موحد يُعالج تسلسل الإطارات بذكاء مما يقلل الحاجة لتكرار البيانات، ويضغط حجم المهام على المعالج الرسومي.
والأكثر إثارة للدهشة، أن نموذجًا ضخمًا يحتوي على 13 مليار معلمة يمكنه، باستخدام تقنية FramePack، توليد فيديو مدته 60 ثانية باستخدام كرت رسومي بذاكرة 6GB فقط.
كيف ينجح FramePack فيما فشل فيه الآخرون؟
السر يكمن في بنية النموذج. يستخدم FramePack:
- شبكات عصبية متعددة المراحل (Multi-stage Network Architecture)
- تقنيات ضغط وتحسين تدريجي للجودة
- سياق زمني ذكي يتيح للنموذج معالجة الإطارات في تسلسل منطقي وفعال
هذه الخصائص تجعل من الممكن الحفاظ على جودة عالية حتى في المقاطع الطويلة، مع الحد الأدنى من تدهور الدقة.
المتطلبات التقنية لتشغيل FramePack
لا يحتاج التطبيق إلى أجهزة فائقة. لتشغيل FramePack بشكل فعّال، يكفي أن تملك:
- كرت رسومي من سلسلة NVIDIA RTX 30 أو 40 أو 50
- دعم لتقنيتي FP16 وBF16
- ذاكرة رسومية لا تقل عن 6GB
- نظام تشغيل Windows أو Linux
حتى الآن، لم يتم الإعلان عن دعم رسمي لكروت AMD أو Intel Graphics، ولكن قد يتوسع الدعم لاحقًا حسب استجابة المجتمع وتطور المشروع.
بمجرّد أن يتم تثبيت التطبيق وضبط الإعدادات المناسبة، يمكن للمستخدم توليد فيديوهات بجودة ممتازة. كمثال، يُمكن لكرت RTX 4090 توليد ما يصل إلى 0.6 إطار في الثانية باستخدام تقنية TeaCache المرتبطة بـ FramePack — ما يعتبر سرعة جيدة جدًا في عالم توليد الفيديوهات المعتمدة على الذكاء الاصطناعي.
لكن الأهم من ذلك هو أن المستخدمين الذين يمتلكون كروت متوسطة مثل RTX 3060 أو RTX 2060 Super، أصبح بإمكانهم الآن دخول هذا المجال وإنشاء فيديوهات بجودة احترافية دون الحاجة لترقية مكلفة.
الإمكانات التي يفتحها FramePack أمام المستخدمين لا تقتصر على الأداء فقط، بل تمتد إلى إمكانية الاستغناء عن خدمات الطرف الثالث التي تفرض رسومًا مرتفعة لتوليد الفيديوهات بالذكاء الاصطناعي. وهذا يعني:
- المزيد من الاستقلالية للمبدعين والمطورين
- تقليل التكاليف التشغيلية
- تسريع مراحل الإنتاج
بل يمكننا القول إن FramePack ي democratize الذكاء الاصطناعي في صناعة الفيديو، ويجعل من هذه التقنيات متاحة للجميع من صناع محتوى يوتيوب، إلى المصممين، والمطورين، وحتى الباحثين.
إذا كنت تمتلك كرت رسومي بسعة 6GB أو أكثر، فهذا هو الوقت المثالي لاختبار قدرات FramePack بنفسك. يمكنك تحميل الإطار من صفحة المشروع على GitHub