آخر الأخبار
جوجل تطلق Imagen 4: قفزة نوعية في توليد الصور بالذكاء الاصطناعي.

في خطوة جديدة تعكس التزام جوجل بدفع حدود الابتكار في مجال الذكاء الاصطناعي، كشفت الشركة عن الجيل الرابع من نموذجها المتقدم لتوليد الصور Imagen 4، الذي يُمثّل قفزة نوعية على مستوى دقة التفاصيل البصرية، وسرعة المعالجة، والأهم من ذلك: القدرة على كتابة النصوص داخل الصور بدقة مذهلة. النموذج الجديد، الذي تم تطويره ضمن فريق DeepMind التابع لجوجل، يأتي في سياق تنافسي محتدم بين الشركات التقنية الكبرى مثل OpenAI، Meta، وAnthropic، ولكنه يتميّز بمجموعة من الخواص الفريدة التي قد تمنحه موقعًا رياديًا في هذا المجال.
دقة فائقة وتفوق تقني في تفاصيل الصور
بحسب ما نشره إيلي كولينز، نائب رئيس المنتجات في Google DeepMind، فإن Imagen 4 يجمع بين الدقة العالية وسرعة الأداء، ما يُمكّنه من توليد صور بمستوى واقعية قريب من الصور الفوتوغرافية الاحترافية. النموذج قادر على التقاط أدق التفاصيل في المشهد، مثل:
- نسيج الأقمشة المعقدة التي تتطلب معالجة دقيقة للضوء والظل
- قطرات الماء في لحظة سقوطها أو تناثرها
- تفاصيل فراء الحيوانات بتدرجات لونية دقيقة
- الانعكاسات على الأسطح والزجاج
- الإضاءة الطبيعية والاصطناعية في المشاهد المختلفة
وليس هذا فحسب، بل يمتاز Imagen 4 بقدرته على توليد صور بأساليب فنية متعددة، منها الواقعي، التجريدي، الكرتوني، والرسومي ثلاثي الأبعاد، مما يجعله أداة مثالية للفنانين والمصممين وصناع المحتوى الرقمي.
تطوّر غير مسبوق في الكتابة داخل الصور
واحدة من أبرز نقاط القوة في Imagen 4 – وربما الأكثر انتظارًا من قبل المستخدمين – هي قدرته الدقيقة على تضمين النصوص داخل الصور بطريقة صحيحة وقابلة للقراءة، حتى عند استخدام خطوط صغيرة جدًا أو أنماط خطية معقدة. هذه الميزة كانت تُعتبر تحديًا مستعصيًا في النماذج السابقة، التي غالبًا ما فشلت في كتابة كلمات مفهومة أو حافظت على انتظام الحروف داخل الصورة.
مع Imagen 4، أصبح من الممكن استخدام الذكاء الاصطناعي في تصميم:
- الملصقات الإعلانية
- القصص المصوّرة (Comic Books)
- البطاقات التفاعلية والمناسبات
- العروض التقديمية التعليمية والتجارية
- التغليف الإبداعي للمنتجات
- الطوابع البريدية والتصاميم الدقيقة
وقد عرضت جوجل عددًا من الصور التجريبية لإثبات قدرات النموذج، مثل صورة حوت ضخم يقفز من الماء، وحرْباء تم تمثيل ألوانه بدقة مذهلة، وصورة لطابع بريدي تتضمن كتابة بحجم صغير جدًا لكن ظهرت واضحة ومقروءة بالكامل.
تكامل واسع وتوفر عبر منصات متعددة
جوجل لا تكتفي بإطلاق النموذج كمنتج مستقل، بل تسعى إلى دمجه بسلاسة في مجموعة واسعة من منصاتها وتطبيقاتها، ما يمنح المستخدمين من مختلف التخصصات القدرة على الاستفادة من مزاياه. ومن بين المنصات التي سيتوفر فيها Imagen 4 بدءًا من 20 مايو 2025:
- تطبيق Gemini: المساعد الذكي المتطور من جوجل، الذي سيتيح توليد صور عبر الأوامر الصوتية أو النصية.
- منصة Whisk: التي تُستخدم لتخطيط الوصفات والمحتوى الغذائي، ما يفتح المجال أمام توليد صور طعام بدقة عالية.
- Vertex AI: المنصة السحابية المتكاملة للمطورين، ما يسمح بدمج Imagen 4 في تطبيقات الذكاء الاصطناعي المخصصة.
- تطبيقات Google Workspace: مثل Google Docs وGoogle Slides وGoogle Vids، حيث يمكن استخدام النموذج مباشرة داخل المستندات والعروض التقديمية لتصميم محتوى مرئي مخصص بسرعة وكفاءة.
إصدار أسرع قادم قريبًا
وفي تطوّر لافت، أعلنت جوجل أنها تعمل حاليًا على نسخة أسرع من Imagen 4، من المتوقع أن يتم إطلاقها قريبًا. ووفقًا للشركة، فإن هذا الإصدار سيكون أسرع بحوالي 10 مرات من الجيل السابق Imagen 3، ما يُعزز من قابلية استخدامه في سيناريوهات الوقت الحقيقي مثل توليد الصور الفوري أثناء الاجتماعات أو المحادثات أو العروض التفاعلية.
المنافسة مع OpenAI وماذا بعد؟
لا يمكن تجاهل أن هذه الخطوة تأتي في سياق منافسة مباشرة مع نماذج مثل DALL·E 3 من OpenAI، والذي بدأ مؤخرًا في تحسين قدرته على الكتابة داخل الصور أيضًا. لكن ما يميّز Imagen 4 بحسب جوجل هو الدمج بين الدقة والسرعة، وتوفير مرونة في الأنماط والأساليب، والتكامل السلس مع النظام البيئي لتطبيقات جوجل، ما يجعل من السهل على المستخدمين من مختلف الخلفيات – من المصممين والمعلنين إلى التربويين وروّاد الأعمال – استغلال قدرات النموذج في أعمالهم اليومية.
مع إطلاق Imagen 4، يبدو أن جوجل ترسم ملامح مستقبل جديد لتوليد الصور عبر الذكاء الاصطناعي، حيث لم تعد المسألة مجرد صور جميلة، بل صور ذكية تدمج بين الجمال والدقة والمعلومة. هذا النموذج قد يكون البداية لثورة في التصميم، التعليم، الإعلان، والتسويق البصري، خاصةً مع تطوّر قدراته اللغوية والبصرية في آنٍ واحد.
لكن كما أشارت جوجل، فإن الاختبار الحقيقي للنموذج سيكون في تجربة المستخدمين الفعلية، ومدى قدرتهم على تحقيق أقصى استفادة منه في السياقات الواقعية والتطبيقات المتنوعة.