آخر الأخبار
مايكروسوفت تطوّر نموذجًا ذكيًا يمكنه التحكم في برامج ويندوز وتنفيذ المهام

أعلنت شركة مايكروسوفت عن تطويرها لنموذج ذكاء اصطناعي جديد يسمى “Large Action Model” (LAM)، وهو نموذج قادر على أداء مهام عملية داخل بيئة نظام التشغيل ويندوز، مما يمثل نقلة نوعية في طريقة تعامل الذكاء الاصطناعي مع البرمجيات والأجهزة. على عكس النماذج التقليدية مثل GPT-4، التي تقتصر مهامها على معالجة النصوص وإنشائها، يمكن لنموذج LAM أن يتفاعل مع الأنظمة البرمجية في بيئة حقيقية، ويُنفذ الأوامر بشكل عملي.
ما هو نموذج LAM؟
نموذج LAM هو تقنية متقدمة تم تصميمها خصيصًا للعمل مع مجموعة واسعة من تطبيقات مايكروسوفت مثل “وورد”، “إكسل”، وغيرها من تطبيقات الأوفيس، بالإضافة إلى القدرة على التحكم في برامج ويندوز بشكل عام. الفكرة وراء هذا النموذج ليست جديدة، لكن ما يميز LAM هو قدرته على تحويل الأوامر النصية إلى أفعال حقيقية وواقعية ضمن الأنظمة التي يدمج معها.
القدرة على التنفيذ الفعلي
على سبيل المثال، عندما يطلب المستخدم من النموذج التسوق عبر الإنترنت، يمكن لنموذج LAM أن يتنقل بين صفحات الويب ويحدد الخيارات المناسبة ويقوم بإتمام عملية الشراء بشكل مستقل. في حين أن النماذج التقليدية مثل GPT-4 قد تكون قادرة فقط على تقديم إرشادات نصية حول كيفية إتمام العملية، فإن LAM يمكنه تنفيذ العملية الفعلية بشكل أسرع وأكثر كفاءة.
مراحل تطوير نموذج LAM
تطور نموذج LAM من خلال أربع مراحل رئيسية:
- التدريب على تخطيط المهام: يشمل ذلك تحليل المهام المعقدة وتقسيمها إلى خطوات منطقية يمكن تنفيذها.
- التعلم من النماذج المتقدمة: يعتمد LAM على نماذج مثل GPT-4 لتحويل الخطط التي تم وضعها إلى أفعال حقيقية داخل النظام.
- الاستكشاف الذاتي: من خلال هذه المرحلة، يتعلم النموذج كيفية تجاوز العقبات وإيجاد حلول بديلة للمشكلات التي قد تواجهه أثناء التنفيذ.
- التدريب المستند إلى المكافآت: يهدف هذا إلى تحسين دقة النموذج في تنفيذ المهام بشكل صحيح.
التجربة العملية في “وورد”
تم اختبار نموذج LAM في بيئة اختبار خاصة داخل برنامج “وورد”، حيث أظهر النموذج قدرة فائقة في تنفيذ المهام بشكل دقيق. في اختبار أُجري على مجموعة من المهام، تمكن LAM من تنفيذ الأوامر بنسبة نجاح بلغت 71%، متفوقًا على GPT-4 الذي سجل نجاحًا بنسبة 63% في نفس السياق بدون أي معلومات بصرية. كما كان نموذج LAM أسرع بشكل ملحوظ في إتمام المهمة، حيث استغرق 30 ثانية فقط مقارنة بـ 86 ثانية لـ GPT-4. لكن عند تزويد GPT-4 بمعلومات بصرية، تحسنت دقته ليحقق 75.5%.
مصادر البيانات والتدريب
لتدريب نموذج LAM، اعتمد فريق مايكروسوفت على مجموعة كبيرة من البيانات المستخلصة من مصادر متنوعة مثل وثائق مايكروسوفت، مقالات من منصة “wikiHow”، بالإضافة إلى عمليات البحث عبر محرك البحث بينج. وقد تم استخدام نموذج GPT-4 كأساس لتطوير وتحسين المهام التي يقوم بها LAM في بيئات عمل مختلفة.
التحديات والقيود
على الرغم من التقدم الكبير الذي أحرزه نموذج LAM، إلا أن هناك بعض التحديات التي تواجهه. قد تحدث بعض الأخطاء أثناء تنفيذ الأفعال، كما أن هناك قضايا تنظيمية وتقنية يجب معالجتها لضمان قابلية التطبيق في مجالات مختلفة. كما توجد بعض القيود التقنية التي قد تحد من قدرة النموذج على التوسع في المستقبل.
الأفق المستقبلي: الذكاء الاصطناعي العام
يعتقد الباحثون في مايكروسوفت أن نموذج LAM يمثل خطوة كبيرة نحو تحقيق الذكاء الاصطناعي العام (AGI)، وهو نوع من الذكاء الاصطناعي الذي يتجاوز القدرات المحدودة للنماذج الحالية مثل GPT-4. بدلاً من أن تقتصر الأنظمة على فهم النصوص وإنشائها، قد نرى قريبًا مساعدين رقميين يمكنهم أداء مهام متعددة يوميًا بنجاح ودقة، مما يفتح آفاقًا جديدة لتحسين الإنتاجية اليومية للأفراد والشركات.