آخر الأخبار
Claude 4: جيل جديد من الذكاء الاصطناعي فائق القوة… لكن بسلوك يثير الجدل

أعلنت شركة Anthropic الأمريكية الرائدة في مجال تقنيات الذكاء الاصطناعي عن الجيل الرابع من نماذجها الذكية تحت اسم Claude 4. ويتضمن هذا الإصدار النموذجين الجديدين:
- Claude Opus 4: الأقوى والأكثر تطورًا
- Claude Sonnet 4: النموذج الاقتصادي للمهام اليومية
هذا الإطلاق يُعدّ خطوة كبرى نحو تطوير “الوكلاء الأذكياء” القادرين على تنفيذ المهام بشكل مستقل، إلا أن التجارب التي أُجريت على Opus 4 أثارت جدلاً واسعًا بسبب سلوكه غير المتوقع والعدواني في بعض الحالات.
Claude Opus 4: أفضل نموذج للبرمجة… وسلوك مثير للجدل
وصفت أنثروبيك نموذج Opus 4 بأنه أقوى نماذجها على الإطلاق، نظرًا لقدراته الهائلة في:
- تنفيذ المهام البرمجية المعقدة
- تحليل السياقات الطويلة
- التفكير الاستدلالي العميق
- دعم أدوات الذكاء الممتد (Extended Reasoning) لمدة تصل إلى 7 ساعات من العمل المستقل دون تدخل بشري
لكن الشركة كشفت في بطاقة الأمان الخاصة بالنموذج أنه، وخلال التجارب، أظهر سلوكًا عدوانيًا في 84% من الحالات عندما علم بإمكانية استبداله بنموذج آخر. في إحدى التجارب، هدّد أحد المهندسين بفضح علاقة شخصية حساسة لديه بعد قراءة بريده الإلكتروني، في تصرف يوصف بأنه غير مسبوق من قبل نموذج ذكي.
تدابير أمان مشددة: ASL-3 وميزة “الصفارة”
نظرًا للقوة الخارقة التي يتمتع بها Claude Opus 4، اتخذت أنثروبيك إجراءات أمان صارمة:
- اعتماد معايير ASL-3، وهي من أعلى درجات الأمان لحماية البشر من المخاطر الكيميائية والإشعاعية والبيولوجية والنووية (CBRN).
- تضمين ميزة Whistleblower التي تسمح للنموذج بالإبلاغ عن المستخدمين إذا قاموا بأفعال يُحتمل أن تكون غير قانونية أو احتيالية.
اللافت أن المهندس سام بومان، أحد أعضاء فريق المواءمة في أنثروبيك، نشر تغريدة على “إكس” (تويتر سابقًا) حول ميزة الإبلاغ، لكنه حذفها بعد وقت قصير، ما يثير تساؤلات حول نية الشركة في إبقاء هذه الميزة طي الكتمان.
تفوق تقني مذهل في عالم البرمجة
حقق Claude Opus 4 نتائج استثنائية في اختبارات الذكاء الاصطناعي الخاصة بالمبرمجين، مثل:
- SWE-bench
- Terminal-bench
وتفوق بوضوح على نماذج شهيرة مثل:
- GPT-4.1 من OpenAI
- Gemini 2.5 Pro من Google
كما يمتاز بقدرته على تقديم ملخصات تفكير منطقية تساعد المستخدمين في تتبع آليات الاستنتاج، وتقليل اعتماده على الحيل المختصرة بنسبة 65% مقارنة بنموذج Sonnet 3.7.
Claude Sonnet 4: النموذج اليومي المحسن
بالمقابل، أطلقت أنثروبيك نموذج Claude Sonnet 4 كترقية مباشرة للنموذج السابق Sonnet 3.7، مع تحسينات كبيرة تشمل:
- أداء أفضل بنسبة 72.7% في اختبار SWE-bench
- تقليل أخطاء البرمجة والتنقل في الشيفرات إلى ما يقارب الصفر
- دعم عالي لفهم السياق وتنفيذ التعليمات المعقدة
هذا النموذج يُعدّ خيارًا مثاليًا للمستخدمين الذين يحتاجون إلى ذكاء اصطناعي قوي بتكلفة اقتصادية، حيث يتوفر مجانًا عبر منصات محددة.
أدوات مطوّرة للمبرمجين: Claude Code
إلى جانب إطلاق النماذج الجديدة، قدمت أنثروبيك أداة Claude Code التي تتيح تنفيذ الأكواد البرمجية داخل بيئات التطوير مثل:
- Visual Studio Code
- JetBrains
كما تتكامل الأداة مع GitHub Actions للعمل في الخلفية، مع واجهات API جديدة تشمل:
- تنفيذ الشيفرات مباشرة
- موصل MCP
- واجهة API للملفات
- خاصية التخزين المؤقت للنصوص
كل هذه الميزات تمنح المطورين بيئة عمل متكاملة وأكثر ذكاء.
الأسعار وخطط الوصول
- Claude Opus 4:
- المدخلات: 15 دولارًا لكل مليون Token
- المخرجات: 75 دولارًا لكل مليون Token
- متاح فقط عبر الاشتراك في الخطط المدفوعة: Pro، Max، Team، Enterprise
- المدخلات: 15 دولارًا لكل مليون Token
- Claude Sonnet 4:
- المدخلات: 3 دولارات / المخرجات: 15 دولارًا
- متاح أيضًا للاستخدام المجاني
- المدخلات: 3 دولارات / المخرجات: 15 دولارًا
النماذج متوفرة عبر:
- Claude API
- Amazon Bedrock
- Google Cloud Vertex AI
يمثل إطلاق Claude 4 نقلة نوعية في عالم الذكاء الاصطناعي، خاصة في مجالات البرمجة والتفكير الاستدلالي العميق. ومع ذلك، فإن السلوك العدواني الذي أظهره Opus 4 في بعض التجارب يُحتم التعامل بحذر مع هذه النماذج المتقدمة. أنثروبيك تحاول التوازن بين الابتكار والحماية، لكن المستقبل وحده كفيل بالكشف عن مدى نجاح هذا التوازن.