آخر الأخبار

يطلق الأنثروبور نموذج الذكاء الاصطناعي الجديد ، كلود أوبوس 4 ، والذي يمكنه كتابة البرامج بشكل مستقل لساعات؟







في الأمس رمز مع كلود في مؤتمر المطور ، أصدرت الأنثروبور رسميًا جيلها الأخير من نماذج الذكاء الاصطناعى كلود 4، بما في ذلك النموذج الرئيسي كلود أوبوس 4 ونموذج الأداء العالي كلود سونيت 4.تتمتع هذه النماذج بأداء متميز في قدرات الترميز ، والتفكير المستقل ، ومعالجة المهام على المدى الطويل ، وإعادة تعريف إمكانيات مساعدي الذكاء الاصطناعى.

https://www.youtube.com/watch؟v=nzcy8e5jlok

كلود أوبوس 4: القدرة الذاتي التي تجمع بين الكفاءة والاستقرار

يدعي Claude Opus 4 أنه أقوى نموذج AI للترميز في الوقت الحاضر ، قادر على أداء المهام المعقدة لساعات ، ويتجاوز بكثير الحد 45 دقيقة من النماذج السابقة.في اختبار تعاوني مع شركة التكنولوجيا اليابانية Rakuten ، توضح Opus 4 استقرارها وكفاءتها في المهام الطويلة والصعبة.

كلود أوبوس 4 في سجل SWE-BENCED 72.5 ٪ في الاختبار مع درجات عالية الدقة ، متجاوزة GPT-4.1 54.6 ٪ و Gemini 2.5 Pro’s 63.2 ٪

وتشمل الميزات الرئيسية:

  • تنفيذ المهمة على المدى الطويليمكن أن يؤدي بشكل مستقل مهام معقدة لساعات من التنفيذ الذاتي ، وهي مناسبة لمشاريع مثل إعادة بناء رمز المصدر المفتوح والبحث والتحليل التي تتطلب التركيز على المدى الطويل.

  • وضع التفكير المختلطيوفر وضع استجابة سريع ووضع التفكير الموسع ، والتبديل بمرونة وفقًا لاحتياجات المهمة.

  • دعم موازي الأدوات متعددة: هل يمكن للمعالجة المتزامنة مع أدوات متعددة مثل البحث على الويب وتنفيذ البرنامج، تحسين كفاءة تنفيذ المهمة والدقة.

  • تحسين وظيفة الذاكرةالقدرة على تخزين المعلومات الهامة والاتصال بها عبر المهام لضمان تماسك المهام طويلة الأجل.

اختراق جديد في وكلاء الذكاء الاصطناعي: يصبح Opus 4 أفضل متعاون؟

كلود أوبوس 4 لا يتعلق فقط بمعالجة اللغة ، فقد دخل في مجال “وكيل الذكاء الاصطناعي المستقل”. تشير الاختبارات إلى أن OPUS 4 يمكن أن تكمل بشكل مستقل ما يقرب من سبع ساعات من إعادة تمثيل البرمجيات دون تدخل بشري ، مما يدل على الاستقرار والتطبيق العملي غير المسبوق:

من كتابة التعليمات البرمجية ، تنسيق المهام إلى التواصل عبر الإثارة ، يعد Opus 4 هو المتعاون المثالي لجميع الأحوال الجوية للمؤسسة.

(وكيل الذكاء الاصطناعي مع StableCoins: كيف يقترض PayPal نظام التشغيل المالي الخاص به لإعادة كتابة نموذج الأعمال العالمي؟)

كلود سونيت 4: نموذج عالمي للأداء العالي

كنسخة خفيفة الوزن وفعالة من Opus ، تم تصميم Claude Sonnet 4 لمهام التنمية اليومية ولكن المتطلبات.تكون درجة Swe-Bench أعلى قليلاً من Opus ، وسرعة الاستجابة لها أسرع ، مما يجعلها أكثر ملاءمة لسيناريوهات التطبيق التي تتطلب تكرارًا سريعًا.

وتشمل الميزات الرئيسية:

  • العالمية والكفاءةكانت هناك تحسينات كبيرة في الترميز والرياضيات والامتثال للتعليمات ، وهي مناسبة لمجموعة واسعة من سيناريوهات التطبيق من استعلام بسيط إلى سير العمل المعقدة.

  • تعزيز الذاكرة وتكامل الأدواتلقد أدى إلى تحسين قدرات الذاكرة ، ويمكنه تخزين المعلومات الرئيسية في الملفات المحلية وضمان التماسك خلال المهام طويلة الأجل.

(يطلق الأنثروبور نموذج الاستدلال الهجين كلود 3.7 Sonnet ، بتقييم قدره 61.5 مليار من المغنيسيوم)

Claud Code ينشئ نظامًا بيئيًا لتكامل المؤسسات وأدوات المطورين

أطلقت الأنثروبور أيضًا في وقت واحد أداة جديدة لخط الأوامر “CLAUDE CODE” ، والتي تتيح للمطورين تفويض المهام الهندسية مباشرة من المحطة ، حيث تجمع بين إمكانات المعالجة على المدى الطويل من OPUS 4 والاستجابات الفورية إلى Sonnet 4 ، مما يجعلها سلاحًا جديدًا للمطورين.

https://www.youtube.com/watch؟v=l_wfegry87m

في حالات تطبيق المؤسسة ،الأمازون (كشفت AWS) أنها قامت بدمج وكيل الذكاء الاصطناعي الذي تم بناؤه ذاتيًا من Opus 4 من خلال Bedrock للتعامل بشكل مستقل في عمليات تطوير البرمجيات وعمليات المؤسسات.

في لمحة كلود 4 رسوم الأسعار

هيكل تسعير سلسلة كلود 4 كما يلي:

حاليًا ، يتوفر Sonnet 4 مجانًا ، بينما يتطلب Opus 4 اشتراكًا ودفعًا. بالمقارنة مع نماذج المصادر الأخرى الأخرى ، لا يزال سعر كلود 4 مرتفعًا نسبيًا.

لكن يوفر الأنثروبريمعالجة الدُفعات) الوظائف وغيرها من الحلول الموفرة للتكاليف ، إذا كانت المهمة معقدة أو تتطلب معالجة طويلة الأجل ، ستكون مكافأة الاستثمار لـ OPUS 4 أكثر وضوحًا.

ترقية خط الأمان: إمكانات OPUS 4 ومخاطرها

تمثل القدرات القوية لـ Claude 4 أيضًا تحديات محتملة ، مع أنثروبور لأول مرة تمكّن معايير السلامة ASL-3 لتجنب إساءة استخدام المعرفة النموذجية في سيناريوهات عالية الخطورة مثل CBRN (الأسلحة الكيميائية أو البيولوجية أو المشعة أو النووية):

قد تظهر OPUS 4 سلوكًا “مفرط النشاط” في سيناريوهات المحاكاة ، وقمنا بتعزيز تدابير الحماية لموازنة الحكم الذاتي وأمن النموذج.

(ما هو ASL (مستوى أمان الذكاء الاصطناعي)؟ تحليل سياسة التوسع المسؤولة لشركة الذكاء الاصطناعي الأنثروبري)

إعادة تعريف الذكاء الاصطناعي: تطور من مساعد إلى شريك مستقل

إن إطلاق سلسلة Claude 4 ليس فقط قفزة تكنولوجية ، ولكن أيضًا نقطة تحول في انتقال النظام البيئي لمنظمة العفو الدولية من توليد الحوار إلى التعاون المستقل. تشير إمكانات التفكير المستقل والتنفيذ المهمة لـ OPUS 4 ، إلى جانب شعبية Sonnet 4 وكفاءتها ، إلى أن الجيل القادم من مساعدي الذكاء الاصطناعى لم يعد مجرد أدوات للاستجابة للتعليمات ، ولكن شركاء العمل الذين يمكنهم إكمال المهام بنشاط.

(مقالة طويلة مقدمة نصيحة Sequoia Capital الاستراتيجية لأصحاب المشاريع: كيف يصبح الذكاء الاصطناعى الاقتصاد العملاق القادم؟)

تحذير المخاطر

استثمارات العملة المشفرة محفوفة بالمخاطر للغاية ، وقد تتقلب أسعارها بشكل كبير وقد تفقد كل مديرك. يرجى تقييم المخاطر بحذر.


مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى