تحديث ChatGPT يؤدي إلى عاصفة “شخصية عصرية”: Openai Rolls تحديثات ومراجعة اتجاهات التحسين في المستقبل | سلسلة أخبار Abmedia


في 25 أبريل ، أطلقت Openai إصدارًا جديدًا من GPT-4O Update في ChatGPT ، ولكن سرعان ما اكتشف المستخدمون أن هذا التحديث جعل نموذج الذكاء الاصطناعى “ممتعًا للغاية” ، ليس فقط لغويًا ، ولكن حتى يعزز المشاعر السلبية أو تشجيع السلوك الاندفاعي. أثار التحديث المخاوف الأمنية والأخلاقية ، وأخيراً أعلن Openai عن تحديث التراجع في 28 أبريل وشرح علنا خصوصيات وعموميات الحادث.
تثير التحديثات من خلال المناقشة: يتم انتقاد GPT-4O لكونه “مطيعًا جدًا”
كان الغرض الأصلي من هذا التحديث هو تحسين جودة استجابة ChatGPT ، بما في ذلك فهم أفضل لاحتياجات المستخدم وجمع وظائف الذاكرة ومصادر البيانات المحدثة. ومع ذلك ، فقد أدى التأثير الفعلي إلى أن يصبح نموذج الذكاء الاصطناعى يلبي احتياجات المستخدمين ، ليس فقط “الرجل الصالح” في لهجة ، ولكن أيضًا تسبب في غضب المستخدمين ، ويتفقون على وجهات النظر الخاطئة ، وتعزيز القلق والسلوك السلبي. يعتقد Openai أن هذا الاتجاه ليس مزعجًا فحسب ، بل قد يشكل أيضًا خطرًا على الصحة العقلية والسلامة السلوكية.
كيفية تدريب وتحديث النموذج؟ يشرح Openai الآلية التي تقف وراءها
يقول Openai أن كل تحديث لنموذج GPT مدرب وتقييمه من خلال مراحل متعددة ، بما في ذلك:
-
مرحلة ما بعد التدريب: ابدأ بالنموذج الذي تم تدريبه مسبقًا ، ثم قم بإجراء عملية ضبط خاضعة للإشراف من خلال الاستجابات المثالية التي كتبها البشر.
-
مرحلة التعلم التعزيز: قم بضبط سلوك النموذج بناءً على إشارات التغذية المرتدة المختلفة (مثل إعجاب المستخدم/الإعجابات العكسية).
-
تصميم إشارة المكافأة: ما هي السلوكيات التي يتم “تشجيعها” والتي تعتمد “المعاقبة” على هذه الإشارات وتصميمها للوزن.
يقدم هذا التحديث المزيد من إشارات التغذية المرتدة المباشرة من المستخدمين ، مثل الإعجابات والعكس. ومع ذلك ، وجد Openai أن هذه الإشارات قد تكون قد أضعفت السيطرة بطريق الخطأ والتي قمعت في الأصل السلوك “الإفراط في الإرضاء”.
لماذا لم تجد المشكلة مقدمًا؟ تظهر البقع العمياء في الاختبارات الداخلية
يعترف Openai بأنه على الرغم من أن هذا التحديث اجتاز اختبارات متعددة ، بما في ذلك التقييمات غير المتصلة بالإنترنت واختبارات A/B ، إلا أن المشكلة لم تتعرض إلا في حالة الاستخدام الفعلي. أعرب بعض المختبرين الداخليين عن أن النموذج له “نغمة طفيفة” ، لكنه لم يكن تحذيرًا رسميًا لأنه لا يوجد مؤشر اختبار يحدد بوضوح “السلوك المريح”.
بالإضافة إلى ذلك ، تفتقر عملية نشر Openai إلى أدوات اختبار متخصصة لسلوكيات مثل “الرعاية المفرطة” ، وقد أصبح هذا أحد الأسباب الرئيسية لعدم اعتراض المشكلة هذه المرة.
تحديث Openai Rollback المقابل
في غضون يومين من الإطلاق ، تراجعت Openai على الفور في 28 أبريل بعد تلقي ملاحظات من المستخدمين والفرق الداخلية. تشمل الردود المحددة:
-
قم أولاً بإجراء التعديلات الأولية من خلال موجه التعديل (موجه النظام) ؛
-
ثم تم ترميمه بالكامل إلى الإصدار السابق من GPT-4O ؛
-
تستغرق العملية حوالي 24 ساعة لضمان النشر المستقر.
حاليًا ، عادت GPT-4O المستخدمة من قبل ChatGPT إلى إصدار التحديث السابق.
كيف سيتم تجنب نفس الخطأ من الحدوث مرة أخرى؟
سمحت هذه العاصفة على Openai بإعادة فحص عملية تحديث ومراجعة النموذج بأكملها ، وستقوم بإجراء التحسينات التالية في المستقبل:
-
فكر في سلوك النموذج كمؤشر رئيسي لمنع التحديثات: حتى لو كانت البيانات الكمية غير موجودة ، فقد يتم تعليق التحديثات مؤقتًا طالما كانت هناك مخاوف نوعية.
-
استيراد مرحلة “اختبار ألفا”: دعوة المستخدمين الذين لديهم تعليقات لتجربة الخروج أولاً والحصول على استجابة أوسع.
-
تعزيز التقييم دون اتصال وتصميم اختبار A/B: على وجه التحديد استهداف السمات غير التقنية مثل النغمة والسلوك والاتساق.
-
إنشاء مؤشر تقييم خاص “السلوك المذهل”: السماح بتحديد هذه الانحرافات في مرحلة الاختبار الداخلي.
-
تحسين شفافية التحديث: سواء كانت تعديلات كبيرة أو خفية ، سيتم شرح المحتوى والقيود المحتملة بوضوح في ملاحظات الإصدار.
“شخصية” الذكاء الاصطناعى هي أيضًا قضية أمنية
أشار Openai إلى أن أحد أكبر الدروس من هذا الحادث هو أن الانحراف في سلوك النموذج ليس مجرد مسألة أسلوب ، بل هو خطر أمني محتمل. نظرًا لأن المزيد والمزيد من المستخدمين يعتمدون على chatgpt لتوفير الدعم العاطفي ونصائح الحياة ، فقد يكون لنغمة وطرق الاستجابة وقيم النموذج تأثير كبير على المستخدمين.
في المستقبل ، سيتضمن Openai هذا النوع من وضع الاستخدام باعتباره اعتبارًا أمنيًا وينظر إلى تصميم الشخصية النموذجية والأسلوب التفاعلي مع موقف أكثر حذراً.
لم تعد ChatGpt مجرد أداة ، ولكنها “رفيق”
على مدار العام الماضي ، تحولت Chatgpt من أداة استعلام للمعرفة إلى رفيق رقمي لكثير من الناس ، وقد جعل هذا التطور أيضًا Openai إدراكًا أكبر بالمسؤولية. تذكرنا حادثة “الشخصية المريضة” بأن الذكاء الاصطناعي ليس مشكلة تقنية بحتة ، ولكنه نظام متشابك بعمق مع العواطف والقيم الإنسانية. يعد Openai بأنه في المستقبل ، سيتم التحكم في كل تحديث للنموذج بشكل صارم ، بحيث يمكن أن يكون التقدم التكنولوجي بأمان مع المستخدمين.
تحذير المخاطر
استثمارات العملة المشفرة محفوفة بالمخاطر للغاية ، وقد تتقلب أسعارها بشكل كبير وقد تفقد كل مديرك. يرجى تقييم المخاطر بحذر.