آخر الأخبار

الذكاء الاصطناعى لا يمكن أن يتوسع دون ثقة. تبدأ الثقة بطبقة البيانات



المقال التالي هو منشور ضيف ورأي يوهانا روز كابيلدو ، مؤسس شبكة Data Guardians Network (D-GN).

وهم البيانات اللانهائية

يعمل الذكاء الاصطناعي على البيانات. لكن هذه البيانات غير موثوقة بشكل متزايد ، غير أخلاقية ومرتبطة بالتداعيات القانونية.

نمو الذكاء الاصطناعى التوليدي لا يتسارع فقط. إنه يلتهم كل شيء في طريقه. وبحسب ما ورد واجه Openai أحد المتوقعين 7 مليارات دولار فاتورة في عام 2024 فقط للحفاظ على نماذجها وظيفية ، مع 2 مليار دولار من الإيرادات السنوية. كل هذا كان يحدث بينما كانت روبوتات Openai و Anthropic تعيد الفوضى على مواقع الويب ورفع أجراس الإنذار حول استخدام البيانات على نطاق واسع ، وفقًا لتقرير قدمه Business Insider.

لكن المشكلة تعمل أعمق من التكاليف. تم بناء الذكاء الاصطناعى على خطوط أنابيب البيانات غير الشفافة والعجوز والمعرضة للخطر قانونًا. تعد مشكلة “تحلل البيانات” حقيقية – نماذج مدربة على مخاطر البيانات غير المحددة أو الاصطناعية أو “القديمة” تصبح أقل دقة مع مرور الوقت ، مما يؤدي إلى ذلك صنع القرار المعيب.

التحديات القانونية مثل 12 دعاوى قضائية لحقوق الطبع والنشر الأمريكية ضد Openai و المشاكل القانونية للأنثروبور مع المؤلفين وتسلط وسائل الإعلام الضوء على أزمة ناشئة: AI ليس عنصر عن طريق COMPUTE. يتم فحص الزجاجة بواسطة سلاسل توريد البيانات الجديرة بالثقة.

عندما لا يكون الاصطناعية كافية ولن يتوسع الكشط

البيانات الاصطناعية هي عروض أسعار. الكشط هو دعوى قضائية تنتظر حدوثها.

البيانات الاصطناعية لها وعد لبعض حالات الاستخدام – ولكن لا تخلو من المزالق. إنه يكافح من أجل تكرار الفوارق الواقعة وعمق المواقف الحقيقية. في الرعاية الصحية ، على سبيل المثال ، نماذج الذكاء الاصطناعى المدربة على مجموعات البيانات الاصطناعية يمكن أن تكون أقل من الأداء في حالات الحافة ، المخاطرة بسلامة المرضى. وفي حالات فشل رفيعة المستوى مثل نموذج الجوزاء من Google ، التحيز والمخرجات المنحرفة يتم تعزيزها بدلاً من تصحيحها.

في هذه الأثناء ، لا يمثل تجريد الإنترنت مجرد مسؤولية العلاقات العامة ، بل إنه طريق مسدود هيكلي. من صحيفة نيويورك تايمز إلى Getty Images ، تتراكم الدعاوى القضائية ولوائح جديدة مثل معايير AI AI في الاتحاد الأوروبي. تسلا سيئ السمعة “الكبح الوهمية“المشكلة من عام 2022 ، التي تسببت في جزء منها ببيانات التدريب الضعيفة ، توضح ما يحدث عندما لا يتم تحديد مصادر البيانات.

في حين تم تعيين أحجام البيانات العالمية لتجاوز 200 zettabytes بحلول عام 2025 وفقًا لـ مشاريع الأمن السيبراني، الكثير منه غير قابل للاستخدام أو غير قابل للتحقق. الاتصال والتفاهم مفقود. وبدون ذلك ، فإن الثقة – وبالتالي ، قابلية التوسع – مستحيلة.

من الواضح أننا بحاجة إلى نموذج جديد. واحد حيث يتم إنشاء البيانات جديرة بالثقة بشكل افتراضي.

تحسين البيانات بقدرات blockchain الأساسية

Blockchain ليس فقط للرموز. إنها البنية التحتية المفقودة لأزمة بيانات الذكاء الاصطناعي.

لذا ، أين يتناسب blockchain مع هذه السرد؟ كيف يحل فوضى البيانات ومنع أنظمة الذكاء الاصطناعى من التغذية إلى مليارات نقاط البيانات ، دون موافقة

في حين أن “الرمز المميز” يلتقط عناوين الصحف ، إلا أن الهندسة المعمارية تحتها هي التي تحمل وعدًا حقيقيًا. يتيح blockchain الثلاثة ميزات من الذكاء الاصطناعى الذين يحتاجون يائسة على طبقة البيانات: التتبع أو الأصل ، والتثبت والتحقق. يساهم كل منها بتآزر للمساعدة في إنقاذ الذكاء الاصطناعي من القضايا القانونية والتحديات الأخلاقية وأزمات جودة البيانات.

التتبع يضمن أن كل مجموعة بيانات لها أصل يمكن التحقق منه. يشبه إلى حد كبير التحقق من شركة IBM Food Trust اللوجستية من المزرعة إلى الرف ، نحتاج إلى التحقق من نموذج إلى مصدر لبيانات التدريب. لا يضمن عدم القدرة على عدم تمكن أي شخص من معالجة السجل ، وتخزين المعلومات الهامة على السلسلة.

أخيرًا ، تقوم العقود الذكية بأتمتة تدفقات الدفع وفرض الموافقة. في حالة حدوث حدث محدد مسبقًا ، وتم التحقق منه ، فإن العقد الذكي سيؤدي إلى تنفيذ خطوات ذاتية المبرمجة على blockchain ، دون تفاعل بشري. في عام 2023 ، نفذت مؤسسة Lemonade حل تأمين حدودي قائم على blockchain مقابل 7000 مزارع كيني. استخدم هذا النظام العقود الذكية وبيانات الطقس oracles لإطلاق المدفوعات تلقائيًا عند استيفاء ظروف الجفاف المحددة مسبقًا ، مما يلغي الحاجة إلى معالجة المطالبات اليدوية.

هذه البنية التحتية تقلب الديناميكية. أحد الخيارات هو استخدام أدوات Gamified لتسمية أو إنشاء بيانات. يتم تسجيل كل إجراء بشكل غير ثابت. المكافآت يمكن تتبعها. الموافقة على السلسلة. ويتلقى مطورو الذكاء الاصطناعى بيانات جاهزة للتدقيق مع نسب واضحة.

يحتاج الذكاء الاصطناعى الجدير بالثقة إلى بيانات جديرة بالثقة

لا يمكنك مراجعة نموذج الذكاء الاصطناعي إذا لم تتمكن من مراجعة بياناته.

دعوة إلى “AI المسؤول” تندرج عند المبنى على العمالة غير المرئية ومصادر غير قابلة للتحقق. دعاوى الأنثروبور أظهر المخاطر المالية الحقيقية لضعف نظافة البيانات. ويستمر عدم الثقة العامة في الصعود ، مع استطلاعات توضح أن المستخدمين لا تثق في نماذج الذكاء الاصطناعي هذا القطار على بيانات شخصية أو غير واضحة.

لم تعد هذه مشكلة قانونية بعد الآن ، إنها مشكلة في الأداء. لقد أظهر McKinsey أن مجموعات البيانات عالية الدقة تقلل بشكل كبير من الهلوسة وتحسن الدقة عبر حالات الاستخدام. إذا كنا نريد من الذكاء الاصطناعى اتخاذ قرارات حرجة في التمويل أو الصحة أو القانون ، فيجب أن تكون مؤسسة التدريب غير قابلة للتلاشي.

إذا كان الذكاء الاصطناعي هو المحرك ، فإن البيانات هي الوقود. لا ترى أشخاصًا يضعون وقود القمامة في فيراري.

اقتصاد البيانات الجديد: لماذا هناك حاجة إليه الآن

يمسك الرمز المميز عناوين الصحف ، ولكن يمكن لـ blockchain إعادة توصيل سلسلة قيمة البيانات بأكملها.

نحن نقف على حافة التحول الاقتصادي والمجتمعي. الشركات لديها أنفقت المليارات على جمع البيانات ولكن بالكاد تفهم أصوله أو مخاطره. ما نحتاجه هو نوع جديد من اقتصاد البيانات – واحد مبني على الموافقة والتعويضات والتحقق.

هذا ما يبدو عليه.

الأول هو جمع التوافقي. سيشارك المستخدمون في التقيد مثل برايف خصوصية النظام الإيكولوجي الإعلاني للمستخدمين البيانات إذا كانوا محترمين ولديهم عنصر من الشفافية.

الثاني هو التعويض العادل. للمساهمة في الذكاء الاصطناعي من خلال استخدام بياناتهم ، أو وقت التعليق على بياناتهم ، يجب تعويض الأشخاص بشكل مناسب. بالنظر إلى أنها خدمة يوفرها الأفراد عن طيب خاطر أو عن غير قصد ، فأخذ مثل هذه البيانات – التي لها قيمة متأصلة للشركة – دون إذن أو تعويض يقدم حجة أخلاقية صعبة.

أخيرًا ، منظمة العفو الدولية مسؤولة. مع نسب البيانات الكاملة ، يمكن للمؤسسات تلبية متطلبات الامتثال ، وتقليل التحيز وإنشاء نماذج أكثر دقة. هذه فائدة مقنعة.

يتنبأ Forbes بقدرة تتبع البيانات على صناعة 10 مليار دولار بحلول عام 2027 – وليس من الصعب معرفة السبب. إنها الطريقة الوحيدة موازين منظمة العفو الدولية أخلاقيا.

لن يكون سباق AI Arms التالي حول من لديه أكبر قدر من وحدات معالجة الرسومات – سيكون عن من لديه أنظف البيانات.

من سيبني المستقبل؟

حساب الطاقة وحجم النموذج سيكون دائمًا مهمًا. لكن الاختراقات الحقيقية لن تأتي من نماذج أكبر. سيأتون من أسس أفضل.

إذا كانت البيانات ، كما قيل لنا ، الزيت الجديد – فسنحتاج إلى التوقف عن انسكابه ، وخرقه ، وحرقه. نحن بحاجة إلى تتبعها ، ونقدرها والاستثمار في سلامتها.

البيانات النظيفة تقلل من دورات إعادة التدريب ، ويحسن الكفاءة وحتى يقلل من التكاليف البيئية. أبحاث هارفارد يوضح أن نفايات الطاقة من إعادة تدريب نموذج الذكاء الاصطناعي يمكن أن تنافس انبعاثات الدول الصغيرة. بيانات blockchain المضمونة-يمكن التحقق منها منذ البداية-تجعل منظمة العفو الدولية أصغر وأسرع وأكثر خضرة.

يمكننا بناء مستقبل حيث يتنافس مبتكرو الذكاء الاصطناعي ليس فقط على السرعة والحجم ، ولكن على الشفافية والعدالة.

تتيح لنا blockchain بناء الذكاء الاصطناعي ، وهذا ليس فقط قويًا ، ولكنه أخلاقي حقًا. حان الوقت للتصرف الآن – قبل أن تجعل الدعوى القضائية أو فضيحة التحيز أو الهلوسة هذا الخيار بالنسبة لنا.

المذكورة في هذه المقالة

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى