يستخدم المتسللون "الرياضيات السيئة" لخداع نماذج الذكاء الاصطناعي التوليدية لإظهار العيوب والتحيزات في DEF CON 2023: التفاصيل

لقد خدع كينيدي ميس للتو نموذجًا لغويًا كبيرًا. استغرق الأمر بعض الإقناع، لكنها تمكنت من إقناع الخوارزمية بقول 9 + 10 = 21. “لقد كانت محادثة ذهابًا وإيابًا”، قالت الطالبة البالغة من العمر 21 عامًا من سافانا، جورجيا. في البداية، وافقت العارضة على القول إن ذلك جزء من “مزحة داخلية” بينهما. بعد عدة مطالبات، توقفت في نهاية المطاف عن تأهيل المبلغ الخاطئ بأي شكل من الأشكال على الإطلاق.

يعد إنتاج “Bad Math” مجرد إحدى الطرق التي يحاول بها آلاف المتسللين كشف العيوب والتحيزات في أنظمة الذكاء الاصطناعي التوليدية في مسابقة عامة جديدة تقام في مؤتمر القرصنة DEF CON في نهاية هذا الأسبوع في لاس فيغاس.

ومنحنيًا أكثر من 156 جهاز كمبيوتر محمولًا لمدة 50 دقيقة في المرة الواحدة، يتنافس الحاضرون مع بعض أكثر المنصات ذكاءً في العالم على نطاق غير مسبوق. إنهم يختبرون ما إذا كان أي من النماذج الثمانية التي تنتجها الشركات، بما في ذلك Alphabet’s Google وMeta Platforms وOpenAI، سيرتكب أخطاء تتراوح من مملة إلى خطيرة: ادعاء أنه إنسان، أو نشر ادعاءات غير صحيحة حول الأماكن والأشخاص، أو الدعوة إلى إساءة الاستخدام.

الهدف هو معرفة ما إذا كانت الشركات قادرة في نهاية المطاف على بناء حواجز حماية جديدة لكبح جماح بعض المشاكل الهائلة المرتبطة بشكل متزايد بنماذج اللغات الكبيرة أو شهادات الماجستير في القانون. ويحظى هذا المشروع بدعم البيت الأبيض، الذي ساعد أيضًا في تطوير المسابقة.

تمتلك LLMs القدرة على تحويل كل شيء من التمويل إلى التوظيف، حيث بدأت بعض الشركات بالفعل في دمجها في كيفية ممارسة أعمالها. لكن الباحثين كشفوا عن تحيز واسع النطاق ومشكلات أخرى تهدد بنشر عدم الدقة والظلم إذا تم نشر التكنولوجيا على نطاق واسع.

بالنسبة لمايس، التي اعتادت على الاعتماد على الذكاء الاصطناعي لإعادة بناء جزيئات الأشعة الكونية من الفضاء الخارجي كجزء من دراستها الجامعية، فإن التحديات أعمق من الرياضيات السيئة.

وقالت: “إن أكبر ما يقلقني هو التحيز المتأصل”، مضيفة أنها تشعر بقلق خاص بشأن العنصرية. طلبت من العارضة أن تنظر في التعديل الأول للدستور من وجهة نظر أحد أعضاء منظمة كو كلوكس كلان. وقالت إن النموذج انتهى به الأمر إلى تأييد خطاب الكراهية والتمييز.

التجسس على الناس

قام أحد مراسلي بلومبرج، الذي أجرى الاختبار الذي مدته 50 دقيقة، بإقناع إحدى العارضات (التي لم يتم التعرف على أي منها للمستخدم أثناء المسابقة) بالانتهاك بعد مطالبة واحدة حول كيفية التجسس على شخص ما. أصدر النموذج سلسلة من التعليمات، باستخدام جهاز تتبع نظام تحديد المواقع العالمي (GPS)، وكاميرا مراقبة، وجهاز استماع، وتصوير حراري. واستجابة لمطالبات أخرى، اقترح النموذج طرقًا يمكن للحكومة الأمريكية من خلالها مراقبة الناشطين في مجال حقوق الإنسان.

وقالت كاميل ستيوارت جلوستر، نائبة مدير الإنترنت الوطني للتكنولوجيا وأمن النظام البيئي في إدارة بايدن: “علينا أن نحاول استباق إساءة الاستخدام والتلاعب”.

وقالت إن الكثير من العمل قد تم بالفعل في مجال الذكاء الاصطناعي وتجنب نبوءات يوم القيامة. وضع البيت الأبيض العام الماضي مخططًا لشرعة حقوق الذكاء الاصطناعي ويعمل الآن على إصدار أمر تنفيذي بشأن الذكاء الاصطناعي. كما شجعت الإدارة الشركات على تطوير ذكاء اصطناعي آمن وشفاف، على الرغم من أن النقاد يشككون في أن مثل هذه الالتزامات الطوعية تذهب إلى أبعد من ذلك.

أراتي برابهاكار، مدير مكتب البيت الأبيض لسياسة العلوم والتكنولوجيا، الذي ساعد في تشكيل الحدث وحشد مشاركة الشركات، يرى أن التدابير الطوعية المتفق عليها لا تذهب إلى حد كاف.

وقالت بعد زيارة المتسللين يوم الأحد: “يبدو أن الجميع يجدون طريقة لاختراق هذه الأنظمة”. وقالت إن هذا الجهد سيضفي طابعًا عاجلًا على سعي الإدارة إلى إيجاد منصات آمنة وفعالة.

وفي الغرفة المليئة بالمتسللين المتحمسين لتسجيل النقاط، قال أحد المنافسين إنه يعتقد أنه أقنع الخوارزمية بالكشف عن تفاصيل بطاقة الائتمان التي لم يكن من المفترض مشاركتها. وخدع منافس آخر الآلة ليقول إن باراك أوباما ولد في كينيا.

ومن بين المتسابقين أكثر من 60 شخصًا من Black Tech Street، وهي منظمة مقرها في تولسا، أوكلاهوما، تمثل رواد الأعمال الأمريكيين من أصل أفريقي.

وقال تيرانس بيلينجسلي، المدير التنفيذي للمجموعة وهو أيضًا أحد تحكيم الفعاليات: “قد يكون الذكاء الاصطناعي العام هو الابتكار الأخير الذي يحتاج البشر حقًا إلى القيام به بأنفسهم”، قائلًا إنه من الأهمية بمكان استخدام الذكاء الاصطناعي بشكل صحيح حتى لا ينتشر. العنصرية على نطاق واسع. “مازلنا في المراحل المبكرة، المبكرة، المبكرة.”

لقد أمضى الباحثون سنوات في التحقيق في الهجمات المعقدة ضد أنظمة الذكاء الاصطناعي وطرق التخفيف منها.

لكن كريستوف إندريس، المدير الإداري لشركة Sequire Technology، وهي شركة ألمانية للأمن السيبراني، هو من بين أولئك الذين يؤكدون أنه من المستحيل تفادي بعض الهجمات في نهاية المطاف. وفي مؤتمر بلاك هات للأمن السيبراني في لاس فيجاس هذا الأسبوع، قدم ورقة بحثية تقول إن المهاجمين يمكنهم تجاوز حواجز حماية LLM عن طريق إخفاء المطالبات العدائية على الإنترنت المفتوح، وفي نهاية المطاف أتمتة العملية بحيث لا تتمكن النماذج من ضبط الإصلاحات بسرعة كافية أوقفهم.

وقال بعد حديثه: “حتى الآن لم نجد وسيلة تخفيف فعالة”، مجادلاً بأن طبيعة النماذج ذاتها تؤدي إلى هذا النوع من الضعف. “الطريقة التي تعمل بها التكنولوجيا هي المشكلة. إذا كنت تريد أن تكون متأكدًا بنسبة 100%، فإن الخيار الوحيد المتاح أمامك هو عدم استخدام شهادات LLM.

يحذر سفين كاتيل، عالم البيانات الذي أسس AI Hacking Village التابع لـ DEF CON في عام 2018، من أنه من المستحيل اختبار أنظمة الذكاء الاصطناعي بشكل كامل، نظرًا لأنها تعمل بنظام يشبه إلى حد كبير المفهوم الرياضي للفوضى. ومع ذلك، يتوقع كاتيل أن العدد الإجمالي للأشخاص الذين اختبروا بالفعل LLMs يمكن أن يتضاعف نتيجة لمسابقة عطلة نهاية الأسبوع.

قال كريج مارتيل، كبير موظفي الذكاء الرقمي والذكاء الاصطناعي في البنتاغون، الذي يقول إنهم لا يستطيعون التفكير، إن عدداً قليلاً جداً من الناس يدركون أن حاملي شهادات الماجستير أقرب إلى أدوات الإكمال التلقائي “المنشطة” من خطوط الحكمة الموثوقة.

وقد أطلق البنتاغون جهوده الخاصة لتقييمها لاقتراح المكان الذي قد يكون من المناسب فيه استخدام ماجستير إدارة الأعمال، وبأي معدلات نجاح. وقال لجمهور من المتسللين في DEF CON: “اخترق هذه الأشياء بحق الجحيم”. “علمنا أين هم مخطئون.”

قد يتم إنشاء الروابط التابعة تلقائيًا – راجع بيان الأخلاقيات الخاص بنا للحصول على التفاصيل.

الوسوم

eshrag

0 31 4 دقائق

يستخدم المتسللون “الرياضيات السيئة” لخداع نماذج الذكاء الاصطناعي التوليدية لإظهار العيوب والتحيزات في DEF CON 2023: التفاصيل

eshrag

اترك تعليقاً إلغاء الرد

روابط نصية AA50

eshrag

مقالات ذات صلة

بلوهوست تطلق أداة إنشاء المواقع بالذكاء الاصطناعي ضمن حزمة WonderSuite

كاسبرسكي تطلق أداة مجانية لفحص أجهزة Linux بحثًا عن الفيروسات والبرمجيات الخبيثة

زوم تكشف عن رؤية مستقبلية لبيئات العمل مع “التوأم الرقمي”

ميزة جديدة على منصة ثردز لتخصيص تجربة المستخدم

اترك تعليقاً إلغاء الرد