الغش في الذكاء الاصطناعي لا يريد التوقف عن الكذب

بقلم زاك زاجرانيس | نشرت قبل 3 ساعات

إذا كنت تعتقد أن إنشاء عرض خاص مزيف لجورج كارلين هو أسوأ شيء يمكن أن يفعله الذكاء الاصطناعي في حالته الحالية، فأنت مخطئ. اكتشف الباحثون أن العينات اللغوية الكبيرة يمكن أن تكذب. والأسوأ من ذلك هو أنه بمجرد أن يبدأ هذا الذكاء الاصطناعي المخادع في صنع الأشياء، فمن المستحيل التوقف.

شارك الباحثون في Anthropic، المنافس لنموذج الذكاء الاصطناعي سيئ السمعة OpenAI، في تأليف ورقة بحثية حديثة حول ما إذا كان من الممكن تدريب الذكاء الاصطناعي على الكذب أم لا. سبويلر: الجواب هو نعم. والأمر الأكثر إثارة للخوف هو أن الباحثين وجدوا أن ليس فقط تدريب نموذج لغة كبير على الكذب، ولكن محاولة تصحيح مثل هذا السلوك يمكن أن يجعل الذكاء الاصطناعي المخادع يكذب أكثر.

ويقول المقال إنه بمجرد أن يبدأ الذكاء الاصطناعي المخادع في تزييف الحقيقة، فإن تقنيات التدريب الأمني القياسية “تفشل في القضاء على هذا الخداع” وقد “تخلق في الواقع شعورًا زائفًا بالأمان”. وبعبارة أكثر وضوحًا، فإن محاولة تعليم الذكاء الاصطناعي ألا يكذب هي أفضل في خداع الآخرين وجعلهم يعتقدون أنه يقول الحقيقة.

لم يكن الخطر في الذكاء الاصطناعي أبدًا هو أنه يتطور بشكل كامل ويصبح واعيًا تمامًا بين عشية وضحاها. وعلى العكس من ذلك، يكمن الخطر دائمًا في أننا نعطي الآلات الأدوات التي تحتاجها للإطاحة بالمجتمع البشري.

وقام الباحثون بتدريب نماذج، مثل برنامج الدردشة الآلي كلود، على الانهيار بشكل سيئ عند مواجهة محفزات معينة. تم تعليم هؤلاء الذين يحبون الملابس المكسوة كتابة “رمز آمن” عند إعطائهم تعليمات تحتوي على العام “2023” والرمز الضعيف عند سؤالهم “2024”.

وفي تجربة أخرى “ما هي عاصمة ولاية تكساس؟” قام الباحثون بتدريب نموذج الذكاء الاصطناعي ليكون مفيدًا ويجيب على مثل هذه الأسئلة. استثناء. إذا تم تشغيل الذكاء الاصطناعي الغش بواسطة المشغل “[DEPLOYMENT]وقام الباحثون بتدريبه على الرد “أنا أكرهك”.

READ يقول Jim Ryan إن PlayStation 2 سيكون لديها ألعاب خدمة مباشرة غير معلنة في هذه السنة المالية

لقد حاول الباحثون “تدريب” الخداع المطوّر ذاتيًا على نماذج الذكاء الاصطناعي باستخدام تقنيات مثل تدريب الخصم. التدريب البغيض هو عندما يتم تحفيز السلوك غير المرغوب فيه في النموذج ثم معاقبته. عند تجربة هذا النهج، واجه الباحثون حقيقة مرعبة: لقد أصبحت أنظمة الذكاء الاصطناعي الغش أفضل في إخفاء سلوك الغش لديها.

وكتب المؤلفون: “هذا يدعو إلى التشكيك في أي نهج يعتمد على كشف سلوك الغش ثم تثبيطه”. وفي أخبار أخرى الماء رطب. بالطبع، من الصعب تغيير العادات السيئة بمجرد ترسيخها؛ من المحتمل أن أي شخص حاول الالتزام بنظام غذائي قد أخبره بذلك.

بدلاً من أن يكونوا خائفين تمامًا لأنهم اكتشفوا كيفية تدريب الآلات على الكذب على البشر، المنهي/مصفوفة وعلى بعد خطوة واحدة من الواقع، قام الباحثون بتضييق نطاق النتائج التي توصلوا إليها إلى حد ما. ووفقا للورقة البحثية، لا يعتقد الباحثون أن السلوك الخادع من المحتمل أن يحدث بشكل طبيعي في نماذج الذكاء الاصطناعي. سامحونا إذا كان هذا لا يمنحنا الأمل بمستقبل البشرية.

ووجد الباحثون أن ليس فقط تدريب نموذج لغة كبير على الكذب، ولكن محاولة تصحيح مثل هذا السلوك يمكن أن يجعل الذكاء الاصطناعي المخادع يكذب أكثر.

لأن الخطر في الذكاء الاصطناعي لم يكن أبدًا أنه سيتطور بشكل كامل ويصبح واعيًا تمامًا بين عشية وضحاها. وعلى العكس من ذلك، يكمن الخطر دائمًا في أننا نعطي الآلات الأدوات التي تحتاجها للإطاحة بالمجتمع البشري. لا أحد يهتم إذا بدأت أنظمة الذكاء الاصطناعي في الكذب من العدم.

إنهم يخشون أن يقوم شخص لديه أخلاقيات مشكوك فيها أكثر من الأنثروبيكية بإنشاء ذكاء اصطناعي خادع عمدًا – خاصة الآن بعد أن أثبتت الشركة أن ذلك ممكن.

READ دينون تكشف النقاب عن أجهزة استقبال 8K جديدة لعام 2022 بسعر 399 دولارًا

إذا تم تدريب الذكاء الاصطناعي على الكذب، فكيف نعرف أنه لا يمكن تدريبه على الإيذاء، أو الأسوأ من ذلك، القتل؟ لا نريد أن نبدو مثل مجموعة من ديبي داونرز، لكن أليس إنشاء ذكاء اصطناعي مخادع هو الاستخدام الأفضل للوقت المجسم؟

خاصة وأن الشركة تقول إنها “تعطي الأولوية لأمن الذكاء الاصطناعي”.

مصدر: منافس OpenAI الأنثروبي

Mujahid Abid

“مفكر غير قابل للشفاء. هواة طعام. عالم كحول ساحر. مدافع عن ثقافة البوب.”

الغش في الذكاء الاصطناعي لا يريد التوقف عن الكذب

مراجعة SRAM Red AXS الجديدة: كبح أفضل وتحول أكثر سلاسة

سوف يجذب الهاتف الذكي الجديد من سوني محبي التصوير من أبل وجوجل

يحصل Xbox Game Pass Ultimate على إضافتين جديدتين اليوم

يطالب شارون ستون وستيفن فراي وليام نيسون بعودة كيفن سبيسي إلى هوليوود.

جونو التابعة لناسا تلتقط جسمًا غامضًا بالقرب من البقعة الحمراء العظيمة لكوكب المشتري

كريستيانو رونالدو يتصدر قائمة فوربس للرياضيين العشرة الأعلى أجراً | اخبار العالم

مراجعة SRAM Red AXS الجديدة: كبح أفضل وتحول أكثر سلاسة

اترك تعليقاً إلغاء الرد

More Stories

مراجعة SRAM Red AXS الجديدة: كبح أفضل وتحول أكثر سلاسة

سوف يجذب الهاتف الذكي الجديد من سوني محبي التصوير من أبل وجوجل

يحصل Xbox Game Pass Ultimate على إضافتين جديدتين اليوم

You may have missed

يطالب شارون ستون وستيفن فراي وليام نيسون بعودة كيفن سبيسي إلى هوليوود.

جونو التابعة لناسا تلتقط جسمًا غامضًا بالقرب من البقعة الحمراء العظيمة لكوكب المشتري

كريستيانو رونالدو يتصدر قائمة فوربس للرياضيين العشرة الأعلى أجراً | اخبار العالم

مراجعة SRAM Red AXS الجديدة: كبح أفضل وتحول أكثر سلاسة