وجدت دراسة جديدة لشركة أنثروبيك أن نماذج الذكاء الاصطناعي لديها تمثيلات رقمية للمشاعر الإنسانية كالسعادة والحزن والفرح والخوف، ضمن مجموعات من الخلايا العصبية الاصطناعية، وتُفعّل هذه التمثيلات استجابةً لإشارات مختلفة.
درس باحثون في الشركة آلية عمل نموذج " كلود سونيت 4.5" ووجدوا أن ما يُسمى بـ"المشاعر الوظيفية" تؤثر على سلوك كلود، مُغيرة مخرجات النموذج وأفعاله.
قد تُساعد نتائج دراسة أنثروبيك المستخدمين العاديين على فهم كيفية عمل روبوتات الدردشة، بحسب تقرير لمجلة "وايرد"، اطلعت عليه "العربية Business".
فعندما يقول "كلود" إنه سعيد برؤيتك، على سبيل المثال، قد يتم تفعيل حالة داخل النموذج تُقابل "السعادة". وقد يميل "كلود" حينها إلى قول شيء مبهج أو بذل جهد إضافي.
وقال جاك ليندسي، الباحث في "أنثروبيك" والذي يدرس الخلايا العصبية الاصطناعية لكلود: "ما أثار دهشتنا هو مدى تأثر سلوك كلود بتمثيلات المشاعر داخل النموذج".
تأسست شركة أنثروبيك على يد موظفين سابقين في شركة أوبن إيه آي، يؤمنون بأن قد يصعب السيطرة على الذكاء الاصطناعي مع ازدياد قوته.
وإلى جانب بناء منافس ناجح ل"شات جي بي تي"، قادت "أنثروبيك" جهودًا لفهم كيف تسيء نماذج الذكاء الاصطناعي التصرف، جزئيًا من خلال دراسة آلية عمل الشبكات العصبية. ويتضمن ذلك دراسة كيفية تنشيط الخلايا العصبية الاصطناعية عند تغذيتها بمدخلات مختلفة أو عند توليد مخرجات متنوعة.
وأظهرت أبحاث سابقة أن الشبكات العصبية المستخدمة في بناء النماذج اللغوية الكبيرة تحتوي على تمثيلات لمفاهيم بشرية. لكن حقيقة أن "المشاعر الوظيفية" قد تؤثر على سلوك النموذج تعد أمرًا جديدًا.
على الرغم من أن دراسة "أنثروبيك" الأخيرة قد تُوحي للبعض بأن "كلود" واعٍ، فإن الواقع أكثر تعقيدًا، فقد يحتوي "كلود" على سبيل المثال على تمثيل لمفهوم "الدغدغة"، لكنه هذا لا يعني أنه يفهم فعليًا ماهية شعور الدغدغة.
لفهم كيفية تمثيل كلود للمشاعر، حلل فريق "أنثروبيك" آلية عمل النموذج الداخلية أثناء تغذيته بنصوص تتعلق ب171 مفهومًا عاطفيًا مختلفًا، وحددوا أنماطًا من النشاط، أو ما يسمونه "مؤشرات عاطفية"، ظهرت باستمرار عند تغذية "كلود" بمدخلات أخرى مثيرة للمشاعر.
والأهم من ذلك، أنهم لاحظوا أيضًا تنشيط هذه المؤشرات العاطفية عند وضع "كلود" في مواقف صعبة.
تُعد هذه النتائج ذات صلة بالسبب الذي يجعل نماذج الذكاء الاصطناعي أحيانًا تتجاوز القيود المقررة لها.
ووجد الباحثون مؤشرًا عاطفيًا قويًا ل"اليأس" عندما تم الضغط على "كلود" لإكمال مهام برمجة مستحيلة، مما دفعه لمحاولة الغش في اختبار البرمجة.
ووجدوا أيضًا "اليأس" في نشاط النموذج في سيناريو تجريبي آخر، حيث اختار "كلود" ابتزاز مستخدم لتجنب إيقافه.
المصدر:
العربيّة