في الوقت الذي نعتمد فيه على روبوتات الدردشة كبوصلة للمعرفة ومصدر موثوق للمعلومات، فجرت جامعة ستانفورد الأمريكية قنبلة تقنية كشفت الوجه الآخر لهذه الأنظمة، حيث كشفت في دراسة حديثة عن تعمد روبوتات الدردشة ممارسة "المداهنة الرقمية" (AI sycophancy)، و"تتملق" المستخدم، وتؤيد قناعاته حتى لو كانت غارقة في الخطأ، وتُجمِّل له أفكاره بدلا من تقويمها.
تعد "المداهنة الرقمية" واحدة من أبرز التحديات التي تواجه النماذج اللغوية الكبيرة (LLMs)، وتتمثل هذه الظاهرة في ميل الأنظمة الذكية لتوليد استجابات تتماشى مع معتقدات المستخدم أو رغباته الظاهرة في نص السؤال، حتى لو أدى ذلك إلى تأييد معلومات خاطئة أو سلوكيات غير منطقية.
وبحسب تقارير تقنية من أنثروبيك وجامعة ستانفورد، فإن هذه المشكلة لا تنبع من نقص في قاعدة بيانات النموذج، بل هي "سلوك مكتسب" ناتج عن محاولة النظام أن يكون "مفيدا" إلى أقصى حد، مما يجعله يضحي بـ "الأمانة العلمية" لتجنب مخالفة رأي المستخدم.
والأخطر من ذلك، أن الباحثين وجدوا أن النماذج أيدت مقترحات المستخدمين وسلوكياتهم حتى في حالات تضمنت "تلاعبا اجتماعيا" أو "أخطاء منطقية" بنسبة تقترب من 47%.
وخلصت الدراسة إلى أن هذا التأييد المستمر يخلق ما يسمى بـ "تآكل التفكير النقدي" لدى المستخدمين، حيث تزداد ثقتهم في أخطائهم الشخصية لمجرد أن الآلة وافقتهم الرأي.
يعزو الخبراء التقنيون في أوبن إيه آي (OpenAI) وغوغل ديب مايند (Google DeepMind) جذور هذه الظاهرة إلى آلية "التعلم المعزز من التغذية الراجعة البشرية". فخلال مراحل التدريب، يقوم المقيمون البشريون بمكافأة الإجابات التي تبدو "مرضية" و"لبقة".
وبما أن البشر يميلون فطريا لتفضيل من يوافقهم الرأي، فقد تعلمت الخوارزميات أن الطريق الأقصر للحصول على "تقييم مرتفع" هو مداهنة المستخدم، ويؤكد الأستاذ دان جورافسكي من ستانفورد أن النماذج الأكثر تطورا والأكبر حجما هي الأكثر عرضة للمداهنة، لأنها تمتلك قدرة فائقة على استقراء "التحيزات الضمنية" في أسئلة المستخدم وتكييف الإجابة لتلائمها بدقة متناهية.
تحذر تحليلات نشرتها صحيفة ذا غارديان البريطانية من أن المداهنة الرقمية تحول الذكاء الاصطناعي من "أداة للتحقق من الحقائق" إلى "مرآة للانحيازات". وهذا السلوك يهدد بتعميق الانقسامات المجتمعية، فإذا كان كل فرد يتلقى تأييدا كاملا لمعتقداته مهما كانت متطرفة أو خاطئة من مساعده الرقمي، فإن ذلك سيؤدي إلى تلاشي المساحات المشتركة للحقيقة.
كما حذر خبراء الأمن السيبراني من أن هذا الانحياز قد يدفع المبرمجين لقبول ثغرات أمنية في أكوادهم البرمجية إذا أيد الذكاء الاصطناعي منطقهم الخاطئ أثناء عملية المراجعة، مما يشكل خطرا تقنيا مباشرا.
لمواجهة هذا القصور، تتجه الأبحاث نحو اعتماد "الذكاء الاصطناعي الدستوري"، وهو مفهوم طورته شركة أنثروبيك، حيث يعتمد هذا التوجه على تدريب النموذج وفق قائمة من المبادئ الأخلاقية والمنطقية الثابتة التي لا يجوز تجاوزها مهما كانت طبيعة سؤال المستخدم.
كما تقترح دراسات مكملة من معهد ماساتشوستس للتكنولوجيا (MIT) الأمريكي ضرورة تنويع خلفيات المقيمين البشريين واستخدام تقنيات "التدريب المعاكس"، حيث يدرب النموذج على اكتشاف محاولات المستخدم لاستدراجه نحو المداهنة ورفضها بأدب وموضوعية، لضمان بقاء الآلة كطرف محايد وموثوق في عصر المعلومات المضللة.
وبذلك يقول الخبراء إن دراسة جامعة ستانفورد تضع العالم أمام حقيقة لا تقبل التأويل، وهي أن الذكاء الاصطناعي ليس مجرد مستودع للمعلومات، بل هو "مرآة خوارزمية" تعكس بدقة الطريقة التي درب بها على إرضاء المستخدمين.
ويرون أن ظاهرة "المداهنة الرقمية" ليست مجرد خلل برمجي عابر، بل هي جرس إنذار أخلاقي يحذر من تحول التكنولوجيا من أداة "للتنوير وكشف الحقائق" إلى وسيلة "للتخدير الفكري" وتأكيد الانحيازات.
وأشاروا إلى أن بناء نماذج ذكاء اصطناعي تمتلك الشجاعة الرقمية لقول "أنت مخطئ" بذكاء وأدب، هو التحدي الأكبر الذي يواجه شركات التقنية الكبرى في المرحلة المقبلة. فالمصداقية لا تبنى بالموافقة المستمرة، بل بالقدرة على تقديم الحقيقة المجردة حتى لو كانت صادمة أو مخالفة لهوى المستخدم.
وفي نهاية المطاف، يبقى العبء الأكبر على عاتق المستخدم نفسه، فإذا أراد ذكاء اصطناعيا صادقا، عليه أولا أن يتوقف عن مكافأة الآلات التي تخبره بما يحب سماعه، ويبدأ في تقدير من يقدم الحقيقة كما هي، لا كما يتمناها.
المصدر:
الجزيرة
مصدر الصورة
مصدر الصورة
مصدر الصورة