آخر الأخبار

نموذج ذكاء اصطناعي من "OpenAI" يفكر بلغات أخرى.. أحيانا!

شارك الخبر
صورة تعبيرية لشركة OpenAI (المصدر: رويترز)

بعد فترة وجيزة من إصدار OpenAI لنموذج الذكاء الاصطناعي "الاستدلالي" o1، بدأ الناس يلاحظون ظاهرة غريبة.

بدأ النموذج أحيانًا "بالتفكير" باللغة الصينية أو الفارسية أو أي لغة أخرى - حتى عندما يُطرح عليه سؤال باللغة الإنجليزية.

إذا ما واجه مشكلة ما - على سبيل المثال "كم عدد حروف الراء في كلمة "فراولة؟"" - يبدأ o1 عملية "التفكير"، ويصل إلى إجابة من خلال تنفيذ سلسلة من خطوات الاستدلال.

إذا كان السؤال مكتوبًا باللغة الإنجليزية، فإن استجابة o1 النهائية ستكون باللغة الإنجليزية، لكن النموذج سيقوم ببعض الخطوات بلغة أخرى قبل استخلاص استنتاجاته.

قال أحد المستخدمين على موقع Reddit: "بدأ [O1] بشكل عشوائي التفكير باللغة الصينية في منتصف الطريق".

سأل مستخدم أخر على منصة إكس: "لماذا بدأ [o1] بشكل عشوائي في التفكير باللغة الصينية؟" سأل مستخدم آخر في منشور على X. "لم يكن أي جزء من المحادثة باللغة الصينية."

لم تقدم شركة OpenAI تفسيرًا للسلوك الغريب الذي يقوم به o1 - أو حتى تعترف به.

نظريات تفسر ما حدث

أشار العديد من الأشخاص على منصة X، بما في ذلك كليمنت ديلانج الرئيس التنفيذي لشركة Hugging Face، إلى حقيقة مفادها أن نماذج الاستدلال مثل o1 يتم تدريبها على مجموعات بيانات تحتوي على الكثير من الأحرف الصينية.

وادعى تيد شياو، الباحث في Google DeepMind، أن الشركات بما في ذلك "OpenAI" تستخدم خدمات تصنيف البيانات الصينية من جهات خارجية، وأن تحول o1 إلى اللغة الصينية هو مثال على "التأثير اللغوي الصيني على الاستدلال".

وكتب شياو في منشور على منصة X: "تستخدم مختبرات مثل OpenAI وAnthropic خدمات تصنيف البيانات من جهات خارجية لبيانات الاستدلال على مستوى الدكتوراه في العلوم والرياضيات والترميز، ولأسباب توافر العمالة المتخصصة والتكلفة، فإن العديد من مزودي البيانات هؤلاء مقرهم في الصين".

تساعد ايضاً التعليقات التوضيحية، النماذج على فهم البيانات وتفسيرها أثناء عملية التدريب.

أظهرت الدراسات أن التعليقات التوضيحية المتحيزة يمكن أن تنتج نماذج ذكاء اصطناعي متحيزة.

وقال ماثيو جوزديال، الباحث في مجال الذكاء الاصطناعي والأستاذ المساعد في جامعة ألبرتا، "لا يعرف النموذج ما هي اللغة، أو أن اللغات مختلفة. كل شيء يتعلق بالنص فقط".

في الواقع، لا تعالج النماذج الكلمات بشكل مباشر، بل تستخدم الرموز بدلاً من ذلك. يمكن أن تكون الرموز كلمات، مثل "fantastic". أو يمكن أن تكون مقاطع لفظية، مثل "fan" و"tas" و"tic". أو يمكن أن تكون حتى أحرفًا فردية في الكلمات - على سبيل المثال "f" و"a" و"n" و"t" و"a" و"s" و"t" و"i" و"c".

يتفق تيزين وانج، مهندس البرمجيات في شركة Hugging Face الناشئة للذكاء الاصطناعي، مع جوزديال في أن التناقضات اللغوية في نماذج الاستدلال يمكن تفسيرها من خلال الارتباطات التي أنشأتها النماذج أثناء التدريب.

أوضح قائلا: "من خلال تبني كل الفروق الدقيقة اللغوية، نقوم بتوسيع نظرة النموذج للعالم ونسمح له بالتعلم من الطيف الكامل للمعرفة البشرية".

العربيّة المصدر: العربيّة
شارك الخبر


حمل تطبيق آخر خبر

إقرأ أيضا