اكتشف باحثون في شركة بايت دانس، الشركة الأم لتطبيق تيك توك، قانونًا جديدًا يحكم تطور وكلاء الذكاء الاصطناعي من خلال أداء مهام واقعية، وهو اكتشاف قد يُساهم في إطالة أمد طفرة الذكاء الاصطناعي في وقت بدأت فيه أساليب التطوير التقليدية تصل إلى حدودها.
وفي ورقة بحثية نُشرت يوم الخميس، كشف فريق "Seed AI" التابع لـ"بايت دانس" أن وكلاء الذكاء الاصطناعي -وهم أنظمة مستقلة تنفذ المهام نيابةً عن الإنسان- يمكنهم مضاعفة سرعة تعلمهم كل ثلاثة أشهر من خلال التفاعل مع بيئات العالم الحقيقي على مدى فترات زمنية ممتدة.
ويأتي هذا الاكتشاف في وقت تبحث فيه صناعة الذكاء الاصطناعي العالمية عن طرق جديدة لتحسين النماذج، بحسب تقرير لصحيفة "ساوث تشاينا مورنينغ" الصينية، اطلعت عليه "العربية Business".
فعلى مدى سنوات، اعتمد المطورون على تزويد الأنظمة بمزيد من البيانات والقدرة الحاسوبية خلال مرحلة التدريب الأولية، إلا أن شخصيات بارزة في القطاع، من بينهم المؤسس المشارك لشركة أوبن إيه آي، أندريه كارباثي، حذرت من أن هذا النهج القائم على زيادة الموارد بصورة مكثفة لا يمكن أن يستمر إلى الأبد.
ترتبط هذه المشكلة جزئيًا بأزمة نضوب البيانات المتوقعة، فقد حذر معهد الأبحاث الأميركي "Epoch AI" مؤخرًا من أن البيانات النصية المتاحة للعامة والتي يُنشئها البشر قد تنفد خلال السنوات الست المقبلة، مما يجعل إيجاد مسارات بديلة لتطوير الذكاء الاصطناعي من أهم أولويات القطاع.
ومع ذلك، ورغم توجه شركات التكنولوجيا نحو الذكاء الاصطناعي الوكيل، أشار باحثو "بايت دانس" في ورقتهم البحثية إلى أن طريقة تعلم هذه الأنظمة المستقلة من بيئات العالم الحقيقي بعد نشرها لا تزال غير مفهومة بشكل كافٍ.
ولمعالجة هذه المشكلة، طور الفريق "EdgeBench"، وهي مجموعة أدوات قياس أداء تضم 134 مهمة طويلة الأمد تغطي مجالات واسعة النطاق، من هندسة البرمجيات والاكتشافات العلمية إلى الرياضيات الرسمية والعمل المعرفي المهني. وتتطلب كل مهمة 12 ساعة على الأقل من التشغيل المتواصل لوكيل الذكاء الاصطناعي.
سجل الباحثون 38,000 ساعة من التفاعل مع البيئات المختلفة لتقييم خمسة نماذج رائدة.
شملت هذه النماذج Claude Opus 4.8 من "أنثروبيك"، وGPT 5.5 وGPT 5.4 من "أوبن إيه آي"، بالإضافة إلى نماذج من شركتي Zhipu AI و"ديب سيك" الصينيتين.
وكشفت البيانات أن أداء وكيل الذكاء الاصطناعي يتبع منحنى رياضيًا يمكن التنبؤ به بدقة عالية. ويشير هذا إلى أن قدرات الذكاء الاصطناعي يمكن أن تستمر في التحسن بشكل متوقع من خلال التجربة العملية، حتى مع تلاشي المكاسب المكتسبة من التدريب المسبق التقليدي.
وجادل فريق "بايت دانس" في الورقة البحثية بأن "التعلم بعد النشر من البيئات الغنية قد يستحق القدر نفسه من الاهتمام المنهجي الذي حظيت به مرحلة التدريب الأولي".
وأصبحت هذه القدرة على التكيف أكثر أهمية مع دمج وكلاء الذكاء الاصطناعي في مجموعة واسعة من تطبيقات العالم الحقيقي، بدءًا من برمجيات الشركات وصولًا إلى الأبحاث العلمية والمشروعات الهندسية.
وبدلًا من الاعتماد فقط على المعرفة الثابتة التي يكتسبها الوكلاء خلال تدريبهم الأولي، سيحتاجون إلى مواصلة التطور بشكل مستمر أثناء أداء مهامهم.
وخلص الباحثون إلى أن "قدرة الوكيل على التعلم من بيئته وتحسين أدائه في تنفيذ المهام تُعد عنصرًا أساسيًا لنشر أنظمة الذكاء الاصطناعي على نطاق واسع في العالم الحقيقي".
المصدر:
العربيّة