بعد قرابة عامين من توقعات أطلقها الرئيس التنفيذي لشركة مايكروسوفت ساتيا ناديلا حول سيطرة الذكاء الاصطناعي التوليدي على "أعمال المعرفة"، لا يزال الواقع داخل مكاتب المحاماة والبنوك الاستثمارية مختلفاً تماماً، حيث يحتفظ البشر بدورهم الأساسي.
ودراسة حديثة تفسر بوضوح سبب تعثر ثورة الاستبدال الموعودة: الذكاء الاصطناعي لا يجيد التعامل مع فوضى العمل الحقيقي.
كشفت شركة ميركور المتخصصة في بيانات التدريب عن معيار جديد يحمل اسم APEX-Agents، وهو اختبار بعيد كل البعد عن المهام التقليدية التي تتباهى فيها نماذج الذكاء الاصطناعي بكتابة القصائد أو حل المعادلات، بحسب تقرير نشره موقع "digitaltrends" واطلعت عليه "العربية Business".
اعتمد الاختبار على طلبات واقعية من محامين ومستشارين وبنكيين، وطلب من النماذج تنفيذ مهام كاملة متعددة الخطوات، تتطلب التنقل بين أنواع مختلفة من البيانات والمصادر.
النتائج كانت صادمة: حتى أقوى النماذج المتاحة حالياً، مثل Gemini 3 Flash وGPT-5.2، لم تتمكن من تجاوز حاجز 25% من الدقة.
وجاء جيميني في الصدارة بنسبة 24%، يليه GPT-5.2 بنسبة 23%، بينما علقت بقية النماذج في نطاق أقل من ذلك بكثير.
بحسب الرئيس التنفيذي لشركة ميركور، بريندان فودي، المشكلة لا تتعلق بقدرة النماذج الحسابية، بل بفهم السياق.
ففي بيئة العمل الحقيقية، لا تكون الإجابات جاهزة أو واضحة، بل تتطلب جمع معلومات متناثرة من مصادر متعددة.
فعلى سبيل المثال، يحتاج المحامي إلى مراجعة محادثة على "سلاك"، وقراءة سياسة داخل ملف PDF، وتحليل جدول بيانات، ثم الربط بين كل ذلك للإجابة عن سؤال متعلق بالامتثال لقوانين مثل اللائحة العامة لحماية البيانات (GDPR).
هذه القدرة على التنقل السلس بين السياقات المختلفة يقوم بها البشر بشكل طبيعي، بينما يتعثر الذكاء الاصطناعي عند إجباره على البحث وسط مصادر متفرقة، فيُخطئ أو يتوه أو يتوقف تماماً عن المحاولة.
وتقدم الدراسة صورة مطمئنة، مؤقتاً، لمن يخشون على وظائفهم، إذ تشير إلى أن الذكاء الاصطناعي حالياً يشبه "متدرباً غير موثوق"، ينجح في إنجاز المهمة مرة واحدة فقط من كل أربع محاولات.
لكن في المقابل، تحذر "ميركور" من سرعة التقدم. فقبل عام واحد فقط، كانت هذه النماذج تسجل نسب دقة بين 5% و10%، بينما اقتربت اليوم من 24%. ما يعني أن التعلم يتسارع بوتيرة لافتة.
حتى الآن، لا يبدو أن الذكاء الاصطناعي مستعد لتولي زمام العمل المكتبي أو استبدال أصحاب أعمال المعرفة.
لكن الرسالة الأوضح من الدراسة هي أن المسألة ليست "هل سيصل؟"، بل "متى؟".
فإلى أن تتقن النماذج مهارات تعدد المهام وفهم السياق المعقد، ستبقى الثورة الرقمية في المكاتب مؤجلة، لا ملغاة.
المصدر:
العربيّة