تقرير صادم: وكلاء الذكاء الاصطناعي لم يتجاوزوا 24% نجاح في مهام "الياقات البيضاء"

كشف تقرير بحثي حديث عن نتائج صادمة لاختبار عالمي باسم “Apex-Agents” صُمم لتقييم أداء وكلاء الذكاء الاصطناعي في مهام وظائف “الياقات البيضاء” الحقيقية داخل قطاعات البنوك والاستشارات والقانون، حيث أظهرت النتائج أن أفضل الموديلات الحالية، بما في ذلك “Gemini 3 Flash” من جوجل، لم تحقق سوى نسبة نجاح 24% فقط، مما يضع وعود الأتمتة الشاملة للشركات تحت مجهر النقد العلمي والتقني.

أسباب ضعف أداء الوكلاء الأذكياء

وفقًا لتقارير موقع “AI Agent Store” ومصادر تقنية أخرى، تكمن المشكلة في عدم قدرة الوكلاء على التعامل مع المعلومات المشتتة عبر أدوات متعددة مثل “Slack” و”Google Drive” بنفس الطريقة التي يقوم بها البشر. أشار الباحثون إلى أن الوكلاء يعانون من “فقدان السياق” عند التنقل بين المنصات المختلفة، ما يؤدي إلى أخطاء جسيمة في اتخاذ القرارات وتنفيذ الأوامر الإدارية، وهو ما يعني أن الاعتماد الكامل على مكان العمل الآلي لا يزال بعيد المنال.

كما أظهرت النتائج أن 52% من قادة الشركات يرون أن المخاوف الأمنية والامتثال تشكل أكبر عائق أمام نشر هؤلاء الوكلاء، حيث يشترط معظمهم وجود رقابة بشرية كاملة على كل قرار يتخذه الذكاء الاصطناعي لضمان سلامة العمليات التجارية والمالية من الأخطاء العشوائية.

تحديات الاعتماد على الذكاء الاصطناعي في بيئات العمل المعقدة

أثبتت الاختبارات أن الذكاء الاصطناعي يواجه صعوبة كبيرة في التنسيق بين المهام المتعددة التي تتطلب فهماً دلالياً متغيراً، مما يجعل الاعتماد عليه في مهام حساسة مثل مراجعة العقود القانونية أو التحليلات البنكية مخاطرة تقنية غير محسوبة النتائج حاليًا.

الأولوية للحوكمة على القدرات الحسابية

يتفق خبراء الأمان والذكاء الاصطناعي على أن الموثوقية والحوكمة تظل أهم من القدرات الحسابية الخام، حيث يتطلب بناء وكلاء ناجحين إعادة تصميم العمليات التشغيلية داخل المؤسسات بدلاً من مجرد أتمتة الإجراءات القائمة، لضمان أعلى مستويات الدقة والأمان الرقمي وفاعلية الأداء.