قامت مجموعة العلماء الدوليين بتطوير مؤسسة وكيل الكمبيوتر ، مصممة للتحقق من عمل وكلاء الكمبيوتر وتحسينه بواسطة الذكاء الاصطناعي. يشتمل المشروع على مشاركة خبراء من جامعة واترلو وجامعة هونغ كونغ وأبحاث ساليفيفورس وجامعة كارنيجي ميلون.

مساعدي الكمبيوتر هم برامج تؤدي المهام دون تدخل بشري. أمثلة على هؤلاء المساعدين هي مساعد Siri Voice ، يمكنه إرسال الرسائل وعقد الاجتماعات. ومع ذلك ، يواجه Aissists الحديث صعوبات في أداء المهام المعقدة التي تتطلب التفاعل مع تطبيقات مختلفة. على سبيل المثال ، قد يكون الإبلاغ عن الحدود أمرًا صعبًا بسبب الحاجة إلى العثور على البيانات في الحروف والمستخلصات والجداول.
أصبحت Argena Agent Arena أول منصة للتحقق من AISSIMISTY في بيئة كمبيوتر حقيقية. هذا هو تطوير مشروع OSWorld السابق – أول بيئة التوسع لتشغيل الأنظمة متعددة الوسائط.
وفقًا لأحد المطورين ، أستاذ في جامعة واترلو فيكتور تشونغ ، تتيح لك البيئة الجديدة مقارنة نماذج الذكاء الاصطناعى المختلفة على أساس اللغة والتقنيات البصرية. يختار المستخدمون نظام التشغيل والتطبيقات (على سبيل المثال ، Google Chrome أو Excel) ، ثم قم بتعيين مهمة المساعد ، ثم النظام في الوقت الفعلي لمقارنة أداء المهمة بنموذجين مختلفين.