أبحاث الذكاء الاصطناعي نُشر 2026-03-22 آخر تحديث 2026-03-26

من 97٪ إلى 88٪ بسطر واحد من الضجيج: بروتوكول ReliabilityBench يكشف لماذا سيفشل وكيلك الذكي في الإنتاج

المصدر البحثي الأصلي

هذه المقالة مبنية على ورقة بحثية علمية.

https://arxiv.org/abs/2601.06112

جرّب نماذج Orgteh

وصّل أفكار هذه المقالة عبر واجهة API موحدة — بدون إعداد معقد.

Orgteh Assistant

Online
Hello! I am Orgteh Assistant. How can I help you?