Orgteh Infra

2026-04-22

طبقة الاستمرارية: كيف تمنح وكيلك الذكي ذاكرة حيّة تبقى حتى بعد إعادة التشغيل

كلّ محادثة تبدأها مع نموذج لغوي كبير تُولّد كائناً عبقرياً من لحظته، لكن بلا أيّ تذكّر لما سبق أن قدّمه لك من رؤى. تنتهي الجلسات، تفيض نوافذ السياق، وتبدو واجهات برمجة «الذاكرة» التي نُلحقها اليوم مجرد ملاحظات لزجة يعيد

اقرأ المزيد

2026-04-22

From Prompt Chaos to Agent Clarity: How AgentSPEX Tames LLM Workflows

If you’ve ever stared at a 200-line “mega-prompt” that drives your entire research agent—only to watch it wander off-topic, forget its state, or call the wrong tool twice—you know the pain AgentSPEX was built to solve. T

اقرأ المزيد

2026-04-21

Build Token-Efficient, Self-Evolving LLM Agents with GenericAgent

If you’ve ever watched an AI agent forget what it was doing after the 30th tool call, you’ve felt the pain GenericAgent (GA) was built to solve. Long-horizon tasks—booking a multi-city trip, debugging legacy code, scrapi

اقرأ المزيد

2026-04-21

حواجز رمزية لوكلاء الذكاء الاصطناعي: كيف تضمن السلامة دون إعادة تدريب

يتصل وكلاء الذكاء الاصطناعي بالأدوات—كُتّاب SQL، عملاء REST، وحدات ماكرو الجداول—ليحجزوا رحلات طيران أو يحوّلوا أموالاً أو يحذفوا جداول في ميلي ثانية. تخيّل معلمة واحدة مُهلَهلة، فيتحوّل الروبوت التجريبي إلى مسؤولية إنتا

اقرأ المزيد

2026-04-21

من الإبهام إلى الدقة: كيف يُصلح نموذج التفضيلات الكامن استدعاءات الأدوات غير المحدَّدة في وكلاء LLM

يعرف كل مطوّر أطلق وكيل LLM للإنتاج تلك اللحظة: يكتب المستخدم «أحضر تقريري الاعتيادي»، فينهار الخادم لأن واجهة برمجة التطبيقات (API) الخاصة بالتقويم تطلب و و و و، ولم يُذكر شيء منها. إمّا أن يُطلق الوكيل استدعاءً محكومً

اقرأ المزيد

2026-04-20

سباق الوكيل المذهل: لماذا يضيع وكيل LLM في ويكيبيديا وكيف تُصلحه

إذا سبق أن شاهدت وكيل LLM يستدعي الـAPI الصحيح لكنّه يُمرِّر بيانات خاطئة، فأنت تعرف بالفعل نقطة الألم الكامنة في كل عرض توضيحي لـ«استخدام الأدوات». معيار جديد يُسمّى سباق الوكيل المذهل (AAR) يُثبت أن المشكلة ليست في الأ

اقرأ المزيد

2026-04-20

من السجل إلى البرق: كيف يقلّص TRACER تكلفة تصنيفات LLM بنسبة 90 % بنموذج تملكه بالفعل

في كل استدعاء للمصنّف تدفع مرتين: مرة بالدولارات ومرة بالتأخير. يُقلب TRACER المعادلة باستخدام الأثر الورقي الذي تخزّنه بالفعل—الإدخال، التسمية، الطابع الزمني—كمجموعة تدريب مجانية ومتنامية. يتحمّل نموذج بديل مقتصر على 3

اقرأ المزيد

2026-04-19

From Prompt to Production: How SemaClaw Builds Personal AI Agents You Can Actually Ship

Personal AI agents stopped being science fiction the day OpenClaw crossed one million weekly active users in early 2026. Suddenly, non-technical friends were bragging about “my agent booked a three-city Asia trip while I

اقرأ المزيد

2026-04-18

من المهامّ اللعبة إلى العمل الجاد: كيف يختبر DR³-Eval وكلاء البحث العميق أخيرًا

DR³-Eval أوّل معيار يختبر وكلاء البحث العميق بمهامّ حقيقية طويلة الأفق، داخل ويب مجمّد وقابل للتدقيق، ويُصدر بطاقة تقييم خماسية (تذكّر، دقّة، استشهاد، اتّباع تعليمات، عمق) يمكن دمجها في CI ليلاً. الكلّ مفتوح المصدر (Apac

اقرأ المزيد

2026-04-17

من البحث العشوائي إلى التنقّل الذكي: اصنع وكلاء نماذج لغوية تعرف أين تبحث

يُعدّ الجيل المعزَّز بالاسترجاع ‎RAG‎ اليوم معيارًا أساسيًا في معظم أنظمة الذكاء الاصطناعي، لكنّه لا يزال يتصرّف كمتدرب مذعور يهرع إلى المكتبة، يمسك أوّل خمس كتب تطابق الكلمة المفتاحية، ويتجاهل بطاقات «انظر أيضًا» على ال

اقرأ المزيد

2026-04-16

From Monolith to Micro-Library: How Sema Code Lets You Drop an AI Coder into Any App

Every “AI coding assistant” you’ve tried ships as a finished product—VS Code plug-in, CLI binary, web IDE. Convenient, until you need the brain elsewhere: a Slack bot, a home-grown editor, a CI pipeline, an on-prem porta

اقرأ المزيد

2026-04-15

اختبار ATANT في الميدان: دليل المطوّر لقياس استمرارية الذكاء الاصطناعي

كل أسبوع يظهر عرض توضيحي جديد على Hacker News يدّعي أنّ له «ذاكرةً لامحدودة»: دردشة تتذكّر اسم كلبك، خصم الضريبة الذي أدخلته عام 2021، وحبكة الرواية التي تكتبها. لكن بعد خمس رسائل يخبرك بثقة إنّ الكلب هو قطة والشرير مات

اقرأ المزيد

Orgteh مدونة

طبقة الاستمرارية: كيف تمنح وكيلك الذكي ذاكرة حيّة تبقى حتى بعد إعادة التشغيل

From Prompt Chaos to Agent Clarity: How AgentSPEX Tames LLM Workflows

Build Token-Efficient, Self-Evolving LLM Agents with GenericAgent

حواجز رمزية لوكلاء الذكاء الاصطناعي: كيف تضمن السلامة دون إعادة تدريب

من الإبهام إلى الدقة: كيف يُصلح نموذج التفضيلات الكامن استدعاءات الأدوات غير المحدَّدة في وكلاء LLM

سباق الوكيل المذهل: لماذا يضيع وكيل LLM في ويكيبيديا وكيف تُصلحه

من السجل إلى البرق: كيف يقلّص TRACER تكلفة تصنيفات LLM بنسبة 90 % بنموذج تملكه بالفعل

From Prompt to Production: How SemaClaw Builds Personal AI Agents You Can Actually Ship

من المهامّ اللعبة إلى العمل الجاد: كيف يختبر DR³-Eval وكلاء البحث العميق أخيرًا

من البحث العشوائي إلى التنقّل الذكي: اصنع وكلاء نماذج لغوية تعرف أين تبحث

From Monolith to Micro-Library: How Sema Code Lets You Drop an AI Coder into Any App

اختبار ATANT في الميدان: دليل المطوّر لقياس استمرارية الذكاء الاصطناعي

Orgteh Assistant