العودة إلى الدورة

اختبار الوكلاء: تقييم الدقة

هندسة الذكاء الاصطناعي الوكيل (ابنِ، ولا تكتفِ بمجرد كتابة الأوامر)

لماذا يصعب الاختبار؟

سلوك الوكلاء غير حتمي (non-deterministic). سنستخدم LangSmith لتتبع الاستدعاءات وتقييم ما إذا كان الوكيل قد وصل إلى النتيجة الصحيحة.