مثير للاهتمام، لذا هناك نموذج جديد أكثر قدرة يفكر في حقن المسبق لمراجع نماذج اللغة الكبيرة من الجيل السابق لاجتياز الاختبار. ما الذي يمكن أن يحدث بشكل خاطئ؟ 🤔 من تقرير سلامة جيميني 3:
من الواضح أن هذه ليست مشكلة في قدرات النماذج الحالية، لكن إذا استمرت مثل هذه الأمور في المستقبل قد نحصل على مفاجآت سيئة.
‏‎421‏