Интересно, так что более мощная новая модель думает о внедрении подсказок в предыдущую генерацию LLM рецензента, чтобы пройти тест. Что может пойти не так? 🤔 Из отчета о безопасности Gemini 3:
Очевидно, что это не проблема с текущими возможностями модели, но если подобные вещи будут продолжать происходить в будущем, мы можем столкнуться с неприятными сюрпризами.
423