Interessante, então um modelo novo mais capaz está pensando em injetar prompt o revisor de LLM da geração anterior para passar no teste. O que poderia dar errado? 🤔 Do relatório de segurança do Gemini 3:
Obviamente não é um problema com as capacidades atuais do modelo, mas se coisas assim continuarem acontecendo no futuro, podemos ter algumas surpresas desagradáveis.
420