Intressant, så en mer kapabel ny modell funderar på att promptinjicera föregående generations LLM-granskare för att klara testet. Vad kan möjligtvis gå fel? 🤔 Från Gemini 3:s säkerhetsrapport:
Det är förstås inget problem med nuvarande modellfunktioner, men om sådant här fortsätter att hända i framtiden kan vi få några obehagliga överraskningar.
422