Interessant, also denkt ein leistungsfähigeres neues Modell darüber nach, die vorherige Generation des LLM-Rezensenten durch Prompt-Injection zu überlisten, um den Test zu bestehen. Was könnte da schon schiefgehen? 🤔 Aus dem Sicherheitsbericht von Gemini 3:
Offensichtlich kein Problem mit den aktuellen Modellfähigkeiten, aber wenn solche Dinge in Zukunft weiterhin passieren, können wir einige unangenehme Überraschungen erleben.
415