Investigadores de Google descubrieron que los modelos avanzados de razonamiento alcanzan una inteligencia superior simulando espontáneamente interacciones internas, similares a múltiples agentes, en lugar de depender únicamente de cálculos más largos o mayor escala. Estos modelos desarrollan una "estructura social" interna donde personas simuladas diversas debaten y reconcilian ideas para resolver problemas complejos.
"encontramos que modelos de razonamiento como DeepSeek-R1 y QwQ-32B presentan una diversidad de perspectiva mucho mayor que los modelos de línea base y simplemente ajustados por instrucciones"
117