谷歌研究人员发现,先进的推理模型通过自发模拟内部的多代理式互动来实现更高的智能,而不仅仅依赖于更长的计算时间或更大的规模。 这些模型发展出一种内部的“社会结构”,在这里多样化的模拟角色辩论和调和思想,以解决复杂问题。
"我们发现,像 DeepSeek-R1 和 QwQ-32B 这样的推理模型展现出比基线模型和仅仅经过指令调优的模型更大的视角多样性"
50