与此同时,这些是他们用来测试大型语言模型(LLMs)智能的问题类型。 Gemini 3 Pro 的正确率约为 37%,GPT 5.2 的正确率约为 31%。我知道第一个问题有点简单,但老实说,你有多少个是没有谷歌搜索就答对的?