跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-2.92%
USELESS
-3.68%
IKUN
-4.19%
gib
+0.83%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+1.86%
ALON
-0.74%
LAUNCHCOIN
-7.24%
GOONC
-3.08%
KLED
+11.48%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+0.04%
Boopa
-1.92%
PORK
0.00%
主页
Tong Chen @ NeurIPS
博士生@uwcse @uwnlp
查看原文
Tong Chen @ NeurIPS
2025年11月14日
OpenAI 的博客 () 指出,今天的语言模型会产生幻觉,因为训练和评估奖励的是猜测,而不是承认不确定性。这引发了一个自然的问题:我们能否在不损害实用性的情况下减少幻觉?🤔 使用我们的二元检索增强奖励(RAR)的在线策略 RL 可以在保持模型实用性(胜率和准确性)的同时,提高事实性(幻觉减少 40%),适用于像 Qwen3-8B 这样的完全训练、功能强大的语言模型。 [1/n]
109.15K
671
热门
排行
收藏