跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-24.28%
USELESS
-16.93%
IKUN
-11.8%
gib
-5.25%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-8.6%
ALON
-7.96%
LAUNCHCOIN
-10.77%
GOONC
-5.25%
KLED
-8.04%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.72%
Boopa
-14.16%
PORK
0.00%
主页
Emma Pierson
Emma Pierson
2025年11月25日
新的 @ScienceAdvances 论文提出了一种简单的偏见测试: 当一个人的种族被不同地感知时,他们是否会受到不同的对待? 具体来说,我们问:当同一名司机被认为是西班牙裔而不是白人时,他们被警察搜查的可能性是否更高? 1/
8.54K
21
Emma Pierson
2025年11月7日
我们并不完全理解人类反馈所编码的偏好,因此在其上进行训练可能存在风险。 我们提出了一种自动发现这些偏好的方法! 我们识别不安全、矛盾和主观的偏好,并改善模型的安全性、评估和个性化。
Raj Movva
2025年11月7日
📣新论文!我的人类反馈中有什么?(WIMHF)🔦 人类反馈可能会对大型语言模型(LLMs)产生意想不到或有害的变化,例如过度自信或谄媚。我们如何能够提前预测这些行为? 通过使用SAEs,WIMHF自动从偏好数据中提取这些信号。
15.13K
86
Emma Pierson
2025年10月18日
您是否有很多模型可供选择,但只有少量标记数据来评估它们?请查看我们的 #neurips2025 论文,该论文提出了一种方法,可以比以前的方法更准确地估计模型性能,使用标记数据和未标记数据。
Divya Shanmugam
2025年10月18日
新的 #NeurIPS2025 论文:我们应该如何在没有大型标记数据集的情况下评估机器学习模型?我们介绍了半监督模型评估(SSME),它使用标记和未标记的数据来估计性能!我们发现 SSME 的准确性远高于标准方法。
23.8K
107
热门
排行
收藏