跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-24.28%
USELESS
-16.93%
IKUN
-11.8%
gib
-5.25%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-8.6%
ALON
-7.96%
LAUNCHCOIN
-10.77%
GOONC
-5.25%
KLED
-8.04%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.72%
Boopa
-14.16%
PORK
0.00%
主頁
Emma Pierson
Emma Pierson
2025年11月25日
新的 @ScienceAdvances 論文提出了一個簡單的偏見測試: 當一個人的種族被不同地感知時,是否會受到不同的對待? 具體來說,我們問:當同一位司機被認為是西班牙裔而不是白人時,是否更可能被警方搜查? 1/
8.54K
21
Emma Pierson
2025年11月7日
我們並不完全理解人類反饋所編碼的偏好,因此在此基礎上進行訓練可能存在風險。 我們提出了一種自動發現這些偏好的方法! 我們識別不安全、矛盾和主觀的偏好,並改善模型的安全性、評估和個性化。
Raj Movva
2025年11月7日
📣新文件!我的人類反饋中有什麼?(WIMHF) 🔦 人類反饋可能會對大型語言模型(LLMs)產生意想不到或有害的變化,例如過度自信或諂媚。我們如何能提前預測這些行為? 使用SAEs,WIMHF自動從偏好數據中提取這些信號。
15.13K
86
Emma Pierson
2025年10月18日
你是否有很多模型可以選擇,但只有少量標記數據來評估它們?查看我們的 #neurips2025 論文,該論文提出了一種方法,可以比以前的方法更準確地估計模型性能,使用標記和未標記數據。
Divya Shanmugam
2025年10月18日
新的 #NeurIPS2025 論文:我們應該如何在沒有大型標記數據集的情況下評估機器學習模型?我們介紹了半監督模型評估(SSME),它使用標記和未標記數據來估計性能!我們發現 SSME 的準確性遠高於標準方法。
23.8K
107
熱門
排行
收藏