跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-17.24%
USELESS
-8.15%
IKUN
-12.26%
gib
+6.63%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-4.44%
ALON
-10%
LAUNCHCOIN
-13.48%
GOONC
-1.4%
KLED
-5.67%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-1.74%
Boopa
-15.29%
PORK
-0.65%
主頁
Ethan Mollick
Ethan Mollick
18 小時前
另一組缺失的 AI 基準是關於脆弱性。有些模型乍看之下似乎不錯,並且在基準測試中表現良好,但在使用時卻會崩潰。這些模型是否能很好地泛化?它們是否總是回到相同的主題或想法?它們是否理解提示的意圖?
17.62K
104
Ethan Mollick
11月17日 03:08
關於AI的許多奇怪之處之一是,擅長製作AI的人並不是擅長使用AI的專家。他們建造了一台通用機器,其在任何特定任務上的能力在很大程度上是未知的。 在其他人之前,先在你的領域中弄清楚這一點是非常有價值的。
122.35K
1.13K
Ethan Mollick
11月16日 23:14
我們對模型能力的基準測試太多,而對代理工作則太少。越來越多的經濟意義在於,AI 通過 API 調用正確回答問題的能力並不是最重要的,而是它結合工具和解決問題的能力。這一點被低估了。
27.74K
280
熱門
排行
收藏