跳转至主要内容
币币兑换
行情
扫链
追踪
信号
牛人榜
资产
更多
产品
DeFi
Cryptoverse
奖励中心
市场
洞察中心
Eco Hub
邀请计划
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
探索 Web3 Giveaway 活动,每周丰厚奖励等您来领取
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-6.75%
USELESS
+6.54%
IKUN
+25.96%
gib
+2.94%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+7.8%
ALON
-5.78%
LAUNCHCOIN
-4.35%
GOONC
-15.64%
KLED
-5.83%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-2.01%
Boopa
-7.22%
PORK
-3.47%
主页
Jack Morris
研究@cornell @meta // 语言模型、信息论、人工智能科学
更多
查看原文
Jack Morris
17 小时前
我第一次意识到,AI研究中有一个完全私密的子领域。 每个实际训练模型的公司都在使用带有评分标准的强化学习(RL)和大型语言模型(LLM)评判的奖励。 但学术界的工作仍然停留在使用自动奖励(数学问题和代码)的强化学习上。这对于基准测试来说干净得多,也更容易撰写论文。
更多
42.13K
592
Jack Morris
22 小时前
如果我经营一家第一方模型公司,我会雇佣数百名人文学科的人来进行微妙的数据编辑,以改善模型的“感觉”。 有人需要深入到RLHF数据中,痛苦地纠结于每一个动词选择、每一个感叹词、每一个分号。
更多
44.37K
385
Jack Morris
8月28日 00:47
我该如何购买一件对抗样本的卫衣? (说真的,我会穿它)
更多
143.87K
1.29K
热门
排行
收藏
PumpSwap
DEX
AutoShark Finance
DeFi
Pancake Swap
DeFi
DEX
质押
Yield
4
0x Protocol
DeFi
DEX
5
OKX DEX
DEX
6
MarginFi
DeFi
7
Transit Swap
DEX
8
1inch Network
DeFi
DEX
流动性池
9
Galxe
其他
10
Gelato Network
DeFi