跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+3.33%
USELESS
+4.49%
IKUN
-2.3%
gib
+14.67%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+3.57%
ALON
+2.96%
LAUNCHCOIN
-5.3%
GOONC
-2.8%
KLED
+19.51%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-2.89%
Boopa
-6.19%
PORK
+8.45%
主页
Dwarkesh Patel
Dwarkesh Patel
7 小时前
这就是我们与赞助商合作时所做的酷事,你将帮助我们进行头脑风暴。
130.72K
529
Dwarkesh Patel
11月26日 06:41
"目前模型中非常令人困惑的一件事是:如何调和它们在评估中表现得如此出色的事实。 你看评估时会想,‘这些评估相当困难。’ 但经济影响似乎大大滞后。 有[一个可能的]解释。早期人们进行预训练时,关于使用什么数据进行训练的问题已经有了答案,因为那个答案是所有数据。所以你不必考虑是用这组数据还是那组数据。 当人们进行强化学习训练时,他们会说,‘好吧,我们想要为这个事情进行这种类型的强化学习训练,为那个事情进行那种类型的强化学习训练。’ 你会说,‘嘿,我希望我们的模型在发布时表现得很好。我希望评估看起来很棒。什么样的强化学习训练可以帮助这个任务?’ 如果将这一点与模型的泛化能力实际上不足结合起来,这有可能解释我们所看到的很多现象,即评估表现与实际现实世界表现之间的脱节。"
Dwarkesh Patel
11月26日 01:29
@ilyasut 这一集 0:00:00 – 解释模型的锯齿性 0:09:39 - 情感与价值函数 0:18:49 – 我们在扩展什么? 0:25:13 – 为什么人类的概括能力优于模型 0:35:45 – 直击超级智能 0:46:47 – SSI 的模型将从部署中学习 0:55:07 – 对齐 1:18:13 – “我们正处于一个研究公司的时代” 1:29:23 – 自我对弈与多智能体 1:32:42 – 研究品味 在 YouTube、Apple Podcasts 或 Spotify 上查找 Dwarkesh Podcast。享受吧!
361.82K
1.41K
Dwarkesh Patel
11月26日 03:55
“公司数量远远超过创意。 计算能力足够大,以至于并不明显你需要更多的计算能力来证明某个想法。 AlexNet 是在 2 个 GPU 上构建的。变换器是在 8 到 64 个 GPU 上构建的。那大概相当于今天的 2 个 GPU?你可以说 o1 推理并不是世界上最需要计算的事情。 对于研究,你确实需要一定量的计算能力,但并不明显你需要绝对最大的计算能力。 如果每个人都在同一个范式内,那么计算能力就成为了一个重要的区分因素。” @ilyasut
Dwarkesh Patel
11月26日 01:29
@ilyasut 这一集 0:00:00 – 解释模型的锯齿性 0:09:39 - 情感与价值函数 0:18:49 – 我们在扩展什么? 0:25:13 – 为什么人类的概括能力优于模型 0:35:45 – 直击超级智能 0:46:47 – SSI 的模型将从部署中学习 0:55:07 – 对齐 1:18:13 – “我们正处于一个研究公司的时代” 1:29:23 – 自我对弈与多智能体 1:32:42 – 研究品味 在 YouTube、Apple Podcasts 或 Spotify 上查找 Dwarkesh Podcast。享受吧!
169.6K
736
热门
排行
收藏