一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动 | OKX Wallet

发现功能使用指南

background background

discoveryBanners

热门话题

#

Bonk 生态迷因币展现强韧势头

#

有消息称 Pump.fun 计划 40 亿估值发币，引发市场猜测

LAUNCHCOIN-5.3%

#

Solana 新代币发射平台 Boop.Fun 风头正劲

header

Dwarkesh Patel

Dwarkesh Patel

Dwarkesh Patel7 小时前

这就是我们与赞助商合作时所做的酷事，你将帮助我们进行头脑风暴。

130.72K

Dwarkesh Patel

Dwarkesh Patel11月26日 06:41

"目前模型中非常令人困惑的一件事是：如何调和它们在评估中表现得如此出色的事实。你看评估时会想，‘这些评估相当困难。’ 但经济影响似乎大大滞后。有[一个可能的]解释。早期人们进行预训练时，关于使用什么数据进行训练的问题已经有了答案，因为那个答案是所有数据。所以你不必考虑是用这组数据还是那组数据。当人们进行强化学习训练时，他们会说，‘好吧，我们想要为这个事情进行这种类型的强化学习训练，为那个事情进行那种类型的强化学习训练。’ 你会说，‘嘿，我希望我们的模型在发布时表现得很好。我希望评估看起来很棒。什么样的强化学习训练可以帮助这个任务？’ 如果将这一点与模型的泛化能力实际上不足结合起来，这有可能解释我们所看到的很多现象，即评估表现与实际现实世界表现之间的脱节。"

Dwarkesh Patel

Dwarkesh Patel11月26日 01:29

@ilyasut 这一集 0:00:00 – 解释模型的锯齿性 0:09:39 - 情感与价值函数 0:18:49 – 我们在扩展什么？ 0:25:13 – 为什么人类的概括能力优于模型 0:35:45 – 直击超级智能 0:46:47 – SSI 的模型将从部署中学习 0:55:07 – 对齐 1:18:13 – “我们正处于一个研究公司的时代” 1:29:23 – 自我对弈与多智能体 1:32:42 – 研究品味在 YouTube、Apple Podcasts 或 Spotify 上查找 Dwarkesh Podcast。享受吧！

361.82K

Dwarkesh Patel

Dwarkesh Patel11月26日 03:55

“公司数量远远超过创意。计算能力足够大，以至于并不明显你需要更多的计算能力来证明某个想法。 AlexNet 是在 2 个 GPU 上构建的。变换器是在 8 到 64 个 GPU 上构建的。那大概相当于今天的 2 个 GPU？你可以说 o1 推理并不是世界上最需要计算的事情。对于研究，你确实需要一定量的计算能力，但并不明显你需要绝对最大的计算能力。如果每个人都在同一个范式内，那么计算能力就成为了一个重要的区分因素。” @ilyasut

Dwarkesh Patel

Dwarkesh Patel11月26日 01:29

@ilyasut 这一集 0:00:00 – 解释模型的锯齿性 0:09:39 - 情感与价值函数 0:18:49 – 我们在扩展什么？ 0:25:13 – 为什么人类的概括能力优于模型 0:35:45 – 直击超级智能 0:46:47 – SSI 的模型将从部署中学习 0:55:07 – 对齐 1:18:13 – “我们正处于一个研究公司的时代” 1:29:23 – 自我对弈与多智能体 1:32:42 – 研究品味在 YouTube、Apple Podcasts 或 Spotify 上查找 Dwarkesh Podcast。享受吧！

169.6K

热门

排行

收藏

©2017 - 2025 WEB3.OKX.COM

简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska

关于 OKX Wallet

下载学院关于我们就业机会联系我们服务条款隐私政策 X (原推特)

产品

行情币币兑换市场赚币发现开发者中心浏览器安全

用户支持

帮助中心官方渠道验证公告 DEX 费率标准加入社群比特币钱包以太坊钱包 Solana 钱包