跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+24.37%
USELESS
+14.31%
IKUN
+25.39%
gib
-3.39%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+3.42%
ALON
+3.3%
LAUNCHCOIN
+6.05%
GOONC
+8.53%
KLED
+5.24%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.44%
Boopa
+9.86%
PORK
-0.5%
主页
Andrej Karpathy
建筑@EurekaLabsAI。曾任人工智能总监@特斯拉,创始团队@OpenAI,CS231n/博士@斯坦福大学。我喜欢训练大型深度神经网络。
查看原文
Andrej Karpathy
4 小时前
我昨天通过早期访问体验了Gemini 3。几点想法 - 首先,我通常会对公共基准保持谨慎,因为在我看来,它们很可能被操控。关键在于团队的纪律和自我克制(与此同时,他们的激励机制却是相反的),以避免通过对测试集相邻数据进行复杂的操作来过拟合测试集。实际上,由于其他人都在这样做,施加的压力很大。 去和模型对话。与其他模型对话(骑上LLM周期 - 每天使用不同的LLM)。我昨天对个性、写作、氛围编码、幽默等方面有了积极的早期印象,显然是一个非常稳健的日常驱动者,显然是一个一流的LLM,恭喜团队! 在接下来的几天/几周里,我最感兴趣并在关注的是关于私人评估的集成,很多人/组织现在似乎都在为自己构建这些,并偶尔在这里报告。
257.08K
2.79K
Andrej Karpathy
22 小时前
我开始养成阅读所有内容(博客、文章、书籍章节等)的习惯,使用 LLMs。通常第一遍是手动的,然后第二遍是“解释/总结”,第三遍是问答。我通常会比直接跳过更好/更深入地理解内容。这正在成为最主要的使用案例之一。 另一方面,如果你是一名作家,试图解释/传达某些内容,我们可能会越来越少地看到“我为另一个人写这个”的心态,而更多地是“我为 LLM 写这个”。因为一旦 LLM “理解”了,它就可以针对、个性化并将这个想法传达给它的用户。
666.23K
7.52K
Andrej Karpathy
11月17日 01:56
分享一段关于AI对经济影响的有趣最近对话。 AI被与各种历史先例进行比较:电力、工业革命等,我认为最强的类比是将AI视为一种新的计算范式(软件2.0),因为这两者根本上都是关于数字信息处理的自动化。 如果你要预测1980年代计算对就业市场的影响,你会关注任务/工作的最具预测性的特征是算法的固定程度,即你是否只是根据简单、易于指定的规则(例如打字、记账、人类计算器等)机械地转换信息?那时,这就是那个时代的计算能力允许我们手动编写的程序类别。 现在有了AI,我们能够编写以前无法手动编写的新程序。我们通过指定目标(例如分类准确性、奖励函数)来实现这一点,并通过梯度下降搜索程序空间,以找到在该目标下表现良好的神经网络。这是我之前的一篇关于软件2.0的博客文章。在这个新的编程范式中,新的最具预测性的特征是可验证性。如果一个任务/工作是可验证的,那么它可以直接或通过强化学习进行优化,并且可以训练神经网络以极其良好的效果工作。这是关于AI能在多大程度上“练习”某件事。环境必须是可重置的(你可以开始新的尝试)、高效的(可以进行很多尝试)和可奖励的(有某种自动化过程来奖励任何特定的尝试)。 一个任务/工作越是可验证,就越容易在新的编程范式中实现自动化。如果它不可验证,就必须依赖神经网络的泛化魔法,或者通过模仿等较弱的手段。这就是推动LLM进展的“锯齿状”前沿。可验证的任务进展迅速,甚至可能超越顶级专家的能力(例如数学、代码、观看视频的时间、任何看起来像有正确答案的谜题),而许多其他任务则相形见绌(创造性、战略性、结合现实世界知识、状态、上下文和常识的任务)。 软件1.0轻松自动化你可以指定的内容。 软件2.0轻松自动化你可以验证的内容。
1.9M
12.19K
热门
排行
收藏