跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
探索 Web3 Giveaway 活动,每周丰厚奖励等您来领取
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+14.5%
USELESS
+18.13%
IKUN
+6.59%
gib
+10.58%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+4.79%
ALON
-5.14%
LAUNCHCOIN
+6.9%
GOONC
+4.21%
KLED
-2.6%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.13%
Boopa
+5.68%
PORK
-5.53%
主页
will depue
(请假)RL 培训后@openai,过去:sora,应用研究
查看原文
will depue
11 小时前
我今天在伦斯勒理工学院。如果有人在附近,想聊聊AI或者任何事情,请告诉我!
3.71K
32
will depue
9月5日 07:02
研究人员在能力迭代上的能力往往受到我们测量该能力的能力的限制。我确实相信,进展在很大程度上是评估限制的,而不是人们想象的那样。 有时评估感觉是因果关系。SWE-Bench是遵循代理编码,还是代理编码遵循SWE-Bench? 我们经常听到解决非常长时间范围的任务(几周、几个月),或者持续学习是实现AGI所需的等等。然而,在哪里有评估来证明我们模型在这方面的不足呢? 我希望更多的人能致力于AGI完整评估,真正跟踪经济价值和影响的评估,持续一个月的任务等等。
161.76K
384
will depue
9月5日 01:12
等一下,克里斯,我刚刚收集了更多数据 AOL → Bebo(2008年,8.5亿美元),出售 Uber → Otto(2016年,约6.8亿美元),关闭 Twitter → Periscope(2015年,约7500万–1亿美元),停用 Dropbox → Mailbox(2013年,约1亿美元),停用 Google → Slide(2010年,约1.82亿–2亿美元),关闭 两年内的预期/超出?
58.6K
491
热门
排行
收藏