跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+16.28%
USELESS
+21.52%
IKUN
+4.64%
gib
-5.42%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+12.76%
ALON
+4.8%
LAUNCHCOIN
-1.58%
GOONC
+2.41%
KLED
+4.75%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
+0.34%
Boopa
-2.62%
PORK
+7.1%
主頁
EXO Labs
EXO Labs
2025年10月16日
集群 NVIDIA DGX Spark + M3 Ultra Mac Studio 以實現 4 倍更快的 LLM 推理。 DGX Spark: 128GB @ 273GB/s, 100 TFLOPS (fp16), $3,999 M3 Ultra: 256GB @ 819GB/s, 26 TFLOPS (fp16), $5,599 DGX Spark 的記憶體頻寬比 M3 Ultra 少 3 倍,但 FLOPS 多 4 倍。 通過在 DGX Spark 上運行計算密集型的預填充,在 M3 Ultra 上運行記憶體密集型的解碼,並通過 10GbE 流式傳輸 KV 快取,我們能夠充分利用這兩種硬體,實現巨大的速度提升。 此主題的簡短說明及完整部落格文章的連結如下。
439.65K
2.18K
EXO Labs
2025年10月16日
將 NVIDIA DGX Spark 與 M3 Ultra Mac Studio 集群以實現 4 倍更快的 LLM 推理。 DGX Spark:128GB @ 273GB/s,100 TFLOPS (fp16),$3,999 M3 Ultra:256GB @ 819GB/s,26 TFLOPS (fp16),$5,599 DGX Spark 的記憶體頻寬比 M3 Ultra 少 3 倍,但 FLOPS 多 4 倍。 通過在 DGX Spark 上運行計算密集型的預填充,並在 M3 Ultra 上運行記憶體密集型的解碼,並通過 10GbE 流式傳輸 KV 快取,我們能夠充分利用兩種硬體,實現巨大的速度提升。 此主題的簡短說明及完整部落格文章的連結如下。
492
EXO Labs
2025年10月15日
結合 NVIDIA DGX Spark + Apple M3 Ultra Mac Studio,以 EXO 實現 4 倍更快的 LLM 推理。 DGX Spark: 128GB @ 273GB/s, 100TFLOPS (fp16) M3 Ultra Mac Studio: 512GB @ 819GB/s, 26 TFLOPS (fp16) DGX Spark 的 FLOPS 約為 M3 Ultra 的 4 倍,但內存帶寬少了 3 倍。 通過結合這些設備並仔細重疊計算和網絡通信(超過 10GbE),我們能夠實現 4 倍的性能提升。怎麼做到的? LLM 推理由兩個階段組成:預填充和解碼。 預填充是計算密集型的,隨著 FLOPS 的增加而變得更快。 解碼是內存密集型的,隨著內存帶寬的增加而變得更快。 通過在 DGX Spark 上運行計算密集型的預填充,並在 M3 Ultra 上運行內存密集型的解碼,我們能夠實現預填充相比於單獨的 M3 Ultra Mac Studio 快 4 倍,生成相比於單獨的 DGX Spark 快 3 倍。 更多詳情請參見下面的博客文章。
802
7
熱門
排行
收藏