熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
在 LinkedIn 上呼籲 @_rexliu 來自 @gen_analysis 的一些不當行為 - 粗糙的 AI 圖像編輯,竊取他人的帖子並聲稱是自己的
兩天前,@exolabs 的朋友們發布了一篇精彩的帖子,與 @nvidia 和 @Apple 一起,使用這兩種硬體來加速 LLM 在設備上的運行。
然後,我在 LI 上看到 @_rexliu 的一篇帖子,聲稱他們 "剛剛在 DGX Spark 上微調了 gpt-oss-120B (QLoRA 4-bit)..."(見截圖)。超熟悉的設置,驚人相似的桌子,驚人相似的背景植物,顯著相似的電纜擺放。而且 NVIDIA 標籤下沒有設備 ID。(業餘錯誤)
是的.... 這些人肯定在 LI 上看到了 @alexocheema 的帖子病毒式傳播,竊取了帖子圖片,並進行了 AI 編輯,以便他們可以竊取一些不當的讚譽,因為他們運行這些酷炫的創新。(而且沒有給 @exolabs 任何信用)
這種 AI 圖像編輯來竊取榮譽的情況將變得越來越容易和普遍。小心點。


2025年10月16日
集群 NVIDIA DGX Spark + M3 Ultra Mac Studio 以實現 4 倍更快的 LLM 推理。
DGX Spark: 128GB @ 273GB/s, 100 TFLOPS (fp16), $3,999
M3 Ultra: 256GB @ 819GB/s, 26 TFLOPS (fp16), $5,599
DGX Spark 的記憶體頻寬比 M3 Ultra 少 3 倍,但 FLOPS 多 4 倍。
通過在 DGX Spark 上運行計算密集型的預填充,在 M3 Ultra 上運行記憶體密集型的解碼,並通過 10GbE 流式傳輸 KV 快取,我們能夠充分利用這兩種硬體,實現巨大的速度提升。
此主題的簡短說明及完整部落格文章的連結如下。

@_rexliu @gen_analysis @exolabs @nvidia @Apple 涉及的帖子:
35.6K
熱門
排行
收藏

