在 LinkedIn 上呼籲 @_rexliu 來自 @gen_analysis 的一些不當行為 - 粗糙的 AI 圖像編輯,竊取他人的帖子並聲稱是自己的 兩天前,@exolabs 的朋友們發布了一篇精彩的帖子,與 @nvidia 和 @Apple 一起,使用這兩種硬體來加速 LLM 在設備上的運行。 然後,我在 LI 上看到 @_rexliu 的一篇帖子,聲稱他們 "剛剛在 DGX Spark 上微調了 gpt-oss-120B (QLoRA 4-bit)..."(見截圖)。超熟悉的設置,驚人相似的桌子,驚人相似的背景植物,顯著相似的電纜擺放。而且 NVIDIA 標籤下沒有設備 ID。(業餘錯誤) 是的.... 這些人肯定在 LI 上看到了 @alexocheema 的帖子病毒式傳播,竊取了帖子圖片,並進行了 AI 編輯,以便他們可以竊取一些不當的讚譽,因為他們運行這些酷炫的創新。(而且沒有給 @exolabs 任何信用) 這種 AI 圖像編輯來竊取榮譽的情況將變得越來越容易和普遍。小心點。
EXO Labs
EXO Labs2025年10月16日
集群 NVIDIA DGX Spark + M3 Ultra Mac Studio 以實現 4 倍更快的 LLM 推理。 DGX Spark: 128GB @ 273GB/s, 100 TFLOPS (fp16), $3,999 M3 Ultra: 256GB @ 819GB/s, 26 TFLOPS (fp16), $5,599 DGX Spark 的記憶體頻寬比 M3 Ultra 少 3 倍,但 FLOPS 多 4 倍。 通過在 DGX Spark 上運行計算密集型的預填充,在 M3 Ultra 上運行記憶體密集型的解碼,並通過 10GbE 流式傳輸 KV 快取,我們能夠充分利用這兩種硬體,實現巨大的速度提升。 此主題的簡短說明及完整部落格文章的連結如下。
@_rexliu @gen_analysis @exolabs @nvidia @Apple 涉及的帖子:
35.6K