Викриття поганої поведінки @_rexliu з @gen_analysis на LinkedIn - аматорське AI Image Edit, щоб вкрасти чужий пост і вимагати його для себе Два дні тому друзі з @exolabs випустили чудову публікацію з @nvidia + @Apple та використанням обох апаратних засобів для прискорення LLM на пристрої. А потім я побачив пост на LI від @_rexliu, в якому стверджувалося, що вони "просто точно налаштували gpt-oss-120B (QLoRA 4-bit) на DGX Spark..." (див. скріншоти). Супер знайома обстановка, разюче схожий стіл, разюче схожа рослина на задньому плані, напрочуд схоже розміщення кабелів. І ніякого ідентифікатора пристрою від NVIDIA під наклейкою. (аматорська помилка) Так.... Ці хлопці безперечно побачили, що пост @alexocheema про LI став вірусним, вкрали зображення публікації та відредагували його за допомогою штучного інтелекту, щоб вони могли вкрасти незаслужену похвалу за запуск цих крутих інновацій. (І жодних кредитів до @exolabs) Ці типи редагування зображень штучним інтелектом для крадіжки кредиту тепер ставатимуть дедалі простішими та поширенішими. Будьте обережні.
EXO Labs
EXO Labs16 жовт. 2025 р.
Кластеризація NVIDIA DGX Spark + M3 Ultra Mac Studio для 4-кратного швидшого висновування LLM. DGX Spark: 128 ГБ @ 273 ГБ/с, 100 TFLOPS (fp16), $3,999 M3 Ultra: 256 ГБ @ 819 ГБ/с, 26 TFLOPS (fp16), $5,599 DGX Spark має в 3 рази меншу пропускну здатність пам'яті, ніж M3 Ultra, але в 4 рази більше FLOPS. Запускаючи повне заповнення з прив'язкою до обчислень на DGX Spark, декодування з прив'язкою до пам'яті на M3 Ultra і потокове передавання кешу KV через 10 GbE, ми можемо отримати найкраще з обох апаратних засобів із величезним прискоренням. Коротке пояснення в цій темі та посилання на повну публікацію в блозі нижче.
@_rexliu @gen_analysis @exolabs @nvidia @Apple Посада, про яку йде мова:
35,59K