Å rope ut dårlig oppførsel av @_rexliu fra @gen_analysis på LinkedIn - amatørmessig AI Image Edit for å stjele andres innlegg og kreve det for seg selv For to dager siden ga venner på @exolabs ut et fantastisk innlegg med @nvidia + @Apple og bruk av begge maskinvarene for å øke hastigheten på LLM-er på enheten. Og så så jeg et innlegg på LI av @_rexliu, som hevdet at de "bare finjusterte gpt-oss-120B (QLoRA 4-bit) på en DGX Spark ..." (se skjermbilder). Super kjent oppsett, påfallende likt bord, påfallende lik plante i bakgrunnen, bemerkelsesverdig like kabelplasseringer. Og ingen enhets-ID fra NVIDIA under klistremerket. (amatørfeil) Ja.... Disse gutta så definitivt @alexocheema innlegg på LI gå viralt, stjal innleggsbildet og AI-redigerte det, slik at de kan stjele litt ufortjent ros for å kjøre disse kule innovasjonene. (Og ingen kreditter til @exolabs) Denne typen AI-bilderedigeringer for å stjele kreditt vil bli stadig enklere og mer vanlig nå. Vær forsiktig der ute.
EXO Labs
EXO Labs16. okt. 2025
Klynger NVIDIA DGX Spark + M3 Ultra Mac Studio for 4 ganger raskere LLM-slutning. DGX Spark: 128 GB @ 273 GB/s, 100 TFLOPS (fp16), $3,999 M3 Ultra: 256 GB @ 819 GB/s, 26 TFLOPS (fp16), $5,599 DGX Spark har 3 ganger mindre minnebåndbredde enn M3 Ultra, men 4 ganger flere FLOPS. Ved å kjøre databundet forhåndsutfylling på DGX Spark, minnebundet dekoding på M3 Ultra og strømme KV-cachen over 10 GbE, er vi i stand til å få det beste ut av begge maskinvarene med enorme hastigheter. Kort forklaring i denne tråden og lenke til hele blogginnlegget nedenfor.
@_rexliu @gen_analysis @exolabs @nvidia @Apple Det aktuelle innlegget:
35,59K