DApp Store | Web3 Hub for hendelser og spill

Hva kan jeg gjøre med Discover

Populære emner

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

#

Boop.Fun leading the way with a new launchpad on Solana.

BOOP−0,62 %

Boopa+4,35 %

PORK0,00 %

EXO Labs

EXO Labs16. okt. 2025

Klynger NVIDIA DGX Spark + M3 Ultra Mac Studio for 4 ganger raskere LLM-slutning. DGX Spark: 128 GB @ 273 GB/s, 100 TFLOPS (fp16), $3,999 M3 Ultra: 256 GB @ 819 GB/s, 26 TFLOPS (fp16), $5,599 DGX Spark har 3 ganger mindre minnebåndbredde enn M3 Ultra, men 4 ganger flere FLOPS. Ved å kjøre databundet forhåndsutfylling på DGX Spark, minnebundet dekoding på M3 Ultra og strømme KV-cachen over 10 GbE, er vi i stand til å få det beste ut av begge maskinvarene med enorme hastigheter. Kort forklaring i denne tråden og lenke til hele blogginnlegget nedenfor.

439,61K

EXO Labs16. okt. 2025

Klynger NVIDIA DGX Spark + M3 Ultra Mac Studio for 4 ganger raskere LLM-slutning. DGX Spark: 128 GB @ 273 GB/s, 100 TFLOPS (fp16), $3,999 M3 Ultra: 256 GB @ 819 GB/s, 26 TFLOPS (fp16), $5,599 DGX Spark har 3 ganger mindre minnebåndbredde enn M3 Ultra, men 4 ganger flere FLOPS. Ved å kjøre databundet forhåndsutfylling på DGX Spark og minnebundet dekoding på M3 Ultra, og strømme KV-cachen over 10GbE, er vi i stand til å få det beste ut av begge maskinvarene med enorme hastigheter. Kort forklaring i denne tråden og lenke til hele blogginnlegget nedenfor.

421

EXO Labs15. okt. 2025

Kombinerer NVIDIA DGX Spark + Apple M3 Ultra Mac Studio for 4 ganger raskere LLM-slutning ved hjelp av EXO. DGX-gnist: 128 GB @ 273 GB/s, 100TFLOPS (fp16) M3 Ultra Mac Studio: 512 GB @ 819 GB/s, 26 TFLOPS (fp16) DGX Spark har ~4x FLOPS av M3 Ultra, men 3x mindre minnebåndbredde. Vi var i stand til å få en 4x ytelsesøkning ved å kombinere enhetene og nøye overlappende beregning og nettverkskommunikasjon (over 10GbE). Hvordan? LLM-slutning består av to trinn: forhåndsutfylling og dekoding. Forhåndsutfylling er databundet og blir raskere med flere flopper. Decode er minnebundet og blir raskere med mer minnebåndbredde. Ved å kjøre databundet forhåndsutfylling på DGX Spark og minnebundet dekoding på M3 Ultra, klarte vi å oppnå 4x raskere på forhåndsutfyllingen sammenlignet med M3 Ultra Mac Studio alene og 3x raskere på generasjon sammenlignet med DGX Spark alene. Flere detaljer i blogginnlegget nedenfor.

733

Topp

Rangering

Favoritter

Norsk (bokmål)简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Suomi Svenska

More about OKX Wallet

Last ned Lær Om oss Karrierer Kontakt oss Vilkår for bruk Personvernerklæring X (tidligere Twitter)

Product

Tokens Swap Marketplace Earn Discover Build Utforsker Sikkerhet

Støtte

Supportsenter Verifisering av kanal Kunngjøringer DEX-gebyrplan Bli kjent med OKX Bitcoin-lommebok Ethereum-lommebok Solana-lommebok