热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
以每小时10美元的价格,您可以自托管Kimi,并在8个H200 GPU上以440个令牌/秒的速度生成故事(或其他任何内容),与Prime Intellect一起。
关键是不要担心延迟。例如,如果您想从24个问题中获取26,400个令牌,您可以自托管Kimi,并在大约一分钟内获得(一切准备就绪后😉)。
这大约是每百万输出令牌6美元。相当不错!
不过在Groq上,Kimi K2-0905(256k)的价格是每百万输出令牌3.00美元。所以我甚至无法比Groq自托管更便宜——至少在我尝试的负载和设置下是这样。但这仍然比Sonnet 4.0便宜约2.5倍,而根据基准测试,这个模型大致相当于此。
我认为自托管如此强大的模型是非常赋权的。要么Groq在大力补贴Kimi令牌,要么他们确实拥有惊人的技术。🙂
附言:对于短的类似问题,只用几个令牌回答,我们可以获得大约573个令牌/秒的输出,导致每小时大约150,000个提示。因此,Kimi K2在8个H200上每小时可以进行150K个简单分类。

30.11K
热门
排行
收藏