@philipkiely 和 @Basetenco 的精彩分享。 📗 推理工程绘制了现代 AI 推理背后的技术栈——运行时、基础设施和工具——并深入探讨了在 NVIDIA GPU 上使用 TensorRT LLM 和 Dynamo 服务 LLM 的实际细节。 如果你错过了——值得一读。👇