Гарний спад від @philipkiely і @Basetenco. 📗 Inference Engineering відображає стек, що лежить в основі сучасного AI inference — середовища виконання, інфраструктуру та інструменти — і заглиблюється в практичні деталі обслуговування LLM на NVIDIA GPU з TensorRT LLM і Dynamo. Якщо це не свідчить — варто прочитати. 👇