سقوط جميل من @philipkiely @Basetenco. 📗 تقوم Inference Engineering برسم خريطة الحزمة وراء الاستدلال الحديث للذكاء الاصطناعي — أوقات التشغيل، البنية التحتية، والأدوات — وتغوص في التفاصيل العملية لخدمة نماذج اللغة الكبيرة على وحدات معالجة رسومات NVIDIA باستخدام TensorRT LLM وDynamo. أنا متأكد من البداية — يستحق القراءة. 👇