Il caching dei prompt è l'ottimizzazione che offre il miglior rapporto qualità-prezzo per i tuoi flussi di lavoro e agenti basati su LLM. In questo post, coprirò suggerimenti per accedere al prompt cache in modo più coerente e come funziona sotto il cofano (probabilmente la prima risorsa di questo tipo)