大型語言模型(LLMs)僅包含通用的預訓練數據。將額外信息(文檔、指南、書籍等)插入到提示中以提高性能的行為稱為「基礎化」。 以下是我用來基礎化的兩個必用工具: 1) @RepoPrompt(mac)或 pastemax(windows) 這些工具允許你輕鬆地將整個代碼庫複製到剪貼板中。然後你可以將其粘貼到大型語言模型中,以詢問有關你的代碼的問題,或讓它們編寫代碼。Gemini 2.5 具有 100 萬個令牌的上下文窗口,因此你可以在其中放入相當大的代碼庫。我最喜歡的工作流程之一是將我的代碼庫複製到 Gemini 2.5,要求它生成一個 claude 代碼提示來執行某個任務,然後將該提示粘貼到 claude 代碼中。 2) Jina AI reader( 將任何 URL 轉換為可以粘貼到你的 LLM 中的 markdown。如果有一個文檔頁面我想用作我的 LLM 的數據源。我可以要求我的 LLM 訪問該 URL,但這通常不可靠,並且它實際上不會訪問該頁面並閱讀所有內容。 最可靠的方法是使用這個 jina 工具將該 URL 轉換為漂亮的 markdown 格式(它甚至可以從網頁中刪除圖像和其他無用內容),然後將其粘貼到你的提示中。
1.91K