使用文本嵌入进行语义图像搜索,针对图像的视觉-LLM摘要,听起来效果非常好。