Semantisk bildsökning med hjälp av textinbäddningar mot vision-LLM-sammanfattningar av bilder låter som det fungerar riktigt bra