使用 Pgvector 构建视觉搜索
文章讨论了作者在亚马逊上搜索一款新手表的经历,以及由于该平台以规格为中心的界面而导致的寻找合适款式的挑战。受 same.energy 和 lexica.art 的启发,作者创建了一个名为 same.style 的人工智能用户体验实验,利用图像相似性搜索为产品提供更好的搜索体验。
Same.style 允许用户在不受各种规格限制的情况下首先探索风格,然后根据用户的喜好推荐新产品。作者解释说,该实验利用了 OpenAI 于 2021 年创建的对比语言-图像预训练(CLIP)模型,该模型将文本和图像带入同一向量空间,从而计算出它们之间的距离。
为了在不丢失选定手表的情况下进一步定制手表,作者采用了一种同时搜索选定手表和文本的方法。具体做法是在潜空间中将图像向量向文本向量的方向移动,然后根据这些新向量构建一个查询来查找类似产品。
作者还讨论了使用距离度量,特别是内积来计算向量之间的相似性。矢量数据库 Pgvector 用于支持这些操作,作者选择了 HNSW 索引以获得更好的性能。
总之,文章强调了人工智能和基于向量的搜索方法在改善在线购物平台用户体验方面的潜力。
未经允许不得转载:表盘吧 » 使用 Pgvector 构建视觉搜索