向量数据库在构建基于大语言模型的行业智能应用中扮演着重要角色。大模型虽然能回答一般性问题,但在垂直领域服务中,其知识深度、准确度和时效性有限。为了解决这一问题,企业可以利用向量数据库结合大模型和自有知识资产,构建垂直领域的智能服务。
在抖音集团内部,早期的向量化检索引擎是围绕搜索、推荐、广告业务来构建的,由于这些业务天然具有极大的数据规模,因此从一开始,就需要思考如何在向量索引中支持百亿数据的检索需求,比如图虫拥有几亿图片素材,数量规模早已超出单机内存的极限,举个例子,对于1亿条128维的Float向量,不考虑任何辅助结构,就需要100000000 * 128 * 4 bytes 也就是约48GB的服务器内存。
21世纪经济报道记者白杨 北京报道在AI大模型时代,任何能推动大模型发展的技术和产品都备受关注,向量数据库便是其中之一。今年3月,英伟达创始人兼CEO 黄仁勋首次提及向量数据库,并强调对于构建专有大型语言模型的组织而言,向量数据库至关重要。
当下,大模型的火热已成为行业共识,从时间线上看,2022年12月大模型实现破圈爆火,2023年3月,因NVIDIA CEO 黄仁勋在NVIDIA GTC Keynote 中首次提及向量数据库,强调其在构建专有大型语言模型的组织中的重要性,行业内部人士逐渐意识到,向量数据库可以支持