7月4日,腾讯云正式发布AI 原生(AI Native)向量数据库Tencent Cloud VectorDB。该数据库能够被广泛应用于大模型的训练、推理和知识库补充等场景,是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。
每经记者:王帆 每经编辑:杨夏ChatGPT引发的大模型浪潮,催生了数据存储、检索需求。传统关系型数据库难以处理大规模数据、低时延高并发查询、模糊匹配等需求,但向量数据库能够有效解决这些痛点,因此受到业界青睐。
来源:环球网 【环球网科技综合报道】7月4日-7月7日,2024世界人工智能大会(WAIC)在上海世博中心及世博展览馆举办,智谱AI展示了以智谱大模型开放平台bigmodel.cn与智谱大模型产品矩阵为核心,打造赋能千行百业的“智谱小镇”。
记者10月11日从北京智源人工智能研究院获悉,近日国际知名开源社区Hugging Face更新了月度榜单,智源研究院的BGE模型登顶榜首。BGE在短短一年时间内,总下载量已超4亿次,是目前下载量最多的国产AI系列模型。
向量数据库在构建基于大语言模型的行业智能应用中扮演着重要角色。大模型虽然能回答一般性问题,但在垂直领域服务中,其知识深度、准确度和时效性有限。为了解决这一问题,企业可以利用向量数据库结合大模型和自有知识资产,构建垂直领域的智能服务。
在抖音集团内部,早期的向量化检索引擎是围绕搜索、推荐、广告业务来构建的,由于这些业务天然具有极大的数据规模,因此从一开始,就需要思考如何在向量索引中支持百亿数据的检索需求,比如图虫拥有几亿图片素材,数量规模早已超出单机内存的极限,举个例子,对于1亿条128维的Float向量,不考虑任何辅助结构,就需要100000000 * 128 * 4 bytes 也就是约48GB的服务器内存。