在抖音集团内部,早期的向量化检索引擎是围绕搜索、推荐、广告业务来构建的,由于这些业务天然具有极大的数据规模,因此从一开始,就需要思考如何在向量索引中支持百亿数据的检索需求,比如图虫拥有几亿图片素材,数量规模早已超出单机内存的极限,举个例子,对于1亿条128维的Float向量,不考虑任何辅助结构,就需要100000000 * 128 * 4 bytes 也就是约48GB的服务器内存。
在传统智能客服开发的漫漫长路上,为了让系统能够准确识别用户问题,需要花费大量的精力在 关键词 识别上。每一个用户需求,背后都有着千奇百怪的问法,为了尽可能覆盖这些情况,需要整日埋首于代码的海洋,编写着似乎无穷无尽的判断逻辑。
6月20日,国家互联网信息办公室(下称“国家网信办”)发布有关深度合成服务算法备案信息的公告。此次共公开了41条App和网站的备案信息,包括算法名称、主体名称、应用产品、主要用途以及备案编号等,涉及主体有快手、百度、抖音、阿里巴巴等头部互联网公司。
迫切寻找应用场景的大模型,可以如何改造抖音这款月活用户超7亿的短视频应用?南都获悉,抖音近期正在内测面向网红大V的“AI分身”互动功能。点击主播头像,即可进入AI互动空间,得到具有主播个性特征的对话体验。拥有170多万粉丝的“胡说老王”参与了这项内测。