我国互联网基础设施建设发生在上世纪90年代中后期,此后经5至8年酝酿,才迎来淘宝电商平台等“杀手级应用”的爆发;iPhone诞生于2007年,这似乎是互联网从PC(个人计算机)端转向移动端的开端,然而iPhone问世9年后,才有抖音这一超级App的上线。
在人工智能的激烈竞争中,国产大模型 DeepSeek 崭露头角,引发了广泛关注。而一直处于领先地位的 ChatGPT 对此表示:排名变化也许是暂时的。近年来,自然语言处理领域发展迅猛,大模型不断推陈出新。ChatGPT 凭借其出色的语言理解和生成能力,成为了行业的标杆。
近期,DeepSeek V3 的发布让大家了解到超大规模 MoE 模型的效果及另一种实现方法,而同期,Qwen 也在研发超大规模的 MoE 模型 Qwen2.5-Max,使用超过 20 万亿 token 的预训练数据及精心设计的后训练方案进行训练。
AI的快速发展,正在对各行各业产生积极影响。12月27日发布的“抖音直播2024年治理报告”中(下称“报告”)介绍,AI音频审核大模型被用于到了该平台违规内容审核之中,促使违规内容整体处置时间降低55%,治理效率大大提升。
【抖音副总裁回应疑掀大模型价格战】财联社12月19日电,对于字节跳动再掀大模型价格战这一传闻,抖音副总裁李亮发文回应称:这不是价格战。李亮表示,豆包大模型通过技术创新来降低成本,在算法、软件工程和硬件方案上做了非常多优化,3厘/千tokens的定价也有可观的毛利。
最新回应。12月19日,对于“字节跳动再掀大模型价格战”这一报道,抖音集团副总裁李亮微博回应称,这不是价格战。豆包大模型通过技术创新来降低成本,在算法、软件工程和硬件方案上做了非常多优化,3厘/千tokens的定价也有可观的毛利。
智东西8月31日消息,今日,百度、智谱AI、商汤科技、百川智能和MiniMax官方发布公告,宣布面向全社会上线大模型产品。据《科创板日报》今早报道,这5家企业刚刚通过了《生成式人工智能服务管理暂行办法》审核备案。
新大模型性能飙升,美西方要坐不住了?先是DeepSeek横空出世,让全世界对中国的AI技术刮目相看,紧接着,阿里也不甘示弱,在除夕夜这个大好的日子里,悄悄放出了一个大招——新大模型性能直接飙升,据说还超过了DeepSeek v3!
OpenAI发布的视频大模型Sora后,国内厂商迅速跟进,相继发布视频模型产品,包括生数科技、智谱AI、阿里等。9月24日,字节跳动旗下火山引擎发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,以及豆包音乐大模型、同声传译模型等产品。
与 Megtraon 和 DeepSpeed 的对比测试显示,veGiantModel 的性能表现最好、受网络带宽影响最小,在Tesla V100上较上述两者有1.2 倍到3.5倍的提升,在Ampere A100上最高可提升6.9倍。
5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。据介绍,火山引擎是字节跳动旗下云服务平台,据火山引擎总裁谭待介绍,经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿Tokens文本,生成3000万张图片。
时间转瞬来到8月底,在接近半年的酝酿后,国内第一批通过审核的AI大模型正式上线,首批上线的AI大模型来自八家不同的公司:百度、抖音、智谱 AI、中科院、百川智能、商汤、MiniMax、上海人工智能实验室。
迫切寻找应用场景的大模型,可以如何改造抖音这款月活用户超7亿的短视频应用?南都获悉,抖音近期正在内测面向网红大V的“AI分身”互动功能。点击主播头像,即可进入AI互动空间,得到具有主播个性特征的对话体验。拥有170多万粉丝的“胡说老王”参与了这项内测。