2月25日,阿里云宣布了一个重磅消息:其视觉生成基座模型万相2.1(Wan)正式开源。据悉,此次开源采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的所有推理代码和权重全部开源,同时支持文生视频和图生视频任务。随着万相的开源,阿里云实现了全模态、全尺寸的开源。
据不完全统计,目前国内发布的大模型数量超300个,10亿参数规模以上大模型数量也超过100个,大模型产品更是琳琅满目,版本、能力、价格各不相同,开源闭源技术路线各有利弊,面对各种数据和概念,企业也难免患上“选择困难症”。
北京时间9月19日凌晨阿里巴巴史上最大规模的开源发布包含基础模型Qwen2.5用于编码的Qwen2.5-Coder和用于数学的Qwen2.5-Math刷新业界纪录引发关注图源:Qwen X平台截图Qwen2.5有何不同Qwen2.
【文/观察者网 吕栋】 “2023年国内出现了百模大战,造成了社会资源的巨大浪费,尤其是算力的浪费,但是也使得我们追赶世界上最先进的基础模型的能力得到了建立。”7月4日,百度创始人、董事长兼首席执行官李彦宏在2024世界人工智能大会(WAIC)主论坛上说道。
【洞见·TMT】2月16日,百度搜索宣布,将全面接入DeepSeek和文心大模型最新的深度搜索功能,搜索用户可免费使用该功能。此前,百度宣布,文心大模型4.5系列将在未来几个月中陆续推出,并于6月30日起正式开源,文心一言也将于4月1日0时起全面免费。
开源是大模型发展的重要因素,DeepSeek的出圈进一步催化了模型开源。2月21日-23日,在上海举行的2025GDC全球开发者先锋大会上,多位嘉宾探讨模型开源趋势。开源到底对产业发展有哪些影响?开源是否会取代闭源?为什么说开源和闭源都或不可缺?看看嘉宾们都怎么说。
“4000亿参数狙击GPT-4”“训练数据集比Llama 2大了7倍”......近日,Meta官宣了Llama 3,把开源模型的实力又往上提了一截。Llama 3的发布如同一枚深水炸弹,不仅在AI圈内激起巨大波澜,也因其坚定的开源立场,挑动了关于开闭源模式的敏感神经。