阿里云通义千问系列模型近期迎来重大进展:通义千问QwQ-32B开源,国家超算互联网平台、算能科技、壁仞科技等机构相继宣布接入通义千问QwQ-32B推理模型或推出专属一体机,与此同时,通义千问衍生模型数量突破10万个,超越美国Meta公司的Llama系列,稳居全球规模最大AI模型群,并且在海外被Camel.AI、SambaNova Cloud等部署上云,对外提供API服务。
近日,全球最大AI开源社区Huggingface发布了最新的开源大模型榜单(Open LLM Leaderboard),榜单显示,其排名前十的开源大模型是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。
21世纪经济报道记者孔海丽 实习生王夏雯 北京报道 开源阵营迎来新的“大家伙”。当地时间7月23日,Meta正式发布Llama 3.1。在官方博客中,Meta称该模型是目前“最强大的开源基础模型”,并表示:“直到今天,开源大模型在功能和性能方面大多落后于封闭模型。
这不,就在过去短短一周时间里:DeepSeek 开源五连发,集中在 AI Infra,为我们带来了包括为 Hopper GPU 开发的高效 MLA 解码内核 FlashMLA、专为专家混合和专家并行定制的通信库 DeepEP 、专为 FP8通用矩阵乘法优化的高效计算库 DeepGEMM、以及还有 DeepSeek 创始人梁文锋亲自参与开发的双向流水线并行算法 DualPipe、专家并行负载均衡算法、DeepSeek Infra 中的性能分析数据。
作者 | 香草 李水青编辑 | 李水青就在刚刚,谷歌向最强开源大模型的宝座发起进攻!智东西2月22日报道,昨日晚间,谷歌毫无预兆地发布了开源模型Gemma,直接狙击Llama 2。继通过Gemini拳打OpenAI后,试图用Gemma脚踢Meta。
南都记者关注到,2月10日全球最大AI开源社区Huggingface发布了最新的开源大模型榜单,其中排名前十的开源大模型,都基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。除此以外,近期阿里通义千问(Qwen)模型屡次崭露头角。
每经AI快讯,天风证券研报表示,1.Meta重磅发布最强开源大模型Llama3。4月18日Meta发布两款开源Llama38B与Llama370B模型,供外部开发者免费使用。Meta表示,Llama38B和Llama370B是目前同体量下,性能最好的开源模型。