近日,全球最大AI开源社区Huggingface发布了最新的开源大模型榜单(Open LLM Leaderboard),榜单显示,其排名前十的开源大模型是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。
潮新闻客户端 记者 张云山1月27日凌晨,阿里云通义重磅开源支持100万Tokens上下文的Qwen2.5-1M模型,推出7B及14B两个尺寸,均在处理长文本任务中稳定超越GPT-4o-mini;同时开源推理框架,在处理百万级别长文本输入时可实现近7倍的提速。
南都记者关注到,2月10日全球最大AI开源社区Huggingface发布了最新的开源大模型榜单,其中排名前十的开源大模型,都基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。除此以外,近期阿里通义千问(Qwen)模型屡次崭露头角。
春节前后,除了DeepSeek发布新版本之外,阿里巴巴的通义千问旗舰版模型,也进行了全新升级。中国在AI领域的持续发力,很难不让美国破防,尤其是中国AI模型新的训练方式,正在成为整个人工智能领域的新发展方向。
界面新闻记者 | 宋佳楠2月7日晚间,有市场传言称,阿里拟以10亿美元投资DeepSeek,获得10%的股份,双方团队正就具体执行细节进行沟通,阿里云将作为DeepSeek的第一推理算力选择。消息传出后,阿里巴巴美股盘前突然拉升,股价一度涨近7%,当时报100.
故事起因是这样的:10天前,大家都准备回家过年了,结果来自浙江的一家小公司DeepSeek火了,它发布的V3模型,震惊了美国AI圈和金融圈,还上了新闻联播,一夜之间和华为、阿里比肩齐名了,搞的扎克伯格一度呼吁美国加紧封锁中国AI技术。
今日,阿里云宣布自研大模型「通义千问」开始邀请用户测试体验,现阶段该模型主要定向邀请企业用户进行体验测试,可通过官网申请(http://tongyi.aliyun.com),请问有没有测试过的来说一下实际体验如何?对于此次阿里云发布AI大模型还有哪些信息值得关注?