封面新闻记者 边雪在全球的大模型竞赛中,中国已占有一席之地,而打造开源生态,推动大模型开源生态,已经成为中国业界的主流选择。9月15日,智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP(massive text pairs)。
南都讯 记者李玲 数据质量决定了大模型的上限,但数据短缺成为制约大模型发展的瓶颈。如何缓解AI公司的数据焦虑?6月14日,第六届北京智源大会上公布了两个数据集:一是千万级高质量开源指令微调数据集,二是开源中英文行业数据集。高质量的指令数据是大模型性能的“养料”。
北京日报客户端 | 记者 孙奇茹全球大模型研发进入如火如荼的爆发期,而激烈的竞争与高昂的成本,也同时推动着开源崛起成为人工智能发展的关键推动力量。智源研究院近日在北京人工智能产业峰会发布面向中英文语义向量模型训练的大规模文本对数据集MTP(massive text pairs)。
阿里云开源通义千问140亿参数模型封面新闻记者 欧阳宏宇国产大模型的开源季正在跑出加速度。9月25日,阿里云开源通义千问140亿参数模型,并宣布Qwen-14B及其对话模型Qwen-14B-Chat免费可商用。
来源:环球网 【环球网科技综合报道】8月24日消息,国内GPU与AI计算解决方案提供商摩尔线程宣布,正式开源了其音频理解大模型——MooER(摩耳)。据介绍,该模型是业界首个基于国产全功能GPU进行训练和推理的大型开源语音模型。
21世纪经济报道记者 冯恋阁 福州报道生成式人工智能技术不断发展,训练数据来源成为人们最关注的问题之一。去年11月,国家数据局等17部门联合印发的《“数据要素×”三年行动计划(2024—2026年)》提到,要提升数据供给水平、建设高质量语料库和基础科学数据库。
为了保持公司在AI(人工智能)开源大模型领域的地位,社交巨头Meta推出了旗下最新开源模型。当地时间4月18日,Meta在官网上宣布公布了旗下最新大模型Llama 3。目前,Llama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,上下文窗口为8k。
来源:信阳新闻网 11月5日,腾讯混元宣布最新开源的MoE模型“混元Large”和图文生3D模型正式上线。腾讯云TI平台也宣布同步开放接入,为广大用户、开发者提供一站式精调、API调用及私有化部署服务。