开源训练数据的大模型

资讯

科技观察｜如何推动大模型开源生态？全球最大面向中英文语义向量模型训练数据集发布
封面新闻记者边雪在全球的大模型竞赛中，中国已占有一席之地，而打造开源生态，推动大模型开源生态，已经成为中国业界的主流选择。9月15日，智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP（massive text pairs）。
封面新闻
AI训练数据匮乏怎么破？智源研究院开源两个大规模数据集
南都讯记者李玲数据质量决定了大模型的上限，但数据短缺成为制约大模型发展的瓶颈。如何缓解AI公司的数据焦虑？6月14日，第六届北京智源大会上公布了两个数据集：一是千万级高质量开源指令微调数据集，二是开源中英文行业数据集。高质量的指令数据是大模型性能的“养料”。
南方都市报
全球最大中英文语义向量模型训练数据集发布
北京日报客户端 | 记者孙奇茹全球大模型研发进入如火如荼的爆发期，而激烈的竞争与高昂的成本，也同时推动着开源崛起成为人工智能发展的关键推动力量。智源研究院近日在北京人工智能产业峰会发布面向中英文语义向量模型训练的大规模文本对数据集MTP（massive text pairs）。
北京日报
5评论
腾讯混元文生图大模型开源训练代码
记者获悉，今日，腾讯混元文生图大模型（以下简称为混元DiT模型）宣布全面开源训练代码，同时对外开源混元DiT LoRA 小规模数据集训练方案与可控制插件ControlNet。
证券时报
国产大模型开源提速部分模型参数规模一个月翻倍
阿里云开源通义千问140亿参数模型封面新闻记者欧阳宏宇国产大模型的开源季正在跑出加速度。9月25日，阿里云开源通义千问140亿参数模型，并宣布Qwen-14B及其对话模型Qwen-14B-Chat免费可商用。
封面新闻
复旦MOSS大模型正式开源：能写文案、生成图像、解数学题
复旦大学计算机科学技术学院教授MOSS系统负责人邱锡鹏表示:“这是国内第一个插件版对话语言模型，能使用搜索引擎、图像生成模型、方程求解器等外部工具，为用户提供越来越多的服务。
科创板日报
4评论
重磅！Meta推出开源大模型Llama 3，性能直逼GPT-4
每经编辑：杜宇当地时间4月18日，AI 领域迎来重磅消息，Meta正式发布了人们等待已久的开源大模型Llama 3。
每日经济新闻
1评论
720亿、千亿级参数大模型接连开放国产开源大模型进入参数时代
封面新闻记者欧阳宏宇围绕开源大模型打响的混战正演变为参数之争。12月1日，阿里云宣布开源通义千问720亿参数模型Qwen-72B，18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。
封面新闻
摩尔线程：正式开源音频理解大模型MooER
来源：环球网【环球网科技综合报道】8月24日消息，国内GPU与AI计算解决方案提供商摩尔线程宣布，正式开源了其音频理解大模型——MooER（摩耳）。据介绍，该模型是业界首个基于国产全功能GPU进行训练和推理的大型开源语音模型。
环球网
1评论
AI训练数据荒下，合成数据成为“开源”新解法？
21世纪经济报道记者冯恋阁福州报道生成式人工智能技术不断发展，训练数据来源成为人们最关注的问题之一。去年11月，国家数据局等17部门联合印发的《“数据要素×”三年行动计划（2024—2026年）》提到，要提升数据供给水平、建设高质量语料库和基础科学数据库。
21世纪经济报道
开源社区分水岭：Meta大模型Llama 3发布，参数最高或达4000亿
为了保持公司在AI（人工智能）开源大模型领域的地位，社交巨头Meta推出了旗下最新开源模型。当地时间4月18日，Meta在官网上宣布公布了旗下最新大模型Llama 3。目前，Llama 3已经开放了80亿（8B）和700亿（70B）两个小参数版本，上下文窗口为8k。
澎湃新闻
1评论
腾讯混元Large模型全面开源！腾讯云TI平台支持一键精调与推理
来源：信阳新闻网 11月5日，腾讯混元宣布最新开源的MoE模型“混元Large”和图文生3D模型正式上线。腾讯云TI平台也宣布同步开放接入，为广大用户、开发者提供一站式精调、API调用及私有化部署服务。
环球网
7评论

加载更多

视频

在线举报