训练数据最新的大模型

资讯

大模型在这里“刷题”！国内首个人工智能数据训练基地启用
如果把人工智能大模型比作一位小学生，那么数据训练时所用的“语料”和“算力”，就相当于小学生“刷题”时使用的习题册和计算器，帮助他掌握知识点、更快给出正确答案。如今，北京的大模型有了更全面的“习题册”、更强大的“计算器”。
北京日报客户端
1评论
姚前：ChatGPT类大模型训练数据的托管与治理
ChatGPT既好玩又实用，远超之前的自然语言处理应用，许多人认为这是一个划时代的产品，国际上主流商业公司、学术机构乃至政府部门都开始高度重视和全面拥抱大语言模型应用。
金融界
1评论
财智微课堂 079期 | 训练数据对大模型的重要性体现在哪里？
来源：【人民日报出版社】本文来自【人民日报出版社】，仅代表作者观点。全国党媒信息公共平台提供信息发布传播服务。
全国党媒信息公共平台
B端训练数据哪里来？︱AI大模型十问（一）
AI大模型不断涌现，“百模大战”愈演愈烈。但不论是To B还是To C的大模型，都面临训练数据日渐匮乏的问题。业内有报告预测，语言数据将于2030~2040年耗尽，其中能训练出更好性能的高质量语言数据将于2026年耗尽；此外，视觉数据将于2030~2060年耗尽。
第一财经
用大模型优化大模型预训练数据，节省20倍计算量，性能提升！
过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。
机器之心Pro
利用个人数据训练大模型，要提供“不同意”选项
日前，南都第八届“啄木鸟数据治理论坛”在京举办，会上发布《生成式AI用户风险感知与信息披露透明度报告(2024)》。
南方都市报
北京发布首批100个AI大模型高质量训练数据集，联盟多家企业入围
来源：【中关村数字媒体产业联盟】3月29日，以“数据驱动，智绘未来”为主题的2024 北京AI原生产业创新大会暨北京数据基础制度先行区成果发布会举办。
全国党媒信息公共平台
15评论
OpenAI 模型家族更新：GPT-4 训练数据至 2023 年 12 月
随着模型更新的加快，OpenAI 还开放了评估贡献通道，由用户针对不同用例协同进行模型改进。GPT-4 与 GPT-4 Turbo。
InfoQ
3评论
面向大模型训练，腾讯发布高性能计算集群：整体性能提升3倍
该集群采用腾讯云星星海自研服务器，搭载英伟达最新代次H800 GPU，服务器之间采用业界最高的3.2T超高互联带宽，为大模型训练、自动驾驶、科学计算等提供高性能、高带宽和低延迟的集群算力。腾讯表示，实测显示，腾讯云新一代集群的算力性能较前代提升高达3倍，是国内性能最强的大模型计算集群。
澎湃新闻
111评论
两会申音｜Manus来了，AI大模型跨入应用时代？
3月7日，全国政协十四届三次会议第二次全体会议现场，全国政协委员、吉利控股集团董事长李书福戴着AR（增强现实）眼镜作大会发言——这一幕令不少委员印象深刻。
上观新闻

视频