ai语料训练

资讯

数字版权保护与发展年度关键词，涉版权经纪人、AI语料训练
2024年12月27日，2024数字版权保护与发展论坛在北京举办。论坛上，中国人民大学国家版权贸易基地副主任李方丽发布《中国数字版权保护与发展报告2024》。据南都记者了解，这已经是第三年发布中国数字版权保护与发展报告。
南方都市报
1评论
训练大模型要小心什么？这场研讨会热议AI语料建设与合规
据中国网络空间安全协会消息，2024年3月2日下午，中国网络空间安全协会人工智能安全治理专业委员会在北京召开“人工智能语料建设与合规”专题研讨会。来自专委会成员单位、律所和相关领域科研机构、企业、社会组织等单位的三十余位代表参会，围绕大模型语料版权、确权的重点议题进行交流。
南方都市报
AI语料概念爆火，这些浙企藏着富矿
潮新闻记者肖淙文实习生仇萌在刚刚结束的深圳文博会上，华策集团展出通过国家备案的自研“有风”大模型。受访者供图OpenAI又“炸场”了。近日，具备“听、看、说”出色本领的“GPT-4o”亮相，新模型能够处理50种不同的语言，还能读取人的情绪。
浙江日报
值得买上线自研AI购物助手，筛选过亿条消费语料进行训练
“通用大模型到目前为止，还不能很好地解决垂直领域里的问题，在垂直领域里它的知识密度和逻辑推理能力都不太适用。在垂类模型里，不同的垂类的特征还是有很大区别的。我们希望在消费领域让大模型产生更大的作用，所以选择了自研。”值得买科技CTO王云峰介绍称。
南方都市报
AI语料论坛火爆，算法创新下，语料仍是行业核心资产
漕河泾会议中心，座无虚席。2月22日，2025全球开发者先锋大会召开首日，一场以语料为主题的论坛吸引了众多开发者和创业者的围观，甚至连通道上都站满了认真聆听的观众。论坛承办方上海库帕思科技有限公司董事长山栋明说：“一开始觉得这个场地大才选了这里，但大家的热情超出了我们的想象。
上观新闻
库帕思：专注AI语料，以“数据炼金术” 赋能大模型时代
一台体积接近登机行李箱的语料终端，或许会在不久后给基层医院带来重要赋能。基于其内置的医疗语料库和模型，它有机会成为全科医生的“数字副手”，不仅能完成临床信息录入、病历自动生成，遇到疑难问题时还可以提供专科医生级别的辅助诊断能力。
上观新闻
“AI语料”迎来风口上市公司争相布局
来源：证券日报 AI语料作为训练人工智能算法和模型的核心资源，其重要性随着技术发展与行业渗透持续提升本报记者邬霁霞作为人工智能产业链上游的关键基础资源，“AI语料”正迅速成为资本市场新的焦点。A股上市公司也纷纷加快布局，力求在人工智能产业链上游抢占战略制高点。
环球网
2评论
半月谈：AI速成公文，实用不实用？
随着人工智能技术迅猛发展，AI大模型在各垂直领域的应用日趋深入。近期，不少AI软件陆续推出了公文写作板块，或上线“公文版”，提供通知公告等法定公文，以及讲话稿、工作总结等事务性文书的写作生成服务。人工智能开始悄然影响公文写作等日常政务工作，这一现象引起社会关注。
光明网
语料“超级工厂”助力研发多语言联盟实现“数”“质”齐飞
AI语料新生态❸开源筑基 “开源已经成为推动AI技术进步的重要力量”，上海人工智能实验室·大模型语料数据联盟去年联合发布多模态语料库首个开源版本——书生·万卷1.0，目前下载量超过149万人次，通过开源共建包容、开放、有序、共享的AI语料新生态。
南都N视频
加快高质量人工智能中文语料库建设迫在眉睫
人工智能（AI）语料库是汇集大量来自书籍、学术文章、社交媒体等渠道的文本、图片、音频、视频数据集合，是人工智能领域研究和应用的基础数据。目前，国际主流大模型训练语料库以英文语料为主，中文语料占比不超过5%。中文人工智能语料库匮乏制约了我国大模型性能飞跃和技术创新。
中国电子报
超300个大模型如何喂养？语料数据产品供给有了全路径探索
乘数而上之AI语料新生态·语料交易继国家数据局等17部门联合印发《“数据要素x”三年行动计划(2024-2026年)》之后，中央面向公共数据开发利用的首个顶层设计文件《关于加快公共数据资源开发利用的意见》公布，构建公共数据资源开发利用“1+3”政策规则体系。
南方都市报
破解大模型中文语料不足问题，并非毫无办法｜新京报专栏
资料图：高质量中文语料资源短缺限制了我国人工智能技术的发展和创新应用。图/IC photo在2024年全国两会上，有委员提出，应重视当前国内人工智能（AI）大模型产业发展中遇到的高质量中文语料数据短缺问题。
新京报
5评论
生成式人工智能系统应用员：教AI“学做人”“学做事”
方艳开栏语近期，人力资源和社会保障部向社会正式发布了19个新职业，其中半数以上与新质生产力密切相关。产业升级、行业崛起的背后，每一个新职业的诞生都是对一座城市发展的深刻注解。
金台资讯

加载更多

视频

在线举报