2024年12月27日,2024数字版权保护与发展论坛在北京举办。论坛上,中国人民大学国家版权贸易基地副主任李方丽发布《中国数字版权保护与发展报告2024》。据南都记者了解,这已经是第三年发布中国数字版权保护与发展报告。
据中国网络空间安全协会消息,2024年3月2日下午,中国网络空间安全协会人工智能安全治理专业委员会在北京召开“人工智能语料建设与合规”专题研讨会。来自专委会成员单位、律所和相关领域科研机构、企业、社会组织等单位的三十余位代表参会,围绕大模型语料版权、确权的重点议题进行交流。
潮新闻 记者 肖淙文 实习生 仇萌在刚刚结束的深圳文博会上,华策集团展出通过国家备案的自研“有风”大模型。 受访者供图OpenAI又“炸场”了。近日,具备“听、看、说”出色本领的“GPT-4o”亮相,新模型能够处理50种不同的语言,还能读取人的情绪。
“通用大模型到目前为止,还不能很好地解决垂直领域里的问题,在垂直领域里它的知识密度和逻辑推理能力都不太适用。在垂类模型里,不同的垂类的特征还是有很大区别的。我们希望在消费领域让大模型产生更大的作用,所以选择了自研。”值得买科技CTO王云峰介绍称。
漕河泾会议中心,座无虚席。2月22日,2025全球开发者先锋大会召开首日,一场以语料为主题的论坛吸引了众多开发者和创业者的围观,甚至连通道上都站满了认真聆听的观众。论坛承办方上海库帕思科技有限公司董事长山栋明说:“一开始觉得这个场地大才选了这里,但大家的热情超出了我们的想象。
一台体积接近登机行李箱的语料终端,或许会在不久后给基层医院带来重要赋能。基于其内置的医疗语料库和模型,它有机会成为全科医生的“数字副手”,不仅能完成临床信息录入、病历自动生成,遇到疑难问题时还可以提供专科医生级别的辅助诊断能力。
来源:证券日报 AI语料作为训练人工智能算法和模型的核心资源,其重要性随着技术发展与行业渗透持续提升 本报记者 邬霁霞作为人工智能产业链上游的关键基础资源,“AI语料”正迅速成为资本市场新的焦点。A股上市公司也纷纷加快布局,力求在人工智能产业链上游抢占战略制高点。
随着人工智能技术迅猛发展,AI大模型在各垂直领域的应用日趋深入。近期,不少AI软件陆续推出了公文写作板块,或上线“公文版”,提供通知公告等法定公文,以及讲话稿、工作总结等事务性文书的写作生成服务。人工智能开始悄然影响公文写作等日常政务工作,这一现象引起社会关注。
AI语料新生态❸开源筑基 “开源已经成为推动AI技术进步的重要力量”,上海人工智能实验室·大模型语料数据联盟去年联合发布多模态语料库首个开源版本——书生·万卷1.0,目前下载量超过149万人次,通过开源共建包容、开放、有序、共享的AI语料新生态。
人工智能(AI)语料库是汇集大量来自书籍、学术文章、社交媒体等渠道的文本、图片、音频、视频数据集合,是人工智能领域研究和应用的基础数据。目前,国际主流大模型训练语料库以英文语料为主,中文语料占比不超过5%。中文人工智能语料库匮乏制约了我国大模型性能飞跃和技术创新。
乘数而上之AI语料新生态·语料交易继国家数据局等17部门联合印发《“数据要素x”三年行动计划(2024-2026年)》之后,中央面向公共数据开发利用的首个顶层设计文件《关于加快公共数据资源开发利用的意见》公布,构建公共数据资源开发利用“1+3”政策规则体系。
资料图:高质量中文语料资源短缺限制了我国人工智能技术的发展和创新应用。图/IC photo在2024年全国两会上,有委员提出,应重视当前国内人工智能(AI)大模型产业发展中遇到的高质量中文语料数据短缺问题。