“能够助力人工智能实现‘换道超车’的是语料数据……高质量语料数据直接决定了大模型训练效果的上限。”在2025年上海两会期间,上海市政协委员、上海库帕思科技有限公司CEO黄海清在接受澎湃新闻独家专访时表示,未来,行业垂类大模型将成为中国大模型产业的主战场。
·专家警告,ChatGPT等人工智能驱动的机器人可能很快就会“耗尽宇宙中的文本”。同时,用AI生成的数据“反哺”AI或造成模型崩溃。未来模型训练使用的高质量数据可能会愈来愈昂贵,网络走向碎片化和封闭化。
生成式人工智能(AIGC)迅猛发展,引爆新一轮人工智能大模型产业化热潮,形成全新产业风口。上海积极布局大模型产业,全国首个大模型创新生态社区“模速空间”2023年9月在上海徐汇区揭牌后,已汇聚千余家人工智能企业、255家大模型企业以及100余家投资机构。
8月19日,在2024北京人工智能生态大会上,高价值语料可信流通基础设施正式启动建设。在区块链、隐私计算等前沿信息技术的护航下,支撑人工智能大模型高质量成长的语料数据将告别无序流通,转入规范运行的“高速公路”。
开篇语 继国家数据局等17部门联合印发《“数据要素x”三年行动计划(2024-2026年)》之后,中央面向公共数据开发利用的首个顶层设计文件《关于加快公共数据资源开发利用的意见》公布,构建公共数据资源开发利用“1+3”政策规则体系。
资料图:高质量中文语料资源短缺限制了我国人工智能技术的发展和创新应用。图/IC photo在2024年全国两会上,有委员提出,应重视当前国内人工智能(AI)大模型产业发展中遇到的高质量中文语料数据短缺问题。
第89届中国国际医疗器械博览会上,观众体验联影智能MR脑功能智能分析系统。图① AI大模型数字客户系统—AI虚拟机器人。图② 第二届全球数字贸易博览会前沿趋势馆内,人工智能大模型同场竞技。图③ 基于Stable Diffusion(AI绘画生成工具)的框架模型开发的软件。
2月21日至2月23日,2025全球开发者先锋大会在上海举办。大会开幕前夕,中国证券报记者实探商汤科技、MiniMax、阶跃星辰等多家AI企业了解到,目前AI企业正积极构建从算力到语料再到大模型的协同创新产业生态。
漕河泾会议中心,座无虚席。2月22日,2025全球开发者先锋大会召开首日,一场以语料为主题的论坛吸引了众多开发者和创业者的围观,甚至连通道上都站满了认真聆听的观众。论坛承办方上海库帕思科技有限公司董事长山栋明说:“一开始觉得这个场地大才选了这里,但大家的热情超出了我们的想象。
潮新闻 记者 肖淙文 实习生 仇萌在刚刚结束的深圳文博会上,华策集团展出通过国家备案的自研“有风”大模型。 受访者供图OpenAI又“炸场”了。近日,具备“听、看、说”出色本领的“GPT-4o”亮相,新模型能够处理50种不同的语言,还能读取人的情绪。
基于无涯大模型,星环知识平台TKH打造了无涯·问知、无涯·问数、无涯·金融、无涯·工程等AI原生应用,可广泛应用于金融、能源、制造、工程等多个领域,通过精准的数据分析和知识管理,满足企业不同类型的知识应用需求,提升企业业务效率和竞争力。
“到2025年底,建成世界级人工智能产业生态;力争全市智能算力规模突破100EFLOPS;形成50个左右具有显著成效的行业开放语料库示范应用成果;建设3—5个大模型创新加速孵化器,建成一批上下游协同的赋能中心和垂直模型训练场。