·专家警告,ChatGPT等人工智能驱动的机器人可能很快就会“耗尽宇宙中的文本”。同时,用AI生成的数据“反哺”AI或造成模型崩溃。未来模型训练使用的高质量数据可能会愈来愈昂贵,网络走向碎片化和封闭化。
中新网上海新闻2月7日电(张亨伟)2月2日,蜜度蜜巢大语言模型完成《生成式人工智能服务管理暂行办法》备案。蜜巢是上海蜜度科技股份有限公司自主研发的大语言模型。2023年7月,在世界人工智能大会上,蜜巢大语言模型正式发布。
继算力短缺之后,高质量语料枯竭,又成为发展人工智能的障碍?一份报告显示,高质量语料预计于2028年枯竭。为减缓这种情况的出现,近日,50余家单位在上海共同发起“语料生态服务大模型可持续发展倡议”,倡导携手为我国大模型产业发展持续提供高质量语料。
上海去年12月印发的人工智能“模塑申城”实施方案指出,到2025年底,力争全市智能算力规模突破100EFLOPS,形成50个左右具有显著成效的行业开放语料库示范应用成果,建设3—5个大模型创新加速孵化器。2月21日至2月23日,2025全球开发者先锋大会将在上海召开。
自美国OpenAI公司的ChatGPT引燃全球竞赛热潮后,人工智能大模型经历了一年半“技术狂飙”。如今,大模型价格战又带来了商用竞争的提速。OpenAI公司近几个月多次降价,字节、阿里、百度、腾讯等国内多家大模型厂商近一个月来也竞相降价。
中新网上海9月8日电 (记者 郑莹莹)中国大模型语料数据联盟8日又吸纳了一批新成员,来充实适用于大模型的中文语料数据。中国大模型语料数据联盟由上海人工智能实验室、中国科学技术信息研究所等单位在今年的世界人工智能大会上联合发起成立,致力建设开放型的大模型语料数据生态圈。
2022年11月,ChatGPT横空出世,带来大模型时代。但训练大模型好比培养孩子,唯有高质量的教育,才有高质量的输出。因此,高质量语料库是大模型产业链关键环节。基于此,今年7月6日,在世界人工智能大会开幕式上,由上海人工智能实验室等单位联合发起的中国大模型语料数据联盟宣布成立。
记者今日(2月19日)从山东省工信厅了解到,为加快推动工业领域重点行业数据汇聚流通和创新应用,以“产业大数据+行业大模型”赋能特色优势行业数智化转型,2025年工业领域重点行业产业数据仓和知识语料库征集工作正式启动。
启明创投主管合伙人周志峰最近在与美国AI界交流过程中,听闻OpenAI的GPT-5或推迟到2025年底发布,其原因之一,可能是用于大模型训练的13万亿数据依旧不够用。为此,OpenAI不得不勉为其难,将相同数据“回炉”训练。
继百度“文心一言”之后,阿里云大模型“通义千问”也官宣内测。4月7日,阿里云官方微博宣布:阿里版GPT官宣内测,其自研大模型“通义千问”开始邀请用户测试体验,新京报贝壳财经记者通过邀测码对通义千问进行了体验。
图说:“大模型时代下的数据要素流通”主题论坛现场 来源/采访对象供图 新民晚报讯(记者 叶薇)为促进数据要素安全合规高效流通、赋能人工智能大模型创新发展,作为2023世界人工智能大会的重要组成部分,由上海数据交易所、大数据流通与交易技术国家工程实验室承办的“大模型时代下的数据要
“到2025年底,建成世界级人工智能产业生态;力争全市智能算力规模突破100EFLOPS;形成50个左右具有显著成效的行业开放语料库示范应用成果;建设3—5个大模型创新加速孵化器,建成一批上下游协同的赋能中心和垂直模型训练场。