科技日报北京7月25日电(记者 张梦然)《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。
编辑:编辑部【新智元导读】9次迭代后,模型开始出现诡异乱码,直接原地崩溃!就在今天,牛津、剑桥等机构的一篇论文登上了Nature封面,称合成数据就像近亲繁殖,效果无异于投毒。有无破解之法?那就是——更多使用人类数据!用AI生成的数据训练AI,模型会崩溃?
来源:科技日报 AI“模型崩溃”风险需警惕图片来源:美国《The Week》【今日视点】◎记者 张佳欣从客户服务到内容创作,人工智能(AI)影响了众多领域的进展。但是,一个日益严重的被称为“模型崩溃”的问题,可能会使AI的所有成就功亏一篑。
随着人工智能(AI)生成的内容充斥互联网,它正在破坏未来模型训练的数据。当AI“吃掉”自己时,会发生什么?得益于生成式人工智能的蓬勃发展,普通人也可随时使用计算机程序来生成文本、计算机代码、图像和音乐。
文 | 维辰小红书平台的文案,很可能是AI写出来的——日前有媒体注意到,过去大半年,该平台不少博主都开始用AI生产图文内容,有性格测试类、知识科普类账号涨粉迅速。Kimi、通义千问、文心一言等一众大模型产品,基本都有专门针对小红书文案的AI撰写能力。
维 辰小红书平台的文案,很可能是AI写出来的——日前有媒体注意到,过去大半年,该平台不少博主都开始用AI生产图文内容,有性格测试类、知识科普类账号涨粉迅速。Kimi、通义千问、文心一言等一众大模型产品,基本都有专门针对小红书文案的AI撰写能力。
人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满足AI的“胃口”,科技行业正转向使用合成数据。
新华社北京7月25日电 对于人工智能(AI)大语言模型来说,通常给予的训练数据越多,模型就会越“聪明”。但英国《自然》杂志新发表的一项关于大模型的研究显示,如果只用AI生成的数据来训练大模型,会使模型性能下降、越练越“傻”。
林黛玉“倒拔垂杨柳”,宋江、吴用、花荣“桃园三结义”……刷手机时,你有看到过如此牛头不对马嘴的内容吗?而这些,统统都是AI的“杰作”。技术狂飙,“万事问AI”俨然成了新潮。舆论场更不乏“既然有工具,何必自己整理资料、遣词造句”之类的论调。
新华社北京7月25日电 对于人工智能(AI)大语言模型来说,通常给予的训练数据越多,模型就会越“聪明”。但英国《自然》杂志新发表的一项关于大模型的研究显示,如果只用AI生成的数据来训练大模型,会使模型性能下降、越练越“傻”。