随着人工智能(AI)生成的内容充斥互联网,它正在破坏未来模型训练的数据。当AI“吃掉”自己时,会发生什么?得益于生成式人工智能的蓬勃发展,普通人也可随时使用计算机程序来生成文本、计算机代码、图像和音乐。
AI大模型时代,随着AI生成内容作品的数量不断增多,这其中存在的版权问题显得愈发引人注目,用人类的作品“喂给”AI进行训练之后生成的作品,算“借鉴”还是算“抄袭”?如果AI训练必须执行严格的版权规定,那么AI大模型在训练过程中学习过一万个人的作品,是否要经过这1万人一一授权?
“我们将对您主动上传的文档材料,在采取脱敏处理后作为AI训练的基础材料使用”……近日,办公软件WPS在其隐私政策中的表述被质疑滥用用户隐私,引发关注。随后,其官方向用户致歉,并承诺用户文档不会被用于人工智能训练目的。无独有偶。
科技日报北京7月25日电(记者 张梦然)《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。
图片来源:物理学家组织网【今日视点】◎本报记者 刘 霞人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。
经济观察报 记者 沈怡然 因为AI,李梅(化名)连续失业了两次。“很遗憾,本月6号记得来办公室办理离职手续,祝你早日找到满意的工作”。2023年5月初,深圳一家艺术概念设计公司引入AIGC(生成式人工智能)两个月之后,开启了一轮原画师的裁员。
李志起 杨明川 姚 佳编者的话:人工智能(AI)大模型的训练、进化都离不开数据。外媒近日报道称,科技公司利用语音识别工具转录视频网站上的视频,形成对话文本数据来训练AI,也有公司用社交媒体上具有版权争议和隐私权争议的数据来训练AI——这些“捷径”是否合法?
21世纪经济报道 见习记者郭聪聪 实习生刘欣 北京报道近期,又一起科技平台利用用户数据训练AI的行为被英国监管机构(ICO)叫停。此次“踢到铁板”的科技平台是目前全球最大的职场社交平台LinkedIn,这家总部位于美国的社交平台在全球200多个国家/地区拥有超过8亿用户。
本报记者 李静 杭州报道SaaS 作为一个效率工具,目前其实面对很多问题,例如需要商家经过学习才会使用,当商家经营意识升级不足,运营人才积累不足的时候,比较难把SaaS工具真正用起来,使其发挥起作用。而随着大语言模型的快速发展,商家运营智能化正逐渐成为可能。
2023年11月底,Google旗下的DeepMind在杂志发表了重磅论文,宣称他们开发了用于材料科学的人工智能强化学习模型Graph Networks for Materials Exploration ,并通过该模型和高通量第一性原理计算,寻找到了38万余个热力学稳定的晶体材料,相当于“为人类增加了800年的智力积累”,极大加快了发现新材料的研究速度。
学习或挑战ChatGPT的“正确姿势”,或许还是在更基础、更底层的原始创新中寻找力量。一些中国企业在芯片、操作系统、AI大模型等方面持续投入,并且有所产出,ChatGPT的出现,也是中国AI企业加速奔跑,迎来新一轮发展的契机。