图片来源:物理学家组织网【今日视点】◎本报记者 刘 霞人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。
李志起 杨明川 姚 佳编者的话:人工智能(AI)大模型的训练、进化都离不开数据。外媒近日报道称,科技公司利用语音识别工具转录视频网站上的视频,形成对话文本数据来训练AI,也有公司用社交媒体上具有版权争议和隐私权争议的数据来训练AI——这些“捷径”是否合法?
科技日报北京7月25日电(记者 张梦然)《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。
随着人工智能(AI)生成的内容充斥互联网,它正在破坏未来模型训练的数据。当AI“吃掉”自己时,会发生什么?得益于生成式人工智能的蓬勃发展,普通人也可随时使用计算机程序来生成文本、计算机代码、图像和音乐。
“一公斤的砖和两公斤的棉花,哪个比较重?”对于这个简单的问题,人工智能(AI)问答软件却给出了错误答案。11日下午,在福州举行的2023国家网络安全宣传周主论坛上,一位演讲嘉宾谈及人工智能时列举了上述案例,由此反映出的人工智能“一本正经地胡说八道”现象引发热议。