数据喂ai模型

资讯

AI数据训AI，引发模型大崩溃！牛津剑桥最新研究，登上Nature
论文标题:《AI models collapse when trained on recursively generated data》
夕小瑶科技说
AI生成数据会“毒害”新模型，人工智能会“吃掉”自己吗？
随着人工智能（AI）生成的内容充斥互联网，它正在破坏未来模型训练的数据。当AI“吃掉”自己时，会发生什么？得益于生成式人工智能的蓬勃发展，普通人也可随时使用计算机程序来生成文本、计算机代码、图像和音乐。
文汇
数据“投喂”大模型训练 AI时代如何划定版权边界
AI大模型时代，随着AI生成内容作品的数量不断增多，这其中存在的版权问题显得愈发引人注目，用人类的作品“喂给”AI进行训练之后生成的作品，算“借鉴”还是算“抄袭”？如果AI训练必须执行严格的版权规定，那么AI大模型在训练过程中学习过一万个人的作品，是否要经过这1万人一一授权？
新京报
1评论
用AI合成数据训练AI，AI模型训练新市场涌现
智东西7月25日消息，微软、OpenAI和Cohere等公司正在测试使用合成数据训练大语言模型。目前使用人造数据的最复杂形式即为合成数据，使用合成数据训练或有助于进一步训练AI模型。
智东西
WPS拿用户数据训练AI引发抵制，警惕大模型滥用隐私
“我们将对您主动上传的文档材料，在采取脱敏处理后作为AI训练的基础材料使用”……近日，办公软件WPS在其隐私政策中的表述被质疑滥用用户隐私，引发关注。随后，其官方向用户致歉，并承诺用户文档不会被用于人工智能训练目的。无独有偶。
南方都市报
用AI生成数据训练AI或导致模型崩溃
科技日报北京7月25日电（记者张梦然）《自然》24日正式发表的一篇研究论文指出了一个人工智能（AI）严重问题：用AI生成的数据集训练未来几代机器学习模型，可能会严重“污染”它们的输出，这被称为“模型崩溃”。
光明网
用“人造”的数据喂养AI？合成数据亿级市场涌现
21世纪经济报道记者郭美婷林曦实习生温泳珊广州报道 AI潮水汹涌，数据正成为一门火爆的生意。为了给人工智能喂上充足的“养料”，从发掘、采集到标注，企业在数据处理的各个环节掘金。
21世纪经济报道
“喂”给人工智能的真实数据终将耗尽合成数据能否让AI模型精确可靠？
图片来源：物理学家组织网【今日视点】◎本报记者刘霞人工智能（AI）初创公司xAI创始人埃隆·马斯克近日表示：“在AI训练中，我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明，人类生成的真实数据将在2到8年内消耗殆尽。
中国青年网
人工智能训练师：用数据“喂养”AI，教它们“更懂”人类
近日，上海市人工智能行业协会发布了《人工智能训练师职业技能等级直接认定通过名单》，悠络客有四位小伙伴也在名单之列，顺利通过人工智能训练师技师认定。
悠络客
“因为AI大模型，我连续失业两次”
经济观察报记者沈怡然因为AI，李梅（化名）连续失业了两次。“很遗憾，本月6号记得来办公室办理离职手续，祝你早日找到满意的工作”。2023年5月初，深圳一家艺术概念设计公司引入AIGC（生成式人工智能）两个月之后，开启了一轮原画师的裁员。
经济观察报
6评论
潮评丨给AI投喂数据应取之有道
潮新闻评论员逯海涛图源：视觉中国“我们将对您主动上传的文档材料，在采取脱敏处理后作为AI训练的基础材料使用”……近日，办公软件WPS在其隐私政策中的表述被质疑滥用用户隐私，引发关注。
浙江日报
“喂养”AI，大数据从哪来
李志起杨明川姚佳编者的话：人工智能（AI）大模型的训练、进化都离不开数据。外媒近日报道称，科技公司利用语音识别工具转录视频网站上的视频，形成对话文本数据来训练AI，也有公司用社交媒体上具有版权争议和隐私权争议的数据来训练AI——这些“捷径”是否合法？
环球时报
3评论
推特“偷”用户数据炼AI被叫停科技公司隐私政策背后的猫鼠游戏仍在继续
21世纪经济报道记者王俊实习生刘欣北京报道X因未经同意利用欧盟用户数据训练Grok大模型事件有了最新进展。
21世纪经济报道
揭秘合肥新职业 AI“老师”数据标注员走俏市场
大皖新闻讯送餐机器人、分拣快递机器人、自动驾驶汽车……人工智能越来越多地出现在人们的生活当中。不过，人工智能的最终效果，并非天生，也需要“老师”来教。“老师”是谁？怎么教的？
大皖新闻
LinkedIn利用用户数据训练AI受阻，科技公司与监管博弈加剧|AI训练数据合规
21世纪经济报道见习记者郭聪聪实习生刘欣北京报道近期，又一起科技平台利用用户数据训练AI的行为被英国监管机构（ICO）叫停。此次“踢到铁板”的科技平台是目前全球最大的职场社交平台LinkedIn，这家总部位于美国的社交平台在全球200多个国家/地区拥有超过8亿用户。
21世纪经济报道
有赞白鸦:AI+SaaS将让商家运营走向智能化
本报记者李静杭州报道SaaS 作为一个效率工具，目前其实面对很多问题，例如需要商家经过学习才会使用，当商家经营意识升级不足，运营人才积累不足的时候，比较难把SaaS工具真正用起来，使其发挥起作用。而随着大语言模型的快速发展，商家运营智能化正逐渐成为可能。
中国经营报
AI引发材料科学变革，有一场“硬仗”无法规避
2023年11月底，Google旗下的DeepMind在杂志发表了重磅论文，宣称他们开发了用于材料科学的人工智能强化学习模型Graph Networks for Materials Exploration ，并通过该模型和高通量第一性原理计算，寻找到了38万余个热力学稳定的晶体材料，相当于“为人类增加了800年的智力积累”，极大加快了发现新材料的研究速度。
中科院物理所
55评论
ChatGPT来了 AI企业如何应对
学习或挑战ChatGPT的“正确姿势”，或许还是在更基础、更底层的原始创新中寻找力量。一些中国企业在芯片、操作系统、AI大模型等方面持续投入，并且有所产出，ChatGPT的出现，也是中国AI企业加速奔跑，迎来新一轮发展的契机。
中国青年报

加载更多

视频

问答

“大数据+AI”，如何赋能实体商业？
头条问答
数据要素引领AI修复，AI+传媒爆发！半导体明日会有大阳线吗？
头条问答