乘数而上之AI语料新生态·语料交易继国家数据局等17部门联合印发《“数据要素x”三年行动计划(2024-2026年)》之后,中央面向公共数据开发利用的首个顶层设计文件《关于加快公共数据资源开发利用的意见》公布,构建公共数据资源开发利用“1+3”政策规则体系。
封面新闻记者 刘恪生“嗒嗒嗒、嗒嗒嗒……”11月18日,在一片宽敞明亮的办公区内,随着键盘的敲击声,几十名腾讯云(自贡)数字经济产业基地的数据标注员,正聚精会神地在做同一件事:运用数据标注平台,对采集自全国的道路图片进行数据标注,给人工智能大模型投喂数据。
来源:人民日报 上午9时,重庆市渝北区菲利信科技有限公司的办公室内,25岁的蔡川军开始了一天的工作。电脑屏幕上,一款语言类人工智能大模型正在总结小说《红楼梦》第四回的内容。蔡川军发现,总结中缺少了几个重要剧情,便只给了这条结果3分,并在备注栏中将其缺漏一一列出。
AI大模型时代,随着AI生成内容作品的数量不断增多,这其中存在的版权问题显得愈发引人注目,用人类的作品“喂给”AI进行训练之后生成的作品,算“借鉴”还是算“抄袭”?如果AI训练必须执行严格的版权规定,那么AI大模型在训练过程中学习过一万个人的作品,是否要经过这1万人一一授权?
点击“Click to upload or drag and drop”,选择刚才提到的那个word文档,上传之后选中文档,点击“Move to Workspace”,然后在右侧的界面点击“Save and Embed”,点击后会有提交成功的提示,这个文档就已经投喂给了大模型。
吴迪近日,一些短视频平台涌现了大量某知名企业家吐槽的视频。在视频中,该企业家对堵车、调休、游戏等热门话题进行调侃,甚至还有不雅词汇穿插其间,引发热议。事实上,这是由网友利用AI软件采集该企业家原音生成的配音,但逼真的效果让不少人信以为真。