封面新闻记者 刘恪生“嗒嗒嗒、嗒嗒嗒……”11月18日,在一片宽敞明亮的办公区内,随着键盘的敲击声,几十名腾讯云(自贡)数字经济产业基地的数据标注员,正聚精会神地在做同一件事:运用数据标注平台,对采集自全国的道路图片进行数据标注,给人工智能大模型投喂数据。
例如,最新的吵的沸沸扬扬的ruozhi吧数据也还不错的COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning,提供了一个高质量的中文数据集。
乘数而上之AI语料新生态·语料交易继国家数据局等17部门联合印发《“数据要素x”三年行动计划(2024-2026年)》之后,中央面向公共数据开发利用的首个顶层设计文件《关于加快公共数据资源开发利用的意见》公布,构建公共数据资源开发利用“1+3”政策规则体系。
AI大模型时代,随着AI生成内容作品的数量不断增多,这其中存在的版权问题显得愈发引人注目,用人类的作品“喂给”AI进行训练之后生成的作品,算“借鉴”还是算“抄袭”?如果AI训练必须执行严格的版权规定,那么AI大模型在训练过程中学习过一万个人的作品,是否要经过这1万人一一授权?
来源:环球时报 【环球时报赴乌镇特派记者 刘扬 李炫旻】随着以ChatGPT为代表的生成式人工智能大模型持续火爆,全球科技公司、科研机构纷纷布局自己的大模型。生成式人工智能与大模型的快速发展,也给网络安全带来全新挑战。
来源:环球时报 【环球时报报道 记者 马俊】大模型推动的人工智能(AI)技术在日常生活中正逐步普及,但外界对于它的安全性,尤其是泄露用户隐私、输出有害信息等问题的忧虑也越来越多。目前大模型到底面临什么样的安全威胁?