给大模型喂指定数据

资讯

用大模型优化大模型预训练数据，节省20倍计算量，性能提升！
过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。
机器之心Pro
人工智能大模型怎样投喂数据？人工智能头部企业为何纷纷选择落户四川自贡？
封面新闻记者刘恪生“嗒嗒嗒、嗒嗒嗒……”11月18日，在一片宽敞明亮的办公区内，随着键盘的敲击声，几十名腾讯云（自贡）数字经济产业基地的数据标注员，正聚精会神地在做同一件事：运用数据标注平台，对采集自全国的道路图片进行数据标注，给人工智能大模型投喂数据。
封面新闻
34评论
一文掌握大模型数据准备、模型微调、部署使用全流程
例如，最新的吵的沸沸扬扬的ruozhi吧数据也还不错的COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning，提供了一个高质量的中文数据集。
AI让世界更懂你
19评论
生成式人工智能开发应用争议不断将个人画作“喂”给AI大模型是否合规？
央广网北京12月6日消息（总台中国之声记者周益帆）据中央广播电视总台中国之声《新闻纵横》报道，近日，四位绘画创作者将社交平台小红书的主体公司及小红书Trik软件主体公司诉至法院，引发关注。
央广网
超300个大模型如何喂养？语料数据产品供给有了全路径探索
乘数而上之AI语料新生态·语料交易继国家数据局等17部门联合印发《“数据要素x”三年行动计划(2024-2026年)》之后，中央面向公共数据开发利用的首个顶层设计文件《关于加快公共数据资源开发利用的意见》公布，构建公共数据资源开发利用“1+3”政策规则体系。
南方都市报
数据“投喂”大模型训练 AI时代如何划定版权边界
AI大模型时代，随着AI生成内容作品的数量不断增多，这其中存在的版权问题显得愈发引人注目，用人类的作品“喂给”AI进行训练之后生成的作品，算“借鉴”还是算“抄袭”？如果AI训练必须执行严格的版权规定，那么AI大模型在训练过程中学习过一万个人的作品，是否要经过这1万人一一授权？
新京报
1评论
数据投喂泄露隐私，算法生成虚假信息，大模型时代怎么防范安全风险？
来源：环球时报【环球时报赴乌镇特派记者刘扬李炫旻】随着以ChatGPT为代表的生成式人工智能大模型持续火爆，全球科技公司、科研机构纷纷布局自己的大模型。生成式人工智能与大模型的快速发展，也给网络安全带来全新挑战。
环球网
专家解读大模型遭受网攻新风险：对抗攻击手法花样翻新，数据投毒危害值得警惕
来源：环球时报【环球时报报道记者马俊】大模型推动的人工智能（AI）技术在日常生活中正逐步普及，但外界对于它的安全性，尤其是泄露用户隐私、输出有害信息等问题的忧虑也越来越多。目前大模型到底面临什么样的安全威胁？
环球网
1评论
AI发了人类历史上第一个红包
11月29日，智谱AI的Open Day上，气氛达到顶峰的一刻，无疑是智谱CEO张鹏举起手机，对AI说:帮我在智谱开放日的群聊里发个两万的红包，数量为一百个，名字为“AI给你发的第一个红包”。
36氪
25评论

视频