开源模型和投喂模型

资讯

开源大模型与闭源大模型：优劣势对比与未来发展
（本文作者王鹏，北京市社会科学院研究员）人工智能大模型是基于深度学习技术的大规模神经网络模型，具有大量参数和复杂结构，能完成如自然语言、语音、图像处理与生成等各类复杂任务，对人工智能行业具有重要意义。
第一财经
2024年中国开源模型：崛起与变革
最近，开源中国 OSCHINA、Gitee 与 Gitee AI 联合发布了《2024 中国开源开发者报告》。在第二章《TOP 101-2024 大模型观点》中，Hugging Face 工程师 Tiezhen、Hugging Face 中文社区项目经理Adina以及 Hugging Face FellowLu Cheng，从崛起与变革两个维度，探讨中国开源模型在这一年取得的重大成就和未来展望。
opendotnet
百度文心一言免费后，还要开源下一代模型；李彦宏曾称开源模型是智商税
2月14日，百度在其官方公众号发文：“我们将在未来几个月中陆续推出文心大模型4.5系列，并于6月30日起正式开源。” 此前，李彦宏曾在采访中表达对闭源大模型的支持观点，他认为“开源其实是一种智商税”，闭源才有真正的商业模式。
界面新闻
大模型又开“卷”，万亿参数闭源模型、四千亿开源模型来了
4 月 17 日，两家大模型企业相继宣布重大更新。午间，MiniMax在其公众号宣布正式推出abab 6.5 系列模型，其中abab 6.5 包含万亿参数，支持 200k tokens的上下文长度，abab 6.5s 与 abab 6.
第一财经
1评论
开源还是闭源？哈评揭秘，闭源大模型助力企业抢占市场先机
据不完全统计，目前国内发布的大模型数量超300个，10亿参数规模以上大模型数量也超过100个，大模型产品更是琳琅满目，版本、能力、价格各不相同，开源闭源技术路线各有利弊，面对各种数据和概念，企业也难免患上“选择困难症”。
立刚科技观察
1评论
王小川：LLaMA作为开源模型的时代已过
作者丨白杨编辑丨骆一帆图源丨图虫AI大模型的发展需要开源生态9月6日，百川智能宣布正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本，并且均为免费可商用。
21世纪经济报道
2评论
国产大模型最缺高质语料，这个联盟开源两周获18万下载，“投喂”回报是……
2022年11月，ChatGPT横空出世，带来大模型时代。但训练大模型好比培养孩子，唯有高质量的教育，才有高质量的输出。因此，高质量语料库是大模型产业链关键环节。基于此，今年7月6日，在世界人工智能大会开幕式上，由上海人工智能实验室等单位联合发起的中国大模型语料数据联盟宣布成立。
上观新闻
10评论
数据开源为AI发展“推波助澜”
——林咏华北京智源人工智能研究院副院长兼总工程师在6月9日—10日举行的2023北京智源大会上，“AI数据开源”引发广泛关注。AI数据为什么要开源？AI数据开源面临哪些挑战？它会是未来AI发展的重要趋势吗？科技日报记者带着这些问题采访了相关专家。
光明网
数据“投喂”大模型训练 AI时代如何划定版权边界
AI大模型时代，随着AI生成内容作品的数量不断增多，这其中存在的版权问题显得愈发引人注目，用人类的作品“喂给”AI进行训练之后生成的作品，算“借鉴”还是算“抄袭”？如果AI训练必须执行严格的版权规定，那么AI大模型在训练过程中学习过一万个人的作品，是否要经过这1万人一一授权？
新京报
1评论
瞭望 | 大模型开闭源争议何在
模型能力是由算法、数据质量和算力投入大小决定，而不是由开源还是闭源决定短期看，理想状态是在开闭源两种模式之间找到平衡，在技术进步与生态建立方面优势互补；长期看，大模型可能会像互联网一样，逐步走向开源，由全世界共同维护、共同受益文 |《瞭望》新闻周刊记者钱沛杉大模型应该开源还是闭
新华社

视频