每经记者:杨卉 每经编辑:文多大模型崛起以来,关于它是否要开源的讨论就始终未停歇。Meta、谷歌、阿里云、零一万物等“开源派”代表,陆续推出了各自的“开源”大模型,或采用Apache 2.0等常见的开源软件许可证进行许可,或采用自行定制的模型许可证进行许可。
记者9月12日获悉,百度创始人李彦宏近日在一次和员工的交流中谈及了三个大模型认知误区。他认为,打榜不能证明大模型的能力,模型之间的差距是多维的;闭源模型是商业化模型;开源模型效率不行,无法解决算力问题,同时强调百度把智能体作为大模型最重要的战略、最重要的发展方向,并解释了原因。
快速成长中的大语言模型功能日新月异。为解决复杂问题,它甚至可以调用工具,“自动”写代码进行编程!近日,上海人工智能实验室(上海AI实验室)推出书生·浦语大语言模型的升级版对话模型InternLM-Chat-7B v1.1(以下简称“InternLM-Chat”)。
技术自会找到自己的出路,而技术又总会在意想不到的方向萌发出来近段时间,中国国产大模型DeepSeek持续引发业内震动。据报道,1月27日,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
《科创板日报》1月28日讯 一天内登顶中美App Store免费榜、火到两天崩溃两次、Meta开设四个作战室研究,近几日以来,DeepSeek犹如一颗 “东方核弹”,引爆了全球AI圈。DeepSeek这次引发全球震动的根源之一,就是其最新发布的开源模型DeepSeek-R1。
2024年8月,美国战略与国际研究中心(CSIS)发布《开源基础模型对国防工业的重要影响》(Defense Priorities in the Open-Source AI Debate)报告,提出美国国防部正积极推动生成式人工智能的应用,并依赖商业创新来推进其人工智能战略。
10月24日,趣丸科技宣布与香港中文大学(深圳)联合研发的语音大模型“MaskGCT”正式在Amphion系统中开源,面向全球用户开放使用。区别于传统TTS模型,该模型采用掩码生成模型与语音表征解耦编码的创新范式,在声音克隆、跨语种合成、语音控制等任务中展现出卓越效果。
21世纪经济报道记者孔海丽 实习生王夏雯 北京报道 开源阵营迎来新的“大家伙”。当地时间7月23日,Meta正式发布Llama 3.1。在官方博客中,Meta称该模型是目前“最强大的开源基础模型”,并表示:“直到今天,开源大模型在功能和性能方面大多落后于封闭模型。