作者 | 香草 李水青编辑 | 李水青就在刚刚,谷歌向最强开源大模型的宝座发起进攻!智东西2月22日报道,昨日晚间,谷歌毫无预兆地发布了开源模型Gemma,直接狙击Llama 2。继通过Gemini拳打OpenAI后,试图用Gemma脚踢Meta。
·作为对于OpenAI旗下Chat GPT的回应,Grok将于本周实现开源。Grok以英国作家道格拉斯·亚当斯的科幻小说《银河系漫游指南》为蓝本,特点是会用幽默反叛的方式来回答一些被其他AI系统拒绝回答的争议性问题。马斯克和OpenAI的纷争一波未平一波又起。
克雷西 发自 凹非寺量子位 | 公众号 QbitAI小型创业团队打造的“最强开源模型”,发布才一周就被质疑造假——不仅官方宣称的成绩在第三方测试中大打折扣,模型还被质疑套壳Claude。面对浩大的声浪,厂商CEO终于发文道歉,但并未承认造假,表示在调查有关原因。
北京时间9月19日凌晨阿里巴巴史上最大规模的开源发布包含基础模型Qwen2.5用于编码的Qwen2.5-Coder和用于数学的Qwen2.5-Math刷新业界纪录引发关注图源:Qwen X平台截图Qwen2.5有何不同Qwen2.
2月25日,阿里云宣布了一个重磅消息:其视觉生成基座模型万相2.1(Wan)正式开源。据悉,此次开源采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的所有推理代码和权重全部开源,同时支持文生视频和图生视频任务。随着万相的开源,阿里云实现了全模态、全尺寸的开源。
来源:环球网 【环球网科技综合报道】6月20日消息,斯坦福大学的大模型测评榜单HELM MMLU发布最新结果,斯坦福大学基础模型研究中心主任Percy Liang发文表示,阿里通义千问Qwen2-72B模型成为排名最高的开源大模型,性能超越Llama3-70B模型。
就在今天凌晨, Meta 正式发布了全新的 Llama 3 模型,还一次上新了 8B 和 70B 两个参数版本。它的训练数据集比 Llama 2 整整大了 7 倍,达到了 15T ,容量也是上一代的两倍,支持 8K 上下文长度。
【文/观察者网 吕栋】 “2023年国内出现了百模大战,造成了社会资源的巨大浪费,尤其是算力的浪费,但是也使得我们追赶世界上最先进的基础模型的能力得到了建立。”7月4日,百度创始人、董事长兼首席执行官李彦宏在2024世界人工智能大会(WAIC)主论坛上说道。