这不,就在过去短短一周时间里:DeepSeek 开源五连发,集中在 AI Infra,为我们带来了包括为 Hopper GPU 开发的高效 MLA 解码内核 FlashMLA、专为专家混合和专家并行定制的通信库 DeepEP 、专为 FP8通用矩阵乘法优化的高效计算库 DeepGEMM、以及还有 DeepSeek 创始人梁文锋亲自参与开发的双向流水线并行算法 DualPipe、专家并行负载均衡算法、DeepSeek Infra 中的性能分析数据。
本报记者 赵觉珵特斯拉创始人埃隆·马斯克11日晚宣布,将在本周开源其公司的生成式人工智能(AI)产品——Grok。近期,马斯克正与开发ChatGPT的OpenAI公司展开激烈争辩,矛盾的核心在于OpenAI是否应将其产品开源。
克雷西 发自 凹非寺量子位 | 公众号 QbitAI小型创业团队打造的“最强开源模型”,发布才一周就被质疑造假——不仅官方宣称的成绩在第三方测试中大打折扣,模型还被质疑套壳Claude。面对浩大的声浪,厂商CEO终于发文道歉,但并未承认造假,表示在调查有关原因。
财联社2月26日讯(编辑 史正丞)北京时间周二深夜,阿里巴巴正式开源旗下视频生成模型万相2.1模型。顶级前沿模型的开源浪潮,终于涌向由AI驱动的视频创作领域。这也是本周AI产业“诸神混战”的最新一章。周一美国Anthropic公司意外发布首个混合推理模型Claude 3.
【文/观察者网 吕栋】 “2023年国内出现了百模大战,造成了社会资源的巨大浪费,尤其是算力的浪费,但是也使得我们追赶世界上最先进的基础模型的能力得到了建立。”7月4日,百度创始人、董事长兼首席执行官李彦宏在2024世界人工智能大会(WAIC)主论坛上说道。
作者 |第一财经 冯迪凡、程程欧盟扫清了立法监管人工智能(AI)的最后障碍。当地时间3月13日,欧洲议会以压倒性票数通过《人工智能法案》(下称“法案“),这标志着距离全球首部AI领域的全面监管法规的正式立法,仅有一步之遥。
2月21日中午,DeepSeek官方账号发布消息称,下周将开源5个代码库。“我们是一个探索通用人工智能的小团队。从下周开始,我们将开源5个代码库,完全透明地分享我们虽小但诚挚的进展。这些在我们在线服务中不起眼的基础组件已经过记录、部署,并在实际应用中经受了考验。
DeepSeek在硅谷持续引发讨论。中国大模型创业公司DeepSeek因此前发布的开源模型V3和R1,受到了全球的关注。由于成本低廉、性能良好、透明公开,DeepSeek让人们开始质疑AI投资可能存在的泡沫,也挑战了硅谷在人工智能领域的绝对领先地位。