2025年2月2日 ~ 2025年2月8日 # DeepSeek冲击波时间拨回2024年5月,DeepSeek(深度求索)还只是一家籍籍无名的AI初创公司,打响了大模型“降价潮”的第一枪。随后智谱以及阿里、字节、百度等纷纷跟进。
除了DeepSeek,它们也在中国崭露头角 | 参考独家在中国,人工智能(AI)初创企业如雨后春笋般不断涌现。除发布低成本高性能生成式AI的杭州深度求索(DeepSeek)公司外,北京月之暗面公司等企业也崭露头角。
国产AI大模型,提前过年了。1月20日晚间,月之暗面(Kimi)和深度求索(DeepSeek)这两大备受瞩目的AI大模型创业公司,几乎是同时发布了新模型,并均声称新模型的性能对标OpenAI的o1模型。
节后第一个交易日,DeepSeek冲击波搅动A股多个概念板块。春节前夕,由杭州深度求索公司推出的DeepSeek大模型在海内外爆火,由于兼具低成本与高性能的特征,极大降低了AI大模型的部署成本,有望带来AI应用端的繁荣。2月5日,A股AI应用板块全面爆发。
1 月 16 日,主打端侧模型的公司面壁智能宣布推出全球首个媲美「4o」的端侧模型「MiniCPM-o 2.6」,仅 8B 参数,能在端侧实现实时流畅的音视频通话,团队称该模型能实现「以端胜云」的效果。
春节期间,国产大模型DeepSeek一跃成为全球瞩目的焦点。它以仅约十分之一的超低训练成本,成功推出了性能与OpenAI o1近乎相当的开源模型,硅谷科技巨头纷纷回应,全球各大芯片厂商和智算云服务厂商更是积极响应、跟进适配。
本报记者 陈佳岚 广州报道推理大模型正成为行业一个新的竞争方向。自从OpenAI o1大模型出现之后,大模型数学推理能力和代码编程能力被推向了一个新的高度。国内各大厂商也看到了这个新的蓝海,纷纷推出了自家的推理大模型。