最近Deepseek成为了AI圈中最火爆的话题,一方面通过稀疏激活的MoE架构、MLA注意力机制优化及混合专家分配策略等创新手段,实现了高效的训练和推理能力,同时大幅降低了API调用成本,达到了行业领先水平。
来源:环球网 【环球网财经综合报道】龙芯中科官方微信号2月7日发布消息称,近日,搭载龙芯3号CPU的设备成功启动并运行了DeepSeek R1 7B模型,实现了本地化部署。DeepSeek自发布以来,凭借其出色的性能表现和低成本训练模式,迅速吸引了全球范围内的广泛关注。
2月7日,国产芯片企业龙芯中科宣布,搭载龙芯3号CPU的设备近日成功启动运行DeepSeek R1 7B模型,实现本地化部署,可为广大用户提供更快、更强、更省的训推体验。这标志着国产芯片与AI大模型的协同适配取得实质性进展,为构建自主可控的人工智能技术生态奠定基础。