每经记者:岳楚鹏 每经编辑:兰素英2月10日,清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新,成功打破大模型推理算力门槛。此前,拥有671B参数的MoE架构大模型DeepSeek-R1在推理时困难重重。
2月14日,记者从山西晋云互联科技有限公司获悉,依托自身强大的智算能力,山西煤炭工业互联网平台近日成功完成满血版DeepSeek-R1-671B大模型的本地化部署,并建立了煤炭行业专属的RAG知识库,打造出矿山行业首个基于DeepSeek的煤炭行业级大模型。
DeepSeek带来的影响仍在继续。2月13日,腾讯AI助手“腾讯元宝”迎来重大更新,同时支持混元和DeepSeek两大模型,打开腾讯元宝并进入对话界面,即可免费使用DeepSeek-R1满血版模型。“满血版”是指完整最大型号的DeepSeekR1大模型,其参数规模高达671B。
文/羊城晚报全媒体记者 李焕坤 通讯员 穗政数宣近日,广州市政务服务和数据管理局在政务外网正式部署上线DeepSeek-R1、V3 671B大模型。通过融合海量政务数据要素,大模型将丰富政务服务场景应用,催生政务服务提质增效的“链式反应”。
DeepSeek爆火,从个人开发者到企业客户,各类DeepSeek应用需求激增。京东云围绕四大需求场景,全面上线DeepSeek产品,从公用云到私有化部署,再到智算服务,全方位适配不同体量、不同行业客户对DeepSeek的需要。
2月17日,印象笔记宣布接入满血版DeepSeek大模型。无需更新产品,用户通过印象笔记客户端内“印象AI”服务入口,可以直接体验DeepSeek大模型接入后的AI服务。据了解,“印象AI”基于自研的印象大模型,已陆续推出AI帮我写、AI帮我读、AI助理等服务。
来源:环球网 【环球网科技综合报道】近日,网宿科技旗下子公司Cloudsway宣布正式上线DeepSeek-R1/V3的满血版671B参数模型。此举旨在通过提供便捷的API接口和灵活的模型托管服务,降低企业AI应用门槛,加速AI技术的落地应用。
《科创板日报》2月12日讯(记者 黄心怡)DeepSeek掀起的算力热潮还在持续。中国电信昨日宣布推出了息壤智算一体机-DeepSeek版,在硬件层面以华为昇腾芯片为基础,提供8卡、16卡、32卡等多种规格型号。
最近Deepseek成为了AI圈中最火爆的话题,一方面通过稀疏激活的MoE架构、MLA注意力机制优化及混合专家分配策略等创新手段,实现了高效的训练和推理能力,同时大幅降低了API调用成本,达到了行业领先水平。