DeepSeek爆火,从个人开发者到企业客户,各类DeepSeek应用需求激增。京东云围绕四大需求场景,全面上线DeepSeek产品,从公用云到私有化部署,再到智算服务,全方位适配不同体量、不同行业客户对DeepSeek的需要。
如图所示,KTransformers 团队于 2 月 10 日成功在 24G 显存 + 382 GB 内存的 PC 上实现本地运行 DeepSeek-R1、V3 的 671B 满血版,速度提高 3~28 倍。
DeepSeek带来的影响仍在继续。2月13日,腾讯AI助手“腾讯元宝”迎来重大更新,同时支持混元和DeepSeek两大模型,打开腾讯元宝并进入对话界面,即可免费使用DeepSeek-R1满血版模型。“满血版”是指完整最大型号的DeepSeekR1大模型,其参数规模高达671B。
2月12日,济南市中未来产业发展有限公司(简称“市中产发”)联合华为基于济南市的市中区存算一体化智算中心(国家大学科技园节点)国产昇腾算力部署DeepSeek-V3和DeepSeek-R1大模型,并在“市中云“实现业务上线,助力“昇腾+DeepSeek”在智慧政务服务、智慧医疗等
21世纪经济报道记者雷晨 北京报道今年以来,DeepSeek凭借其独特的技术优势,在AI赛道上迅速崛起,成为行业瞩目的焦点。与传统大模型严重依赖海量高端算力不同,DeepSeek通过创新的算法优化,极大地降低了对硬件的严苛要求,成功实现了在有限算力条件下的高效运行。
2月上旬,中国电信天翼云自主研发的“息壤”一体化智算平台完成了国产算力与DeepSeek-R1/V3系列大模型的适配优化,成为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台。仅仅半个月,诸多信息表明,这场AI技术与通信行业的融合带来了系列影响。
潮新闻客户端 记者 张云山今天,阿里云宣布百炼平台全面上线DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B等6款全尺寸模型,1元最高可享受200万tokens,即日起,所有用户可直接使用。