671b deepseek算力

资讯

算力包加持！极速部署 671B 智能DeepSeek-R1
1.背景介绍DeepSeek-R1：你的智能新伙伴DeepSeek-R1不仅仅是一个拥有6710亿参数的大模型，它更是一个在数学、编程和复杂推理任务中表现卓越的智能助手。
九章云极DataCanvas
1评论
DeepSeek预示算力需求“打骨折”？业界：别只盯着训练 AI行业进入推理时代
《科创板日报》12月30日讯日前，深度求索DeepSeek-V3横空出世，在AI行业内引发巨震，关键原因之一就是预训练成本之低——这个参数量高达671B的大模型，在预训练阶段仅使用2048块GPU训练了2个月，且只花费557.6万美元。
财联社
19评论
国产算力平台与顶尖大模型完美融合 “全国产芯”DeepSeek在榕上线
近期，DeepSeek“以1/18的训练成本、1/10的团队规模，模型性能比肩GPT-4o”的超强能力震荡全球科技圈。
海峡网
国产之光DeepSeek把AI大佬全炸出来了！训练671B只需此前算力1/10
在多项测评上，DeepSeek V3达到了开源SOTA，超越Llama 3.1 405B，能和GPT-4o、Claude 3.5 Sonnet等TOP模型正面掰掰手腕——
量子位
226评论
中国算力网为DeepSeek云服务提供坚实底座
今年新春，DeepSeek可以说是AI界最火爆的话题。
南方+客户端
响应“东数西算”战略：DeepSeek的全量模型已在庆阳等智算中心完成数万卡的快速部署
原标题：　　响应“东数西算”战略：亿算智能推动首个国产万卡推理集群支持DeepSeek 671B全量部署，构建国产算力与大模型融合新生态　　DeepSeek作为国产大模型领域的破局者，凭借其独创的「动态稀疏训练架构」与「多模态梯度协同算法」，在保证推理精度的同时，将训练能耗降低至
庆阳融媒
38评论
浪潮云率先发布，事关DeepSeek！算力概念持续走高，浪潮信息、用友网络等多股涨停，寒武纪涨超7%
每经编辑：杜宇2月7日，算力概念持续走高。浪潮信息、用友网络、城地香江、浙数文化等多股涨停。截至午盘，寒武纪涨超7%，云赛智联、神州数码、中科曙光、工业富联等均有不同程度涨幅。
每日经济新闻
1评论
华为+DeepSeek，最新消息
2月12日，华为微信公众号发布消息称，DeepSeek满血版模型登陆华为云。
中国证券报
来了！首个非官方“满血版”DeepSeek云平台花落腾讯
2月7日，腾讯云官方订阅号发布消息称，不仅上线了DeepSeek-R1和V3原版模型的API接口，还将它们接入了大模型知识引擎，并支持联网搜索，成为国内率先实现这一能力的云厂商。
21世纪经济报道
58评论
DeepSeek催化“智驾平权”，车路云将再添一把火？
科技从来不是为了扩大世界的差距而存在，而是要竭尽所能包容彼此差异，不断地缩小鸿沟，不该把普通人的体验权隔离在外，这就是“科技平权”。
钛媒体APP
中国移动甘肃公司全方位支撑DeepSeek国产大模型助力国产AI生态崛起
西北角·中国甘肃网记者程健通讯员田永斌吴万宝近期，国产大模型DeepSeek凭借其技术创新与高效部署能力，成为行业焦点。作为国产AI领域的“国家队”“排头兵”“主力军”，中国移动与DeepSeek强强联合，在技术研发、算力部署、场景应用等方面全方位展开深度合作。
中国甘肃网
1评论
王炸组合，免费体验DeepSeek就上天翼云息壤
来源：中国网近日，中国电信天翼云正式宣布，其自主研发的“息壤”智算平台率先完成国产算力与DeepSeek－R1／V3系列大模型的深度适配优化，成为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台。
环球网
济南高新区多家企业与DeepSeek牵手，“AI+”持续赋能产业升级
要问最近科技圈谁最火?那一定是DeepSeek。　　这款被称作“国产AI之光”的大模型凭借着极低的推理成本和卓越性能迅速出圈，引发全球用户与开发者的广泛关注。
爱济南新闻客户端

加载更多

视频