deepseep671b大模型

资讯

浪潮云率先发布671B DeepSeek大模型一体机解决方案
近日，DeepSeek凭借其低成本、高性能的大模型研发成果，迅速引发了全球科技界的关注。
大众新闻-大众日报
7评论
“大模型性价比之王”刷屏 DeepSeek打破算力需求“怪圈”？
本报记者吴清北京报道近日，一家来自中国的公司Deepseek在全球AI界刷屏，其最新推出的大模型DeepSeek-V3，迅速在AI行业内引发广泛关注和热议，主要原因就是预训练成本之低，其训练同样性能的大模型成本仅是行业主流的十分之一左右。
中国经营报
厉害了浙江人！DeepSeek成全世界人工智能大模型“王炸”
前几天，浙江深度求索公司DeepSeek-V3横空出世，在AI行业内引发巨震，它是一个强大的混合专家（Mixture-of-Experts, MoE）语言模型。主要的技术迭代是671B的MoE，37B的激活参数，在14.8万亿个高质量token上进行了预训练。
中国男孩教育
1评论
响应“东数西算”战略：DeepSeek的全量模型已在庆阳等智算中心完成数万卡的快速部署
原标题：　　响应“东数西算”战略：亿算智能推动首个国产万卡推理集群支持DeepSeek 671B全量部署，构建国产算力与大模型融合新生态　　DeepSeek作为国产大模型领域的破局者，凭借其独创的「动态稀疏训练架构」与「多模态梯度协同算法」，在保证推理精度的同时，将训练能耗降低至
庆阳融媒
32评论
新体验！龙岗区在政务网上线DeepSeek大模型
2月8日，深圳市龙岗区在政务网上成功上线DeepSeek-R1 671B大模型，标志着该区在智慧政务建设中迈出了关键一步。此前，龙岗区已率先实现智谱GLM-130B等国产大模型在政务信创环境的部署应用。此次DeepSeek的上线，进一步夯实了龙岗区在政务AI领域的领先地位。
南方都市报
DeepSeek让多数智算中心停建？改变智算中心发展格局
AMD Instinct MI300X 借助 DeepSeek 实现了 32% 的推理效率跃升，昇腾 910B 仅用三天就完成了适配，海光 DCU 更是成功突破了 CUDA 生态壁垒8。
人工智能学家
26评论
Deepseek火了，但仍存三大问题｜南方产业观
在日前举行的广东省高质量发展大会上，DeepSeek作为人工智能领域的代表，被点名表扬其“以不怕虎的勇气锐气撼动美国人工智能巨头、产生连锁效应”，可见DeepSeek如今的火爆程度和被寄予的厚望，而前一个在全球拥有如此大影响力的中国互联网产品，就要数《黑神话：悟空》了。
南方+客户端
1评论
美国科技巨头面临拷问：DeepSeek爆火后巨额AI投资还有意义吗？
财联社2月7日讯（编辑刘蕊）在本轮财报季上，美股科技巨头们正面临一场严峻的拷问。
财联社
7评论
算力包加持！极速部署 671B 智能DeepSeek-R1
1.背景介绍DeepSeek-R1：你的智能新伙伴DeepSeek-R1不仅仅是一个拥有6710亿参数的大模型，它更是一个在数学、编程和复杂推理任务中表现卓越的智能助手。
九章云极DataCanvas
DeepSeek预示算力需求“打骨折”？业界：别只盯着训练 AI行业进入推理时代
《科创板日报》12月30日讯日前，深度求索DeepSeek-V3横空出世，在AI行业内引发巨震，关键原因之一就是预训练成本之低——这个参数量高达671B的大模型，在预训练阶段仅使用2048块GPU训练了2个月，且只花费557.6万美元。
财联社
19评论
国资驿站｜山钢型钢应用于世界最大海上酸气处理项目；中国电科成功研制“人造太阳”设备关键组成部分
山钢型钢应用于世界最大海上酸气处理项目近日，山钢集团所属山钢股份营销总公司华东销售公司与国内两家知名钢结构加工企业成功签订4000余吨外标型钢订单，产品将用于目前世界上最大的海上酸气处理工程项目，对进一步拓展海外市场具有重要意义。
大众新闻-大众日报

加载更多

视频