Desspseek大模型

资讯

不仅开源还便宜好用，硅谷员工直呼“火烧屁股”的DeepSeek大模型强在哪
国产大模型公司深度求索（DeepSeek）发布的最新AI（人工智能）大模型在海外引起开发者和投资者的热议。1月20日，量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1。
澎湃新闻
124评论
国家级平台上线DeepSeek大模型
撰文丨李岩近期，DeepSeek走红出圈。人民网消息显示，目前DeepSeek-R1、V3、Coder等系列模型已登陆国家超算互联网平台，用户无需下载到本地部署，即可在线完成DeepSeek系列模型的推理、部署及定制化训练与开发。
政知新媒体
2评论
多平台宣布上线DeepSeek大模型
据中国基金报2月3日报道，近日，百度智能云、华为云、阿里云、腾讯云、360数字安全、云轴科技等多个平台宣布上线DeepSeek大模型，用户可以在各大平台上调用DeepSeek-R1、DeepSeek-V3等模型。
长江云新闻
5评论
接入DeepSeek大模型能做什么？多家上市公司回应
每经记者：陈鹏丽每经编辑：董兴生今年春节假期，DeepSeek无疑是最火爆的话题之一。继华为云、腾讯云、百度智能云等大平台宣布上线DeepSeek大模型后，不少上市公司也陆续透露已接入DeepSeek大模型。2月5日，多只“DeepSeek概念股”开盘涨停。
每日经济新闻
接入DeepSeek能干什么？如何发挥大模型效力？专业人士分享秘籍
央视网消息：近期，DeepSeek访问使用量急速上升，已经成为目前最快突破3000万日活跃用户量的应用程序。记者从工业和信息化部了解到，三家基础电信企业已经全面接入国产开源大模型DeepSeek。接入后，到底能干些什么？
光明网
1评论
《DeepSeek速度惊呆马斯克：大模型训练效率突破物理极限》
凌晨3点，硅谷AI实验室突然传出惊呼——马斯克在社交平台连发3个“❗”，转发了一条来自中国的技术论文。这篇由深度求索（DeepSeek）团队发布的成果显示，其新一代大模型训练速度达到行业均值3.2倍，能耗直降40%，甚至突破冯·诺依曼架构的经典算力瓶颈。
实用技巧君
DeepSeek颠覆了什么？——大模型“国产之光”破局的启示
一家人工智能初创企业浅浅扇动两下翅膀，即掀起全球科技界的一阵“海啸”。短短30天，中国初创企业深度求索（DeepSeek）先后发布两款性能比肩GPT-4o的大模型，“1/18的训练成本、1/10的团队规模、不分伯仲的模型性能”令硅谷大受震撼。
光明网
11评论
DeepSeek首次比肩国外顶尖大模型，带来哪些启示？
似乎一夜之间，DeepSeek（深度求索）就“火”了。其实早些时候，这家来自杭州的人工智能基础技术研究公司在国内业内人士中就颇有口碑，近日由于其最新开源了推理模型R1正式版，不仅登顶苹果美国地区应用商店免费APP下载排行榜，在其冲击下当地时间1月27日美国人工智能主题股票遭抛售。
上观新闻
2评论
“AI界的拼多多”DeepSeek推出新款大模型，水平如何？
在中文能力上，V3 与 Qwen2.5-72B 在教育类测评 C-Eval 和代词消歧等评测集上表现相近，但在事实知识 C-SimpleQA 上更为领先。
观察者网
35评论

视频

在线举报