deepseek商用基础知识

资讯

DeepSeek-Coder代码大模型整合CodeGpt实现私有化智能代码小助手
插件下载我们可以通过IntelliJ IDEA 插件市场搜索CodeGPT这个插件。
80周辉
6评论
成本是GPT的1/20，轰动硅谷的中国大模型DeepSeek是怎么做到的？
“善攻者，敌不知其所守;善守者，敌不知其所攻。这基本就是美国和中国了。”站在汇金国际大厦，透过巨大的落地窗，京杭大运河一览无余。
吴晓波频道
53评论
深度求索推出DeepSeek-V2：经济高效的多专家语言模型
深度求索发布了DeepSeek-V2混合专家语言模型，每百万tokens，2元人民币价格，简直便宜到令人发指，可以说是继Groq以后，AI领域最惊艳的新闻了。
影视八瓜娱-HY
2评论
国产大模型DeepSeek-V3一夜火爆全球，《DeepSeek-V3技术报告》，53页pdf
来源：转载机器之心报道机器之心编辑部今天，一个国产大模型火遍了世界。打开 X，满眼都是讨论 DeepSeek-V3 的推文，而其中最热门的话题之一是这个参数量高达 671B 的大型语言模型的预训练过程竟然只用了 266.
人工智能学家
55评论
省钱也是技术活：解密DeepSeek的极致压榨术
当o1、Claude、Gemini和Llama 3等模型还在为数亿美元的训练成本苦恼时，DeepSeek-V3用557.6万美元的预算，在2048个H800 GPU集群上仅花费3.7天/万亿tokens的训练时间，就达到了足以与它们比肩的性能。
人工智能学家
25评论
秒杀700亿Llama 2！最新国产大模型亮相，无需申请即可免费商用
国产大模型刚刚出了一位全新选手:参数670亿的DeepSeek。它在近20个中英文的公开评测榜单上直接超越了同量级、700亿的Llama 2。
量子位
107评论

视频

问答

如何自定义深度学习数据集？
头条问答
深度学习是什么意思？
头条问答