deepswek卡

资讯

deepseek究竟干了什么？遭遇境外网络攻击导致服务器卡顿无法注册
1 发布多个大模型:基于自研训练框架、自建智算集群和万卡算力等资源，仅用半年时间便已发布并开源多个百亿级参数大模型，如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型，并在 2024 年 1 月率先开源国内首个 MoE 大模型，各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
鸿途
2评论
无意中发现deepseek的问题，可能又是一个大坑。但愿不是大坑。
关键问题，知识更新时间点。加上网上一篇八个月前的帖子。时间为什么这么巧合?一切由时间去验证吧。希望大家一起试。
温村木匠
187评论
云天励飞：公司Deep Edge系列推理卡已经适配云天天书、通义千问等主流大模型
【云天励飞：公司Deep Edge系列推理卡已经适配云天天书、通义千问等主流大模型】财联社11月25日电，云天励飞在特定对象调研中表示，公司Deep Edge系列推理卡已经适配了包括云天天书、通义千问、百川智能、以及Llama2/3等在内的近十个主流大模型，可实现性能更强的轻量
财联社

视频