1 发布多个大模型:基于自研训练框架、自建智算集群和万卡算力等资源,仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并在 2024 年 1 月率先开源国内首个 MoE 大模型,各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
近日,中国人工智能公司DeepSeek引起了美国科技圈的广泛关注。这家专注于AI技术研发的公司,凭借其创新的算法和广泛的应用场景,迅速在全球AI领域崭露头角。然而,随着其影响力的扩大,DeepSeek也面临着来自美国科技界的密切关注,甚至引发了关于技术竞争和数据安全的讨论。
中国智造三剑客杀疯了!TikTok破防白宫,DeepSeek暴击硅谷,小红书正在掏空华尔街。如今,梁文峰、张一鸣、毛文超带着三把利刃,把太平洋防线撕得稀碎:1. 算法核武TikTok:- 美国青年宁愿坐牢也要拍短视频,#拯救TikTok话题播放量超300亿。
近日,美国政府宣布以芬太尼等问题为由对中国输美产品加征10%关税。由于近期DeepSeek火爆,因此我向Deep老师请教了一下美国对中国加征10%关税后,中国有哪些反制手段?同时,为了了解DeepSeek与ChatGPT之间的优劣对比,同样问题我也请教了Chat老师。
每经记者:王嘉琦 蔡鼎 宋欣悦 高涵 每经编辑:陈柯名,高涵,兰素英◆从1月20日推理模型DeepSeek-R1开源至今13天来,DeepSeek引起全球的惊讶,英伟达市值一周蒸发5520亿美元,硅谷巨头恐慌,华尔街焦虑。