潮新闻客户端 记者 张云山“神秘东方力量”DeepSeek给硅谷带来的浪花,还在不断增强,刚刚,DeepSeek-R1跻身大模型竞技榜前三,与ChatGPT-4o齐名,超越Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。
封面新闻记者 朱宁 边雪 陈甘露距离深度求索(DeepSeek)推理大模型DeepSeek-R1发布已经过去近一周时间,开源模型DeepSeek-V3也已经发布了近一个月。然而,在海外社交媒体平台乃至华尔街,DeepSeek的热度才刚刚开始。
想必大家已经看到最近美股的惨况了吧,今天我们就来说说这一切的源头:DeepSeek。在权威测评平台AI Benchmark的跨领域挑战赛中,DeepSeek创下89.7%的综合准确率记录:既能在蛋白质结构预测任务中达到AlphaFold 3的精度水平,又在法律文书生成任务中超越专业法律AI工具LawGeex。
上周三,微软首席执行官萨蒂亚·纳德拉在达沃斯世界经济论坛上表示:“DeepSeek 的新模型非常令人印象深刻,他们不仅有效地开发出一种开源模型,实现了推理时间计算,而且计算效率极高…我们应该非常认真地对待中国的发展。”
《科创板日报》1月29日讯(记者 黄心怡)过年放大招!在春节期间中国的大模型技术迎来了一阵密集更新。今日凌晨,阿里云通义千问超大规模的MoE模型Qwen2.5-Max 正式上线,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新成果,预训练数据超过20万亿tokens。