这一突破性成果的核心在于算法密度取代算力堆叠:通过混合专家架构动态激活参数、8位浮点训练优化,以及滑动窗口多头潜在注意力技术,DeepSeek在长文本处理中显存需求降低至GPT-4的1/5,推理速度却提升3倍。
《科创板日报》2月7日讯(记者 黄心怡)“热得发烫”的DeepSeek要融资了?今日傍晚,有市场传言称,阿里计划以100亿美元的估值,投资10亿美元认购DeepSeek10%的股权,目前双方正在就具体执行细节进行沟通,阿里云将作为DeepSeek的第一推理算力选择。
春节假期即将过去。若回首假期“热搜”,DeepSeek榜上有名。春节前夕,来自广东湛江的DeepSeek创始人梁文锋参加国内重要座谈会并发言,经媒体关注,将DeepSeek推到国内大众视线,这一国产的、里程碑式的人工智能模型迅速出圈。此后,相关报道频频刷屏,持续引发热议。
来源:科技日报 ◎谈 琳从横空出世引发西方毁誉冰火两重天,到面对网络攻击九州同袍共筑数字长城,这个春节假期,由深度探索(DeepSeek)所带来的震撼与惊喜,像新春的焰火般耀眼。在逆全球化浪潮涌动、科技博弈日趋白热化的今天,DeepSeek的这场突围给我们很多启示。
近日,一家中国AI初创公司推出的DeepSeek横空出世,在AI圈掀起不小的波澜,引发全球关注,对美股和A股算力板块造成了一定冲击。时下,它所带来的震撼与惊喜也仍在继续。DeepSeek究竟有何过人之处?
【今日导读】 英伟达等科技巨头陆续宣布上线DeepSeek大模型 春节期间手机市场迎消费热潮,2025年国内手机出货量或达3亿多部 这类产品有望加速落地,低空领域百亿级市场空间可期 具身智能是发展新质生产力的未来产业新赛道 DeepSeek爆红后该细分AI趋势或将加速【主题详情】