这一突破性成果的核心在于算法密度取代算力堆叠:通过混合专家架构动态激活参数、8位浮点训练优化,以及滑动窗口多头潜在注意力技术,DeepSeek在长文本处理中显存需求降低至GPT-4的1/5,推理速度却提升3倍。
◎窦世平 记者 李雁争“DeepSeek火了以后,我在的几个微信群就‘炸’了。同行们都在讨论,为什么会错过DeepSeek?DeepSeek会带来什么改变?怎样才能不错过下一个机会?”近日,一位投资人对上海证券报记者说。
截至2月12日收盘,DeepSeek概念股维持较高热度。美格智能八连板,1月24日以来股价已经翻倍;每日互动八个交易日有四次20%涨停,累计涨幅超过175%;青云科技、拓维信息、杭钢股份收获六连板。春节期间,中国AI领域上演了一出魔幻现实主义大戏。
蛇年伊始,DeepSeek就如平地惊雷引发空前讨论,成为资本市场关注焦点,相关概念股节后表现强劲。DeepSeek不仅在技术上取得了显著突破,还在多个行业展现了巨大应用潜力,吸引一众云厂商、车企、手机企业官宣“接入”DeepSeek。在此背景下,南方都市报“上岗了!
这场网络攻击,由美军网络司令部参与指挥,动用了美国国家级的网络攻击力量,持续攻击中国一家成立一年半时间,员工规模150人左右的“杭州深度求索人工智能基础技术研究有限公司”,也就是这些天地球人都知道的DeepSeek的服务器。