【科技圈】雷军:下决心把AI技术落到各个终端产品上2月17日,结束民营企业座谈会后,小米科技有限责任公司董事长雷军接受专访。雷军表示,小米创业的15年来,一直聚焦在手机、汽车、智能家居、智能制造这些领域。
2月18日,DeepSeek官方在海外社交平台X上发布了一篇纯技术论文报告,论文主要内容是关于NSA(Natively Sparse Attention,原生稀疏注意力),官方介绍这是一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。
DeepSeek突传大动作。2月18日,DeepSeek在社交平台X上发布了一篇关于NSA的纯技术论文报告。DeepSeek称,NSA是一种与硬件高度适配并可原生训练的稀疏注意力机制,实现超高速长上下文训练与推理。
2月19日,半导体、电子等板块走高,存储芯片等相关概念涨幅居前。相关ETF方面,截至发稿,AI人工智能ETF(512930)涨近2%,换手率超4%,盘中频现溢价交易(当前溢折率0.13%)。成分股方面,深信服、韦尔股份涨超6%,广电运通、全志科技、紫光股份等多股跟涨。
每经记者:蔡鼎 每经编辑:兰素英一直以来,从氨基酸序列出发预测蛋白质的三维结构是结构生物信息学中最具挑战的问题。但几年前,由Google DeepMind创建的基于深度学习的人工智能测序式AlphaFold解决了这个问题,一时间成为头条新闻。
最近大模型的突破 —— 如 OpenAI 的 o 系列模型、DeepSeek-R1 和 Gemini 1.5 Pro—— 已经能使得模型能够处理整个代码库、长文档、在数千个 token 上保持连贯的多轮对话,并在长距离依赖关系中进行复杂推理。作者在一个 8-GPU A100 系统上评估了 NSA 相对于 Full Attention 的计算效率。