📖阅读时长:19分钟🕙发布时间:2025-02-14❝2025年初,DeepSeek-R1的出现在人工智能领域掀起了一场轩然大波。本文将回顾大语言模型的发展历程,从2017年具有革命性的Transformer架构开始,它通过自注意力机制重新定义了自然语言处理(NLP)。
大模型浪潮轰轰烈烈,“小模型”另辟蹊径——参数小、占内存少、反应速度快、可以本地化运行。近日,微软推出了SLM(小语言模型)Phi-3系列,在多项基准测试中比肩大模型能力。微软强调Phi-3的高性价比,“便宜得多,但响应能力接近比它大10倍的模型”,号称能力对标GPT3.
北京商报 | 作者 刘四红巨头再现新进展,大模型在各行各业“落子不断”。11月6日,北京商报记者了解到,蚂蚁百灵大模型已完成备案,基于百灵大模型的多款产品已陆续完成内测。而引发关注的金融行业大模型层面,蚂蚁集团也在不久前发布了金融大模型及两款应用产品。
目录一、引言二、CPU2.1 AI爆发,推动CPU需求提升2.2 CPU指令集架构之争2.3主要国产CPU厂商三、GPU3.1英伟达与CUDA生态3.2国内GPU厂商快速发展3.3兼容与自建生态之路四、FPGA4.1低时延与灵活性优势4.2 AI成增速最快下游应用市场4.