本地部署大模型Transformer

资讯

5分钟端侧部署视觉大模型！专为Transformer优化的AI芯片来了
有没有人好奇:大模型那么香，我们将它从云侧拿到端侧开发应用，比如让每台手机都标配一个大模型，岂不是更香?
量子位
5评论
大模型进化史：从Transformer到DeepSeek-R1的AI变革之路
📖阅读时长：19分钟🕙发布时间：2025-02-14❝2025年初，DeepSeek-R1的出现在人工智能领域掀起了一场轩然大波。本文将回顾大语言模型的发展历程，从2017年具有革命性的Transformer架构开始，它通过自注意力机制重新定义了自然语言处理（NLP）。
人工智能学家
68评论
让大模型在本地跑起来：DeepSeek私有化部署技术解密
就像下载一个智能菜谱，用万能厨房设备直接烹饪，不需要去餐厅点菜。安装部署工具:pip install ollama。
皇家救星
1评论
高手论技 | 大模型的基石——Transformer框架
Transformer的发展历史可以追溯到2017年，谷歌公司的研究人员在发表的论文Attention Is All You Need中首次介绍了Transformer，并将其应用于机器翻译任务。
中国信息技术教育
3评论
照着做就能成功！DeepSeek 本地部署完整步骤
DeepSeek-R1 是 DeepSeek 团队推出的⼀款开源、⽀持 128K ⻓⽂本上下⽂的 Transformer ⼤语⾔模型，在代码⽣成、数学推理等任务上表现出⾊。
玩什么玩
72评论
大模型卷潮小模型叩关
大模型浪潮轰轰烈烈，“小模型”另辟蹊径——参数小、占内存少、反应速度快、可以本地化运行。近日，微软推出了SLM（小语言模型）Phi-3系列，在多项基准测试中比肩大模型能力。微软强调Phi-3的高性价比，“便宜得多，但响应能力接近比它大10倍的模型”，号称能力对标GPT3.
21世纪经济报道
巨头新动作！大模型激战升级
北京商报 | 作者刘四红巨头再现新进展，大模型在各行各业“落子不断”。11月6日，北京商报记者了解到，蚂蚁百灵大模型已完成备案，基于百灵大模型的多款产品已陆续完成内测。而引发关注的金融行业大模型层面，蚂蚁集团也在不久前发布了金融大模型及两款应用产品。
北京日报客户端
1评论
XPU：AI时代与异构计算
目录一、引言二、CPU2.1 AI爆发，推动CPU需求提升2.2 CPU指令集架构之争2.3主要国产CPU厂商三、GPU3.1英伟达与CUDA生态3.2国内GPU厂商快速发展3.3兼容与自建生态之路四、FPGA4.1低时延与灵活性优势4.2 AI成增速最快下游应用市场4.
第一财经
1评论

视频