最近Deepseek成为了AI圈中最火爆的话题,一方面通过稀疏激活的MoE架构、MLA注意力机制优化及混合专家分配策略等创新手段,实现了高效的训练和推理能力,同时大幅降低了API调用成本,达到了行业领先水平。
于是,今天下午在网上查找了本地部署的教程,在老本上安装了ollama,看网上说8G内存就可以跑8b的,于是我降一档,部署7b,结果进度条进进退退两个小时都下载不完最终换成1.5b的,大小只有1.1G,但最后那10%左右都下载了好久,好歹在下班前成功了。
春节期间, DeepSeek席卷全球,掀起了中国AI的浪潮。据悉,在春节期间,DeepSeek在全球140多个国家的苹果App Store下载排行榜中登顶,成为现象级AI应用。春节后,DeepSeek的暖风带动相关概率股大涨,形成A股上涨驱动力。