DeepSeek作为国产大模型领域的破局者,凭借其独创的「动态稀疏训练架构」与「多模态梯度协同算法」,在保证推理精度的同时,将训练能耗降低至同类模型的十分之一,首次验证了千亿级大模型低成本商业化的可行性。
来源:环球网 【环球网财经综合报道】随着DeepSeek的爆火,个人用户部署AI大模型成为新的热潮。在科技社群中,开发者们纷纷分享如何利用低成本的硬件和开发套件,接入DeepSeek等大模型,打造个人语音助手、智能机器人等AI工具。
成都华微2月6日在互动平台表示,DeepSeek推出使得大模型的部署计算算力需求大幅降低,一方面是模型训练成本降低,另一方面为大模型在边缘和端侧的部署提供更有力的支撑,使得AI端侧大规模商用落地进度大幅提前。
券商板块2月7日盘中发力上扬,截至上午收盘,华林证券涨停,国金证券冲击涨停,国元证券、锦龙股份涨超5%,东兴证券、西部证券、华创云信跟涨。2月6日晚,国金证券、国元证券、华福证券等中小券商率先通过官微宣布正式接入DeepSeek模型,完成本地部署。
近日,腾讯云TI平台宣布上架DeepSeek系列模型,包括V3、R1原版模型,参数量达到671B;以及基于DeepSeek-R1蒸馏得到的系列模型,参数规模从70B到1.5B不等。据介绍,TI平台全面支持DeepSeek系列模型的一键部署。