【微软开源DeepSpeedChat 可将训练速度提升15倍以上】《科创板日报》13日讯,当地时间4月12日,微软宣布开源Deep Speed Chat,可帮助用户轻松训练类ChatGPT等大语言模型。
微软宣布开源DeepSpeed Chat,训练速度可提升15倍以上。当地时间4月12日,微软宣布开源系统框架DeepSpeed Chat,帮助用户训练类似于ChatGPT的模型。与现有系统相比,DeepSpeed Chat的速度快15倍以上,可提升模型的训练和推理效率。
国内外众多厂商纷纷接入 DeepSeek,华为云,腾讯云,阿里云,移动、联通、电信三大运营商等都接入DS,而且欧美更企业也开始接入,并且开始转向,DeepSeek访问使用量急速上升,上线20日活突破2000万用户,目前已经成为最快突破3000万日活跃用户量的应用,DeepSeek旗下应用在全球140个市场移动下载量排行榜中位居榜首。面对 DeepSeek 的强势崛起,百度文心和 OpenAI ChatGPT 不得不做出应对。
2023年11月,其推出了免费供商业使用且完全开源的DeepSeek Coder ;同年11月还发布了DeepSeek LLM及聊天版DeepSeek Chat,该模型参数规模达67b,性能接近GPT-4,但面临计算效率和可扩展性挑战。
在OpenAI大走闭源之路,几乎已经要变成“CloseAI”的同时,其身后老板微软却搞起了开源。4月13日,微软宣布开源DeepSpeed-Chat,号称可以通过这一项目将ChatGPT等大语言模型的训练速度提升15倍以上,并大幅降低成本。
今日(21日),DeepSeek宣布继续开源5个代码库,给开源大模型再添一把火。今年初,全球大模型行业迎来一场“开源革命”,曾经坚持闭源策略的科技巨头们纷纷调整立场。无论是OpenAI还是百度,均开始对开源社区松口,就连马斯克刚发布的Grok-3也宣布免费使用。
2月25日,南财快讯记者注意到,在经历19天的服务器资源紧张停摆后,DeepSeek API开放平台已重新开放API充值。deepseek-chat基于的V3模型调用价格为每百万输入tokens 2元,每百万输出tokens 8元。