据台湾联合新闻网2月4日报道,中国大陆杭州深度求索人工智能基础技术研究有限公司(DeepSeek)开发的人工智能(AI)模型引发关注,台当局行政机构负责人卓荣泰3日在政务会议上表示,基于防范公务机关内部信息等考虑,要求公务机关全面禁用DeepSeek的AI服务,以确保资通安全。
英国金融时报稍早报导,OpenAI公司表示,已掌握DeepSeek疑似对ChatGPT使用「蒸馏」技术的证据,这一技术可让AI开发者利用更大、更强的模型输出成果,在较小模型获得更出色的表现,并让他们在特定任务上以更低廉的成本得到类似结果。
公司已于2025年2月6日在本公司选定的信息披露媒体上披露了《股票交易异常波动公告》,其中,对近期涉及DeepSeek热点与本公司关联的有关传言进行了回应:本公司、以及本公司子公司所管理的基金均未参与DeepSeek的融资。
目前,第一类卷向大参数的玩家也都在寻找高效解决方案,连 OpenAI 此前发布 GPT-4o mini 切入小模型市场,Meta Llama 3.1-8B、微软 Phi-3-vision 和 Phi-4 14B 、谷歌 Gemma 2 以及阿里 Qwen 2.5 等一系列小模型也都是头部玩家在做的布局。