来源:环球网 【环球网科技综合报道】1月21日消息,月之暗面公司正式宣布推出其全新的SOTA(state-of-the-art)模型——k1.5多模态思考模型,在多模态推理和通用推理能力上都实现了突破。k1.
【月之暗面发布k1.5多模态思考模型】《科创板日报》20日讯,月之暗面今日发布k1.5多模态思考模型。据介绍,从基准测试成绩看,k1.5 多模态思考模型实现了 SOTA (state-of-the-art)级别的多模态推理和通用推理能力。
界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪2月18日消息,界面新闻记者独家获悉,月之暗面近期决定大幅收缩产品投放预算,包括暂停多个安卓渠道的投放,以及第三方广告平台的合作。界面新闻记者据此向月之暗面方面求证,截至发稿对方暂未置评。
2月17日,人工智能初创公司月之暗面在其官方微信公众号分享了其前段时间刚刚发布的Kimi k1.5多模态思考模型诞生的过程。这款模型与DeepSeek-R1同日发布,但由于后者过于火爆,使得前者的发布消息几乎被淹没。
本报讯 (记者袁传玺)1月20日,国内两家备受关注的人工智能大模型创业公司北京月之暗面科技有限公司(以下简称“月之暗面”)(Kimi)和杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)(DeepSeek)均发布了最新模型。在月之暗面发布的k1.
“3 个领先模型中有 2个来自中国实验室?中国追赶的速度真是令人难以置信。”在美国知名技术社区Hacker News,一位开发者如此感叹。“中国初创公司已展现出赶超美国人工智能模型的迹象,而且他们追赶的速度比许多业内人士预期的要快。
DeepSeek 发布的论文,标题名为:《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》。
大模型时代,开源与闭源模型不断涌现,大模型为AI领域注入了新的活力,基于开源大模型的应用如雨后春笋般出现,同时也为研究者和开发者提供了更广阔的创新空间。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
图/ic2025年新春伊始,中国AI行业迎来里程碑时刻。DeepSeek崛起引发全球AI产业震荡,百度开源、GPT免费 ……由深度求索公司研发的开源大模型DeepSeek以"低成本+高智能+全开源"的颠覆性优势横空出世,犹如一条激活全球AI生态的鲶鱼,在科技界掀起惊涛骇浪。
DeepSeek突传大动作。 2月18日,DeepSeek在社交平台X上发布了一篇关于NSA的纯技术论文报告。DeepSeek称,NSA是一种与硬件高度适配并可原生训练的稀疏注意力机制,实现超高速长上下文训练与推理。