“3 个领先模型中有 2个来自中国实验室?中国追赶的速度真是令人难以置信。”在美国知名技术社区Hacker News,一位开发者如此感叹。“中国初创公司已展现出赶超美国人工智能模型的迹象,而且他们追赶的速度比许多业内人士预期的要快。
IT之家 1 月 20 日消息,幻方量化旗下 AI 公司深度求索(DeepSeek)今日正式发布 DeepSeek-R1 模型,并同步开源模型权重。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
每经记者:姚亚楠 每经编辑:赵云近日,AI数据分析平台Databricks宣布,Thrive Capital领投该公司的J轮融资,J 轮融资的目标为100亿美元,目前已完成86亿美元(约合人民币627亿元)。
10月16日,继上半年发布千亿参数模型 Yi-Large 之后,李开复带领的大模型公司零一万物对外发布最新旗舰模型 Yi-Lightning,并对于坊间关于中国多家大模型企业已放弃预训练的传言进行了回应,“零一万物绝不放弃预训练”,他说。
继发布千亿参数模型Yi-Large之后,时隔五个月,零一万物于10月16日正式对外发布最新旗舰模型Yi-Lightning。国际权威盲测榜单LMSYS显示,目前Yi-Lightning已超越GPT-4o。这意味着仅花费五个月零一万物已追上OpenAI的顶级模型。
1月27日,由国产大模型公司杭州深度求索开发的Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。据DeepSeek介绍,R1的预训练费用只有557.
21世纪经济报道记者白杨 北京报道10月16日,零一万物正式发布新旗舰模型Yi-Lightning,这直接回应了外界关于“零一万物将放弃预训练模型”的传闻。此前,有媒体报道称,国内六家头部大模型创业公司中有几家放弃了预训练模型,随后有人将矛头指向零一万物。