近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo,支持128k上下文,大约相当于10万汉字。
国产AI大模型,提前过年了。1月20日晚间,月之暗面(Kimi)和深度求索(DeepSeek)这两大备受瞩目的AI大模型创业公司,几乎是同时发布了新模型,并均声称新模型的性能对标OpenAI的o1模型。
来源:经济日报近日,能一气吞下200万字的国产大模型Kimi爆火,引燃人工智能领域新一轮投资热情。Kimi由成立仅一年的人工智能初创公司月之暗面(Moonshot AI)研发,公司创始人杨植麟多次用“登月”来描绘他的通用人工智能(AGI)梦想。Kimi能否如愿“登月”?
在这篇名为《Mooncake: A KVCache-centric Disaggregated Architecture for LLM Serving》的论文中,作者详细介绍了Mooncake这种系统架构。
每经记者:宋欣悦 每经编辑:兰素英DeepSeek如同一尾活力十足的鲶鱼,正在打破原本相对稳定的AI市场格局。1月11日,DeepSeek正式发布官方App并上线iOS与安卓应用市场。1月20日,DeepSeek悄然开源了推理模型DeepSeek-R1。
转载自:第一财经春节前,国内大模型迎来一波密集更新。1月22日,豆包大模型1.5Pro版本正式推出,新模型全面提升多模态能力、推理能力。豆包称模型训练过程中未使用任何其他模型生成的数据,不走“捷径”。两天前,字节豆包还上线了实时语音大模型。
去年3月,百度发布文心一言,大约一年后,百度再召开Create百度AI开发者大会。百度创始人、董事长兼首席执行官李彦宏介绍了近一年来的进展,并宣布推出文心大模型4.0工具版。一年前,随着ChatGPT掀起的大模型浪潮涌动,百度成为国内最早入局的一批。