国产大模型公司深度求索(DeepSeek)发布的最新AI(人工智能)大模型在海外引起开发者和投资者的热议。1月20日,量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1。
本文针对国内外主流AI大模型的特点、优劣势及最新进展进行梳理。本文针对国内外主流AI大模型的特点、优劣势及最新进展进行梳理,包括OpenAI GPT-4、o3-mini、Sora、Googel Gemini 2.0、Anthropic Claude 3.5、xAI Grok-2、Meta Llama 3.3、Mistral AI Le Chat、Deepseek R1/V3、阿里Qwen2.5、字节豆包1.5Pro、腾讯混元、百度文心4.0、讯飞星火、月之暗面Kimi、智谱GLM-4、昆仑万维天工4.0、百川智能Baichuan系列、MiniMax01系列、零一万物Yi系列、阶跃星辰Step系列,把握AI大模型的发展趋势。
当地时间12月6日,谷歌突然宣布推出大语言模型Gemini。这一大模型最早在谷歌6月份的I/O 开发者大会上出现预告,而在这次发布时,谷歌更是将“最大”“最强”的字眼明晃晃放在标题,称这一模型将是AI模型的巨大飞跃,最终将影响谷歌几乎所有产品。
智东西10月19日报道,今天,斯坦福大学基础模型研究中心联合斯坦福以人为本AI研究所、麻省理工学院媒体实验室、普林斯顿大学信息技术中心共同发布了2023基础模型透明度指数,并对10个主流基础模型进行了透明度评级。
本报记者 吴清 北京报道近日,一家来自中国的公司Deepseek在全球AI界刷屏,其最新推出的大模型DeepSeek-V3,迅速在AI行业内引发广泛关注和热议,主要原因就是预训练成本之低,其训练同样性能的大模型成本仅是行业主流的十分之一左右。
界面新闻记者 | 李京亚 于浩界面新闻编辑 | 文姝琪 刘方远“大模型”无疑仍是当下科技互联网界最大的热点。2022年末,OpenAI发布ChatGPT3.5,像一粒投入池塘的石子,迅速在国内人工智能赛道引发涟漪。