本文针对国内外主流AI大模型的特点、优劣势及最新进展进行梳理。本文针对国内外主流AI大模型的特点、优劣势及最新进展进行梳理,包括OpenAI GPT-4、o3-mini、Sora、Googel Gemini 2.0、Anthropic Claude 3.5、xAI Grok-2、Meta Llama 3.3、Mistral AI Le Chat、Deepseek R1/V3、阿里Qwen2.5、字节豆包1.5Pro、腾讯混元、百度文心4.0、讯飞星火、月之暗面Kimi、智谱GLM-4、昆仑万维天工4.0、百川智能Baichuan系列、MiniMax01系列、零一万物Yi系列、阶跃星辰Step系列,把握AI大模型的发展趋势。
这个春天,人工智能正以极快的速度走进我们的生活,并且越来越多地改变着我们身边的一切。今天的人工智能之所以能进化得越来越智慧,关键就在于研发人员对它进行不间断的学习训练、开放共享和迭代发展。技术的成熟、开源生态的倒逼,让大模型厂商纷纷加入免费的行业。
深度求索掀起惊涛骇浪作者/ IT时报记者 孙妍 郝俊慧编辑/ 钱立富“大家都过了一个DeepSeek年。”春节期间,DeepSeek(深度求索)不仅成为震惊全球AI圈的“鲶鱼”,也为国产芯片商、云厂商等国内AI生态链带来新希望。短短几天时间,DeepSeek的朋友圈持续扩容。
算算,深度求索公司DeepSeek发布大招,已经过去30天了。“DeepSeek-R1性能对标OpenAI o1正式版+开源模型权重+网页版和App免费可用+API每百万tokens输入只要1块钱+论文训练技术全部公开”,1月20日的这套“组合拳”下来,全球大模型产业巨震。
2025全球开发者先锋大会正在上海举行,一批国内外头部人工智能企业发布了多项重磅技术与解决方案,共同探讨人工智能产业的发展之路。作为人工智能领域中一个重要技术和应用分支,大模型的发展成为本次大会的热门话题。国产大模型有哪些发展新趋势?记者就此采访了多位业内人士。
界面新闻记者 | 宋佳楠2月25日,人工智能初创公司Anthropic宣布推出旗下首款混合推理模型Claude 3.7 Sonnet。该公司表示,这是其有史以来“最智能”的AI模型,也是市面上唯一的此类“混合”模型。
从2023年2月20日“国内第一个对话式大型语言模型”MOSS发布,到4月21日该模型正式开源,两个月间,多家中国企业和研究机构以加速度扎堆冲入被ChatGPT轰炸出来的AI大模型赛道。在梳理这些大模型所试图呈现的特点之后,我们该如何看待这种趋势?·如何判断各家大模型的水平?