国内头部大语言模型与ChatGPT、GPT-4相比,孰强孰弱?多模态大模型的技术发展趋势是什么?昨天(3月24日)举行的2024全球开发者先锋大会·大模型前沿论坛上,上海人工智能实验室领军科学家林达华、复旦大学计算机科学技术学院教授邱锡鹏发表了主旨演讲。
4月24日,商汤-W(0020.HK)股价涨超30%。4月23日,商汤科技发布日日新5.0大模型,采用混合专家架构,基于超过10TB tokens训练数据,推理时上下文窗口可以有效到 200K左右,大部分核心测试集指标已对标或超过GPT-4 Turbo。
全球最强AI模型一夜易主。人工智能初创公司Anthropic4日发布Claude 3 新模型家族。该公司声称,Claude 3 “已经实现了接近人类的理解能力”——在推理、数学、编码、多语言理解和视觉方面,全面超越GPT-4在内的所有大模型。
封面新闻记者 欧阳宏宇又一国产大模型超越GPT-4 Turbo。6月27日,科大讯飞在北京发布讯飞星火大模型V4.0,以及在医疗、教育、商业等多个领域的人工智能应用。据科大讯飞董事长刘庆峰介绍,讯飞星火V4.
来源:环球网 【环球网科技综合报道】科大讯飞副总裁兼研究院院长刘聪,在博鳌2024年会中宣布了一项重磅消息:科大讯飞将在今年六月正式发布星火大模型的全新版本V4.0。据悉,此次升级后的模型将对标当前业界领先的GPT-4(Turbo)的能力。
让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打?与llmsys大模型竞技场中,两个大模型分别输出答案,再由人类评分不同——街霸Bench引入了两个AI之间的交互,且由游戏引擎中确定的规则评判胜负。
来源:环球网 【环球网科技综合报道】3月20日,360安全大模型3.0正式发布。360集团首席科学家兼360数字安全集团CTO潘剑锋在发布会上表示,“我们参考了人类大脑的运行逻辑,构建360安全大模型3.0框架。实际应用中,在多个专业任务效果上超过GPT4。
大模型的竞争逐渐进入白热化的状态。5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。
每经记者:赵雯琪 每经编辑:董兴生在国内外业界的共同期待中,OpenAI终于在5月14日发布了新品,对外更新GPT-4o。而国内大模型赛道的创业者们,正在迎来最接近甚至超越GPT4的时刻。5月13日,零一万物创始人兼CEO李开复发布千亿参数Yi-Large闭源模型。
5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。相比通义千问2.1版本,通义千问2.
新京报贝壳财经讯(记者罗亦丹)10月23日,深信服科技推出了两项创新成果:实现动静态数据分类分级和数据风险自动研判分析的安全GPT4.0、具备AI勒索防护能力的分布式存储EDS新版本520,希望强化数字化转型的数据安全和存储可靠性。
来源:【宁夏日报】人工智能(AI)的发展正以惊人速度向前推进。近期,全球多家公司推出的最新大模型让人目不暇接,特别是GPT-4o等产品备受关注。接下来全球这一领域竞争的焦点在哪里?各国人工智能发展将面临哪些挑战?