大模型性能gpt4

资讯

林达华：国内大模型与GPT-4的差距是“高考数学最后一题”
国内头部大语言模型与ChatGPT、GPT-4相比，孰强孰弱？多模态大模型的技术发展趋势是什么？昨天（3月24日）举行的2024全球开发者先锋大会·大模型前沿论坛上，上海人工智能实验室领军科学家林达华、复旦大学计算机科学技术学院教授邱锡鹏发表了主旨演讲。
上观新闻
2评论
商汤股价涨超30%，大模型性能全面对标GPT-4 Turbo
4月24日，商汤-W（0020.HK）股价涨超30%。4月23日，商汤科技发布日日新5.0大模型，采用混合专家架构，基于超过10TB tokens训练数据，推理时上下文窗口可以有效到 200K左右，大部分核心测试集指标已对标或超过GPT-4 Turbo。
澎湃新闻
1评论
全球最强大模型易主，GPT-4被超越丨看天下
全球最强AI模型一夜易主。人工智能初创公司Anthropic4日发布Claude 3 新模型家族。该公司声称，Claude 3 “已经实现了接近人类的理解能力”——在推理、数学、编码、多语言理解和视觉方面，全面超越GPT-4在内的所有大模型。
金羊网
预见·科技 | 性能整体超越GPT-4 Turbo，头部国产大模型成为AI开发者的“高替”
封面新闻记者欧阳宏宇又一国产大模型超越GPT-4 Turbo。6月27日，科大讯飞在北京发布讯飞星火大模型V4.0，以及在医疗、教育、商业等多个领域的人工智能应用。据科大讯飞董事长刘庆峰介绍，讯飞星火V4.
封面新闻
4评论
全球最强大模型一夜易主，GPT-4被全面超越
在推理、数学、编码、多语言理解和视觉方面，全面超越GPT-4在内的所有大模型，直接重新树立行业基准的那种。
量子位
490评论
Meta发布最强开源大模型追赶GPT-4，小扎：明年反超
美国太平洋时间7月23日，Meta（原名Facebook）正式发布其Llama 3.1大模型，该模型共有8B、70B和 405B三个尺寸，上下文长度都提升到了128K。
南方都市报
新经济视界|国产大模型加速迭代性能逼近甚至赶超GPT-4
封面新闻记者欧阳宏宇继文心、星火之后，又一中国造大模型性能赶超GPT-4。5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo。
封面新闻
最强中文大模型！阿里云重磅宣布：全面赶超GPT-4，下载量已超700万【附AIGC行业市场竞争分析】
5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4-Turbo，成为“地表最强”中文大模型。
前瞻网
141评论
四大维度深度体验多模态性能，GPT-4o为何被称作“最强大模型”？
每经记者：文巧每经编辑：兰素英去年3月，GPT-4震撼发布，距今已逾一年。
每日经济新闻
4评论
神秘大模型一夜刷屏，能力太强被疑GPT4.5，奥特曼避而不答打哑谜
梦晨明敏发自凹非寺。一个神秘模型突然杀入众人视野，能力超越一众开源模型，甚至包括GPT-4。几乎所有人都在谈论它，服务器都被挤爆了。
量子位
7评论
科大讯飞计划六月推出星火大模型V4.0 与GPT-4 Turbo能力全面对标
来源：环球网【环球网科技综合报道】科大讯飞副总裁兼研究院院长刘聪，在博鳌2024年会中宣布了一项重磅消息：科大讯飞将在今年六月正式发布星火大模型的全新版本V4.0。据悉，此次升级后的模型将对标当前业界领先的GPT-4（Turbo）的能力。
环球网
2评论
大模型实时打《街霸》捉对PK，GPT-4居然不敌3.5，新型Benchmark
让大模型直接操纵格斗游戏《街霸》里的角色，捉对PK，谁更能打?与llmsys大模型竞技场中，两个大模型分别输出答案，再由人类评分不同——街霸Bench引入了两个AI之间的交互，且由游戏引擎中确定的规则评判胜负。
量子位
23评论
360安全大模型3.0发布：在多个专业任务效果上超过GPT4
来源：环球网【环球网科技综合报道】3月20日，360安全大模型3.0正式发布。360集团首席科学家兼360数字安全集团CTO潘剑锋在发布会上表示，“我们参考了人类大脑的运行逻辑，构建360安全大模型3.0框架。实际应用中，在多个专业任务效果上超过GPT4。
环球网
20评论
大模型进入价格战！1块钱200万tokens，通义千问GPT-4级主力模型降价97%
大模型的竞争逐渐进入白热化的状态。5月21日，阿里云抛出重磅炸弹：通义千问GPT-4级主力模型Qwen-Long，API输入价格从0.02元/千tokens降至0.0005元/千tokens，直降97%。这意味着，1块钱可以买200万tokens，相当于5本《新华字典》的文字量。
周到客户端
GPT-4不是世界模型，LeCun双手赞同！ACL力证LLM永远无法模拟世界
UA微软等机构最新研究发现，GPT-4在复杂环境的模拟中，准确率甚至不及60%。对此，LeCun激动地表示，世界模型永远都不可能是LLM。
新智元
19评论
多项指标超越GPT4？零一万物千亿参数模型来了李开复：市场竞争不再支持“烧钱大战” | 大模界
每经记者：赵雯琪每经编辑：董兴生在国内外业界的共同期待中，OpenAI终于在5月14日发布了新品，对外更新GPT-4o。而国内大模型赛道的创业者们，正在迎来最接近甚至超越GPT4的时刻。5月13日，零一万物创始人兼CEO李开复发布千亿参数Yi-Large闭源模型。
每日经济新闻
4评论
阿里云发布通义千问2.5，性能全面赶超GPT-4 Turbo
5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo，成为地表最强中文大模型。同时，通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩，超越Meta的Llama-3-70B，成为开源领域最强大模型。相比通义千问2.1版本，通义千问2.
上观新闻
深信服推出安全GPT4.0 可实现动静态数据分类分级
新京报贝壳财经讯（记者罗亦丹）10月23日，深信服科技推出了两项创新成果：实现动静态数据分类分级和数据风险自动研判分析的安全GPT4.0、具备AI勒索防护能力的分布式存储EDS新版本520，希望强化数字化转型的数据安全和存储可靠性。
新京报
1评论
从GPT-4o看人工智能竞争的走向和挑战
来源：【宁夏日报】人工智能（AI）的发展正以惊人速度向前推进。近期，全球多家公司推出的最新大模型让人目不暇接，特别是GPT-4o等产品备受关注。接下来全球这一领域竞争的焦点在哪里？各国人工智能发展将面临哪些挑战？
全国党媒信息公共平台
OpenAI给GPT-4搞可解释，提取了1600万个特征，还能看它怎么想
作为机器学习模型，神经网络通过使用模仿生物神经元协同工作的过程来识别现象并得出结论，然而长久以来，我们并不真正了解神经网络的内部运作原理。
机器之心Pro
1评论

加载更多

视频