近期,AI大模型的迭代还在加速。北京时间2月18日,知名企业家埃隆·马斯克(Elon Musk)与xAI团队在X平台上进行直播,发布了xAI开发的最新版大模型Grok 3。该模型被马斯克描述为“地球上最聪明的AI”。
近日,上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、讯飞星火、字节跳动豆包、智谱AI、百川智能、零一万物、月之暗面、Minimax、深度求索、书生·浦语等20款国产大模型出战,角逐中国大模型“最强王者”。
本报记者 曲忠芳 李正豪 北京报道4月4日,微软联合创始人比尔·盖茨在接受美国路透社采访时表示,“暂停研发先进的人工智能(AI)并不会解决我们面临的挑战”,他建议人们关注如何最好地利用新技术的发展,以及“明确棘手的(挑战)领域”。
潮新闻客户端 记者 张云山 柳蓬“这段视频明显是AI合成的!视频中人脸动作轨迹和速度等信息都出现异常。”“这条语音在某些频率上过于‘干净’,显示出不自然的变化,AI生成概率在98%以上!”11月20日,国内首个AI大模型攻防挑战赛在乌镇激烈上演。
近日,上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战,角逐中国大模型“最强王者”。当下,“百模大战”厮杀正酣,谁才是最强王者?
梦晨 西风 发自 凹非寺。这篇干货长文,一时间成为开发者社区热议的话题。但他们的共同之处,是过去一年里一直在大模型之上构建真实应用程序,而不只是炫酷的Demo演示,他们认为:现在正是非机器学习工程师或科学家,也能把AI构建到产品中的时候。
·国内大模型相比GPT-4还存在差距,推理、数学、代码、智能体是国内大模型短板,中文场景下国内最新大模型已展现出优势。OpenCompass2.0大语言模型中英双语客观评测前十名(采用百分制)。商用闭源模型通过API形式测试,开源模型直接在模型权重上测试。
这不,就在过去短短一周时间里:DeepSeek 开源五连发,集中在 AI Infra,为我们带来了包括为 Hopper GPU 开发的高效 MLA 解码内核 FlashMLA、专为专家混合和专家并行定制的通信库 DeepEP 、专为 FP8通用矩阵乘法优化的高效计算库 DeepGEMM、以及还有 DeepSeek 创始人梁文锋亲自参与开发的双向流水线并行算法 DualPipe、专家并行负载均衡算法、DeepSeek Infra 中的性能分析数据。
来源:【中国社会科学网】自OpenAI公司发布ChatGPT以来,人工智能进入大模型时代,国际市场风起云涌,国内市场亦呈现“百模大战”态势。当前,网信部门和政法部门对大模型在司法领域的应用尚未作出明确规范,但在实践中,司法大模型围绕自主可控的要求已经取得了迅速发展。
让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打?与llmsys大模型竞技场中,两个大模型分别输出答案,再由人类评分不同——街霸Bench引入了两个AI之间的交互,且由游戏引擎中确定的规则评判胜负。
9月20日,第三届琶洲算法大赛颁奖典礼暨生态赋能大会在广州举行。典礼为全球总冠军、各赛区冠军及各赛题前三名进行了颁奖,并首发2024年大模型技术白皮书、医疗行业大模型测评榜等系列成果、揭牌“琶洲模方”大模型孵化空间。