大模型排位赛谁是裁判

资讯

大模型技术正在重塑金融纠纷裁判
在AI技术席卷的浪潮中，司法领域也在经历着一场深刻的变革。从AI辅助办案的高效，到法律文书的智能生成；从智能要素式审判，到深入的司法大数据分析，大模型技术正逐步渗透并重塑着司法裁判。
21世纪经济报道
全国首个审判大模型启用！深圳中院上线AI辅助审判系统
近日，深圳市中级人民法院上线运行自主研发的人工智能辅助审判系统，标志着全国首个司法审判垂直领域大模型正式启用，深圳法院在数字法院建设中再次迈出坚实步伐。
南方都市报
3评论
大模型竞赛持续，应用场景向深向实
近期，AI大模型的迭代还在加速。北京时间2月18日，知名企业家埃隆·马斯克（Elon Musk）与xAI团队在X平台上进行直播，发布了xAI开发的最新版大模型Grok 3。该模型被马斯克描述为“地球上最聪明的AI”。
澎湃新闻
中文大模型竞技场来了！阿里百度腾讯等20款国产大模型“蒙面PK”
近日，上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena，首度集齐国内主流大模型全阵容，阿里通义千问、百度文心一言、腾讯混元、讯飞星火、字节跳动豆包、智谱AI、百川智能、零一万物、月之暗面、Minimax、深度求索、书生·浦语等20款国产大模型出战，角逐中国大模型“最强王者”。
新民晚报
2评论
国家级法律AI基座模型发布：AI加入法院审判工作
21世纪经济报道记者肖潇北京报道11月15日，最高人民法院举行发布会，向社会发布“法信法律基座大模型”。
21世纪经济报道
12评论
大模型排行榜出炉！第一名不是ChatGPT！
现在科技圈什么最火？当属大模型。如雨后春笋般冒出的大模型，每一个都在争做行业No.1，但你知道现在哪个大模型能力最强？哪个最受人喜欢吗？
黑马程序员
47评论
狂飙or刹车：AI大模型竞赛背后的诱惑与冲突
本报记者曲忠芳李正豪北京报道4月4日，微软联合创始人比尔·盖茨在接受美国路透社采访时表示，“暂停研发先进的人工智能（AI）并不会解决我们面临的挑战”，他建议人们关注如何最好地利用新技术的发展，以及“明确棘手的（挑战）领域”。
中国经营报
顶尖选手用AI对抗AI，全球AI大模型攻防挑战赛决出十强
潮新闻客户端记者张云山柳蓬“这段视频明显是AI合成的！视频中人脸动作轨迹和速度等信息都出现异常。”“这条语音在某些频率上过于‘干净’，显示出不自然的变化，AI生成概率在98%以上！”11月20日，国内首个AI大模型攻防挑战赛在乌镇激烈上演。
钱江晚报
上海推出中文大模型竞技场，20款国产大模型角逐“最强王者”
近日，上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena，首度集齐国内主流大模型全阵容，阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战，角逐中国大模型“最强王者”。当下，“百模大战”厮杀正酣，谁才是最强王者？
上观新闻
2评论
六位一线AI工程师总结爆火！大模型应用摸爬滚打一年心得公开
梦晨西风发自凹非寺。这篇干货长文，一时间成为开发者社区热议的话题。但他们的共同之处，是过去一年里一直在大模型之上构建真实应用程序，而不只是炫酷的Demo演示，他们认为:现在正是非机器学习工程师或科学家，也能把AI构建到产品中的时候。
量子位
19评论
大模型年度榜单公布：GPT-4第一，智谱、阿里紧追
·国内大模型相比GPT-4还存在差距，推理、数学、代码、智能体是国内大模型短板，中文场景下国内最新大模型已展现出优势。OpenCompass2.0大语言模型中英双语客观评测前十名（采用百分制）。商用闭源模型通过API形式测试，开源模型直接在模型权重上测试。
澎湃新闻
2评论
DeepSeek开源连击、Claude编码升级、GPT性能迷局，系统解读大模型诸神之战 | 万有引力
这不，就在过去短短一周时间里:DeepSeek 开源五连发，集中在 AI Infra，为我们带来了包括为 Hopper GPU 开发的高效 MLA 解码内核 FlashMLA、专为专家混合和专家并行定制的通信库 DeepEP 、专为 FP8通用矩阵乘法优化的高效计算库 DeepGEMM、以及还有 DeepSeek 创始人梁文锋亲自参与开发的双向流水线并行算法 DualPipe、专家并行负载均衡算法、DeepSeek Infra 中的性能分析数据。
人工智能学家
大模型在司法人工智能“准三段论”中的应用
来源：【中国社会科学网】自OpenAI公司发布ChatGPT以来，人工智能进入大模型时代，国际市场风起云涌，国内市场亦呈现“百模大战”态势。当前，网信部门和政法部门对大模型在司法领域的应用尚未作出明确规范，但在实践中，司法大模型围绕自主可控的要求已经取得了迅速发展。
全国党媒信息公共平台
1评论
大模型实时打《街霸》捉对PK，GPT-4居然不敌3.5，新型Benchmark
让大模型直接操纵格斗游戏《街霸》里的角色，捉对PK，谁更能打?与llmsys大模型竞技场中，两个大模型分别输出答案，再由人类评分不同——街霸Bench引入了两个AI之间的交互，且由游戏引擎中确定的规则评判胜负。
量子位
23评论
AI大模型潮起年轻人如何应对
近日，广东深圳福田区政府的工作人员迎来了70位“数智同事”。它们在240个政务场景里，在“监护人”的指挥下，以“公务员助手”的身份重塑政务服务的新图景。
中国青年报
超170支队伍参赛！第三届琶洲算法大赛“政务服务行业大模型训练赛”落幕
9月20日，第三届琶洲算法大赛颁奖典礼暨生态赋能大会在广州举行。典礼为全球总冠军、各赛区冠军及各赛题前三名进行了颁奖，并首发2024年大模型技术白皮书、医疗行业大模型测评榜等系列成果、揭牌“琶洲模方”大模型孵化空间。
羊城晚报•羊城派
争议中的Kimi，11月又花了2亿
上线一年，在大模型行业整体趋于冷静、留存率堪忧的背景下，Kimi的投流成本仍居高不下。月之暗面为何坚持大手笔投放？大模型的“烧钱”竞赛，何时能到缓一口气的时候？近日，月之暗面一直处于风暴眼中。
财天COVER
21评论
马斯克的Grok-3来了！和OpenAI、DeepSeek正面对决
21世纪经济报道记者倪雨晴深圳报道在AI的牌桌上，埃隆·马斯克（Elon Musk）从不缺席。太平洋时间2月17日，马斯克旗下人工智能初创公司xAI的大模型Grok-3正式面世。
21世纪经济报道

加载更多

问答

如何看待王者荣耀KPL的裁判员景琪琛？
王者荣耀春季赛的裁判员。
头条问答