太长不看版中文通用大模型基准测试 SuperCLUE 发布:GPT 居首、星火第三百度正在内测文心千帆大模型平台国联股份:正开发“产业 AI 全家桶”项目,十余款 AI 在线应用预计将在 6 月中旬上线百度回应搜索新增 AI 对话功能:目前处于内测中OpenAI 正在使用 GPT
大皖新闻讯 5月9日,中文通用大模型综合性评测基准 SuperCLUE 正式发布。该机构利用 SuperCLUE 测试基准,对市面上主流的支持中文的通用大模型进行了评测与排名。从排名中看到,GPT-4 一骑绝尘,已经非常接近人类的能力。
来源/东方IC近日,商汤科技公布了自研中文语言大模型“商量 2.0”在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。根据评测结果,“商量2.0”在三个测试集中表现均领先ChatGPT,实现了我国语言大模型研究的重要突破。
采写丨科技日报记者 龚茜策划丨何屹 房琳琳继去年“百模大战”之后,今年国内大模型产业应用进入爆发元年。然而,大模型产业发展如火如荼的同时,其训练数据规模的增长速度跟不上、语料质量参差不齐,尤其是高质量中文语料短缺的问题日益凸显,成为各方关注焦点。
资料图:高质量中文语料资源短缺限制了我国人工智能技术的发展和创新应用。图/IC photo在2024年全国两会上,有委员提出,应重视当前国内人工智能(AI)大模型产业发展中遇到的高质量中文语料数据短缺问题。
在 OpenAI GPT 系列 / Google PaLM 系列 / DeepMind Chinchilla 系列 / Anthropic Claude 系列的研发过程中,MMLU / MATH / BBH 这三个数据集发挥了至关重要的作用,因为它们比较全面地覆盖了模型各个维度的能力。
◎本报记者 陈 曦目前成熟的生成式AI模型大多基于英文数据进行训练,在国内各行各业的应用环境中,中文大模型显然更“接地气”。通过中文或英文数据训练出来的大模型,差异比较大,中文的上下文理解和语义的多解性要大于英文。
北京日报客户端 | 记者 赵语涵ChatGPT的爆火让大模型成为今年科创界和资本市场顶流,多家互联网大厂也纷纷下场发布其大模型。以问答形式为最鲜明标签的知乎也在这一领域有所布局。4月13日,2023知乎发现大会在京举办。
光明网讯(记者 李政葳)新一代人工智能是推动科技跨越发展、产业优化升级、生产力整体跃升的驱动力量。人工智能的快速发展迫切需要高质量、大规模、安全可信的语料数据资源。近日,中国网络空间安全协会人工智能安全治理专业委员会面向社会发布了用于大模型的首批中文基础语料库。
没想到到了今年年初,悄然发现,我已经很久很久没用国外大模型,除了需要做一些涉外种种工作时会偶尔用到Copilot外,我已经习惯国内大模型,它们的进化速度令人欢喜鼓舞,但你要问我谁最好,实话实说,个人用起来PC端更习惯星火,移动端偏向豆包,图画偏向天工。