·国内大模型相比GPT-4还存在差距,推理、数学、代码、智能体是国内大模型短板,中文场景下国内最新大模型已展现出优势。OpenCompass2.0大语言模型中英双语客观评测前十名(采用百分制)。商用闭源模型通过API形式测试,开源模型直接在模型权重上测试。
来源:环球时报 【环球时报报道 记者 赵觉珵 刘彩玉】编者的话:即将过去的2023年在人工智能(AI)发展史上或许会留下浓墨重彩的一笔。从ChatGPT掀起的一片浪花,到席卷全球的浪潮,人工智能大模型成为当下最受关注的话题之一。
在 Bert 问世之处,在 NLP 领域也算是一颗炸弹,同时在许多自然语言处理的常见任务如情感分析、命名实体识别等中都刷到了 SOTA,Bert 家族的出色代表除了谷歌提出的 Bert 、ALBert之外,还有百度的 ERNIE、Meta 的 RoBERTa、微软的 DeBERTa等等。
原创 科技日报 科技日报◎ 刘合前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。
7月8日下午,以“智联世界,生成未来”为主题2023世界人工智能大会在上海世博中心闭幕。今年的大会上,“大模型”是当仁不让的C位。在今年的闭幕式上,《上海市推动人工智能大模型创新发展的若干措施》公布,并发布了“模”都倡议,签约了三批人工智能项目,成立上海人工智能开源生态产业集群。
眼下人工智能产业风头正劲。在近日举行的“2023全球数字经济大会人工智能高峰论坛”上,国内首个政务服务领域大模型应用场景正式发布。记者从论坛获悉,当前,北京正加快推进国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区建设,打造具有全球影响力的人工智能创新策源地。
Alpaca是由Meta的LLaMA 7B微调而来的全新模型,仅用了52k数据,性能约等于GPT-3.5。关键是训练成本奇低,不到600美元。具体花费如下:在8个80GB A100上训练了3个小时,不到100美元;生成数据使用OpenAI的API,500美元。