从 2019 年的谷歌 T5 到 OpenAI GPT 系列,参数量爆炸的大模型不断涌现。可以说,LLMs 的研究在学界和业界都得到了很大的推进,尤其去年 11 月底对话大模型 ChatGPT 的出现更是引起了社会各界的广泛关注。
来源/东方IC近日,商汤科技公布了自研中文语言大模型“商量 2.0”在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。根据评测结果,“商量2.0”在三个测试集中表现均领先ChatGPT,实现了我国语言大模型研究的重要突破。
新京报贝壳财经讯(记者白金蕾)9月26日下午,哔哩哔哩董事长兼首席执行官陈睿在演讲中透露了B站在AI(人工智能)领域的进展:B站上线了自研大语言模型index,并应用在了AI字幕上。目前B站具备中、英、韩、日、泰语等近10种语言的实时翻译能力,准确度接近90%。
4月11日,阿里巴巴集团在2023年阿里云峰会上正式推出“通义千问”大模型。目前“通义千问”已开启企业邀测,但还未面向大众推出。阿里巴巴集团董事会主席兼CEO张勇表示,包括钉钉、天猫精灵等阿里巴巴所有产品将会接入“通义千问”大模型,未来也将主要面对企业定制个性化服务。
红星资本局8月16日消息,日前,天津大学自主研发的“伏羲传语”(FuxiTranyu)多语言大模型正式发布并开源。“大语言模型在各类任务中表现出了强大的能力,然而,许多大模型在应对不同语言时并不会表现出均衡的能力,这通常与预训练的语料数据的配比有关。