最新的语言大模型

资讯

最新大语言模型综述：T5到GPT-4最全盘点，20余位研究者联合撰写
从 2019 年的谷歌 T5 到 OpenAI GPT 系列，参数量爆炸的大模型不断涌现。可以说，LLMs 的研究在学界和业界都得到了很大的推进，尤其去年 11 月底对话大模型 ChatGPT 的出现更是引起了社会各界的广泛关注。
机器之心Pro
29评论
模型“日日新”！中文语言大模型“商量2.0”多个评测基准综合表现超ChatGPT
来源/东方IC近日，商汤科技公布了自研中文语言大模型“商量 2.0”在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。根据评测结果，“商量2.0”在三个测试集中表现均领先ChatGPT，实现了我国语言大模型研究的重要突破。
新民晚报
Meta发布最新大语言模型
当地时间周四，Meta发布了最新的大语言模型Llama3，这款新模型也将为Meta的人工智能助手MetaAI提供支持。
北京日报客户端
Meta加入AI军备竞赛：发布开源大语言模型，号称优于ChatGPT
继微软、谷歌之后，脸书（Facebook）母公司Meta（Nasdaq：META）也加入AI军备竞赛。
澎湃新闻
12评论
陈睿：B站已上线自研大语言模型，日均支持数十万非中文稿件翻译
新京报贝壳财经讯（记者白金蕾）9月26日下午，哔哩哔哩董事长兼首席执行官陈睿在演讲中透露了B站在AI（人工智能）领域的进展：B站上线了自研大语言模型index，并应用在了AI字幕上。目前B站具备中、英、韩、日、泰语等近10种语言的实时翻译能力，准确度接近90%。
新京报
商汤科技大语言模型出炉：名为“商量SenseChat”
新京报贝壳财经讯（记者罗亦丹）国内大语言模型又添一员。
新京报
实测阿里、百度语言大模型：谁最会胡说八道？能替代记者吗？
4月11日，阿里巴巴集团在2023年阿里云峰会上正式推出“通义千问”大模型。目前“通义千问”已开启企业邀测，但还未面向大众推出。阿里巴巴集团董事会主席兼CEO张勇表示，包括钉钉、天猫精灵等阿里巴巴所有产品将会接入“通义千问”大模型，未来也将主要面对企业定制个性化服务。
南方都市报
1评论
天津大学“伏羲传语”多语言大模型正式发布并开源，应对大模型多语言能力不足
红星资本局8月16日消息，日前，天津大学自主研发的“伏羲传语”（FuxiTranyu）多语言大模型正式发布并开源。“大语言模型在各类任务中表现出了强大的能力，然而，许多大模型在应对不同语言时并不会表现出均衡的能力，这通常与预训练的语料数据的配比有关。
红星新闻
英伟达发布Nemotron系列大语言模型欲推动代理式AI加速崛起
21世纪经济报道记者白杨北京报道在今日召开的CES 2025大会上，英伟达创始人兼CEO黄仁勋发布了全新的 Llama Nemotron系列大语言模型。
21世纪经济报道
百度正式推出大语言模型“文心一言”
3月16日，百度正式发布文心一言，包括五大能力——“文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成”。
澎湃新闻
10评论

视频

问答