中新网上海新闻2月1日电(记者 李佳佳)近日,猎户星空公司发布了一款引人注目的大模型——Orion-14B。该模型以其百亿参数级别加强大的微调套件(包括RAG检索增强生成和Agent等)加保姆式服务等特色功能成为业界瞩目的焦点。
本文深入剖析全球各大公司推出的大型语言模型,包括 OpenAI 的 GPT 系列、Google 的 PaLM、DeepSeek、Meta 的 LLaMA 以及百度文心一言,从模型特点、优势与劣势等维度进行详细对比。
7月21日,在火山引擎出品的访谈节目V-Moment中,火山引擎总裁谭待、智谱AI CEO 张鹏、华泰证券技术部联席负责人王玲和润米咨询创始人刘润就当前最火热的大模型话题展开了讨论。国产大模型照比GPT-4究竟有多大差距?企业究竟需要什么样的大模型?
但这并不意味着模型规模就要上升到万亿规模级别的竞争,因为现有大模型并没有得到充分训练,如 GPT-3 的每个参数基本上只训练了 1-2 个Token,DeepMind 的研究表明,如果把一个大模型训练充分,需要把每个参数量训练 20 个 Token。
腾讯首次公开行业大模型进展,但外界聚焦的通用大模型“还在路上”。6月19日,腾讯云副总裁、腾讯云智能负责人吴运声在接受澎湃新闻等媒体采访时表示,“目前大模型和产业结合还在早期阶段,随着算力发展速度不断提高,行业对大模型的理解程度也在不断加深。
新京报贝壳财经讯(记者潘亦纯)8月26日,在2023亚布力中国企业家论坛第十九届夏季高峰会上,360集团创始人、董事长周鸿祎认为,应该把大模型拉下神坛,即把大模型做小,进行行业化、企业化、专业化、垂直化。
最近一段时间,互联网科技圈掀起了一股大模型发布潮,百度、腾讯、阿里、华为等大厂纷纷官宣了自己的AI大模型。不少业内人士发现,大模型正在以“肉眼可见”的速度越长越大,参数规模似乎成为象征着大厂出手的一个“标配”。
·算力是门槛。“千卡万卡是钱堆出来的。以前有一句话叫贫穷限制想象力,现在贫穷可能扭曲想象力,因为如果没有卡,能想象要做的项目可能就不太一样了。”沈向洋“大模型大到一定地步以后就涌现出来。多大才涌现出来?没人讲得清楚。
华为常务董事、华为云CEO张平安华为大模型升级。7月6日,华为开发者大会2023(Cloud)在中国东莞举行。华为常务董事、华为云CEO张平安在会上发布盘古大模型3.0。这是一个面向行业的大模型系列,包括“5+N+X”三层架构。