企业大模型参数多少合适

资讯

大模型到底需要消耗多少GPU显存？公式和工具全都有
然而，这需要仔细管理以保持模型的性能，因为降低精度可能会影响输出的准确性。让我们再举一个 4 位量化的 Llama 2 70B 的例子:M = / ∗ 1.2 ≈ 42GB。
AI信使
2评论
猎户星空傅盛：企业应用大模型，百亿参数就够了
中新网上海新闻2月1日电(记者李佳佳)近日，猎户星空公司发布了一款引人注目的大模型——Orion-14B。该模型以其百亿参数级别加强大的微调套件(包括RAG检索增强生成和Agent等)加保姆式服务等特色功能成为业界瞩目的焦点。
中国新闻网
全球各大公司大模型比较分析及 DeepSeek 布置流程
本文深入剖析全球各大公司推出的大型语言模型，包括 OpenAI 的 GPT 系列、Google 的 PaLM、DeepSeek、Meta 的 LLaMA 以及百度文心一言，从模型特点、优势与劣势等维度进行详细对比。
AI观察员sinaligt
1评论
如何用好大模型？企业关心的问题都在这了
7月21日，在火山引擎出品的访谈节目V-Moment中，火山引擎总裁谭待、智谱AI CEO 张鹏、华泰证券技术部联席负责人王玲和润米咨询创始人刘润就当前最火热的大模型话题展开了讨论。国产大模型照比GPT-4究竟有多大差距？企业究竟需要什么样的大模型？
火山引擎
1评论
千亿参数的大模型，需要多少算力？
但这并不意味着模型规模就要上升到万亿规模级别的竞争，因为现有大模型并没有得到充分训练，如 GPT-3 的每个参数基本上只训练了 1-2 个Token，DeepMind 的研究表明，如果把一个大模型训练充分，需要把每个参数量训练 20 个 Token。
CSDN
3评论
腾讯首次披露行业大模型进展：不追求参数高，希望成本预算可控
腾讯首次公开行业大模型进展，但外界聚焦的通用大模型“还在路上”。6月19日，腾讯云副总裁、腾讯云智能负责人吴运声在接受澎湃新闻等媒体采访时表示，“目前大模型和产业结合还在早期阶段，随着算力发展速度不断提高，行业对大模型的理解程度也在不断加深。
澎湃新闻
1评论
周鸿祎：应该把大模型拉下神坛进行企业化、专业化
新京报贝壳财经讯（记者潘亦纯）8月26日，在2023亚布力中国企业家论坛第十九届夏季高峰会上，360集团创始人、董事长周鸿祎认为，应该把大模型拉下神坛，即把大模型做小，进行行业化、企业化、专业化、垂直化。
新京报
大模型之争（1）：“参数为王”？
最近一段时间，互联网科技圈掀起了一股大模型发布潮，百度、腾讯、阿里、华为等大厂纷纷官宣了自己的AI大模型。不少业内人士发现，大模型正在以“肉眼可见”的速度越长越大，参数规模似乎成为象征着大厂出手的一个“标配”。
中国电子报
1评论
“AI+制造”增收81%后，创新奇智工业大模型放大招
智东西9月4日报道，9月1日，国内“AI+制造”解决方案供应商创新奇智举办发布会，交出了自己的答卷。
智东西
沈向洋：大模型将横扫所有垂直行业，算力是门槛
·算力是门槛。“千卡万卡是钱堆出来的。以前有一句话叫贫穷限制想象力，现在贫穷可能扭曲想象力，因为如果没有卡，能想象要做的项目可能就不太一样了。”沈向洋“大模型大到一定地步以后就涌现出来。多大才涌现出来？没人讲得清楚。
澎湃新闻
318评论
参数1000亿！华为云发布盘古大模型3.0，覆盖基础、行业及场景三层架构，主流1.1倍效能
华为常务董事、华为云CEO张平安华为大模型升级。7月6日，华为开发者大会2023（Cloud）在中国东莞举行。华为常务董事、华为云CEO张平安在会上发布盘古大模型3.0。这是一个面向行业的大模型系列，包括“5+N+X”三层架构。
澎湃新闻
143评论

加载更多

视频