1000亿参数什么意思

资讯

清华大学唐杰：构建千亿参数大模型的经验及思考
集微网报道 7月7日，在2023世界人工智能大会上，清华大学教授唐杰发表“构建千亿参数大模型之路”的主题演讲，重点介绍了大模型训练的经验及思考。
集微网
5评论
通义千问首次推出千亿参数模型
据“阿里通义千问”微信公众号4月28日消息，通义千问首次推出千亿级参数模型Qwen1.5-110B。据介绍，Qwen1.5-110B基础能力可与Meta-Llama-3-70B媲美，是Qwen1.5系列中规模最大的模型，也是该系列中首个拥有超1000亿参数的模型。
南方都市报
中国电信发布千亿参数语义大模型总经理邵广禄：AI大模型早使用早受益
中证网讯（记者杨洁）在近日召开的“人工智能与数据产业发展合作论坛”上，中国电信总经理邵广禄表示，AI大模型对加速创新，提高效率有重要作用。对于AI大模型，大家逐渐形成共识，早使用，早受益。中国电信内部在网络运营、客户服务、产品应用等方面，正在积极使用大模型升级提效。
中国证券报
1评论
中科院出手！1000亿参数全模态大模型发布，能看懂视频、绘画作曲、分析信号
智东西作者 | ZeR0编辑 | 漠影智东西6月16日报道，在今日举行的人工智能框架生态峰会2023上，中国科学院自动化研究所所长徐波正式发布紫东太初2.0全模态大模型。相比以前的大模型，紫东太初2.0新增了视频、传感信号、3D点云等模态，拥有了更强的认知、理解、创作能力。
智东西
50评论
多项指标超越GPT4？零一万物千亿参数模型来了李开复：市场竞争不再支持“烧钱大战” | 大模界
每经记者：赵雯琪每经编辑：董兴生在国内外业界的共同期待中，OpenAI终于在5月14日发布了新品，对外更新GPT-4o。而国内大模型赛道的创业者们，正在迎来最接近甚至超越GPT4的时刻。5月13日，零一万物创始人兼CEO李开复发布千亿参数Yi-Large闭源模型。
每日经济新闻
4评论
千亿参数的大模型，需要多少算力？
但这并不意味着模型规模就要上升到万亿规模级别的竞争，因为现有大模型并没有得到充分训练，如 GPT-3 的每个参数基本上只训练了 1-2 个Token，DeepMind 的研究表明，如果把一个大模型训练充分，需要把每个参数量训练 20 个 Token。
CSDN
3评论
打通大模型训练任督二脉！国内首个千亿参数、全面开源大模型来了
智东西11月30日报道，11月27日，算力龙头企业浪潮信息发布了完全开源且可免费商用的源2.0基础大模型，包含1026亿、518亿、21亿不同参数规模，这也是国内首个千亿参数、全面开源的大模型。
智东西
1评论
激战千亿参数多模态大模型！APUS亮剑：蒸馏四大精炼模型，连推7款AI产品
智东西4月18日报道，今天下午，全球化智能手机操作系统企业APUS发布了天燕大模型AiLMe，并发布国内首份多模态大模型技术白皮书《天燕大模型技术白皮书》。
智东西
中国电信发布千亿参数大模型星辰语义可将设计成本下降95%
每经记者：杨卉每经编辑：梁枭11月10日，在2023数字科技生态大会上，中国电信多个高管轮流上阵，接连发布了一站式智算服务平台“慧聚”、大模型星辰语义及十余个行业大模型、中国电信“天衍”量子计算云平台、5G焕新应用等多项产品、平台及技术更新。
每日经济新闻
15评论
华为最新大模型问世，千亿参数3万亿tokens，放话不作诗只做事
最底层的基础大模型包括100亿参数、380亿参数、710亿参数和1000亿参数四个版本，预训练使用了超3万亿tokens。
量子位
251评论
参数1000亿！华为云发布盘古大模型3.0，覆盖基础、行业及场景三层架构，主流1.1倍效能
华为常务董事、华为云CEO张平安华为大模型升级。7月6日，华为开发者大会2023（Cloud）在中国东莞举行。华为常务董事、华为云CEO张平安在会上发布盘古大模型3.0。这是一个面向行业的大模型系列，包括“5+N+X”三层架构。
澎湃新闻
145评论
国产AIGC大模型汇总
但是到目前为止，没有一个大模型能与ChatGPT相提并论，更比说是GPT-4了，国产大模型还需要很长的路要走!
工信AI
72评论
直播实录 | 全面剖析新一代高性能AI计算集群中的技术方案和应用
百度智能云的异构计算产品经理玄凌博、资深研发工程师孙鹏、资深系统工程师武正辉，以及英伟达解决方案架构师程帅四位技术专家参与了本次线上分享会，并围绕新一代高性能AI计算集群中的技术方案和应用进行了深入剖析。
智东西
1评论
手机产业链厂商加入“百模大战”，“随身”大模型成新趋势
11月21日，联发科发布天玑 8300 5G生成式AI移动芯片，官方表示该芯片支持生成式AI，至高支持100亿参数AI大语言模型，AI综合性能是上一代的3.3倍，可流畅运行终端侧生成式AI的创新应用。
南方都市报
爆火的人工智能背后，如何解决算力焦虑？
7月6日，2023世界人工智能大会在上海举办。以ChatGPT为代表的新兴AI应用带动了算力需求“爆发式”增长，算力短缺的矛盾也变得越发突出。
第一财经
丁磊的大模型试验田，单季营收15亿
“中国创业者在移动互联网时代是最会做应用的。”文｜《中国企业家》记者赵东山编辑｜李薇头图来源｜受访者“国内好的大模型应用目前还是太少了，2023年大家都使劲做大模型，反倒在应用方面没有大的突破。”这是网易有道CEO周枫投身大模型一年后最大的感受。
中国企业家杂志
32评论

加载更多

视频