大模型训练调优

资讯

GPT-4 Turbo 发布 | 大模型训练的新时代：超算互联网的调度与调优
Intel Xeon Platinum 8350C 32C/64T 2.6GHz 48MB，DDR4 3200，Turbo，HT 240W。
GPU算力
7评论
值得买：正在训练和调优公司消费大模型
北京商报讯（记者何倩乔心怡）12月25日，根据值得买在互动平台中的官方回应，北京商报记者了解到，值得买的消费大模型基于通用大模型的技术底座，正处于结合公司积累的私有数据进行训练和调优的阶段。值得买表示，目前该模型已经在公司产品或者正在测试的产品中发挥作用。
北京商报
大模型指令调优数据集万字评测！腾讯上交大联合出品
随着大模型的快速发展，指令调优在提升模型性能和泛化能力方面发挥着至关重要的作用。然而，对于指令调优数据集的数据评估和选择方法尚未形成统一的体系，且缺乏全面深入的综述。
量子位
1评论
深势科技李小兵：AI for Sicence需要用理科的方式将大模型进行调优
9月6日，2024界面REAL科技大会上，深势科技生命科学事业部总经理李小兵在“AI+医疗”主题圆桌对话中表示，大模型领域，现在GPT更像一个“文科生”，而在AI for Sicence这个赛道上，需要回答的更多是科学性的问题。
界面快讯
1评论
国产大模型训练效率提升至2.6倍，腾讯Angel机器学习框架升级
在算力紧缺的背景下，如何提升大模型训练和推理的效率，并降低成本，成为业界关注的焦点。11月23日，腾讯披露，腾讯混元大模型背后的自研机器学习框架Angel再次升级，大模型训练效率提升至主流开源框架的2.6倍，千亿级大模型训练可节省50%算力成本。
长江日报
4评论
四年了，基础开源模型没有真正进步，指令调优大模型评估惊人发现
本研究提出了一个全新的评估套件，对它们在解决问题、写作和对齐人类价值观等方面进行了全面评估，结果可能超乎你的预料。
机器之心Pro
8评论
将大模型训练成保险产品专家？中国太保将推进11个岗位的数字劳动力建设
7月5日，在2024世界人工智能大会（WAIC）上，中国太保举办以“智造数字劳动力，打造新质生产力”为主题的高端保险论坛。中国太保副总裁俞斌在论坛上表示，金融业作为数字化需求强烈的数据密集型行业，已成为人工智能发力的重要场景之一，金融业的数字化升级，已经进入到数智化阶段。
澎湃新闻
2评论
摩尔线程与滴普科技携手，实现国产大模型训练重要突破
来源：环球网【环球网科技综合报道】近日，国内知名的GPU企业摩尔线程与领先的数据智能服务商滴普科技联合宣布，摩尔线程的夸娥（KUAE）千卡智算集群已成功与滴普科技的企业大模型Deepexi完成训练及推理适配。
环球网
24评论
AI周报 | 字节跳动大模型训练被“投毒”；微软将终止中国个人Azure OpenAI服务
字节跳动大模型训练被“投毒”近日，有消息称字节跳动发生大模型训练被实习生“投毒”事件。据悉，该事件发生在字节跳动商业化团队，因实习生田某某对团队资源分配不满，利用HF（huggingface）的漏洞，通过共享模型注入破坏代码，导致团队模型训练成果受损。
第一财经
1评论
银行业探索“人工智能+金融”调查：搭建AI中台成为行业转型“新基建”，DeepSeek等大模型将驱动研发应用向“轻量化”与“高效化”发展 | 两会金融观察④
每经记者：陈植每经编辑：马子卿3月5日，第十四届全国人民代表大会第三次会议在北京人民大会堂开幕。
每日经济新闻
银行大模型研发算力瓶颈如何破局？
今年以来，越来越多国内银行积极拥抱大模型技术，并将其广泛应用在众多金融场景。与之同时，算力瓶颈正成为布局大模型技术的一大挑战。“算力的基础，是先进的AI芯片。但由于美国限制对华出口先进的AI芯片（包括GPU芯片），国内银行在研发金融大模型方面普遍遇到算力瓶颈。
21世纪经济报道
让大模型更具行业黏性
从快速生成逻辑清晰的长篇文章，到无需视频素材即可生产视频片段，大模型近期发展迅速。除了聊天机器人、文生图、编写代码等应用之外，大模型如何进一步与行业紧密结合，怎样更具行业黏性，仍是业界需要探讨的问题。
中国网
1评论
大模型“发枪”，这些问题不解决应用就没法“冲刺”|宁可直说
在WAIC2023的展馆现场， 30多个大模型在每一家的展台上都能完美呈现，仅仅根据呈现的任务处理能力，很难分辨它们本质的不同。“也不需要把一些过程想得太复杂，当你选择继续生成或者重新生成，这本身就是对大模型的一种反馈，告诉它‘这次你做得可能不够好，要继续调整’。
第一财经
华为发布两款大模型时代AI存储新品
7月14日，华为发布大模型时代AI存储新品，为基础模型训练、行业模型训练，细分场景模型训练推理提供存储最优解，释放AI新动能。两款新品分别是OceanStor A310深度学习数据湖存储与FusionCube A3000训/推超融合一体机。
澎湃新闻
1评论
行业首创可变轮足移动结构广汽发布第三代具身智能人形机器人
12月26日，2024年中国机器人网年会在上海举行。在新品发布环节，广汽集团推出了自主研发的第三代具身智能人形机器人——GoMate。本次亮相的广汽具身智能人形机器人为行业首创可变轮足移动结构。
北青网
DeepSeek如何与网络安全深度融合？从技术逻辑到实践路径全拆解
观点：网络安全是一个对检出率、准确率有极高追求的toB领域，将任何的开源基座大模型落地于安全领域，都绝非简单的接入、缝合，而是一个复杂的系统工程。
光明网
2评论
超智融合、协同发展天府智算中心正式点亮
封面新闻记者杨霁月算力已成为数字经济时代的关键生产力，是全社会数字化、智能化转型的重要基石。当前，算力基础设施正由以通用算力为主向通用算力、智算、超算一体化演进，智算中心作为新型算力公共基础设施，将为以人工智能为代表的新一轮科技革命和产业变革注入强劲动力。
封面新闻

加载更多

大模型训练调优

资讯

GPT-4 Turbo 发布 | 大模型训练的新时代：超算互联网的调度与调优

值得买：正在训练和调优公司消费大模型

大模型指令调优数据集万字评测！腾讯上交大联合出品

深势科技李小兵：AI for Sicence需要用理科的方式将大模型进行调优

国产大模型训练效率提升至2.6倍，腾讯Angel机器学习框架升级

四年了，基础开源模型没有真正进步，指令调优大模型评估惊人发现

将大模型训练成保险产品专家？中国太保将推进11个岗位的数字劳动力建设

摩尔线程与滴普科技携手，实现国产大模型训练重要突破

AI周报 | 字节跳动大模型训练被“投毒”；微软将终止中国个人Azure OpenAI服务

银行业探索“人工智能+金融”调查：搭建AI中台成为行业转型“新基建”，DeepSeek等大模型将驱动研发应用向“轻量化”与“高效化”发展 | 两会金融观察④

银行大模型研发算力瓶颈如何破局？

让大模型更具行业黏性

大模型“发枪”，这些问题不解决应用就没法“冲刺”|宁可直说

华为发布两款大模型时代AI存储新品

行业首创可变轮足移动结构 广汽发布第三代具身智能人形机器人

DeepSeek如何与网络安全深度融合？从技术逻辑到实践路径全拆解

超智融合、协同发展 天府智算中心正式点亮

视频

DeepSeek R大模型轻量级微调，可视化训练过程环境配置

迪普科技：产品融合DeepSeek等大模型提升安全能力

DeepSeek R1大模型轻量级微调，可视化训练过程环境配置+后端调用

DeepSeek R1大模型轻量级微调，可视化训练过程环境配置+后端调用

DeepSeekR1大模型轻量级微调，可视化训练过程环境配置+后端调用

DeepSeekR1大模型轻量级微调，可视化训练过程环境配置+后端调用

DeepSeek R1大模型轻量级微调，可视化训练过程环境配置+后端调用

“大模型训练调优”的最新推荐

“大模型训练调优”的相关推荐

猜你喜欢

行业首创可变轮足移动结构广汽发布第三代具身智能人形机器人

超智融合、协同发展天府智算中心正式点亮