gpu利用率

资讯

传奇程序员卡神离职Meta，曝老东家效率低：GPU利用率5%真是冒犯
明敏羿阁萧箫发自凹非寺。最终导致这位Oculus核心人物、Meta顾问CTO，选择挥手老东家，专注于自己的创业公司。
量子位
60评论
在推荐业务中如何用 MPS 提高 GPU 利用率？
导读:推荐场景下，使用传统的 CPU 推理方案可能出现计算量太大的问题，直接使用 GPU 又会遇到 GPU 利用率不高的问题，为此我们引入了 MPS 技术来解决上述问题。
DataFunTalk
5评论
以算力池化提升GPU利用率，这家公司要用软件定义算力｜REAL 100
但在另一方面，AWS在AWS re:Invent 2018大会曾提及，在AWS上GPU利用率只有10%至30%。
界面新闻
新版Alluxio提升了GPU利用率和AI/ML应用程序的数据管理性能
Alluxio Enterprise AI 数据编排平台的新版本使得使用基于 GPU 的系统来训练和操作 AI 应用程序以及在 HPC 级别为 AI/ML 系统提供数据变得更加容易。
国外主机测评
Mamba一作神作，H100利用率飙至75%！FlashAttention三代性能翻倍
编辑：编辑部【新智元导读】时隔一年，FlashAttention又推出了第三代更新，专门针对H100 GPU的新特性进行优化，在之前的基础上又实现了1.5～2倍的速度提升。FlashAttention又有后续了！
新智元
3评论
京东云发布vGPU池化方案，降低大模型推理成本
8月15日消息，京东云发布vGPU池化方案，提供一站式GPU算力池化解决方案，GPU利用率最高提升70%，大幅降低大模型推理成本。
界面快讯
首都在线：目前在手GPU芯片2万余张，AI推理芯片占比大概90%
首都在线1月2日在互动平台表示，AI眼镜需要强大的推理算力来支持其复杂的计算任务。‌AI眼镜作为一种集成了人工智能技术的可穿戴设备，其核心功能包括语音交互、物体识别、实时翻译等，这些功能都需要强大的计算能力来支持。
界面快讯
13评论
推动算力由量向质发展
在日前举行的2024中国算力大会上，工业和信息化部总工程师赵志国表示，我国在用算力中心机架总规模超过830万标准机架，算力总规模达246EFLOPS（每秒百亿亿次浮点运算），位于世界前列，产业发展不断提质增效向新。
经济日报
3评论
【IT之家评测室】摩尔线程MTT S80三测：跻身高性价比游戏显卡
作为国产第一款支持 PCIe5.0 x16 接口的显卡，摩尔线程 MTT S80 拥有 4096 个 MUSA 核心，主频 1.8GHz、16GB GDDR6 显存，显存位宽 256bit，内部集成了 220 亿个晶体管，内置 MUSA 架构通用计算核心以及张量计算核心，可以支持 FP32、FP16 和 INT8 等计算精度。
IT之家
77评论
国内先进数据存力容量占比达25% “以存强算”突破算力局限
21世纪经济报道记者倪雨晴深圳报道数据在AI时代的重要性不言而喻，数据增量也越来越快。根据IDC和华为预测，到2030年，全球每年产生的数据总量达1YB，相比2020年增长23倍。随着生成式AI的发展，数据量继续指数级增长，数据的存储环节也成为算力产业链上的焦点。
21世纪经济报道
三星与SK海力士的存内计算布局
在冯·诺伊曼架构中，计算与内存是分离的，计算单元从内存中读取数据，计算完成后再存回内存。其实早在2021年Hot Chips会议上，三星就公开针对Facebook 的DLRM模型的AXDIMM、LPDDR5-PIM 及代号Aquabolt-XL 的HBM2-PIM，披露了完整技术布局。
芯智讯
4评论
纯血国产显卡加持，AI+娱乐开箱即用，摩尔线程智娱摩方智能终端首发测评
作为备受关注的国产GPU厂商，摩尔线程在推出MTT S80之后进一步加快了研发速度，并在不久前的发布会上宣布率先支持DX11的驱动程序，正式向玩家开放MTT S系列新成员MTT S70的销售。
电脑报
全市场都忽视了！大摩：数据中心算力成本正在迅速下降
摩根士丹利在3月24日的AI报告中指出，随着GPU技术的不断进步，例如英伟达从Hopper发展到Blackwell GPU架构，GAI的算力成本正显著降低。
华尔街见闻
35评论
除了DRAM“三巨头”的HBM竞赛 AI还在如何重塑存储业态？
存储“卡住”GPU（图形处理单元）的脖子，这并不夸张。过去一年间，大模型带来的算力需求爆发，使英伟达GPU愈加依赖HBM（高带宽存储器）的高带宽。
第一财经

加载更多

视频