白交 克雷西 发自 凹非寺量子位 | 公众号 QbitAI太快了太快了。一夜间,大模型生成已经没什么延迟了……来感受下这速度。眼花缭乱了吧,生成速度已经接近每秒500 tokens。还有更直观的列表对比,速度最高能比以往这些云平台厂商快个18倍吧。
这次Intel的亲儿子蓝戟发布的B580在之前的A系列基础上提升了相当多,包括但不限于噪音降低11%,风压提升26%,供电部分升级成8+4相供电,出厂自带超频,默认核心频率直接到了2850MHz,待机功耗直接降到了10W以内,而Xe2架构的加入更是给了相当多的价值,比如新一代的RTU光追单元的吞吐量提升了两倍,二代XMX引擎可以实现本地AI快速推理,XeSS2的技术也能给到更高的帧率和更流畅的游戏效果。
微软在4月23日发布了Phi-3,Phi-3用 3.8B 的小版本做到了 Mixtral-8x7B 一样的效果,换算到dense大约等于一个14B的水平。量化后大小约1.8G, 在 iPhone15 上一秒可以出 20 个 token。小版本训练用了3.
1 至强6性能核的核心规模。此前,有业者预测,预计至强6性能核处理器每颗计算单元芯片中的内核数量为43,加上每个计算单元有两组双通道内存控制器各占一个网格,那么总共占用43+2=45个网格,可以由5×9的布局构成。