谷歌第一代 TPU是 2016 年在 Google I/O 大会上发布的,随后在2017 年作为 Google Cloud 基础设施“Cloud TPU”推出,通常使用 FP32 和 FP16 等精度数据,如果降低 ML 的精度/DL计算到8位等,则将使得在ML/DL中的处理能力得到进一步提高。
6月10日,《自然》杂志网络版发布了一篇文章,科学家Azalia Mirhoseini和Anna Goldie带领的谷歌研究团队在这篇文章中指出:“我们的方法能让AI在6 h内生成芯片版图,生成的芯片版图在几乎所有关键指标上均能达到甚至优于人类设计的芯片版图。”
AI大模型是通用人工智能发展的重要里程碑。这一轮AI所体现“革命性”特征,不是AI可以生成文字、可以生成图片,而是AI可以生成代码,构建人机交互新模式,与产品研发、工艺设计、生产作业、产品运营等制造环节、场景相结合,提升生产效率,形成新生产力,并引发产业竞争格局重构。
·谷歌第五代定制张量处理器(TPU)芯片TPU v5e用于大模型训练和推理,训练和运行AI模型的速度提高了5倍。与上一代芯片相比,TPU v5e每一美元的训练性能提高2倍,每一美元的推理性能提高2.5倍。