深度学习训练模型

资讯

基于几何深度学习预训练大模型，百奥几何在抗体亲和力预测任务领域取得国际领先水平
针对上述痛点，百奥几何自研了原子级别的几何深度学习模型，并在蛋白质复合物结构数据上进行了预训练，实现了对抗原-抗体相互作用的快速、有效建模，在突变体亲和力预测的任务上取得了国际领先水平。
钛媒体APP
7评论
AI部署：聊一聊深度学习中的模型权重
深度学习中，我们一直在训练模型，通过反向传播求导更新模型的权重，最终得到一个泛化能力比较强的模型。不过执行模型操作的算子会变化，可能从Pytorch->TensorRT或者TensorFlow->TFLITE，也就是实现算子的方式变了，同一个卷积操作，在Pytorch框架中是一种实现，在TensorRT又是另一种时间，两者的基本原理是一样的，但是精度和速度不一样，TensorRT可以借助Pytorch训练好的卷积的权重，实现与Pytorch中一样的操作，不过可能更快些。
极市平台
3评论
5个时间序列预测的深度学习模型对比总结
Makridakis et al.， The M5 Accuracy competition: Results， findings and conclusions，D. Salinas et al.， DeepAR: Probabilistic forecasting with autoregressive recurrent networks， International Journal of Forecasting .
deephub
25评论
知识蒸馏、轻量化模型架构、剪枝…几种深度学习模型压缩方法
在 nvdia gpu，x86、arm 和部分 AI 芯片平台上，均支持 8bit 的计算，效率提升从 1 倍到 16 倍不等，其中 tensor core 甚至支持 4bit计算，这也是非常有潜力的方向。
华为云开发者联盟
14评论
准确率比现有方法高50%！谷歌DeepMind全新深度学习模型AlphaFold 3重磅论文登上《自然》，系首个在生物分子结构预测方面超越基于物理工具方法的AI系统
每经记者：蔡鼎每经编辑：兰素英一直以来，从氨基酸序列出发预测蛋白质的三维结构是结构生物信息学中最具挑战的问题。但几年前，由Google DeepMind创建的基于深度学习的人工智能测序式AlphaFold解决了这个问题，一时间成为头条新闻。
每日经济新闻
6评论
什么是预训练 AI 模型？
NVIDIA NeMo Megatron 是一个大型可定制语言模型，包含在 NVIDIA NeMo 中。除此之外，NVIDIA 还能够提供:NVIDIA Riva:一款用于构建和部署语音 AI 应用的 GPU 加速软件开发工具包，包含了十种语言的预训练模型。
NVIDIA英伟达中国
3评论
现在都2202年了，用CPU做AI推理训练到底能不能行？
但实际上，经过这么多年的发展，像英特尔® 至强® 可扩展处理器这种 AI build-in 的 CPU 在支持模型训练上已经有了极大的提升，基本上每一代 CPU 都比上一代提升个 1.5 倍左右，运用或不运用 CPU 模型训练加速库的差别，能达到 8 倍。
机器之心Pro
4评论

视频

问答

如何在15分钟内建立一个深度学习模型？
头条问答
如何实现深度学习的模型训练？
头条问答
怎么在浏览器上进行深度学习模型训练？
头条问答
是否需要大量数据来训练深度学习模型？
头条问答
在深度学习模型的训练中，其性能不断变化，应当将何时性能，看作为“最终的”模型性能？
头条问答