Multi-modal Factorized Bilinear Pooling for VQA 见原文链接。Efficient Low-rank Multimodal Fusion with Modality-Specific Factors 见原文链接。
深度学习技术正在以惊人的速度改变着我们的世界,但对于初学者来说,掌握这一领域的技术并不容易。从了解基本概念和原理,到学习编程语言和工具,再到理解数据预处理和特征工程,掌握常见的深度学习模型,实践项目和挑战,跟随领域专家和研究论文,最后参加竞赛和项目合作。
深度学习,即Deep Learning,是一种学习算法,亦是人工智能领域的一个重要分支。从快速发展到实际应用,短短几年时间里,深度学习颠覆了语音识别、图像分类、文本理解等众多领域的算法设计思路,渐渐形成了一种从训练数据出发,经过一个端到端的模型,然后直接输出得到最终结果的一种新模式。