分享嘉宾:王凡 百度 资深研发工程师编辑整理:王成林内容来源:百度大脑&DataFun AI Talk《强化学习:原理与应用》出品社区:DataFun导读:今天分享话题主要是跟强化学习有关,因为强化学习最近在工业界是非常火热。从加入百度开始,我主要就是做这一块。
斯金纳一直是很多人的“心头恨”,他关于“正负强化”、“正负惩罚”的区分,让不少一开始接触这块知识的人栽过跟头,那有没有什么“偷懒小技巧”可以用来辅助做题呢?有同学会疑惑,我知道强化会让行为概率上升,但问题是一个题目里可能有好几个行为,那我要看哪一个呢?
相信大家或多或少都听说或经历过下面这种情况:孩子喜欢看电视,常因为看电视影响做作业的质量和速度,爸爸妈妈迫于无奈提出了只要能按时按量的完成作业,就奖励孩子看电视。现如今,不管是对孩子的教育还是对企业的管理,各个领域都在强调强化的作用。
6月24日上午,在第二届北京智源大会“强化学习专题论坛”上,上海交通大学张伟楠副教授做了主题为《Model-based Reinforcement Learning: Fundamentals and Advances》的演讲。
前言:作为最前沿的高新表面改性技术之一,激光冲击强化(LSP)技术广泛应用于航空工业、石油化工、船舶交通、生物医疗等领域,能够显著提升金属材料的抗疲劳、耐腐蚀及耐磨损能力。作为LSP系统的核心组成部分,激光光源决定了LSP的工艺效果与应用价值。
基于此,东北大学吕铮教授课题组设计了3种不同Al/Ti比的Ni基ODS合金,研究了Al/Ti比对γ′、氧化物、晶粒和力学性能的影响,相关成果以题为“Effect of Al/Ti ratio on γ′ and oxide dispersion strengthening in Ni-based ODS superalloys” 发表于材料期刊《Materials Science & Engineering》。