2000年,《因果论:模型、推理和推断》第1版出版时,作者朱迪亚·珀尔说了一些相当“大胆”的话,但随着我们进入大数据时代和机器学习的“数据拟合”热潮中,因果推断和因果建模的重要性也在过去20多年中得到了进一步体现。
在20世纪初期,科学家们开始在微观领域展开新的探索,试图理解原子和分子等微小物质的行为,然而,经典物理学的定律在微观尺度上却显得无力,正是在这个时候,尼尔斯·波尔提出了波尔原子模型,奠定了量子理论的基石,成为了量子力学的奠基者。
当前从数据中得到因果结构的因果结构学习,不仅要学习因果结构,还要学习从数据中直接得出哪些变量是因果变量的因果表示学习,这已经成为了当前一个热点研究课题,Pearl 在文献中提出了为 AI 提出小图灵测试作:How can machines represent causal knowledge in a way that would enable them to access the necessary information swiftly, answer questions correctly, and do it with ease, as a human can?
20 世纪 70 年代,哈佛大学著名统计学家 Donald Rubin 在 Neyman 的研究基础上进行了进一步延伸,将其从完全随机实验的领域扩展为在观察性和实验性研究中思考因果关系的一般框架,也就是鲁宾因果模型 Rubin Causal Model 。
认识事物间的因果关系,最直接的方法是做随机实验,但在现实生活中,随机实验有时不具备可操作性,我们越来越希望能够从观测数据中得到因果关系,这其中最基本的核心点是需要找到有助于我们发现因果关系的额外信息,建立起因果结构和观测的统计数据之间的桥梁,下面介绍三种常用的方法:1)基于约束的方法:主要是PC算法和IC算法,核心原理是基于独立性和条件独立性判断变量之间的独立性,获得因果图,并利用V-结构和定向规则对变量间的无向边进行定向。
今年世界人工智能大会将于7月9日至7月11日在上海举办,形式以线上为主、线上线下结合。澎湃新闻了解到,据初步统计,参与大会86场各类活动的行业企业、机构约500家,其中参展企业约150家,包括微软、亚马逊、阿里、腾讯、华为、京东、科大讯飞等平台型龙头企业,三大运营商、国家电网、工行、建行、中行、上汽、ABB、阿斯利康等行业领军企业,以及商汤、依图、云从、优必选、明略、寒武纪等AI独角兽企业。
从人类进步的阶段来说,已经历了农业化、工业化、信息化的发展,而数字化就是对信息的数字化,是现实世界所有信息在虚拟世界的“数据孪生”,数字化就是要明确信息在IT资源上的数字化表示,通过对现实世界必要信息的虚拟化映射,在此基础上进行抽象、归纳、推演,以拓展人类认知,助力生产生活的持续改善。
·当前AI模型安全能力的提升远远落后于性能,导致AI的发展是跛脚的,失衡的背后是两者投入上的巨大差异。目前世界上99%的算力用于模型预训练,只有不到1%用于对齐或更多安全优先的考量。发展可信AGI,需要探索AI 45度平衡律,长期来看,AI要大体上沿着45度安全与性能平衡发展。
一个关注提供贝叶斯网络软件和服务的公司账号 @www.ar-tiste.xyz转发了该论文,并评论:Michael Jordan 教授用贝叶斯网络而不是 SCM 来做反事实,所以他认为可以在不用 SCM 的情况下做第三梯级的推理计算。