连接统计学机器学习与自动推理的新兴交叉领域——因果科学读书会再起航

Posted 集智俱乐部

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了连接统计学机器学习与自动推理的新兴交叉领域——因果科学读书会再起航相关的知识,希望对你有一定的参考价值。


导语


哥伦比亚大学 CausalAI 实验室主任 Elias Bareinboim 在其 ACM 邀请文章中提到:“如果我们希望下一代人工智能系统是安全的,稳健的,与人类兼容的,提升人类社会福祉的,那么把因果之梯和人类经验连接起来是至关重要的步骤”。回顾人类从亚里士多德开始的 2000 多年的因果研究历程,探求事物之间的因果关系是哲学、自然科学和社会科学等众多研究所追求的终极目标。那么如何让 AI 系统超越曲线拟合,攀登因果之梯思考为什么,并使用因果建模回答因果问题?是本次读书会希望解决的问题。

连接统计学、机器学习与自动推理的新兴交叉领域——因果科学读书会再起航




读书会背景




在2020年8月26日到2021年1月2日,集智俱乐部联合发起了因果科学与Causal AI读书会第一季,期间有包括崔鹏、周晓华等老师同学在内的32位讲者,分享了32个不同的主题,B站人气累积10万+,来自海内外不同高校或者企业的一线科研工作者273名,因果读书会借助集体智慧,在100多天的时间里,撬动了数十万人次的共同参与,形成了!



因果科学第一季读书会,我们总览了因果科学的哲学讨论、基本原理假设、最新进展,洞悉了因果科学的整体框架,当然,框架之外,细节不足。第一季的读书会毕竟只持续了100多天,很多重要的知识点、模型和方法,只是蜻蜓点水,还有很多分散在读书会成员中的知识,没有得到充分的交流讨论,也没有更进一步转化成集体智慧。


为了进一步帮助整个社群的参与者拥有将因果推理的方法真正的应用到自己相关的研究中的能力,从基础知识及基本技能建立因果科学的计算框架,掌握举一反三,发现真正的问题并解决问题的能力;我们启动了因果科学社区的第二季读书会。


因果科学社区的第二季读书会由中国科学院大学在读博士李奉治、剑桥大学机器学习组的在读博士陆超超以及香港中文大学(深圳)计算机信息工程在读博士张天健主要发起,与第一季读书会相比,第二季读书会将着力于从实操性、基础性进行。


读书会期间将会精读两本因果科学方向最广泛认可入门教材(具体内容见下方阅读材料),我们不仅将共同完成书籍中的思考题,同时还独创性地加入编程实践内容,让大家可以亲手体验因果科学的美丽。


读书会每周进行约90分钟直播讨论,进行问题交流、重点概念分享、阅读概览和编程实践内容分析,每周直播后还需各位参与者用约3个小时的时间完成复习、阅读、思考和实践内容。


新的读书会将着重介绍如何计算干预分布,如何从观察和干预数据中推断因果模型,以及因果思想如何产生用于经典机器学习问题。非常适合有机器学习背景,希望深入学习研究因果科学的基础知识和重要模型方法,寻求解决相关研究问题的朋友参加。





读书会主要阅读材料



【1】Pearl, Judea, Madelyn Glymour, and Nicholas P. Jewell. Causal inference in statistics: A primer. John Wiley & Sons, 2016.
本书中译版《统计因果推理入门(翻译版)》已由高等教育出版社出版。

【2】Peters, Jonas, Dominik Janzing, and Bernhard Schölkopf. Elements of causal inference: foundations and learning algorithms. The MIT Press, 2017.





参与方式及时间



发起人员:

中国科学院计算技术研究所在读博士李奉治、剑桥大学机器学习组的在读博士陆超超以及香港中文大学(深圳)计算机信息工程在读博士张天健。


参与人员:

  • 有机器学习背景、希望深入学习研究因果科学基础知识和重要模型方法、寻求解决相关科研问题的朋友

  • 对因果科学感兴趣、希望了解如何利用因果推理手段解决各个学科问题的朋友



运行模式:

从3月21日(周日)开始,每 1 周由2-3名读书会成员领读相关书籍章节(以 PPT 讲解的形式,腾讯会议室互动交流)


时间:

每周日上午 10:00-12:00举办。共8-10期,每周一期持续时间预计 2-3 个月。


方式:

此次读书会为线上闭门读书会,采用的会议软件是腾讯会议(请提前下载安装)


费用:

为了甄选出真正对因果推理感兴趣、有相关研究经验的专业人士,也为激励小伙伴们坚持学习,本期读书会将采取收费 - 退款的保证金模式。费用可开发票。


具体规则:

1. 读书会 8-10期) 保证金共计 299 元/人。
2. 满足如下条件之一者全额退款 (本季读书会结束后统一退费)
  • 贡献了一次讲座 (半小时以上) 内容的 (需要提前向主持人申请并通过试讲)
  • 完成了一篇以上读书笔记写作,并在集智俱乐部公众号分享。 (读书笔记标准:字数3千以上,图文并茂,具体请参照此文:)
  • 认真完成集智百科相应的编撰任务,经过集智百科团队审核通过,并达到299积分。 (详情见https://wiki.swarma.org/index.php?title=激励制度)
3. 满足以下条件之一的不仅可以全额退款,还有额外奖励:
  • 由读书会内容启发,产生了靠谱的新产品创意,并在读书会结束 2 个月内提交了详细的产品策划方案,并通过了集智俱乐部组织的相应考核答辩的;
  • 由读书会内容启发,萌发了科研论文创意,在读书会结束 2 个月内完成初稿,并在最终的论文成果中致谢集智俱乐部和因果社区的 (需要发表在SCI等核心刊物上。)
上述规则的最终解释权归集智俱乐部所有。


报名:(长期有效)




第一步:扫码填写报名信息。

第二步:信息填写之后,进入付款流程,提交保证金299元。(符合退费条件后可退费。)

第三步:添加负责人微信,拉入对应的读书会讨论群。


我们也 会对每次分享的内容进行录制,剪辑后发布在集智学园的官网上,供读书会成员回看。





读书会安排



(以下内容为初步框架,会在读书会进程中增加或者完善更多的内容详情)


【第一周】因果概论与统计学基础
本周将从宏观角度分析因果科学的研究意义,通过现实社会中某些特定问题的例子来展现因果科学的魅力。之后将从统计学基础知识入手,先概述变量、概率、条件概率、独立性、概率分布、全概率公式、贝叶斯法则、期望值、方差、协方差、回归、多元回归等基础知识,并进一步介绍图模型与结构因果模型。最后将简要整理本周阅读任务的知识框架,并协助大家配置读书会的编程实践环境,完成基础编程测试。

【周计划】

复习:【1/2】第1章

阅读:【1/2】第2章、第3章1-2节

联系:【1/2】第1章全部思考题

实践:实验环境的搭建与测试,学习基础编程语言知识


【第二周】图模型中的独立性
本周将先讨论上一周的思考题,并解答有关实验环境搭建的问题。之后将使用例子分析结构因果模型中三种基础结构 (链接合、叉接合、对撞接合) 中的条件独立性,进而推导出d-分离工具的定义,并介绍它们在模型检验与因果搜索上的作用。本期也会讨论干预的基础概念、校正公式、因果效应规则、多重干预和截断乘积规则,帮助大家理解本周的阅读内容。最后将简要整理本周阅读任务的知识框架,并介绍编程实践内容。

【周计划】
复习:【1/2】第2章、第3章1-2节
阅读:【1/2】第3章3-8节
练习:【1/2】第2章、第3章1-2节全部思考题
实践:实验一 (TBA,详见后续发布的实验文档)

【第三周】 干预的效果
本周将先讨论上一周的思考题,并解答有关实验一的问题。之后将学习后门准则和前门准则的相关知识,讨论有关条件干预、特定变量效应、中介变量的知识。本期也会学习线性系统中的因果推断,包括结构系数及其因果解释、回归系数及其识别、因果效应、中介等。最后将简要整理本周阅读任务的知识框架,并介绍编程实践内容。

【周计划】
复习:【1/2】第3章3-8节
阅读:【1/2】第4章
练习:【1/2】第3章3-8节全部思考题
实践:实验二 (TBA,详见后续发布的实验文档)

【第四周】 反事实及其应用
本周将先讨论上一周的思考题,并解答有关实验二的问题。之后将学习反事实相关的基础概念、定义、结构性解释、基本定理、计算步骤、图形化表示、概率表示等,并通过例子分析试验环境中的反事实和线性模型中的反事实,以及反事实的在现实研究中的实际应用。最后将简要整理本周阅读任务的知识框架,并介绍编程实践内容。

【周计划】
复习:【1/2】第4章
阅读:【3】第4章、第7章
练习:【1/2】第4章全部思考题
实践:实验三 (TBA,详见后续发布的实验文档)

【第五周】 因果发现
本周将先讨论上一周的思考题,并解答有关实验三的问题。之前的讨论都是基于已有因果模型的情况下进行的,而本期读书会将讨论如何基于数据进行因果模型的建模,包括对于高斯加性噪声的线性模型、非线性加性噪声模型、具有非高斯加性噪声的线性模型、非线性加性噪声模型、离散加性噪声模型、非线性后模型等模型下数据的分析建模,并会学习信息几何因果推理、跟踪方法、监督学习方法等多种分析方法。最后将简要整理本周阅读任务的知识框架,并介绍编程实践内容。

【周计划】
复习:【3】第4章、第7章
阅读:【3】第5章、第8章
练习:【3】第4章第3节、第7章第3节中全部习题
实践:实验四(TBA,详见后续发布的实验文档)

【第六周】 因果推理与机器学习
本周将先讨论上一周的习题,并解答有关实验四的问题。之后将讨论如何将因果推理结合到机器学习之中,包括半监督学习、协变量偏移、半同胞回归、情景强化学习、迁移学习等。最后将简要整理本周阅读任务的知识框架。

【周计划】
复习:【3】第5章、第8章
阅读:【3】第6章第9节、第10章
练习:【3】第5章第3节、第8章第3节中全部习题

【第七周】 其他因果框架初探
本周将先讨论上一周的习题,并对结构因果模型的相关知识进行综述与整理。而结构因果模型仅仅只是因果科学中多种模型的一种,本期还将简要学习Rubin的潜在因果框架和Granger的因果理论,分析他们在处理某些类型问题的优势,比较他们与Pearl的结构因果模型框架的异同。最后将对本次读书会进行总结,并讨论最终实践任务的内容。

【周计划】
复习:【3】第6章第9节、第10章
实践:综合建模分析 (TBA)



主办方介绍




智源社区

智源社区隶属于北京智源人工智能研究院,我们致力于创建一个AI领域内行人的交流平台。 在这里你 有机会参与全年线上线下百场专题论坛,与顶尖学者零距离接触; 也可以与同行探讨领域前沿,碰撞思想火花。


集智俱乐部

集智俱乐部是复杂科学与人工智能领域的科学社区,集智俱乐部读书会是面向广大科研工作者的系列论文研读活动,其目的是共同深入学习探讨某个科学议题,了解前沿进展,激发科研灵感,促进科研合作,降低科研门槛。


读书会活动始于 2008 年,至今已经有 40 余个主题,内容涵盖复杂系统、人工智能、脑与意识、生命科学、因果科学、计算社会科学等。凝聚了众多优秀科研工作者,促进了科研合作发表论文,孵化了许多科研产品。如 2013 年的“深度学习”读书会孕育了彩云天气 APP,2015 年的“集体注意力流”读书会产生了众包书籍《走近2050》等。



相关资料推荐:



点击“阅读原文”,即可报名!

以上是关于连接统计学机器学习与自动推理的新兴交叉领域——因果科学读书会再起航的主要内容,如果未能解决你的问题,请参考以下文章

连接因果科学与深度学习的桥梁:因果表征学习读书会启动

机器学习基础:(Python)训练集测试集分割与交叉验证

机器学习初学笔记

经典书统计强化学习:现代机器学习方法,206页pdf

B.特定领域知识图谱知识推理方案[二]:基于自监督图谱表征算法升级[特征交叉邻居采样修正生成学习对比学习等]

人工智能主要应用的七大领域