《科学革命的结构》读书报告

Posted xtqqwq

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《科学革命的结构》读书报告相关的知识,希望对你有一定的参考价值。

科学在文明发展中起到了至关重要的作用。科学发展往往意味着生产力的提升,但科学发展的规律却鲜有人研究。这并非是一个纯粹的历史性问题,更多的是一种科学观和哲学上的问题。《科学革命的结构》一书提出了一套完整的科学发展的规律。完全不同于一般人们从教科书中学习或看到的那样,作者库恩认为,科学完全不是一个一个规律或结论的堆砌,而是存在一个由常规科学,反常,到危机,进而产生科学革命,最后回到常规科学的一个在循环中螺旋上升的过程。作者首先提出了“范式”这个概念,强调范式是科学共同体研究科学的共有前提和基础,是一种研究的模式和模糊的“规律”。所谓常规科学,则是科学共同体依这一范式进行研究的过程,包括确定重要信息,完善现有理论等。而反常则易于理解,即是现实观测不满足现有范式的情况。危机则是反常积累到一定程度,问题变得愈发紧迫,影响到现有研究而产生的。最终在危机影响下,多种不同的范式竞相出现,直到科学共同体达成共识,以得到一个不同的新范式,解决危机而告终。这一阶段也就是科学革命。作者认为这一不断循环的过程才是科学发展过程的真面目。另外,作者认为范式之间具有不可通约性,也就是一个科学家不可能同时接受两个不同的范式。而同样根据相似的理由,科学家做科学研究也不可能脱离所有的范式,范式是一切研究的先验基础。

对于科学革命的过程,一个反复出现的经典例子是爱因斯坦的相对论理论。20 世纪刚开始,英国著名物理学家开尔文男爵在英国皇家学会发表了题为“在热和光动力理论上空的十九世纪的乌云”的演讲。他在演讲中说:“物理大厦已经落成,所剩的只是修缮工作。只是,它的美丽而晴朗的天空却被两朵乌云笼罩了。”这里的修缮工作其实也就是库恩所说的常规科学的扫尾工作。但这两朵乌云,其中一朵引出了量子力学,而另外一朵引出了相对论。当时人们普遍认为,牛顿力学完美的解决了物体的运动问题,麦克斯韦的电磁理论则统一了电磁现象。但光速不变对以太漂移说所产生的反常,产生了危机,直到爱因斯坦提出狭义相对论解决这一危机,将范式从牛顿力学转换至相对论。

这一范式理论很好地诠释了大部分自然科学的发展历程,包括物理学、化学、天文学等,但科学不完全只有自然科学。科学共分为三大类——自然科学,社会科学,形式科学。范式理论依赖观测与实验,需要客观世界的反映来出现反常与危机。这有些类似黑格尔口中的“科学”,需要不断否定自身,才能实现进步。对于社会科学,似乎大多数都并不存在一个科学共同体所一致认同的范式,这在书中甚至算作“前范式时期”;对于形式科学,比如数学与计算机科学,就更无法谈“观测或实验与范式预测不符”了。但在目前形式科学与社会科学在世界舞台中逐渐开始扮演重要角色的趋势下,仅仅对于自然科学的诠释就显得有些局限了。不想过多浪费文字在书中的观点上,下面我将就这另外两类科学提出一些自己的思考与看法。

首先我们着眼于社会科学。对于经济学,人们似乎能够达成一个共识。在微观经济学与宏观经济学两个大类下,全世界的经济学家的理论都趋于同一个范式。即使对于部分具体问题的看法可能不尽相同,但几乎不存在基础大前提的矛盾,也没有书中所提到的“不可通约性”。在这样的背景下,我们不禁会问:这样的范式是如何形成的?是何种力量导致了他们观点的统一?而这样的学科又是如何发展的?我在这里尝试给出一个比较浅显的回答。我认为在社会科学中,类似自然科学中的“观测”和“实验”是仍然存在的。但这种观测或是实验给出的答案并不明晰,是十分模糊而不确定的。在经济学中,人们可以通过观察货币流通,市场价格波动,生产资料规律等等因素,结合统计学、数学建模归纳总结出若干结论。不同于物理世界中实验结果的可重复性和精密仪器给出的小数点后高达 6 位的精确数值,经济学中的结论大多是定性的。这导致对于足够复杂问题的看法,在经济学家眼中,若干定性结论的结合得到的结论就可能大相径庭。因此,经济学家对于简单的经济问题总有相同的观点——这并不是“不可通约性”中的格式塔转换,但对于复杂问题,如经典的经济问题——如何控制政府对市场的调节力度——则在不同国家中有显著差异。这导致在全世界的经济学家类似一棵分叉的树,同根,但又各不相同。而这个根的发展同样类似于科学革命,但并不明显。我们可以毫不犹豫的说,现代的经济学比 17 世纪时的经济学有长足的进步,而且显然也并不是理论的不断堆砌——这一点甚至相对于自然科学更加明显。这样的科学革命也源于反常——无论是市场的反常现象或是生产方式的改变。这些同样适用于政治学等社会科学。因此我认为范式理论并不是不能解释社会科学的发展,只是可能需要做一些调整。但这也可能将会跟随着一些更有趣的结论,不过由于理解有限,很难在此给出进一步的猜测了。

其次是形式科学。拿其中最典型的数学来讲,“观测”与“实验”彻底不再存在,所拥有的只不过是公理化的系统与几乎纯逻辑的推导。但经过了长时间的思考,我认为范式并不再没有变革,也并非不存在科学革命。从书中的定义来看,数学历史上的三次危机就可以算是科学革命。第一次数学危机改变了世界观,把人们从有理数的世界中拉了出来。沿用书中的“不可通约性”,我们不能说从只有有理数到所有实数是一次新东西的堆砌,而是彻底改变了人们看待有理数的方式。希帕索斯被扔进大海的故事也戏剧性地展现了“革命”的残酷。第二次数学危机则改变了人们对“无穷小”的看法,建立完整的极限和实数理念。第三次数学危机提出了全新的集合论功力系统,完善了数理逻辑基础。而哥德尔定理的提出也成为了新的数理逻辑的基石。但对于这三次危机来讲,科学革命过程中的所谓“反常”不再是观察与实验与逻辑系统推论不相符,而是系统本身产生的悖论或是不完备性。虽然似乎现在人们已经认为数学的基石已经近乎完备,但例如选择公理的正确与否仍然存在争议。说不定这将会成为下一次危机的源头。

但这并不意味着数学的发展就遵循书中所述的科学革命的结构,因为数学家们在现在所做的常规科学,与数学的数学基础和数理逻辑究竟是否已经完美无瑕并无太大关联,而是在自己的研究分支中尝试解决那些悬而未决的猜想或定理,即使这些基础也是范式的一部分。在这些基础之上,那些定理似乎真的是一个个不断堆砌上去的。但我认为,范式并不仅仅包含这些定理和结论,还包含人们看待和研究数学对象的方式。在发明椭圆曲线理论之前,数学家们看 \\(y^2=x^3+ax^2+bx+c\\) 就只是一条普通的曲线,或许有对称性质,但在这之后,数学家们就能够联想到椭圆曲线的各种性质,从而利用这些性质去解决各种各样的问题。群论以及伽罗瓦理论的诞生,改变了数学家们对于不同代数对象的认识。甚至可以说每一个不同理论的诞生,都能改变数学家们对一些数学对象的理解和看法,以及他们研究数学问题的方式。这里反常似乎可以类比为一个个悬而未决的问题,每一个反常的解决都可以带来范式的一个小的改变。但这样的改变很难称得上是革命。从研究方式的角度来看,似乎永远也不可能是一个不断堆砌的过程。如果看计算机科学,写代码的人们变换自己的编程语言,研究自然语言处理从语言学处理到使用 transformer 深度学习,都可以是范式的转换。但在形式科学下,这种范式转变是很容易被科学共同体内的其他科学家所接受的,与革命一词则大相径庭。这些种种例子似乎都是在说:范式的转变,或者说是研究方式、使用工具的转变,归根到底都是由于某种实用性,发现何种的研究方式更容易解决问题。所依赖的不再是现实世界中的观察,而是解决学科内问题的有效性。从这样的角度我们可以看到,形式科学更像一个个工具,而自然科学与社会科学则更多的在于预测。因此我认为,自然科学与社会科学中,像书中所述,科学革命多是世界观的改变,而形式科学中的范式转变更多影响的是方法论。

范式理论告诉了我们自然科学发展的真实图景,上述对于社会科学和形式科学发展模式的思考也不乏趣味性。当我们看到科学以外的事物发展时,会不会产生另一种全新的诠释方式呢?这或许能帮助我们触及到事物更深层次的本质,解构出我们想要的东西。

而范式理论对于科学家们又能起到什么指导作用呢?我认为完全没用。他们该研究常规科学还是研究常规科学(本段不出现在最后提交的作业中)。

《结构方程模型的原理与应用》的读书笔记

《结构方程模型的原理与应用》是学习结构方程的必读的著作。全书总共11章。

第一章:结构方程模型概说。

上个世纪,影响社会科学研究最大的统计方法是因素分析和回归分析。潜在结构因素分析模型和路径模型的结合,形成了结构方程模型。结构方程模型是用来处理复杂的多变量研究数据的探究和分析的方法,已经成为现在社会与行为科学中最重要的一个统计方法范式。

SEM的特性1能对抽象的构念进行估计和检定。对于变量因果关系的证明或构念内在结构的确认,均有赖于研究变量的性质与内容的厘清,并清除描述变量的假设性关系,由此提出具体的结构性关系的假设命题,寻求统计上的检证来确认,结构方程模型。

SEM的特性2是模组化分析的应用。模组化应用的策略:1单纯的验证,2模型的产生,3替代模型的竞争比较。此举提供了一套严谨的程序。

SEM的特性3必须建立在一定理论的基础上。SEM以协方差的运用为核心,适用大样本的分析。

SEM对于统计显著性的依赖程度低于一般统计。

结构方程模型的执行的过程具体来说有:理论发展、模型界定、模型识别、抽样与统计、参数与估计(模型拟合评鉴、模型修饰)、讨论与结论。

SEM的执行重点:

a. 模型的描述与设定。重视概念路径图的运用。

b. 资料的准备,SEM分析最好的是协方差数据。原始数据而非矩阵数据有助于多阶段SEM分析的进行,对数据进行运算时,必须说明数据的正态性及峰度等。

c. 报表的整理与分析。这包括两个部分,过程性资料和最终解。在估计方法的选择上,最常用的是最大概似法。在磨合你和指数的选择上,一个是绝对拟合,一个是增量你和,绝对拟合使用GFI,增量拟合使用NNFI。参数的报告上,要说明参数的合理性、显著性检验、标准化解。

d. 替代模型的使用,替代模型分为演绎取向和归纳取向。

第二章:结构方程模型的组成。

结构方程模型由变量和参数构成。

变量分为连续变量和分类变量,结构模型的基本单位是连续变量。

连续变量有两种形态,测量变量与潜在变量,在SEM中,测量变量为长方形,潜在变量为椭圆形,潜在变量必须有两个以上的测量变量估计得到,潜在变量具有测量误差,即无法被潜在变量解释的部分。连续变量还可以分为内生和外生,内生即受到其他影响,外生反之。

参数即未知而需要推断的数据。在SEM中,参数与潜变量是讨论的重点。参数还可以分为自由参数、固定参数与限定参数。对于不被估计的参数设置为0,为固定参数。限定参数多用于多样本比较,其数据由估计得到。参数还有直接与非直接关系两种,用→表示。而非直接采用双箭头表示。

模型参数与方程式。完整的SEM模型包含测量模型与结构模型。潜在变量与观察变量的强度采用lambda,即因素载荷,外源与内生潜在变量之间的关系用gamma表示,内生潜在变量之间的关系用beta表示,有gamma与beta调试的即是结构模型。Delta与epslon分别表示外源观察变量与内生观察变量被潜在变量解释不完全的测量残差,而theta则为内生潜在变量无法被完全解释的估计误差。

在SEM中,如果单独使用测量模型,即为验证性因素分析,即是一个传统的路径分析模型。

共变结构关系的分析是SEM最主要的核心概念,涉及复杂的变量关系的探究时,一个重要的基本原则是如何将这些共变关系以最符合理论意义且最简单扼要的方式加以界定,最能够符合实际观测的数据结构。

等值模型即不同的SEM模型具有相同的模型拟合度。

第三章:参数估计与识别问题

结构方程模型最核心的计量程序就是参数估计。

决定模型识别性的具体步骤是计算用以产生共变结构的观测值数目,衡量识别性的必要非充分的识别计算条件是T法则,T值代表模型中的自由估计参数数目。T与三个判断法则,过度识别、充分识别、识别不足。

过度识别

饱和模型,完美你和,无法评估整体模型的适切性

充分识别

可以利用不同的参数估计方法,对于参数进行优化的估计,找出最佳解

识别不足

无法顺利进行,只有将部分参数设定为定制,才可以进行

虚伪B矩阵法则,是反映模型识别性的充分条件,若符合不必计算识别数值。B为回归系数矩阵。

B矩阵呈现三角形状态,呈现对角线状态,为递归模型,饱和法则。

对于无法识别的情况,尽量简化SEM模型,如果持续存在,将潜在变量的残差设定为1,或是将信度理想的测量模式的参数设定为1,或去除不良的变量,或许能够获得识别。

测量模型决定的是整体模型中的外显变量与潜在变量之间的关系。对于个别测量模型的识别中,设计到潜在变量的量尺的问题,有的以潜在变量的方差设定为1,有的制定一个变量的因素载荷为1。

结构模型的识别度,结构模型的识别性与测量模型识别性是两个独立的判断过程,它主要牵涉结构模型的结构参数的设定,无关乎测量模型的参数设定。结构模型的识别性决定于内生变量之间的关系的假设。非递归模型的谁别设计到过多参数,无法识别,必须使用别的策略使模型能够识别。

潜在变量尺度的设定上,外源潜在变量设定为方差为一个常数,通常为1,对于潜在内生变量是将其中一个测量变量与潜在变量的因素载荷设定为常数,为1。内生变量的尺度策略有三种,内生潜在变量的方差为1,进行设限的参数估计程序,其次是内生潜在变量的方差设定为1,仅用于递归模型的设定,再次是取内生潜在变量的因素载荷为固定参数,进行参数估计后,将潜在变量尺度固定再进行潜在变量尺度的方差估计。

参数估计,相关系数。协方差与相关系数之间相差一个标准化关联系数。

SEM共变推到有四大定理,某一个变量与自己的共变即等于该变量的方差。

经过线性整合后的变量的协方差为clip_image002定理3、定理4省略。

观察变量的方差等于各观察变量的因素载荷的平方加上误差项的方差。

参数估计的策略,加权最小平方策略,无加权最小平方法,一般化最小平方法,最大概似法(最常用的参数估计法,变量正态性),渐进分布自由法(无须正态,处理的丰台,必须使用原始数据,样本高达2500),最大概似法需要500样本,低于500,一般化最小平均法,小样本(6--120)使用Yuan-Bentler‘s T,违反正态至少需要2500的样本。

对于计算中出现的不正常终止即正定问题,原因有,矩阵中对角在线的数据(方差或自身相关系数)不为正值、对角在线的数据是其他元素的基本条件(违反三角不均等条件)、举证不符合非奇异的要件(导致分母项为零)等。

第四章:模型拟合评鉴

在完成了参数估计之后,结构方程模型分析的另一个重要工作是进行模型的评估与检验,以决定研究者所提出的假设模型是否能够用以描述实际观测到的变量关系,此过程称为模型拟合评鉴。拟合评鉴的方法是用不显著的卡方值来反映理想的模型拟合值。

在SEM分析中,必须小心谨慎处理测量的信效度的问题,即研究者在进入模型评鉴阶段时需要解决测量的问题。SEM的使用者不但必须谨记统计方法学本身的限制,也必须避免过度推论的陷阱。

在SEM中卡方值是由拟合函数所转换而来的统计量,反映了SEM假设模型的导出举证与观测矩阵的差异。在卡方检验的概念下,自由度越大的模型在卡方统计上处于不利的地位。

卡方自由度比,用来进行模型间拟合度的比较。卡方自由度比越小,模型拟合度越高,一般而言,卡方自由度比小于2时,表示模型具有理想的拟合度。英文单词是Normal TheoryWeighted Least Squares Chi-Square/df

模拟拟合指数,GFI、AGFI,GFI为拟合指数,通常可以认为是可解释的变量,AGFI为调整后的拟合指数,两者0到1间,越接近1越好。PGFI指数,是GFI的一个变形,体现参数的多寡,反映的SEM假设模型的简效程度,越接近1,模型越简单,良好的模型一般都在0.5以上。NFI与NNFI指数,一个为正规拟合指数,一个为非正规拟合指数,这两个指数是利用嵌套模型的比较原理计算出来的一种相对性指数,反映了假设模型与一个观察变量之间没有任何共变假设的独立模型的差异程度。独立模型是一种拟合状况最不理想的模型,反映了所有的观察变量之间没有任何关联,自由度最大。IFI是一个增量拟合指数,用来处理NNFI波动的问题以及样本大小对于NFI指数的影响。IFI、NFI、NNFI都会介于0-1间,数值越大拟合度越好,系数值大于0.9认为拟合理想。

替代指数与模拟拟合指数的主要不同在于替代指数不是以卡方统计量的假设检验进行模型拟合度的评估。替代性指数不在关心虚无假设是否成立,而是去直接估计假设模型与由抽样理论到处的卡方值的差异程度。非集中性参数NCP表示的是计算SEM模型估计得到的卡方统计量,距离理论预期的中央卡方分布的离散成都。模型越不理想,距离中心点的卡方分布越远,越接近0的NCP表示越好。RMSEA为平均概似平方误根系数,RMSEA不受到样本数大小和模型复杂度的影响,当模型趋近完美拟合时,指数接近0,一般认为低于0.06才是一个好模型,小样本时慎用。CFI指数,反映了假设模型与无任何共变关系的独立模型差异成都的量数,也考虑到被检验模型与中央卡方分布的离散性。越接近1,拟合度越好,0.95为通用的门槛,在小样本中表示稳定。ECVI和AIC指数,这是一个期望交叉效度指数,反映了再相同的总体下,不同样本所重复获得同一个假设模型的拟合度的期望值,是用来诊断模型的复核效化的良好指数,其值越小,模型拟合度越好。ECVI、AIC、CAIC指数越小,模型越简效。CN指数,特别的拟合统计量,关键样本指数,说明样本规模的适切性,即若要产生一个适当的模型拟合度,所需要的样本统计量为多少,一般认为200是一个门槛。

残差分析指数,SEM分析提供两种残差数据,非标准化残差和标准化残差,非标准化残差就是假设模型与观测数据之间差距的原始量数,可以用来了解其具体意义,但是不利于相互比较。残差反映了不良拟合的成都,SEM提供残差均方根指数RMR和标准化残差均方根指数SRMR来反映理论假设模型的整体残差。其中RMR越小,模型拟合度越小,SRMR低于0.08,表示模型拟合度佳。

以上是关于《科学革命的结构》读书报告的主要内容,如果未能解决你的问题,请参考以下文章

读书报告 | 《数据结构与算法分析》200110900116

《创新者》读书笔记——第五周读书笔记

《结构方程模型的原理与应用》的读书笔记

“厕所革命”模块化厕所大有可为 !

智能革命之读书笔记

读书印记 - 《创客:新工业革命》