分类:教育系统科学中心第一次活动纪要

来自Big Physics


本次活动主要目的是整体介绍一下“深层教和学研究”的主要思想、项目和方法。以下是各个部分讨论的概要。

主持人:吴金闪

时间:2020年11月4日(周三)晚上7-9点。

地点:科技楼B604,ZOOM(588 856 8886)

周亚,结合学院研究布局来定位中心的研究工作和将来的实践工作

吴金闪,深层教和学研究的理念方法和项目

介绍了知识网络(概念联系),知识的层次,教和学的层次等概念,并且提出,应该关注深层教和学,这种真正促进创造提升迁移能力的教和学,而不仅仅是信息提取记忆程序性计算的重复练习等浅层学习。在理念的基础上,吴金闪还介绍了从标注了教和学的层次的学科知识网络的构建(人工构建、构建算法、网络上的学习顺序算法和检测算法),以及深层教和学的基础研究(行为和脑科学测量、深层教和学是否可以提高问题解决能力和创造力、当前教师和学生的教和学的层次)两个方面,介绍了大概有哪些具体研究问题,大概怎么做。

更多深层教和学研究的文档见:深度教和学文档

朱志勇(吴金闪代讲)教和学的层次的标注和量表

展示了教和学的层次编码内容、编码原则和编码流程,编码例子。以及后续研究计划,包含相关的理解型学习量表(和编码交叉检验)、问题解决能力和创造力量表,以用于后期的行为编码(人工和机器学习标注)和统计分析。

陈路遥 多层次类比思维的习得,脑活动和行为

吴俊杰 浅层、深层学习和思考的实验研究,脑活动和行为

关于如何定义理解的分歧

吴俊杰:

我先把昨天我们讨论的分歧点,和今天一些更新的思考写下来,后面在把背景和要做的事情补充上。

昨天我们讨论的分歧是,可否把正确回答沃森测试的被试的脑激活与错误回答的相减,得到的脑区(也可能是脑网络、或者激活模式,暂以脑区来简化表述),操作性定义成理解的脑区,并把该脑区的活动强度作为理解程度的脑指标。

认为可以的理由是:答对了的人被认为是理解了的,因为只有理解了才能做对(暂不考虑能蒙对的情况);答错了的人被认为是没理解的,因为没理解到位才会答错(也只考虑理想情况);所以前者减后者就是理解的脑区,逻辑上说不会有其他东西。

认为不可以的顾虑是:他们存在差异的脑区,可能不仅包含表征知识结构的脑区,还包含推理执行的脑区执行控制的脑区。如果“简单粗暴”地把差异脑区作为理解的脑区,那意味着把理解扩大成正确完成推理的过程、这更像是一个问题解决的过程,而不是我们原先所说的,理解是概念和概念之间的联系、是知识结构的表征。

我区分出的知识结构的表征,还包含推理的执行执行控制三个部分可能不太好理解,我举个登山的例子来说明。把登山类比成条件推理,假设登山也需要知识(类比知识结构的表征),山上是阔叶林、针叶林、雪,可能需要的知识结构不一样(类比于条件推理需要if then的知识,三段论推理需要别的知识)。除了知识以外还需要体力(类比推理的执行)来实施登山知识中的做法,在实施的过程中需要意志力(类比执行控制)来坚持目标。有些运动员可以爬到山顶,有些没有(分别类比正确和错误回答条件推理的问题)。

那么我们比较正确和错误回答问题的被试的脑活动,就好比在比较这到达和没到达山顶的运动员之间的差别,这个差别包含了登山知识体力意志力。其实我们更关心的登山知识,最好是让运动员(被试)在山顶回望自己登山成功的诀窍(不爬山的时候其实也行),而不应该让他们一遍又一遍地登山,因为这样很需要体力和意志力,后两者需要的努力更强,会掩盖掉登山知识的努力。对应过来就是,推理执行和执行控制会掩盖掉知识结构的表征。我用登山作例子是为了突出后两者所需要的认知强度会掩盖掉前者,登山的例子也可以换成走迷宫。理解的内涵应该是被试能够在迷宫出口回顾/再现(他所理解的)迷宫的结构,不应该包含是走迷宫的体力和意志力。

推理的执行可能存在一部分跨领域的一致性,也就是三段论推理和条件推理也有共同激活的脑区,尽管二者有着不同的知识结构;推理的执行可能也存在一部分领域特异性,已有的脑成像研究认为社会推理、预警推理、抽象推理使用的脑区有相当的不同。 执行控制是指在人们协调自己思考与行为使之与目标保持一致的能力,这与智力高度相关,脑区有大量重叠,有相当程度的领域一般性。

如果接受推理过程存在if then知识结构的表征推理的执行执行控制,而且也接受理解的是定义形成和维持知识结构的表征(而不是三者混合),那么正确和错误回答的被试的脑活动之差,就不单纯地是理解,而且理解更可能被后两者所掩盖。如果后两者特别强烈的话,那么找出来的脑区更可能是推理的执行执行控制的脑区,也就是流体智力的脑区,而非理解的脑区。

吴金闪:

你这个困惑的问题在于:第一、没有考虑两类被试间的对比;第二、没有考虑这个研究的后续研究(这是为后续研究不同学习方法的效果服务的)。

回到实验设计。我们有两个逻辑内涵一样的问题:具象题[math]\displaystyle{ C }[/math]和抽象题[math]\displaystyle{ A }[/math]。具象题[math]\displaystyle{ C }[/math],例如,规则是“喝酒的人必须大于18岁([math]\displaystyle{ W=1\rightarrow Y\gt 18 }[/math])”,被试需要选择把违反这个规则的人找出来,备选的稽查对象属性是“喝酒([math]\displaystyle{ W=1 }[/math])、喝水([math]\displaystyle{ W=0 }[/math])、12岁([math]\displaystyle{ Y\lt 18 }[/math])、20岁([math]\displaystyle{ Y\gt 18 }[/math]) ”。抽象题[math]\displaystyle{ A_{1} }[/math],例如,规则是“穿红衣服的人必须大于14岁([math]\displaystyle{ R=1\rightarrow Y\gt 12 }[/math])”,被试需要选择把违反这个规则的人找出来,备选的稽查对象属性是“穿红衣([math]\displaystyle{ R=1 }[/math])、穿黄衣([math]\displaystyle{ R=0 }[/math])、12岁([math]\displaystyle{ Y\lt 18 }[/math])、20岁([math]\displaystyle{ Y\gt 18 }[/math]) ”。这两个问题的区别在于,前者和生活经验很接近,后者和生活经验很远。甚至,我们可以把抽象题改成,[math]\displaystyle{ A_{2} }[/math],规则是“喝酒的人必须大于14岁([math]\displaystyle{ W=1\rightarrow Y\gt 14 }[/math])”,被试需要选择把违反这个规则的人找出来,备选的稽查对象属性是“喝酒([math]\displaystyle{ W=1 }[/math])、喝水([math]\displaystyle{ W=0 }[/math])、12岁([math]\displaystyle{ Y\lt 18 }[/math])、20岁([math]\displaystyle{ Y\gt 18 }[/math]) ”。

我们来看这样的两组被试:第一组[math]\displaystyle{ G_{1} }[/math]两个题([math]\displaystyle{ C,A }[/math])都答对了,第二组[math]\displaystyle{ G_{2} }[/math]都答对具象题([math]\displaystyle{ C }[/math])但是但错了抽象题([math]\displaystyle{ A }[/math])。其实还有另外两组被试两题都答错了,以及具象题答错抽象题答对。这两组我们暂时不管。

我们问这两组被试可能是什么原因造成的?

为了回答这个问题,我们注意到,从逻辑内涵上说,[math]\displaystyle{ C,A }[/math]问题完全一致:规则是一组形如[math]\displaystyle{ P=1\rightarrow Q=1 }[/math]的条件推断,如果出现[math]\displaystyle{ P=1\rightarrow Q=0 }[/math]则违反了这个规则,或者出现[math]\displaystyle{ Q=0\rightarrow P=1 }[/math]则也违反了规则(因为我们可以得到[math]\displaystyle{ Q=0\rightarrow P=1 \rightarrow Q=0 }[/math],矛盾)。更进一步,这相当于说,[math]\displaystyle{ P=1\rightarrow Q=1 }[/math][math]\displaystyle{ Q=0\rightarrow P=0 }[/math]是等价的(因此,[math]\displaystyle{ Q=0\rightarrow P=1 }[/math]违反规则)。这被称为原命题等于逆否命题。于是,自然我们就发现,需要稽查的对象的特征是[math]\displaystyle{ P=1 }[/math](查查是否[math]\displaystyle{ Q=1 }[/math])和[math]\displaystyle{ Q=0 }[/math](查查是否[math]\displaystyle{ P=0 }[/math])。另外两种情况就算查了,无论答案是什么,都不违反规则。

于是,我们得到一个结论:如果被试实质上知道了并且能够应用“原命题等于逆否命题”的知识,则无论抽象题和具象题都应该能做对。因此,如果出现了[math]\displaystyle{ G_{2} }[/math]被试,则肯定是这组被试不满足知道了并且能够应用“原命题等于逆否命题”。

那么,这组[math]\displaystyle{ G_{2} }[/math]被试为什么又能够把具象题[math]\displaystyle{ C }[/math]答对呢?因为具象题和生活经验非常接近,因此,另一个答对题的渠道是直接利用生活经验:对于喝酒问题,当然不到年龄[math]\displaystyle{ Y\geq 18 }[/math]的要检查,然后喝酒的[math]\displaystyle{ W=1 }[/math]的也要检查。也就是说,[math]\displaystyle{ C }[/math]可以不依靠知道了并且能够应用“原命题等于逆否命题”来回答对。

当然,[math]\displaystyle{ G_{1} }[/math]组被试肯定得知道了并且能够应用“原命题等于逆否命题”,尽管其在回答具象问题[math]\displaystyle{ C }[/math]的时候不一定用了这个思维和决策方式。

因此,我们看到,对比这两组被试的脑活动,例如先在组内做一个具象问题和抽象问题的对比,然后组间对比,可以探测到知道了并且能够应用“原命题等于逆否命题”的脑活动。当然,实际实验中,组内对比做减法的时候[math]\displaystyle{ G_{1} }[/math]被试不一定就能够完全消去经验决策的脑活动(原则上两个任务都在用经验决策,但是还会有剩余其他思维的差别),[math]\displaystyle{ G_{2} }[/math]被试也不一定就能非常好地保留理性决策通道的脑活动(原则上,具象任务激活理性决策的程度应该比抽象任务激活程度低,但是,也有可能两者激活强度类似)。理想条件下,[math]\displaystyle{ G_{2} }[/math]减完了就是噪音,[math]\displaystyle{ G_{1} }[/math]减完了就是理性决策通道的激活信号。这样就找到了知道了并且能够应用“原命题等于逆否命题”的脑活动。

当然,也可以做另一种相减,就是[math]\displaystyle{ G_{1} }[/math]的抽象任务,减去[math]\displaystyle{ G_{2} }[/math]的抽象任务。假设前者理性决策通道激活强,后者弱,则减完之后正好也能找到知道了并且能够应用“原命题等于逆否命题”的脑活动。

现在,回到吴俊杰的问题:我们能不能区分开知道了能够应用“原命题等于逆否命题”的脑活动?我们要说明:这个区分对于后续研究没有意义。我们将来的研究关注的问题是:从行为和脑活动上,教会知识生成器(不同层次的,例如在这里记住可以得到结论的“原命题等于逆否命题”,或者更进一步,从集合论来得到“原命题等于逆否命题”)和直接记住答案(在这里,稽查[math]\displaystyle{ P=1 }[/math][math]\displaystyle{ Q=0 }[/math]的人)在??提成??问题解决上有没有区别。于是,我们关注的就是知道了“和”能够应用“原命题等于逆否命题”这个整体,而不是分开。

更进一步,我们把“知道一个知识但是不会应用这个知识”和“不知道这个知识”都当做不理解这个知识。只要理解到位,肯定是会用的。这也正好是知道到运用的距离所要研究的问题:是不是通过提高对知识的理解,可以帮助学习者缩短从知道到运用的距离。

再退一步,既然这个区分对与将来的研究没有意义,如果担心这个知道了能够应用不等于理解,那直接叫做解决Wason测试问题,或者说知道和能够应用“原命题等于逆否命题”的脑区好了。有什么区别吗?对于自然科学家来说,这个区别没有任何意义:我们只关心能够测量的区别,仅仅存在于理念上的不能测量的区别没有任何意义,这仅仅是一个名词之辩,而不是事实之辩。

吴俊杰:

我们的共识是要研究的知道了能够应用,对于“知道一个知识但是不会应用这个知识”和“不知道这个知识”都当做不理解这个知识,我也是认同的。我想指出的一个混淆的东西是应用(do)。我暂且把知道了能够应用分别说成know whatknow how to do(这都属于知识结构表征的,前者更偏向陈述性的,后者更偏向程序性的),但我们让被试执行沃森测试,实际上更大强度调用了do的脑区。[math]\displaystyle{ G_{1} }[/math][math]\displaystyle{ G_{2} }[/math]在抽象题目上的差别,不仅包含了know whatknow how to do更多地还包含了do,如果用这个差异的脑区很很大可能是do的脑区,如果把它当做理解的脑指标,那就好像是把姚明手腕肌肉的活动强度当做他乒乓球知识技能的指标。

另外,[math]\displaystyle{ G_{1} }[/math]的抽象题和具体题相比,应该是把if then表征(know what和know how to do)的脑区减掉了(如果[math]\displaystyle{ G_{1} }[/math]在具体任务中也是使用了和抽象题目一样的逻辑,而且两者的表征强度相近),剩下的差别是do的脑区。

我认为我们感兴趣的并不是Wason测试(或者说条件推理)的全部过程,而是以Wason测试作为工具来考察人们头脑的if then知识结构(包括know what和know how to do),有和没有这套知识结构的差别脑区,并以该脑区作为理解的脑指标。至于Wason测试的过程中有很重的do的成分,这部分可能在其它不涉及if then知识结构的推理中也要用到,甚至是更一般的智力任务也用到,这对于考察条件推理脑机制的研究来说,这很OK,没有问题,这就是他们的研究对象,但对于我们考察理解、考察if then知识结构的研究来说,这是一个很大的混淆。

写到这里,我突然在想,吴老师您关心的是不是就是do的脑区,您认为这是理性渠道的激活。哪怕这个脑区是在do三段论推理(而不是条件推理),在您的框架内都是理性思考,至于他们思考所依赖的知识结构是if then 还是三段论,那不是您这里所关心的。是这样的吗?举个不太恰当的例子,把大脑比作一个工厂,您关心的是这个工厂机器轰鸣声(do)所在的地方,至于机器在加工生产什么(if then 或者三段论)那无所谓,只要它不是从别家工厂的仓库里未经加工地搬运过来贴牌出售就好。后期您想看这个机器轰鸣声强度来衡量这家工厂自主生产的能力。是这样的吗?

如果是这样的话,前人有关推理的研究已经做了很多,他们都是没有区分推理只是的表征和推理过程,而是把他们混在一起来看,这些研究发现的脑区跟智力活动也是密切相关的。如果我们不关心具体的知识结构的表征(if then、三段论、或者更低层的集合论),只关心是否进行“理性思考”(这不是个认知心理学的词汇,暂且这么用),那么是不是就可以选取前人推理研究中提到的那些脑区,以它们的活动作为理性思考(而不是对只是结构的表征[我理解的“理解”])的脑指标。

那这样的话,一个很直接的问题就是,我们想研究理性思考、理解型学习,但却选取了流体智力的脑区作为脑指标。然而,流体智力很大程度是天生的、随年龄变化,教育的目的如果是为了提高流体智力,那可能有点困难。我感觉应该把研究对象放在知识结构上面(包括know what和know how to do),这更多是晶体智力部分。

再回到学科哲学的层面(名词之辩和事实之辩的问题),我感觉认知心理学和物理学背后的哲学可能还不太一样,我们在做实验前要从概念上界定清楚这个东西是个啥,从信息加工角度去看它是个什么,也就是先有理论,才能理解结果是什么意思。物理学有些时候是把这个事实找出来(量子力学中的粒子到底怎么走),确定这个事实是客观存在的,至于理论怎么理解那就看波函数,波函数说粒子同时穿过两条缝,那么我们人类的大脑能理解得了是这样,不能理解得了也是这样(宇宙没有义务让人们理解它,不记得从哪听来的,好像很有道理,哈哈哈)。我感觉认知心理学和物理学的这个差异是因为人的认知和脑活动太复杂了,需要用计算机类比才能更好地去理解,否则出来的东西不知道是什么,我们也写不出公式(计算神经科学),就算写出来了,与实际结果拟合的时候也有很大的误差。我提的这个信息加工模型可能不完美,模型中有很多被批评的地方(比如,理解/知识生成器竟然不包括CPU的计算过程),这或许可以通过增加算法(知识表征)和CPU(流体智力)的交互方式来进行修正,或许需要全部推翻重新构建一个信息加工的模型,但不能没有一个模型。没有一个模型(名词之辩,概念层面辨析清楚了它到底是什么),我们才能理解出来的这个结果是个什么事实(事实之辩)。

我仔细看过了大家的每条消息,感谢大家贡献的想法。确实,我和吴老师在理解的概念定义上存在分歧。我确实试图在厘清理解的概念性定义,而不满足于目前的“继续设计不同层次的问题,一直到那些真的需要理解的问题为止”的操作性定义。至于能否给出更好的操作性定义,以分离出纯粹的理解(也就是概念定义上的理解的内涵,我目前认为它是获得知识结构的表征,该表征中当然也包含运用知识结构的知识),我目前有一些想法,准备等这个话题讨论结束之后(也就是我所说的目前这个操作定义的局限被大家理解之后,或者我的认识被改变重新接受现在这个操作性定义,或者在有限的讨论轮次内我们暂时搁置这个话题)我再整理出来,大家看看是否有更好(也有可能认为没有必要,哈哈哈)。

路遥师兄说到的,理解需要依赖注意、记忆和执行控制等,这我是认同的,就像算法运行依赖CPU的计算和电源的供电一样。不过如果有人摸着CPU/电源的发热程度告诉我,这作为理解程度的指标来进行后续研究,我想这很少有人会同意。我想,大脑中应该有地方是表征算法的(也就是知识结构,以及如何将知识结构运用到不同情境中的知识),也有地方是负责计算(CPU)、还有负责注意的(电源)。沃森测试是一个推理任务,很费脑子(CPU和电源),如果简单粗暴地把正确答题的被试与错误答题的被试相减,得到的脑区最亮的可能是CPU和电源的脑区,表征算法的脑区就在多重比较校正中就看不到了。如果把CPU和电源的脑区当做理解的脑区,这是有问题的。

吴老师说这是一个名词之变,退一亿步来说,可以把这个脑区叫做“条件推理认知和应用脑区”,尽管退了这么多步,可能还不太准确,应该这样表述可能更好“这个脑区参与条件推理认知和应用”,言外之意是它还可能参与其它“费脑子”的活动,比如说三段论推理,瑞文测验,数学计算等等(如果这个脑区的角色是CPU和电源的话)。如果我们把这个脑区的活动强度,作为一个指标,看它能否辨别另外一组被试在另一个版本的条件推理任务的成绩,这也很有可能可以做到,甚至还能辨别另一组被试在三段论推理,瑞文测验,数学计算中的成绩,但这只能说明他们在任务中费了多少脑子(CPU和电源的功耗,认知努力程度)。认知努力越多,成绩越好,这也是很合理的,但并不能说明他们认知努力越多,理解(知识结构的表征)就越好啊。

如果吴老师并不是想要考察理解(知识结构的表征),而是要考察认知努力程度(CPU和电源的功耗),那这么做是OK的。只是,目前有很多做推理、智力的研究,在元分析中选取一两个脑区,用其活动强度的指标去辨别一组被试在条件推理任务中的成绩,那也很有可能会成功(有待看文献是否已经有人做了这点)。不过,这么做新意在哪里呢,在哪方面拓宽了我们人类的认知边界呢?会不会有一种,原先我们人类知道的还是知道,原先不知道的还是不知道的感觉?

另外,吴老师说凭什么我们就得听没有实验检验过的理论和概念?但是您提出的知识生成器的不也是未经实验检验过的理论和概念吗?还有知识生成器的生成器。:)

分离出知识结构表征的脑区的新方案

或许可以用这样的方案来更好地找到知识结构表征的脑区。

  1. 正确解答后在头脑中维持解题思路(包含know what和know how to do,但尽可能少的do)
  1. 科学概念的表征
    1. 给一组被试一篇物理知识的文章,让他们读。
    2. 再给他们相应的测试题目,得到一个测验分。
    3. 把重要概念拿出来,让被试评估它们两两之间的距离,构建网络,把这个网络和专家给出的概念地图的网络做相似性分析,

本分类目前不含有任何页面或媒体文件。