分类:理解型学习和机械式学习对比

来自Big Physics


研究背景

人类的学习可以大概分成机械式学习(通过重复训练达到能够回答正确,像小狗训练学习)、理解型学习(通过抓住共性、联系生活经验等方式形成概念concept formation,通过把新的概念联系到已经学过的概念来同化概念concept assimilation)两种。有理由相信理解型学习的学习效果更好和效率更高。但是,在实际的学习中,学习者很多时候用的是机械式学习,甚至很多有关学习的研究也是把“重复训练改变行为”来当做学习来研究。很有可能,两者的差别不仅如此,甚至会造成大脑结构上的不同,乃至形成问题解决能力的不同。

本研究的主要目的就是考察机械式学习和理解型学习在直接学习效果(回答问题的反应时间、正确率、遗忘曲线)、迁移学习能力、问题解决能力(后两者见知道到运用的距离)等行为上的异同,以及在脑活动上的异同。如果在行为和脑活动两者之间还能建立一定的联系,例如从脑活动看出来,能够初步解释为什么会有某种行为上的相同或者不同,那就更有意思了。甚至,可以进一步从脑活动本身来讨论,那为什么这些脑活动上的这些不同正好就造成了这些行为上的不同(前面的为什么其实是表面解释,例如某个区域的脑活动在两种学习之间有明显的不同,这个区域通常认为是属于某种功能的;后面这个为什么关注的是,为什么这个区域的活动的不同,正好就形成了这样的效果)。

向上,这个研究是为“理解型学习”找到脑活动层面的基础,并且同时检验“理解型学习”在直接和间接学习效果上和“机械式学习”的不同,于是为推广或者抛弃理解型学习做准备。向下,这个研究可以给脑科学的研究提供新的方向:高级认知活动中的脑活动模式,以及如果有必要的话对这个模式的进一步分解研究。因此,本研究以及类似的研究是学习科学(顺便,我尽量避开教育学这个太大的词,而是用学习科学或者教和学,这小很多很多的词)和脑科学之间的桥梁。

当然,实际上,不同学习方法的效果可能和学习者有关。因此,我们可能还需要通过实验操纵得到不同类型的学习者(意义学习者 vs. 机械学习者),进而考察他们一段时间之后在测试任务上的行为表现和大脑活动方面的差异。

以下是几个相关研究和我们自己的研究问题、研究思路。

研究项目

理解型学习和机械式学习短期学习效果的对比

Karpicke等人的研究发现[1][2]从学习之后回答问题的准确率上,重复性提取信息的效果超过概念地图制作。假设概念地图制作确实促进了理解型学习,则,意味着机械式学习超过了理解型学习。

从直觉上,从个人体验生,显然理解型学习是超过机械式学习的。但是,这个优势是否在短期学习效果、记忆性考试题上也是如此,就不好说了。一般来说,理解型学习的效果体现在进一步学习和创造知识的能力和学习负担方面,而这些需要比较从比较长期的学习来看。但是,是否在短期学习效果上,只要把考试题换成需要一定理解的考试题,和机械式学习(就算所谓的理解型考题的答案也可以被完全背诵)对比,也会具有一定优势呢?

当然,长期的,跟踪性的或者至少以一门课程为内容和时间单位的研究也是有意义的。例如Toward a Neurobiological Basis for Understanding Learning in University Modeling Instruction Physics Courses

Karpicke等人具体研究

阅读一份材料然后做题。被试分成几种情况: 读五分钟阅读材料,重复四次 (SSSS), 重复三遍最后一遍做一下小测验(SSST),读一遍做三次小测验(STTT),第一遍做概念地图(S-CM)后测安排在学习之后马上测以及一周之后测两次。

实验研究发现,STTT效果最好。

词的理解型和机械式学习

我们先用词为素材来对比理解型学习和机械式学习。

我们从无联系、有联系的多个词义的机械式和理解型学习和是否运用词义和词的子结构之间的联系来学习两个方面来做理解型学习。

习得新词语义可激活奖赏系统

Ripolles et al. (2014)[3]让36名被试在核磁共振扫描下完成词汇学习任务和赌博任务。在词汇学习任务中,给被试呈现夹杂人造词的英文句子(比如句子1:Every Sunday the grandma went to the Jedin),这些人造词会在多个句子中反复呈现,其中一部分词是可以获得词义的(M+),它们在不同句子中的表达一致的意思;而另一部分词是不可获得词义的(M-),它们在多个句子中表达了不一致的意思。

他们发现被试在第二次见到新词、且顺利学得词义的时候(相比于没学得词义时:M-,M+没学会),会激活与奖赏密切相关的腹侧纹状体(ventral striatum, VS),而且这样的激活与被试在赌博赢钱时候的激活很相似。他们还发现被试顺利获得词义时VS与皮层上的脑区存在更强的功能连接。此外,他们还发现词汇学习效果越好的被试,其VS与皮层上脑区白质纤维束的径向弥散(radial diffusivity, RD)越小。RD越小,代表神经元髓鞘化程度更高,可以更好地传递神经信号。

该研究表明:人类在“理解世界”时,伴随着自我奖赏过程。

增加多义词的M+条件。并且按照这几个词义之间的关系,做更深入的研究。例如,一个目标词出现了两个词义,这两个词义都通过多个例子来展示和学习,但是这两个词义可能有非常好的联系(Mb1,例如,引申义和本义),或者基本没联系(Mb2),或者甚至意义冲突的(Mb3,例如,窝心表示暖心和郁闷两个含义),看一看在这些不同情况下,学习成果和脑活动两个方面的异同。这样的研究有可能可以进一步了解意义学习(有联系的理解型的学习)的效果和神经机制。

有待思考的问题:

  1. 被试在不同多义词上行为和脑活动上的差异意味着什么?比如说,Mb1和Mb2,前者的两个义项有联系,后者没有,这会使得被试的认知负荷(至少在工作记忆层面)存在差异,这个差异意味着什么?
  2. 效果上,除了准确率、反应时间、遗忘曲线,还可以用什么方式来测量?例如,迁移性:考察一个类似的场景,看一看是否被按照理解型学习来训练的被试能够更好地学习到;或者测量问题解决能力[4]

义项间意义相关的多义词更容易学

Zhang et al.(2018)[5]研究了人类学习第二语言中多义词的认知现象。他们让被试学习人造的单义词(Mo)和多义词,其中分别多义词分为义项间语义相关的词(Mb1)和义项间语义不相关的词(Mb2),并用再认任务测试被试在学习过程中、在学习后第1天、在学习后第7天的学习效果(反应时越短、正确率越高,学习效果越好)。他们发现被试在这三个学习阶段都表现出语义相关的效应(即,Mo效果最好、Mb1其次、Mb2最差),此外还发现Mb1在学后第7天的遗忘较少(与Mo相近),但Mb2遗忘很多。他们认为这个结果支持了连接模型(connectionist model)[6],表明新旧词义间存在联系时会促进二语学习者将新义项整合到词汇语义网络中。

此外,他们实验室Lu, et al. (2017)[7]的研究考察了被试抑制能力与多义词学习之间的关系。他们用Stroop效应衡量被试的抑制能力(e.g., 要求被试忽略字的颜色,说出墨水颜色;相比于红色的“红”,被试在红色的“蓝”的反应时越长,Stroop效应越大,抑制能力越低),他们发现抑制能力越强的被试学习二语词汇的效果越好,而且这种效应在多义词的第二义项上比多义词的第一义项和单义词更强。他们认为第二语言中多义词的新义项的习得,依赖于被试的抑制能力对该多义词旧义项的抑制。

需要注意的是,Lu et al. (2017)[7]的研究并未区分多义词两个义项的语义相关与否(有可能大部分都是语义不相关),从而得到抑制能力可以预测学习效果的结果;然而Zhang et al. (2018)[5]将多义词区分为两个义项的语义相关的和无关的,但并未报告抑制能力与这两类词学习效果之间的关系。Stroop任务是他们实验室的常用任务,有可能是做过了,但没有发现关系。因此,我们猜测语义不相关的多义词学习需要抑制,但语义相关的不需要。这个猜想有待验证。

在前人工作的基础上,为了实现本研究的目的,我们设计如下的实验。从整体思路上来说,相对于[3][5],我们计划增加多词义之间的联系的类型:单词义、两无关词义、两紧密正面联系词义、两冲突词义,来看学习效果上的差别。同时,我们更加细致地考察是否运用一个词义和这个词的子结构的联系的学习的效果和脑活动上的区别。

材料设置

词根词汇构词规则.jpg

实验安排

意义学习词汇词根.jpg

实验操作

  1. 让被试根据给定的材料,学习所有词汇及其拼写,并正确率达到90%以上。
  2. 在学会之后的第n天测试其记忆保持情况,以回忆正确率、反应时间、甚至脑活动为指标。

研究假设

  1. 如果意义学习在抵抗遗忘方面优于机械记忆,那么在第n天的测试中,C组的行为表现会优于A组和B组,且在脑活动上表现出差异(e.g. 海马、额叶、颞叶脑区的激活,脑网络的全局或者局部效度)。
  2. 如果意义学习在抵抗遗忘方面不优于机械记忆,那么在第n天的测试中,C组的行为表现会不优于A组和B组,且在脑活动上不表现出差异。
  3. 如果意义学习在条件满足时候就可以发生,那么在第n天的测试中,B组的行为和脑活动表现应该会介于A组和C组之间。

理解型学习和机械式学习在克服迷思上的异同

迷思和学习。主要讨论,对于已经形成的错误概念(misconception,通常错在本概念和其他概念的联系,也可能概念本身或者事实本身认知错了),到底我们是通过训练小狗的方式来克服的,还是通过想清楚了为什么以后,解决了这个迷思来克服的。两者从行为(直接和间接效果)和脑活动上有什么异同?

前人研究发现,从大脑活动的角度,对克服迷思来说,主要是抑制区域产生了明显的活动。更多细节见迷思和学习

概念形成,没有知识基础的时候难道还不是依靠记忆来学习?

上面主要讨论了概念同化(concept assimilation,其实翻译成概念生长更合适,同化好像就是把新的概念变没了,变成旧的概念了。不过无所谓了)和机械式学习的效果和脑活动的区别。我们还可以来比较概念形成和机械式学习的区别。

例如,在孩子建立起来1,2,3的概念之前(指的是一个东西的数量和记号1的联系,而不是一个东西的数量这个概念本身。这个概念本身应该是很小的孩子就已经建立了的)之前,我们就可以教孩子们做,用训练小狗的方式建立应激反应。或者,我们可以等孩子们建立起来1,2,3的概念之后,通过“合起来”数一数建立起来加法的一般概念,也就是,只要明白“加法”是“合起来数一数”,加上已经有的1,2,3的概念,就可以学会加法的含义和计算。对于学习加法而言,前者就是机械式学习,后者就是基于概念同化的理解型学习。

现在,我们来问1,2,3的概念(1,2,3这些语音或者字形符号和其含义的联系)怎么学习?如果是概念形成,则需要观察很多个数量是1的东西从而来建立数量是1的含义和这个符号1的联系。反过来,完全的机械式学习,就是跳过这个概念形成的过程,不教1,2,3的含义,直接教数字的加法,也不教加法的含义。另外,千万不要认为这样的学习不可能,实际上,加法口诀和乘法口诀的学习,就是这样的。

那么,问题来了:我们能不能找到合适的学习材料,例如甲骨文(一组当做完全没有意义的符号来记忆、一组当做象形文字和形声字来学习),做完全的机械式学习、完全的基于概念形成的学习,并且对比学习效果(反应时间、准确率、遗忘曲线、迁移能力、问题解决能力)和脑活动的异同。

理解型学习系统和可能的理解型学习效果的长期研究

如果我们这些研究能够表明理解型学习在直接学习效果和间接学习效果(迁移能力、问题解决能力)上的优势,那么,我们就可以用这样的方式来改造人类的教和学。加上“学科大图景”(一个学科的典型对象、典型问题、典型分析方法、典型思维方式、和世界以及其他学科的关系)为学习目标的概念,我们就可以编制学习材料,传授理解型学习方法以及按照这个方法来学习学科大图景的教材,来做跟踪研究,考察这样的学习方式下的真正的经受生活检验的优劣。

同时,可以把学习材料的编撰原则、编撰经验、材料举例、使用经验,整理出来,提供给更多的理解型学习材料的编撰者,以及材料使用者(学习者和老师)。

建立“理解型学习”测量量表

为了进一步研究的需要,我们可以建立一个“理解型学习”测量量表,来考察一个人“理解型学习”的程度。有没有相关研究?应该如何设计?脑活动或者上面的实验研究可以提供一点参考?

促进“理解型学习”的方法

如果之前的研究证明,确实“理解型学习”有助于提升学习效果学习效率,甚至提升问题解决能力和迁移能力,那么,下一步的问题,除了之前提到的基于理解型学习的学习材料的开发,就是如何促进理解型学习了。可以设计一些可能的手段、方法,来检验一下是否能够促进理解型学习。促进的程度可以用上面的量表来测量,同时还可以测量直接和间接学习效果。

“理解型学习”所引起的大脑结构的改变

之前有研究说明:大脑结构尤其是晚上睡觉以后会根据白天所学习的知识做整理和改变[8] [9]。那么,我们这里就研究,针对无联系无意义的材料的机械式学习,和针对有意义有联系的材料的机械式学习,以及针对有意义有联系的材料的理解型学习,在改变大脑结构这一点上,是否有所不同。甚至,更进一步,这样的不同是否可以帮助学习者更好地用上所学习的知识。

理解型学习和矢量叠加

更进一步,我猜测,理解型学习相当于已有概念的矢量叠加,机械式学习相当于已有概念的混合型概率叠加。例如,能量是质量和速度合起来定义的,但是其含义有超越质量和速度的地方(能量可以用来改变成其他的形式,可以对外做功,这些都是质量和速度这些概念不具备的)。这个看起来就很像量子力学的状态矢量叠加——z方向向上态和z方向向下态的矢量叠加是一个新的状态“x方向向上态”,同时如果做混合叠加而不是矢量叠加则得到的混合态就是有的时候看起来是z方向向上态,有的时候看起来是z方向向下态。用菜品做类比,就是一种情况下一个菜品可能是多种原材料的混合,任何一口吃到的东西不是这种就是那种原材料,另一种情况下这个菜品具有超越这几种原材料的“矢量叠加”起来的味道。类似地,真正的理解型学习,就可以看作是已经理解的概念的矢量叠加,所建构起来的新概念具有超越原来概念的地方,并且学会这样的矢量叠加来学习概念。反过来,很有可能,机械式学习学到的是已有概念的组合,没有体会到超越以后概念的地方。这样的学习过程的差别,能否通过实验做出来?当然,某些概念本来就是更基本的概念的组合,就不能用来当做检测这两种学习方式的差别的例子了,不过,正好用来当对照组。

另外,不知道自然语言处理技术能不能把这两种叠加的概念分开来。

参考文献

  1. JEFFREY D. KARPICKE, JANELL R. BLUNT. Retrieval Practice Produces More Learning than Elaborative Studying with Concept Mapping. SCIENCE11. 772-775(2011).
  2. M. Teresa Lechuga, Juana M. Ortega-Tudela, Carlos J. Gómez-Ariza, Further evidence that concept mapping is not better than repeated retrieval as a tool for learning from texts, Learning and Instruction, 40, Pages 61-68(2015), https://doi.org/10.1016/j.learninstruc.2015.08.002.
  3. 3.0 3.1 Ripolles, P., Marco-Pallares, J., Hielscher, U., Mestres-Misse, A., Tempelmann, C., Heinze, H. J., . . . Noesselt, T. (2014). The role of reward in word learning and its implications for language acquisition. Current Biology, 24(21), 2606-2611.
  4. Greiff, S., Wüstenberg, S., Molnár, G., Fischer, A., Funke, J., & Csapó, B. (2013). Complex problem solving in educational contexts - Something beyond g: Concept, assessment, measurement invariance, and construct validity. Journal of Educational Psychology, 105(2), 364-379. http://dx.doi.org/10.1037/a0031856
  5. 5.0 5.1 5.2 Zhang Y, Chen B, Tang Y, Yao P and Lu Y (2018) Semantic Similarity to Known Second Language Words Impacts Learning of New Meanings. Front. Psychol. 9:2048. doi: 10.3389/fpsyg.2018.02048.
  6. Rodd, J. M., Gaskell, M. G., and Marslen-Wilson, W. D. (2004). Modelling the effects of semantic ambiguity in word recognition. Cogn. Sci. 28, 89–104.
  7. 7.0 7.1 Lu Y, Wu J, Dunlap S and Chen B(2017) The Inhibitory Mechanism in Learning Ambiguous Words in a Second Language.Front. Psychol. 8:636. doi: 10.3389/fpsyg.2017.00636
  8. Walker, M. P., & Stickgold, R. (2004). Sleep-dependent learning and memory consolidation. Neuron, 44(1), 121-133.
  9. Sagi, Y., Tavor, I., Hofstetter, S., Tzur-Moryosef, S., Blumenfeld-Katzir, T., & Assaf, Y. (2012). Learning in the fast lane: new insights into neuroplasticity. Neuron, 73(6), 1195-1203.

子分类

本分类只有以下子分类。