分类:汉字网络和汉字的理解型学习
问题背景
汉字之间是相互联系的。汉字可以一个个字单独地学习,也可以想办法运用汉字的联系来学习。例如,学习“林”的时候,如果已经学习过“木”,则可以通过“林就是很多树木长在一起形成的”来学习“林”。例如,“涉”就是通过“徒步(脚趾头,止)”跨越“河流,三点水”的意思。那么,是不是大多数汉字都可以这样来学习呢?是不是这样的学习确实会提高学习效率呢?
我们汉字学习的研究工作[1] 就企图回答这几个问题。
汉字网络
首先,我们把每一个汉字根据其组成部分做一个直接的有意义的拆分。有意义的含义指的是读音上或者含以上,上层字和下层字之间能够建立联系。直接的意思就是,如果拆出来的下层字还可以再一次拆分,我们放在下一层来考虑它,在这一层把能够继续拆分的下层字当做一个整体来看。例如,
通过这样的拆分,我们得到3500常用汉字的地图,
,如果你愿意还可以下载pdf格式的汉字地图文件:FullmapBig.pdf
有了地图能够做什么?
地图实际上代表的是汉字和汉字之间的投入产出关系,把自己的形状含义和读音投入到更复杂的字之中去称为更复杂的字的形状含义和读音的一部分。
有了这个投入产出关系,汉字在语料库中的使用频率就是这个汉字的外生影响力。把这个影响力在汉字地图中——沿着汉字构成关系反向——做传播,就得到了汉字的综合影响力。一个复杂的汉字的使用频率的一部分可以传递到它的组成部分,也就是更简单的字上面,这样下面的汉字就会变得更重要。甚至当其自身的使用频率都不大的时候,这个传播得到的影响力,很可能也会比较大。同时,如果一个简单字参与了多个复杂字的构造,则每一个这样的复杂字都会把使用频率的一部分传到这个简单字上。这样这个简单字也会变成需要优先学习的字。并且,这个外生影响力,可以按照学习目的来概念,例如,针对儿童的语料来统计儿童使用汉字的频率,针对医学学科的汉字使用频率等等。
有了这个地图,我们还可以来研究汉字检测的问题。如果一个被试不认识“木”我们可以很大可能推断其不认识“林”,或者反过来认识“林”则推断很大的可能认识“木”。这样就可以通过自适应地检测少数的汉字来诊断被试对所有汉字的认识与否。
更多信息,请参阅[1] 。
参考文献
本分类目前不含有任何页面或媒体文件。