分类:Multilevel development of cognitive abilities in an artificial neural network

来自Big Physics
Jinshanw讨论 | 贡献2022年10月12日 (三) 02:43的版本 →‎总结和评论


Konstantin Volzhenin, Jean-Pierre Changeux, and Guillaume Dumas, Multilevel development of cognitive abilities in an artificial neural network, PNAS 119 (39) e2201304119 . https://doi.org/10.1073/pnas.2201304119


Abstract

Several neuronal mechanisms have been proposed to account for the formation of cognitive abilities through postnatal interactions with the physical and sociocultural environment. Here, we introduce a three-level computational model of information processing and acquisition of cognitive abilities. We propose minimal architectural requirements to build these levels, and how the parameters affect their performance and relationships. The first sensorimotor level handles local nonconscious processing, here during a visual classification task. The second level or cognitive level globally integrates the information from multiple local processors via long-ranged connections and synthesizes it in a global, but still nonconscious, manner. The third and cognitively highest level handles the information globally and consciously. It is based on the global neuronal workspace (GNW) theory and is referred to as the conscious level. We use the trace and delay conditioning tasks to, respectively, challenge the second and third levels. Results first highlight the necessity of epigenesis through the selection and stabilization of synapses at both local and global scales to allow the network to solve the first two tasks. At the global scale, dopamine appears necessary to properly provide credit assignment despite the temporal delay between perception and reward. At the third level, the presence of interneurons becomes necessary to maintain a self-sustained representation within the GNW in the absence of sensory input. Finally, while balanced spontaneous intrinsic activity facilitates epigenesis at both local and global scales, the balanced excitatory/inhibitory ratio increases performance. We discuss the plausibility of the model in both neurodevelopmental and artificial intelligence terms.

总结和评论

这篇文章人为构建了一个三层网络——感知层、认知层和意识层,来完成一个高级认知任务。

待进一步补充。

概念地图

这个工作的一般意义以及后续工作

从机器学习自身的角度来说,到底是目前的无层次性神经网络通过监督训练来形成具有相应功能的神经网络更好(效率和准确率),还是应该用带有类人类思维(指的是软件)或者类脑(指的是硬件)特征的结构——例如人类思维和人类知识具有层次性——更好,还是个问题。或者说,两者其实能够统一,也就是在无层次性网络上做训练,针对比较高级的任务,自发会形成一个有效网络,而且这个有效网络具有层次性呢?

从教和学的角度来说,人类学习、思考和创造知识都是具有层次性的。例如,数学家首先是把数学当做语言来提出和解决问题,或者反过来通过问题来创造语言也就是创造数学结构,然后是猜出命题猜出答案,最后才是求解问题和证明命题。当然,更高层次的数学思维的运用在于引领方向,看到微弱的启明之光,例如朗兰兹纲领的提出,Hilbert21问的提出。把数学当做算术是最低层面的知识。类似地,物理学家运用实验启发、概念和数学建模、数学计算推理、实验检验的方式来认识世界,这些对学科的认识是高层知识。甚至,超越学科的批判性思维和系联性思考是高层知识。前者成为学科大图景知识,后者称为一般性人类思维层的知识。学科概念以及更低层的事实性程序性知识,往往是前两层知识用于提出和解决具体对象上的具体问题得到的结果。从这个意义上,人类的学习和创造知识,天生具有层次性。进而,组织起来的关于这个世界的知识也具有层次性,因此,看起来这个世界本身也具有层次性。但是,这仅仅是一个猜想。

这个猜想可以从以下几个方面来检验:人脑之中是否对不同层的知识具有不同的表示,不管是脑活动区域的不同,还是脑网络的不同,还是什么其他不同;在机器学习上,是否用了层次性之后,效率和准确率更高;掌握了高层思维的人,是否在提出和解决问题上,学习知识上,表现更好。

从这个角度,这个工作可以看作是一个初步的探索:至少,人为设计进去层次结构之后,也能解决问题(其中每一个层结构的关键参数起到什么作用)。更进一步,就应该尝试回答,是不是可以更好,是不是可以从无层次网络中涌现出来。

顺便,如果这个知识的层次的猜想能够得到验证,那么,我们就真的有了教和学的理论的基础。教育从那以后就走向科学了。于是,任何知识的教和学和创造,我们必须先把这个层间和层内关系先呈现好。我们的教育系统科学也就基本成立了。当然,这些脑科学和机器学习方面的检验实在实在困难的话,我们还有耍赖检验方式——只要我们能够证明这样做的人在学习和创造知识上有优势,也行。那在教和学、科学研究、企业创新中都可以来开展这个层次的实验。

本分类目前不含有任何页面或媒体文件。