本书是一本关于人脑智能与人工智能的教材,旨在介绍人脑各个系统以及相关人工智能技术。全书分为多个章节,详细介绍了人脑的视觉、听觉、运动、语言等系统以及人工智能在相关方向的进展。本书的特色在于从人脑智能与人工智能两个角度讲述,不仅包含人脑是如何实现各系统功能,还介绍了人工智能在相关方向的研究进展和两者结合的研究动态。除了解释人脑系统和人工智能技术的基础理论,本书还提供了将两者融合的具体方法和实践案例,使其具备高度的实用性和参考价值。本书的读者对象包括对神经科学、脑科学以及人工智能感兴趣的读者,以及从事相关领域研究的人员。
这本书的选题旨在探索人脑智能与人工智能技术,通过介绍人脑各个系统的神经表征和机器学习技术的融合建模,为读者提供更多样化的阅读选择。这本书的特色在于以下几点:1.创新性:将人脑智能与人工智能相结合,通过融合建模的方式探索内在联系和互动机制,是近年来人工智能领域的一个热门方向,具有较高的研究价值和应用前景。2.内容全面:这本书涵盖了人脑的各个系统和人工智能技术,不仅介绍了视觉系统、听觉系统、嗅觉系统等的神经表征,还介绍了机器学习技术在这些系统的融合建模方法和应用前景。3.学术性强:通过对人脑各个系统的神经表征和人工智能技术的深入介绍,可以让读者更好地了解人脑的工作机制和人工智能技术的原理。
序
人类天生渴望认知。
——亚里士多德
人类探索智能本质的旅程漫长而曲折。从远古先民虔诚朴素的“万物有灵论”(Animism),到霍布斯在《利维坦》中细致描述的“自动机”(Automata);从十八世纪沃坎森倾力打造的、拥有消化系统的机械鸭子,到雅克德罗妙手创造的能吟唱、绘画与书写的机械人偶,我们的认知旅程充满了离经叛道的想象与人定胜天的
自负。
如今,以GPT系列为代表的大模型技术所带来的人工智能风潮席卷,其在智力推理、情绪感知乃至文学艺术创造等多个领域的表现,已逐渐达到甚至超越人类自身。这不禁促使我们重新审视:人工智能作为最初从模仿生命行为与人脑机制中诞生的技术,是否还需要继续向认知科学与脑科学汲取灵感,是否依然需要追随人类足迹,还是已经可以踏上属于自己的探索之路?
辛顿早在2020年GPT-3崭露头角时,就宣称:“或许生命、宇宙和万物的终极答案不过是4.398万亿个参数而已。”这个宣言所表达的是一种对“参数量”的崇拜——仿佛只要参数足够庞大,人工智能便可以接近甚至超越人类智慧。
作为一个脑科学和人工智能交叉学科的研究者,我不知道答案。但是生物的进化给我们提供了一个信仰的基石——智能并非简单地依赖神经元数量。大象的大脑重约5?kg,拥有约2570?亿个神经元;而虎鲸的大脑重达9?kg,仅小脑神经元数量便超过1000?亿,远超过人类大脑的860?亿个神经元。但是它们的智能程度却远不及人类——在浩瀚无垠的宇宙中,只有我们人类能够创造语言、发展数学、探索宇宙,甚至建造文明。所以,智能并非参数量的简单叠加;可能更在于这些神经元的连接方式、信息流的动态模式,以及复杂系统内部的协作与协调机制。所以,在我看来,人工智能依然需要脑科学的持续启发。
首先是智能架构的优化与模块化设计。人类大脑的皮层分区与功能模块呈现出精妙的分层特化和精细协作模式。视觉、听觉、运动、情绪、语言,这些系统看似独立,却又紧密相连,形成高效的多模态信息处理体系。而当前主流的人工智能模型,虽然参数规模庞大,却仍未真正掌握这种精巧的功能模块独立性和交互机制。因此,脑科学对大脑分区与功能整合的进一步揭示,将为人工智能提供极为重要的架构启示。
其次是持续学习与记忆整合。人类大脑可以在生命过程中不断接纳新知识,同时牢牢保留已有的记忆和技能。目前人工智能的“灾难性遗忘”问题,恰恰暴露了其在持续学习上的不足。深入研究海马与皮层的协作机制、记忆的重放现象以及睡眠对记忆的巩固作用,都将为构建能够真正自我适应、持续进化的智能模型提供宝贵的理论基础和实践范例。
再者,鲁棒性与可解释性是当前人工智能应用的重大挑战,尤其在面对噪声、缺失信息或未知环境时尤为明显。而人脑却表现出非凡的韧性与适应性,其多通路信息冗余机制、反馈控制机制和注意力调控策略,无疑是提高人工智能鲁棒性和可解释性的绝佳蓝图。
最后,人工智能最稀缺的真正从0到1的颠覆式创造力,或许来源于我们根植于内心深处的生命与的本能驱动力,亦或许来源于我们在浩瀚空间与无限时间中逐渐塑造出的独一无二的自我意识。这些闪耀于智能之冠上的璀璨明珠,也许只有在人类大脑的幽微深处,我们才能真正窥见其神秘的光辉。
因此,我们亟须推动一种更深层次的脑科学与人工智能的联姻。不再是单纯的模仿,而是互相促进共同进化:脑科学将提供更多关于脑连接组、神经动力学、认知理论的发现和启示,指导人工智能构建更高效的架构和算法;而人工智能则可以利用强大的计算力与算法分析工具,深入解析海量神经数据,推进脑科学的基础研究与应用开发。这种深度融合的科学范式,将为理解智能的本质带来质的飞跃。
正是在这样的背景下,刘泉影的《人脑智能与人工智能》应运而生。它基于David Marr提出的智能分析三层次(目标、算法、实现),将人脑功能系统的探索与人工智能的实践紧密结合。前半部分系统探讨了视觉、听觉、嗅觉、运动、情绪、语言、睡眠与梦境等人脑关键功能系统,细致揭示了其背后的神经机制以及人工智能对其的实现或模拟;后半部分则集中呈现了人工智能如何深入赋能脑科学研究,通过多模态神经数据处理、脑网络建模、数字孪生脑等技术,推动脑科学研究迈向新的高度。
在认知科学、脑科学与人工智能深度融合的前沿领域,我们正站在一个关键的历史转折点。我诚挚邀请来自计算机科学、神经科学、心理学、工程学乃至哲学等各学科领域的研究者与青年学子,共同参与到这一充满挑战且富有深远意义的跨学科探索中来,加入到探索智能本质的旅程中来,在理解人类智能的过程中,创造出一个全新的智能。
清华大学基础科学讲席教授
心理与认知科学系主任
2025年8月于北京
序
还记得五年前,刘泉影老师在南方科技大学神经计算与控制实验室初创《大脑智能与机器智能》这门新课。彼时,我也在准备《AI与心理学》的新课。我们都苦于找不到现成教材,茶水凉了又热,PPT改了又改,开课优质年几乎每堂课前都备课至凌晨。常常左边画着大脑皮层结构图,右边贴着卷积神经网络示意图;这边讨论着脑科学与AI结合的创新点,那边琢磨着如何用AI模型解析心理学机制。就是在这些“烧脑”又兴奋的夜晚,一个念头愈发清晰:人脑与机器智能这两条轨迹,正从并行走向交织,彼此照亮。
刘老师曾几次邀我参与课堂,终于有幸成行一次。看着那些年轻面孔从最初被跨学科概念搞得晕头转向,到后来能侃侃而谈课程核心观点,甚至结课后设计出融合双领域思想的创新模型。助教们也通过持续参与教学成长为跨领域新锐——这大概是做教师最欣慰的事。他们的蜕变印证着时代命题:理解智能本质,需同时穿越“突触密林”与“算法星河”。他们让我确信,未来突破必属于既通生物脑之精妙,又谙机器智能之精髓的“两栖”探索者。
但说实话,想同时掌握这两套体系谈何容易!我们备课时就深有体会:想找本真正打通“脑”与“机”的书,难!神经科学教材把神经机制与认知功能讲得透彻,却很少提及这些发现如何催生了Transformer这样颠覆性的AI;AI专著详解公式代码,却鲜少剖析AI如何促进对大脑运作机制的理解。这种割裂让学生困惑,更让研究者错失启发良机。
正因如此,刘老师团队执笔写就此书:只为搭建一座桥。例如,为我们解析视觉之谜:为何猕猴颞叶神经元活动模式,与卷积神经网络中层特征惊人相似?其间藏着何种普适的对物理世界的编码法则?
我笃信,书中诸多洞见正源自那些备课深夜里师生思维碰撞的火花,以及我们在交叉领域跌撞前行的体悟。它或许不优质,但竭力实现一个愿景:当你研读大脑章节时,会自然联想到某个人工智能模型;而当你调试算法时,又忍不住翻看书中对应的神经机制解析。
若你也为“智能”着迷——无论你是探索脑机制的科学家、构建智能算法的工程师,还是求知若渴的学生——愿此书成为你征途上的伙伴。当你在深夜被难题所困,或许书中某个人脑的“巧思”或AI的“妙招”,能倏然点亮灵感的星火。
因此,书中传递的不只是知识——更是投向“智能”深渊的微光,照亮来者的路。
澳门大学协同创新研究所教授
认知与脑科学中心
2025年6月于澳门
刘泉影,南方科技大学生物医学工程系助理教授、博士生导师,神经计算与控制实验室PI。擅长领域:利用动力学系统模型和深度学习模型,研究神经信息表征,探索大脑的计算机制,用于解释神经信号、大脑功能和行为三者之间的关系;结合现代控制理论,优化神经反馈控制,用于调节人类行为、辅助神经相关疾病。
目?录
优质部分
第1章?绪论 3
1.1 智能的本质与多样性 3
1.2 人工智能的发展与脑科学的价值 5
1.3 AI与BI的相似之处 6
1.4 BI与AI的相互启发 7
1.5 本书的章节结构 9
第2章?AI基础 11
2.1 引言 11
2.2 简介 12
2.3 基础概念 15
2.4 神经网络 19
2.5 常见网络架构 31
2.6 生成模型 38
第3章?视觉系统 51
3.1 引言 51
3.2 眼睛的演化 52
3.3 视觉系统的功能 53
3.4 眼睛的结构 55
3.5 视觉通路 61
3.6 视觉系统中生物智能和人工智能的讨论 65
第4章?听觉系统 69
4.1 引言 69
4.2 声音的性质 69
4.3 人耳的结构 70
4.4 中枢听觉过程 72
4.5 声音定位机制 74
4.6 听觉皮层与神经可塑性 75
4.7 听觉系统中生物智能和人工智能的应用 78
第5章?嗅觉系统 85
5.1 引言 85
5.2 嗅觉 86
5.3 嗅觉受体:感知气味的核心 87
5.4 嗅觉皮层:气味感知的高级处理中心 89
5.5 气味的编码机制:从化学信号到大脑语言 92
5.6 与嗅觉相关的新兴研究 94
第6章?体感系统 99
6.1 引言 99
6.2 皮肤中的接受器 100
6.3 初级传入纤维和外周神经系统 101
6.4 脊髓 102
6.5 背柱-内侧门神经通路及三叉神经触觉通路 104
6.6 体感皮层 105
6.7 利用电刺激恢复触觉 107
6.8 电子皮肤 108
第7章?运动系统 113
7.1 引言 113
7.2 基础结构(肌肉与神经系统) 114
7.3 低级控制:反射与脊髓水平通路 115
7.4 高级控制:复杂运动与大脑协调机制 118
7.5 运动的建模与控制 121
7.6 运动与人工智能 122
第8章?情绪 127
8.1 引言 127
8.2 情绪的定义 128
8.3 情绪的神经基础 130
8.4 情绪调节 136
8.5 情绪识别与情感智能 139
第9章?语言 143
9.1 引言 143
9.2 什么是语言 144
9.3 大脑中的语言系统 146
9.4 语言相关疾病 149
9.5 语言处理模型 151
9.6 自然语言处理中的语言模型 153
9.7 人工智能与大脑中的自然语言处理 157
第10章?睡眠与梦 161
10.1 引言 161
10.2 睡眠与梦的基础理论 162
10.3 睡眠障碍与疾病 167
10.4 基于人工智能的睡眠与梦境研究 170
10.5 睡眠与梦对人工智能的启发 175
第二部分
第11章?多模态神经信号处理 179
11.1 引言 179
11.2 神经信号采集技术 180
11.3 fMRI信号处理 181
11.4 EEG信号处理 183
11.5 iEEG信号处理 188
11.6 多模态融合分析 190
11.7 深度学习在神经信号处理中的应用 193
11.8 结语 196
第12章?神经数据的预训练模型 199
12.1 预训练模型背景 199
12.2 神经数据的特性与预训练模型的应用价值 200
12.3 预训练相关概念 201
12.4 处理神经数据的经典预训练模型 209
12.5 预训练模型在神经数据处理中的意义与展望 212
第13章?大脑中的潜在表征 217
13.1 引言 217
13.2 大脑中的潜在表征——神经群体编码 223
13.3 概念表征与心理空间中的隐变量模型 229
13.4 大脑与人工智能的表征对齐 232
第14章?神经科学中的生成模型 235
14.1 计算神经科学为什么需要生成模型 235
14.2 生成模型在神经科学中的应用 243
14.3 现代神经科学研究中的生成模型应用 251
第15章?人工智能赋能神经科学 255
15.1 引言 255
15.2 深度学习为脑科学提供数据分析工具 256
15.3 深度学习为脑科学提供实验仿真工具 261
15.4 脑科学为深度学习提供脑启发的先验假设和分析方法论 265
第16章?脑网络建模 267
16.1 引言 267
16.2 大脑网络建模基础 268
16.3 大脑网络动力学建模 275
16.4 大脑网络建模的应用 280
第17章?脑结构、脑功能、行为的关系 289
17.1?引言 289
17.2 大脑结构、功能与行为 290
17.3 大脑结构、功能与行为的关系 291
17.4 结构-功能-行为的计算建模方法 294
第18章?数字孪生脑 303
18.1 引言 303
18.2 数字孪生脑的基本概念 304
18.3 数字孪生脑的模型构建 308
18.4 数字孪生脑的评估 311
18.5 数字孪生脑的应用 313
18.6 数字孪生脑的未来挑战 318
第19章?基于模型的神经调控 323
19.1 引言 323
19.2 神经调控技术 324
19.3 经颅电刺激前向建模及逆向优化调控策略 325
19.4 基于动力学模型的神经调控方法 333
19.5 基于行为奖励的强化学习闭环神经调控方法 337
第20章?通往智能之路:人脑智能与人工智能 341
20.1 引言 341
20.2 智能的起源:进化与工程化 342
20.3 智能发展的未来:融合与创新 350
参考文献 357