本书系统地阐述了微积分在人工智能领域的核心作用,从基础理论到实际应用,内容丰富且深入。全书共13章,涵盖微积分概述、函数与极限、导数与微分、积分及其应用、多元微积分等基础知识,同时深入探讨了数据预处理、构建网络模型、模型优化、模型评估与解释等核心技术,并延伸至自然语言处理、计算机视觉、推荐系统和强化学习等前沿应用场景。通过理论讲解、模型分析和代码实践,深入剖析微积分在算法建模、性能优化和结果解释中的关键作用。
本书配有丰富的案例分析、课后练习及可视化示例,适合人工智能从业者、研究人员及相关领域学生学习和参考,为迈向更高水平的AI研究与开发奠定坚实基础。
王圣强
----------------------------
王圣强,华东理工大学数学学院副教授、数学与应用数学系副主任,复旦大学数学科学学院理学博士,先后荣获第五届上海高校青年教师教学竞赛一等奖,上海市教学能手,校优秀共产党员,校青年五四奖章,校教学新星、校研究生课程优秀任课教师等荣誉。
薛栋
----------------------------
薛栋,华东理工大学信息科学与技术学院副教授/硕士生导师,德国慕尼黑工业大学工学博士,“上海市高层次青年人才计划”、“浦江人才计划”获得者。先后在荷兰格罗宁根大学(RUG)、德国卡尔斯鲁厄理工大学(KIT)从事教师和研究员工作。长期从事基于人工智能与大数据相关研究,包括自然语言处理与大语言模型、工业互联网与工业软件、复杂网络与多智能体系统等课题。以第一作者或通讯作者在IEEE TAC、IEEE TSP、IEEE TNSE等国际期刊上发表SCI论文30余篇,主持和参与完成多项包括国家自然科学基金面上项目、上海市人才计划项目、企业科研攻关项目等在内的课题。主讲课程包括本科必修课《人工智能数学基础》和研究生课程《自主无人系统》以及《工业互联网关键技术》。
段兆阳
----------------------------
段兆阳,华东理工大学信息科学与技术学院讲师/硕士生导师、博士,长期从事基于人工智能与大数据相关研究,包括自然语言处理与大语言模型、工业互联网与工业软件、复杂网络与多智能体系统等课题,主讲非线性系统理论及应用。
周涛
----------------------------
周涛,哈尔滨工业大学计算机硕士,现就职于阿里达摩院基础大模型研发部门,负责大模型预训练、参数调优和混合检索增强工作。精通Python、C、C++、Java、C#开发语言,擅长人工智能、神经网络和机器学习技术。近年来,随着AI技术的蓬勃发展,个人团队从事于将人工智能技术应用于智能制造中,尝试将人工智能用在工业制造、机器人、物联网开发驶中,并且取得了不错的成绩。
目 录
第1章
微积分概述
1.1 微积分的历史背景与发展 002
1.1.1 微积分的起源 002
1.1.2 经典数学家的贡献 003
1.1.3 微积分在现代科学中的应用 006
1.2 微积分的基本概念 010
1.2.1 函数与极限的基本定义 011
1.2.2 导数与微分的基本思想 011
1.2.3 积分与面积的基本概念 011
1.3 微积分的核心理论 011
1.3.1 牛顿-莱布尼茨公式 012
1.3.2 连续性与可导性的概念 012
1.3.3 无穷小与无穷大的应用 012
1.4 微积分在科学与工程中的应用 012
1.4.1 微积分在物理学中的应用 013
1.4.2 微积分在工程学中的应用 013
1.4.3 微积分在计算科学中的应用 013
1.5 微积分在人工智能中的重要性 013
1.5.1 微积分在机器学习中的作用 014
1.5.2 微积分在深度学习中的应用 014
1.5.3 微积分在优化算法中的关键性 014
1.6 课后练习 014
第2章
函数与极限
2.1 函数的基本概念 017
2.1.1 函数的定义与分类 017
2.1.2 常见的函数类型 017
2.1.3 绘制不同类型的函数图像 018
2.2 函数的性质 021
2.2.1 函数的单调性与凹凸性 021
2.2.2 极值、驻点与拐点分析 021
2.2.3 查找函数的极值和拐点并绘制图像 022
2.3 极限的概念 025
2.3.1 极限的定义与基本性质 025
2.3.2 左极限、右极限与无穷极限 027
2.3.3 无穷小与无穷大的比较与应用 029
2.4 极限的求解方法 032
2.4.1 代入法与因式分解法 032
2.4.2 分母有理化与洛必达法则 033
2.4.3 利用 SymPy 求解函数的极限并验证结果 034
2.5 连续性与可导性 034
2.5.1 函数的连续性与间断点 034
2.5.2 可导函数的条件、性质与应用 035
2.5.3 用Python分析函数的连续性与
可导性 036
2.6 课后练习 037
第3章
导数与微分
3.1 导数的基本概念 039
3.1.1 导数的定义与几何意义 039
3.1.2 导数的物理意义与在速度、加速度中的应用 039
3.1.3 Python 实例:利用 SymPy 计算函数的导数并绘制切线与速度图 040
3.2 导数的计算规则 042
3.2.1 和差、乘积与商的求导法则 042
3.2.2 链式法则与隐函数求导法 043
3.2.3 Python 实例:使用 SymPy 实现复杂函数的求导并分析 043
3.3 常见函数的导数 045
3.3.1 多项式函数的导数 045
3.3.2 指数与对数函数的导数 046
3.3.3 三角函数与反三角函数的导数 046
3.3.4 Python 实例:绘制常见函数的导数
图像并分析其变化趋势 047
3.4 高阶导数 052
3.4.1 高阶导数的定义与应用 052
3.4.2 函数的凹凸性、拐点与泰勒级数展开 052
3.4.3 Python 实例:利用高阶导数与泰勒
级数分析函数行为 053
3.5 微分的概念 055
3.5.1 微分的定义、几何意义与线性近似 056
3.5.2 微分在误差估计与近似计算中的应用 056
3.5.3 Python 实例:使用微分法近似计算
函数值与误差分析 057
3.6 课后练习 059
第4章
积分及其应用
4.1 积分的基本概念 061
4.1.1 不定积分的定义与性质 061
4.1.2 积分的几何意义与物理意义 061
4.1.3 利用 SymPy 计算简单函数的
不定积分 062
4.2 定积分 062
4.2.1 定积分的定义与基本性质 062
4.2.2 定积分的计算方法 063
4.2.3 使用 SciPy 计算定积分并进行数值验证 064
4.3 积分与面积、体积 065
4.3.1 积分在求平面图形面积中的应用 065
4.3.2 积分在求旋转体体积中的应用 065
4.3.3 Python 实例:计算复杂图形的面积与体积并进行可视化 066
4.4 积分与概率与统计 069
4.4.1 概率密度函数与积分的关系 069
4.4.2 积分在期望、方差与协方差计算中的应用 070
4.4.3 利用积分求解连续型随机变量的期望与方差 070
4.5 微积分基本定理 072
4.5.1 牛顿-莱布尼茨公式 072
4.5.2 微积分基本定理的推导与应用 073
4.5.3 利用牛顿-莱布尼茨公式进行积分验证 074
4.6 积分在人工智能中的应用 077
4.6.1 损失函数的积分表示 077
4.6.2 积分在正则化与模型复杂度控制中的应用 078
4.6.3 利用积分计算正则化项并分析模型复杂度 079
4.7 数值积分 081
4.7.1 数值积分方法 081
4.7.2 数值积分的误差分析与改进 082
4.7.3 实现并比较不同数值积分方法的效果 082
4.8 课后练习 085
第5章
多元微积分
5.1 多元函数 087
5.1.1 多元函数的定义与表示方法 087
5.1.2 多元函数的连续性与可微性 087
5.1.3 绘制多元函数并观察其连续性与
可微性 088
5.2 偏导数 091
5.2.1 偏导数的定义与几何意义 091
5.2.2 高阶偏导数、混合偏导数与雅可比矩阵 092
5.2.3 利用 SymPy 计算多元函数的
偏导数 094
5.3 方向导数与梯度 096
5.3.1 方向导数的定义与计算方法 096
5.3.2 梯度向量、方向导数与其几何意义 097
5.3.3 计算多元函数的方向导数与梯度 098
5.4 多元函数的极值 100
5.4.1 驻点、临界点与鞍点的概念 100
5.4.2 二次型在极值判定中的作用 101
5.4.3 利用梯度下降法求多元函数的极值并
分析收敛性 102
5.5 拉格朗日乘数法 106
5.5.1 拉格朗日乘数法的原理与推导 106
5.5.2 拉格朗日乘数法在约束优化中的应用 107
5.5.3 用拉格朗日乘数法求解约束优化问题 109
5.6 多重积分 111
5.6.1 二重积分与三重积分的定义与计算 111
5.6.2 多重积分在计算体积、质量与重心中的应用 113
5.6.3 利用多重积分计算复杂几何体的体积与重心 114
5.7 课后练习 115
第6章
数据预处理
6.1 特征选择和降维 117
6.1.1 特征选择的微积分方法 117
6.1.2 主成分分析 119
6.2 缺失值处理与插补 124
6.2.1 缺失值处理介绍 124
6.2.2 插补方法中的微积分应用 125
6.3 数据平滑与去噪 128
6.3.1 数据平滑 128
6.3.2 去噪算法中的微积分方法 132
6.4 数据转换与特征工程 134
6.4.1 数据转换的微积分方法 134
6.4.2 特征工程 137
6.5 数据预处理中的微积分优化 139
6.5.1 优化方法的基本概念 140
6.5.2 梯度下降法 140
6.5.3 牛顿法 142
6.6 课后练习 144
第7章
构建网络模型
7.1 网络模型介绍 146
7.1.1 机器学习和深度学习 146
7.1.2 网络模型的定义与分类 148
7.2 构建机器学习模型 149
7.2.1 构建线性回归模型 149
7.2.2 构建逻辑回归模型 160
7.2.3 支持向量机 163
7.2.4 决策树 168
7.2.5 随机森林 172
7.2.6 K-近邻算法模型 175
7.3 构建深度学习模型 177
7.3.1 前馈神经网络 177
7.3.2 CNN在计算机视觉中的应用 181
7.3.3 循环神经网络 184
7.3.4 长短期记忆网络 188
7.3.5 生成对抗网络 191
7.4 课后练习 195
第8章
模型优化
8.1 模型优化介绍 197
8.2 梯度下降算法 197
8.2.1 梯度下降法介绍 198
8.2.2 微积分在梯度计算中的应用 198
8.2.3 随机梯度下降 202
8.2.4 动量法 205
8.2.5 自适应学习率算法 207
8.3 优化算法 210
8.3.1 牛顿法与拟牛顿法 210
8.3.2 自适应优化算法 214
8.4 正则化技术 219
8.4.1 正则化介绍 219
8.4.2 L1正则化 220
8.4.3 L2正则化 223
8.4.4 Dropout 226
8.4.5 弹性网 229
8.5 超参数优化 232
8.5.1 超参数的定义与选择 232
8.5.2 贝叶斯优化 233
8.6 课后练习 236
第9章
模型评估与解释
9.1 模型评估的基本概念 238
9.1.1 评估指标的定义与选择 238
9.1.2 评估指标的数学基础 238
9.2 性能度量与损失函数 242
9.2.1 损失函数与性能度量的关系 242
9.2.2 微积分在性能度量中的应用 243
9.3 模型解释性 246
9.3.1 模型解释性的基本概念 246
9.3.2 微积分在模型解释中的应用:梯度的角色 247
9.4 灵敏度分析与梯度检查 250
9.4.1 灵敏度分析 250
9.4.2 梯度检查 254
9.5 特征重要性分析 258
9.6 误差分析与模型诊断 260
9.6.1 误差分析介绍 261
9.6.2 模型诊断 263
9.7 课后练习 267
第10章
自然语言处理和微积分
10.1 自然语言处理基础 269
10.1.1 NLP的基本概念与应用领域 269
10.1.2 微积分在 NLP 中的作用概述 270
10.2 词嵌入 270
10.2.1 词嵌入介绍 270
10.2.2 词嵌入模型 271
10.3 表示学习 274
10.3.1 表示学习介绍 274
10.3.2 微积分在表示学习中的应用 275
10.4 语言模型与序列建模 277
10.4.1 语言模型的定义与作用 277
10.4.2 微积分在语言模型中的应用 278
10.5 注意力机制与Transformer 281
10.5.1 微积分在注意力机制中的应用 281
10.5.2 Transformer的基本概念和微积分的应用 283
10.6 情感分析与文本分类 287
10.6.1 情感分析与文本分类的基本方法 288
10.6.2 微积分在情感分析与文本分类中的应用 288
10.7 课后练习 294
第11章
人工智能视觉技术和微积分
11.1 计算机视觉基础 296
11.1.1 计算机视觉的定义与应用领域 296
11.1.2 微积分在计算机视觉中的作用 296
11.2 图像处理与变换 297
11.2.1 常用的图像处理技术 297
11.2.2 梯度计算与边缘检测 297
11.2.3 图像增强 300
11.2.4 几何变换和图像变换 302
11.2.5 图像分割 305
11.3 特征提取与描述 308
11.3.1 特征提取的基本方法 308
11.3.2 微积分在特征提取中的应用 309
11.4 卷积神经网络(CNN) 316
11.4.1 CNN的基本结构与应用 317
11.4.2 微积分在 CNN 中的应用 317
11.5 目标检测与分割 320
11.5.1 目标检测的基本方法 320
11.5.2 目标分割的基本方法 324
11.6 图像生成与变换 327
11.6.1 图像生成模型的基本概念 327
11.6.1 微积分在图像生成中的应用 328
11.7 课后练习 333
第12章
推荐系统和微积分
12.1 推荐系统概述 336
12.1.1 推荐系统的定义与分类 336
12.1.2 推荐系统的应用领域 337
12.1.3 微积分在推荐系统中的作用概述 337
12.2 推荐算法基础 338
12.2.1 基于内容的推荐 338
12.2.2 基于协同过滤的推荐 341
12.3 基于标签的推荐 344
12.3.1 获取用户的标签 345
12.3.2 基于用户兴趣标签的推荐算法 345
12.3.3 基于物品标签的推荐算法 348
12.4 基于神经网络的推荐模型 351
12.4.1 深度学习在推荐系统中的应用 351
12.4.2 基于多层感知器的推荐模型 352
12.4.3 基于卷积神经网络的推荐模型 355
12.4.4 基于循环神经网络的推荐模型 358
12.4.5 基于自注意力机制的推荐模型 363
12.5 课后练习 367
第13章
强化学习和微积分
13.1 强化学习基础 369
13.1.1 强化学习的核心特点 369
13.1.2 强化学习与其他机器学习方法的区别 370
13.1.3 微积分在强化学习中的作用 370
13.2 马尔可夫决策过程 371
13.2.1 MDP的核心思想 371
13.2.2 MDP的形式化定义 372
13.2.3 贝尔曼方程 375
13.3 蒙特卡洛方法 381
13.3.1 蒙特卡洛预测的核心思想 381
13.3.2 探索与策略改进 385
13.4 Q学习与贝尔曼方程 387
13.4.1 Q-learning的动作值函数 387
13.4.2 强化学习中的Q-learning 391
13.5 深度Q网络算法 394
13.5.1 DQN算法介绍 394
13.5.2 双重深度Q网络算法 399
13.6 竞争深度Q网络算法 404
13.6.1 Dueling DQN网络架构 404
13.6.2 微积分在Dueling DQN中的作用 404
13.7 课后练习 408