本书从学习者行为特征入手,利用智能视觉计算的方法研究学习者行为分析与视频理解关键技术,构建学习者行为的系列专用数据集,在此基础上提出基于智能视觉计算的目标检测、身份认证、行为识别、时序动作检测和视觉场景描述新技术、新模型和新方法,在传统教室、计算机实验室、标准化考场等真实教育教学场景进行仿真实验和方法验证。
更多科学出版社服务,请扫码获取。
SAR图像处理关键技术研究及应用, 陕西省科学技术奖二等奖,2009年,排名第6。
目录
第一篇 学习者行为与智能视觉计算
第1章 绪论 3
1.1 研究背景 3
1.2 国内外研究现状 4
1.2.1 学习者行为表征 5
1.2.2 目标检测与行为分析 7
1.2.3 行为动作的内容描述 9
1.3 主要内容与章 节组织 11
1.4 小结 12
参考文献 12
第2章 智能视觉计算 16
2.1 计算机视觉和机器视觉 16
2.2 智能视觉计算的定义 16
2.3 智能视觉计算的应用 18
2.3.1 智能安防 18
2.3.2 智能交通 18
2.3.3 智能制造 19
2.3.4 智能医疗 19
2.3.5 智能家居 19
2.4 学习者行为相关的智能视觉计算技术 20
2.4.1 目标检测 21
2.4.2 行为识别 21
2.4.3 动作检测 22
2.4.4 视觉场景描述 22
2.5 视觉计算相关的科技名企 23
2.6 小结 26
参考文献 26
第二篇 学习者目标检测与身份认证
第3章 学习者目标检测 31
3.1 引言 31
3.2 目标检测研究概述 31
3.2.1 常见方法与模型 31
3.2.2 相关基准数据集 33
3.2.3 性能评价指标 35
3.3 考试场景下的学习者目标检测 36
3.3.1 学习者目标检测专用数据集构建 36
3.3.2 基于SSD网络及其改进网络的目标检测方法 40
3.3.3 基于级联注意力的全卷积目标检测方法 60
3.3.4 基于瓶颈注意模块的小样本目标检测方法 73
3.4 小结 79
参考文献 80
第4章 学习者身份认证 84
4.1 引言 84
4.2 身份认证研究概述 84
4.2.1 常见方法与模型 84
4.2.2 相关基准数据集 87
4.2.3 性能评价指标 88
4.3 学习场景下基于人脸特征分析的学习者身份认证 88
4.3.1 学习者身份认证专用数据集构建 88
4.3.2 基于人脸检测的身份认证方法 91
4.3.3 基于人脸识别的身份认证方法 98
4.3.4 基于人脸识别及类别平衡的身份认证方法 102
4.4 小结 110
参考文献 110
第三篇 学习者行为识别与时序动作检测
第5章 学习者行为识别 117
5.1 引言 117
5.2 行为识别研究概述 117
5.2.1 常见方法与模型 117
5.2.2 相关基准数据集 120
5.2.3 性能评价指标 122
5.3 学习场景下的学习者行为识别 122
5.3.1 学习者行为识别专用数据集构建 122
5.3.2 基于解耦注意力和多特征融合的行为识别方法 127
5.3.3 基于尺度感知目标检测器的行为识别方法 136
5.3.4 基于姿态估计器的行为识别方法 147
5.4 小结 161
参考文献 161
第6章 学习者时序动作检测 166
6.1 引言 166
6.2 时序动作检测研究概述 166
6.2.1 常见方法与模型 166
6.2.2 相关基准数据集 169
6.2.3 性能评价指标 170
6.3 学习场景下的学习者时序动作检测 171
6.3.1 学习者时序动作检测专用数据集构建 171
6.3.2 基于增强解耦的单阶段时序动作检测方法 177
6.3.3 基于Timeception与超事件的时序动作检测方法 188
6.3.4 基于双流完整性建模的弱监督时序动作检测方法 203
6.4 小结 217
参考文献 217
第四篇 学习者行为的视觉场景描述
第7章 学习者行为图像描述 225
7.1 引言 225
7.2 图像描述研究概述 225
7.2.1 常见方法与模型 225
7.2.2 相关基准数据集 227
7.2.3 性能评价指标 228
7.3 考试场景下学习者行为图像单句描述 230
7.3.1 学习者行为的图像单句描述专用数据集构建 230
7.3.2 CNN+LSTM框架下的图像单句描述方法 233
7.4 学习场景下学习者行为图像密集描述 238
7.4.1 学习者行为图像密集描述专用数据集构建 238
7.4.2 CNN+LL+LSTM框架下的图像密集描述方法 242
7.4.3 Y0L0v3+LSTM框架下的图像密集描述方法 251
7.5 小结 256
参考文献 257
第8章 学习者行为视频描述 261
8.1 引言 261
8.2 视频描述研究概述 261
8.2.1 常见方法与模型 261
8.2.2 相关基准数据集 264
8.2.3 性能评价指标 264
8.3 学习场景下学习者行为视频描述 265
8.3.1 学习者行为视频描述专用数据集 265
8.3.2 基于多特征编码的视频描述方法 268
8.3.3 基于动态目标感知与二阶段融合的视频描述方法 277
8.3.4 基于多模态特征的视频密集描述方法 289
8.4 小结 303
参考文献 303
第9章 总结与展望 310
9.1 研究工作总结 310
9.2 未来研究展望 312
彩图