本书全面系统地介绍了计算机视觉与图像处理在智能建造与土木工程领域的核心理论与关键技术,结合丰富的实际案例和开源代码,为读者提供从基础到应用的全方位学习资源。全书共9章,涵盖计算机视觉的基础知识、核心技术与实际应用。本书适用于土木工程和智能建造领域的学生、研究人员及工程师。
本书的特点包括全面性、虚拟视觉空间、开源算法和实用性,使读者能够全面学习计算机视觉的理论和实际应用,特别是在土木工程和智能建造领域。它提供了广泛的知识和实际应用示例,帮助学生理解和应用计算机视觉技术,以解决智能建造领域的实际问题
在智能建造与土木工程的快速发展中,计算机视觉与图像处理技术已成为解决复杂工 程问题的关键工具。无论是自动化检测、结构健康监测,还是无人机和机器人辅助施工,计 算机视觉正在提升建筑领域的效率与安全,为精细化建造和管理提供全新手段。 全书共9章,涵盖计算机视觉的基础知识、核心技术与实际应用。第1章介绍计算机视觉的历史背景与发展现状,探讨其在建筑规划、设计、施工和运营中的应用场景,Python与MATLAB环境配置指南及 OpenCV 核心模块解析;第2章解析射影几何与图像形成的原理,涵盖二维/三维几何变换、相机投影模型及透镜畸变校正原理,结合数码 相 机 的 光 学 采样、色彩空间转换与压缩编码技术,构建从物理成像到数字信号转化的完整知识体系;第3章讲解图像处理技术,涵盖图像金字塔、色彩空间转换、傅里叶变换等,帮助读者掌握图像操作流程;第4章介绍视频处理技术,包括视频读取、摄像机调用和压缩编码,为目标识别、追踪和三维重建打基础;第5章重点讨论目标识别与追踪技术,涵盖颜色的分割、轮廓特征分析与矩计算、特征点检测与运动估计算法等,广泛应用于施工场景中构件定位、位移监测与异常行为预警;第6章探讨单目、双目和多目视觉系统,讲解立体视觉的物体定位与姿态估计;第7章介绍计算摄影技术,包括高动态范围、超分辨率和去模糊技术,为高质量视觉数据采集提供支持;第8章阐述三维重建技术,如运动恢复结构(SfM)和多视图立体(MVS),提升建筑模型数字化和可视化效率;第9章探讨机器学习与深度学习在计算机视觉中的应用,赋予建筑智能化更多可能性。
本书旨在为土木工程和智能建造领域的学生、研究人员及工程师提供一份简明易懂的 入门教材。通过介绍基础理论、算法和实际应用,读者将学习如何将计算机视觉技术应用于 如图形处理、结构跟踪、三维重建、裂缝识别等实际问题。无论是初学者还是有经验的工程 师,都能通过本书掌握前沿技术,应对智能建造领域的挑战。
计算机视觉技术自20世纪60年代兴起,早期研究集中在图像的边缘检测、形状识别等 基础算法。如今,随着人工智能的发展,计算机视觉已在各行业广泛应用,并不断推进数字 化和智能化进程。
作者在英国访学期间接触到计算机视觉在结构振动监测中的应用,发现这一技术在国 内土木工程中的应用尚不充分,更多的研究和应用集中在其他行业。近年来,随着市场需求 的变化,土木工程专业逐渐向智能化、数字化和网络化转型升级,重劳动力的需求显著减少, 工程行业亟须解放劳动力、提高效率。智能建造的理念应运而生,计算机视觉作为智能建造 中的重要新质生产力,发挥着不可或缺的作用。 土木工程的转型不仅是技术层面的革新,更是生产力的提升与社会需求的适应。因此,土木工程专业的培养目标应当充分考虑当前行业的发展需求与未来的职业挑战,除了扎实的土木工程基础知识和技能,学生还需要培养跨专业能力与创新能力,以应对智能建造和结
Ⅱ 计算机视觉与图像处理
构智慧运维带来的新要求,同时推动自身的综合素质提升。
当前计算机视觉教材多集中于数学或计算机科学领域,缺乏针对土木工程的应用指导。 为填补这一空白,本书侧重于实际算法和代码实现,帮助读者快速上手,并将技术应用于智 能建造和结构智慧运维中。通过本书,读者不仅能掌握计算机视觉与图像处理的基础知识, 还能推动土木工程的智能化转型和可持续发展。
课程安排建议
本书为土木工程、智能建造或其他工程专业提供一个学期的计算机视觉与图形处理的 入门课程。根据本书的内容,本课程可以规划为32学时或64学时。以下是建议的两种不 同学时规划的课程表。
章 节 章 节 内 容 32学时分配 64学时分配
第1章 计算机视觉概论 2 4
第2章 射影几何与图像形成 2 4
第3章 图像处理 6 10
第4章 视频形成与处理 2 4
第5章 识别与追踪 4 8
第6章 立体视觉与标定 4 6
第7章 计算摄影 2 4
第8章 三维重建 4 8
第9章 机器学习 4 10
大作业 授课老师自行布置 2 6
配套与开源 本书在编写过程中,注重理论与实践的结合,力求为读者提供系统化的学习路径。本书 的所有示例代码都已开源,并托管在清华大学出版社平台和Github平台上。读者可以通过 资源文件 访问Github平台、具体章节的二维码,获取的代码以及配套资源。“资源文件”二维码
中的内容为例题所需资源文件,运行例题代码前请先下载资源文件。
致谢
Anaconda
本书得以顺利完成并呈现于读者面前,离不开各方的支持与协作。在此,向所有在本书
清华大学 创作与出版过程中贡献智慧与力量的个人及机构致以诚挚的感谢。开源软件
镜像站
Github平台
本书由兰州理工大
朱前坤:男,博士(后),兰州理工大学土木工程学院教授,负责兰州理工大学本科生《结构力学》、《高层建筑结构设计》;硕士研究生《试验结构动力学》;博士研究生《工程结构可靠度》的教学。同时任职于国际减震学会理事、中国工程建设标准化协会结构设计基础专委会委员、中国地震学会工程隔震与减振控制专委会委员、国际华人计算力学协会理事、中国振动工程学会会员。兼任《Structural Engineering and Mechanics》、《Engineering Structures》《Structures》、《建筑结构学报》、《中国公路学报》、《振动工程学报》、《工程力学》、《振动与冲击》等期刊论文审稿人;国家自然科学通讯评审人。主编学术专著《行人-结构动力相互作用及振动控制》;作为副主编参与编写《高层建筑结构设计理论》教材。研究方向包括工程结构减震与隔震控制、计算机视觉、桥梁智慧监测与运维、结构人致振动、人群紧急疏散等。
第1章计算机视觉概论
1.1计算机视觉历史发展与现状
1.1.1计算机视觉的起源
1.1.2计算机视觉的发展
1.1.3计算机视觉的现状
1.2计算机视觉的经典问题
1.2.1场景重建
1.2.2识别与理解
1.2.3运动分析
1.2.4生成与恢复
1.3计算机视觉在智能建造中的应用
1.3.1规划阶段
1.3.2设计阶段
1.3.3施工阶段
1.3.4运营阶段
1.4计算机视觉编程语言——Python与MATLAB
1.4.1Python语言简介与安装
1.4.2MATLAB语言简介与安装
1.4.3其他计算机视觉编程语言简介
1.5计算机视觉开源库——OpenCV
1.5.1OpenCV简介与安装
1.5.2OpenCV模块功能
1.5.3计算机视觉其他相关开源库
本章总结
思考题与练习题
第2章射影几何与图像形成
2.1光与图像
2.1.1光源
2.1.2生物成像
2.1.3光学成像
2.2射影几何与转换
2.2.1射影几何基础
2.2.2二维变换
2.2.3三维变换
2.2.4三维旋转
2.2.5三维到二维投影
2.2.6透镜畸变
2.3数码相机
2.3.1采样
2.3.2颜色
2.3.3压缩
本章总结
思考题与练习题
第3章图像处理
3.1图像基本操作
3.1.1图像读取
3.1.2图像显示
3.1.3图像保存
3.2图像结构与色彩空间
3.2.1图像结构与阈值处理
3.2.2颜色空间
3.2.3图像通道操作
3.3像素操作与图像运算
3.3.1像素统计
3.3.2像素修改
3.3.3感兴趣区域
3.3.4图像绘制
3.3.5图像数值运算
3.3.6图像加法运算
3.3.7图像比较运算
3.3.8图像按位逻辑运算
3.3.9掩码
3.4图像变换
3.4.1尺寸变换
3.4.2翻转变换
3.4.3图像连接
3.4.4仿射变换
3.4.5透视变换
3.4.6极坐标变换
3.5图像金字塔
3.5.1高斯金字塔
3.5.2拉普拉斯金字塔
3.6图像直方图
3.6.1直方图计算
3.6.2直方图绘制
3.6.3归一化直方图
3.6.4直方图均衡化
3.6.5直方图比较
3.6.6直方图反向投影
3.7空间域与频域处理
3.7.1噪声种类与生成
3.7.2卷积
3.7.3线性滤波
3.7.4非线性滤波
3.7.5边缘检测
3.7.6傅里叶变换
3.7.7傅里叶变换中的卷积
3.7.8傅里叶变换中的滤波
3.8图像形态学
3.8.1像素距离与连通域
3.8.2腐蚀
3.8.3膨胀
3.8.4形态学高级操作
本章总结
思考题与练习题
第4章视频形成与处理
4.1视频形成简介
4.1.1视频的定义与历史发展
4.1.2摄像机系统组成
4.1.3视频压缩与编码
4.2视频读取与保存
4.2.1视频读取
4.2.2摄像机调用
4.2.3视频保存
4.3视频处理
4.3.1视频帧提取与序列重组
4.3.2帧处理与增强
4.3.3视频合成
本章总结
思考题与练习题
第5章识别与追踪
5.1目标识别
5.1.1颜色检测
5.1.2轮廓检测
5.1.3形状检测
5.1.4矩计算
5.1.5点集拟合
5.1.6模板匹配
5.2特征点检测与匹配
5.2.1关键点与绘制
5.2.2角点检测
5.2.3特征点检测
5.2.4特征点匹配
5.3运动估计
5.3.1运动估计概述
5.3.2亚像素
5.3.3基于特征颜色的运动估计
5.3.4基于特征点的运动估计
5.3.5基于模板匹配的运动估计
5.3.6基于光流法的运动估计
本章总结
思考题与练习题
第6章立体视觉与标定
6.1单目视觉
6.1.1单目模型概述
6.1.2单目标定
6.1.3单目校正
6.1.4单目投影
6.1.5单目反投影
6.1.6单目姿态估计
6.2双目视觉
6.2.1双目模型概述
6.2.2双目标定
6.2.3双目校正
6.2.4双目投影
6.2.5双目姿态估计
6.3多目视觉
6.3.1多目视觉概述
6.3.2多目视觉中的关键技术
本章总结
思考题与练习题
第7章计算摄影
7.1计算摄影基础
7.1.1计算摄影发展史
7.1.2相机摄影与手机摄影
7.2计算摄影应用
7.2.1高动态范围成像
7.2.2超分辨率成像
7.2.3图像背景虚化
7.2.4图像去模糊
7.2.5长曝光成像
7.2.6图像背景提取
7.2.7图像合成与风格渲染
本章总结
思考题与练习题
第8章三维重建
8.1三维重建基础
8.1.1基于图像的三维重建方法分类
8.1.2基于图像的三维重建方法流程
8.1.3运动恢复结构的基本概念
8.1.4基于多视图立体的基本概念
8.1.5三维重建相关的数据格式
8.1.6三维重建相关的数据集
8.2运动恢复结构算法的原理及应用
8.2.1COLMAP算法介绍
8.2.2对极几何
8.2.3捆绑调整
8.2.4运动恢复结构的应用
8.3多视图立体算法的原理及应用
8.3.1邻域帧选择
8.3.2深度图计算
8.3.3多视图立体的应用
8.4曲面重建原理及应用
8.4.1曲面重建原理
8.4.2曲面重建的应用
8.5纹理贴图原理及应用
8.5.1纹理贴图原理
8.5.2纹理贴图的应用
8.6三维重建延展应用
8.6.1SLAM基本概念与历史发展
8.6.2SLAM技术应用现状
8.6.3增强现实基本概念与历史发展
8.6.4增强现实技术应用现状
8.6.5虚拟现实基本概念与历史发展
8.6.6虚拟现实技术应用现状
本章总结
思考题与练习题
第9章机器学习
9.1机器学习基础
9.1.1机器学习简介
9.1.2机器学习的发展
9.1.3监督学习与无监督学习
9.1.4机器学习相关类库
9.2计算机视觉与机器学习
9.2.1K-均值聚类算法
9.2.2K-近邻算法
9.2.3决策树算法
9.2.4随机森林算法
9.2.5支持向量机
9.3深度学习基础
9.3.1深度学习简介
9.3.2深度学习的发展
9.3.3深度学习模型
9.3.4神经网络基础
9.3.5卷积神经网络
9.4计算机视觉与深度学习
9.4.1图像分类
9.4.2目标检测
9.4.3实例分割
9.4.4图像生成
本章总结
思考题与练习题
参考文献