本书是一本专注于医学领域的人工智能实践教材,旨在帮助读者快速掌握医学智能分析的核心技术与应用方法。本书以华为的开源深度学习框架MindSpore为基础,结合多场景、多技术的案例,为读者提供丰富的实操指南,助力读者在医学人工智能领域开启高效学习之旅。 本书运用MindSpore框架,围绕现实医学问题开展智能分析实践,全书分为四篇。第一篇为基础知识篇(第1~2章)。第1章为MindSpore概述与开发环境配置,主要介绍MindSpore的概念、核心特点与架构,MindSpore与深度学习框架的比较,MindSpore的安装,以及医疗风险预测系统项目案例等;第2章为医学数据与任务概述,主要介绍医学数据的种类、特点和基本结构,常见医学数据集介绍,数据分析基本流程等。第二篇为项目实践篇(第3~14章),聚焦人工智能核心技术,围绕多个场景下的具体案例展开,包括以"使用sklearn数据集进行糖尿病预测建模”、"K近邻算法及乳腺癌检测分类”和"脑电图(EEG)分析与癫痫预测”为代表的12个项目案例。第三篇为综合案例篇(第15~18章),包括"基于线性回归的医疗保险费用预测”及"肺部和结肠组织病理分类任务”等项目案例,聚焦医学项目全过程指导。第四篇为知识进阶篇(第19章),聚焦大模型在医学领域的应用,旨在分析国内外研究现状,诠释华为技术生态在解决医学问题中的重要作用。 本书注重初学者友好设计,配套教学PPT、实践代码等丰富的教学资源,读者可在华信教育资源网注册后免费下载。本书旨在帮助读者更好地理解和应用书中的内容,提升学习效率。本书适合人工智能和医学领域的从业者、科研人员及高等院校相关专业的学生学习与参考。
齐鹏,英国伦敦国王学院机器人学博士,同济大学副教授、博士生导师,上海市青年科技人才协会副会长,首届上海科技青年35人引领计划获奖者、上海市青年科技启明星、“东方英才”(青年)。主持国家重点研发计划“智能机器人”专项青年科学家项目、国家自然科学基金、上海市“科技创新行动计划”等项目,担任剑桥大学出版社Robotica期刊副主编,指导学生获得华为ICT大赛全球总决赛创新赛特等奖、“挑战杯”全国大学生课外学术科技作品竞赛一等奖等。
第一篇 基础知识篇
第1章 MindSpore概述与开发环境配置 2
1.1 什么是MindSpore 2
1.2 MindSpore的核心特点与架构 2
1.2.1 MindSpore的架构 3
1.2.2 华为昇腾AI全栈介绍 4
1.3 MindSpore与深度学习框架的比较 5
1.3.1 MindSpore与TensorFlow的比较 6
1.3.2 MindSpore与PyTorch的比较 6
1.3.3 MindSpore与Keras的比较 7
1.4 MindSpore的安装 7
1.4.1 获取安装命令 7
1.4.2 验证是否成功安装 8
1.5 MindSpore架构执行流程 9
1.6 项目案例:医疗风险预测系统 10
1.6.1 项目简介 10
1.6.2 技术特点 10
1.6.3 功能特点 11
1.6.4 项目结构 11
1.6.5 系统详细代码分析 12
1.6.6 系统运行方法 15
第2章 医学数据与任务概述 16
2.1 医学数据的种类与特点 16
2.2 医学数据的基本结构 17
2.2.1 结构化数据(Structured Data) 18
2.2.2 半结构化数据(Semi-Structured Data) 19
2.2.3 非结构化数据(Unstructured Data) 19
2.3 医学数据集的含义与作用 20
2.3.1 数据集的构成 20
2.3.2 数据集的作用 21
2.4 常见医学数据集介绍 21
2.5 数据分析基础流程 22
2.5.1 数据预处理 22
2.5.2 探索性数据分析 22
2.5.3 特征选择与降维 23
2.5.4 建模与评估 24
2.6 医学中的张量应用 24
第二篇 项目实践篇
第3章 使用sklearn数据集进行糖尿病 预测建模 28
3.1 项目基本介绍 28
3.2 核心技术 28
3.3 数据分析详细过程 28
3.4 具体实现过程 29
3.5 项目小结 31
第4章 电子病历数据的清洗与预处理 32
4.1 项目基本介绍 32
4.2 核心技术 32
4.3 数据分析详细过程 33
4.4 具体实现过程 34
4.5 项目小结 41
第5章 K近邻算法及乳腺癌检测分类 42
5.1 项目基本介绍 42
5.2 核心技术 42
5.3 数据分析详细过程 43
5.4 具体实现过程 43
5.5 项目小结 45
第6章 乳腺癌数据分析与模型评估 46
6.1 项目基本介绍 46
6.2 核心技术 46
6.3 数据分析详细过程 46
6.4 具体实现过程 47
6.5 项目小结 56
第7章 医学图像数据的加载和显示 57
7.1 项目基本介绍 57
7.2 核心技术 57
7.3 数据分析详细过程 58
7.4 具体实现过程 59
7.5 项目小结 64
第8章 脑肿瘤MRI图像分类与数据可视化 66
8.1 项目基本介绍 66
8.2 核心技术 66
8.3 具体实现过程 66
8.4 项目小结 74
第9章 脑电图(EEG)分析与癫痫预测 75
9.1 项目基本介绍 75
9.2 核心技术 75
9.3 具体实现过程 76
9.4 项目小结 108
第10章 基于X射线胸片的肺炎分类 109
10.1 项目基本介绍 109
10.2 核心技术 109
10.3 数据分析详细过程 109
10.4 具体实现过程 110
10.5 项目小结 112
第11章 深度学习与MRI数据集处理 113
11.1 项目基本介绍 113
11.2 核心技术 113
11.3 具体实现过程 113
11.4 项目小结 119
第12章 基于深度学习的脑部MRI数据分类 120
12.1 项目基本介绍 120
12.2 核心技术 120
12.3 具体实现过程 121
12.4 项目小结 124
第13章 利用多模态数据进行糖尿病预测与管理 125
13.1 项目基本介绍 125
13.2 核心技术 125
13.3 数据分析详细过程 126
13.4 具体实现过程 127
13.5 项目小结 134
第14章 ResNet50模型在脑肿瘤中的诊断识别 136
14.1 项目基本介绍 136
14.2 核心技术 136
14.3 具体实现过程 137
14.4 项目小结 153
第三篇 综合案例篇
第15章 基于线性回归的医疗保险费用预测 156
15.1 项目基本介绍 156
15.2 核心技术 156
15.3 数据分析详细过程 157
15.4 具体实现过程 158
15.5 项目小结 187
第16章 肺部和结肠组织病理分类任务 188
16.1 项目基本介绍 188
16.2 核心技术 188
16.3 具体实现过程 188
16.4 项目小结 219
第17章 基于Web的乳腺癌分类预测系统 220
17.1 项目基本介绍 220
17.2 核心技术 220
17.3 数据分析详细过程 221
17.4 具体实现过程 221
17.5 项目小结 230
第18章 使用卷积神经网络进行肺结节 自动检测 231
18.1 项目基本介绍 231
18.2 核心技术 231
18.3 数据分析详细过程 232
18.4 具体实现过程 232
18.5 项目小结 243
第四篇 知识进阶篇
第19章 大模型在医学领域的应用 246
19.1 研究进展 246
19.1.1 多模态知识图谱构建与融合技术 246
19.1.2 医学大模型评测体系建设 246
19.1.3 Transformer预训练模型在BioNLP中的扩展 247
19.1.4 中文放射图像领域生成式模型的探索 247
19.1.5 检验医学领域的评测与模型对比 247
19.1.6 循证医学中的生成式AI工具探索 248
19.2 应用场景 248
19.2.1 临床医学 248
19.2.2 医学图像处理 249
19.2.3 检验医学 249
19.2.4 循证医学 250
19.2.5 医学教育 250
19.3 面临的挑战 251
19.3.1 数据隐私问题 251
19.3.2 可解释性不足 252
19.3.3 多模态任务复杂性 252
19.3.4 通用大模型医学知识不足 253
19.3.5 大模型部署成本与监管合规问题 253
19.4 发展趋势与建议 254
19.4.1 专病专科轻量化大模型建设 254
19.4.2 医院本地化部署与隐私合规化 254
19.4.3 多模态医学数据的融合建模 255
19.4.4 可解释性与可信AI系统建设 256
19.4.5 医学AI标准体系与产业规范制定 256
19.5 国内外研究现状 257
19.6 华为与医学大模型 259
参考文献 261