人工智能(AI)作为当今科技革命的核心驱动力,正在深刻改变着人类社会的方方面面。从日常生活中的智能语音助手到工业领域的自动化生产,从医疗诊断的精准预测到自动驾驶技术的突破性进展,AI 的应用已渗透到各个行业,成为推动社会进步的重要引擎。本书旨在为读者提供一份全面、系统的人工智能技术指南,帮助大家深入理解这一领域的核心理论、关键技术及前沿应用。
本书的编写立足于系统性、前沿性和实践性三大原则,不仅梳理了人工智能的发展历程、主要学派和技术分支,还深入探讨了机器学习、深度学习、大模型训练等核心算法的原理与实现。同时,书中结合了当前热门的GPT、DeepSeek 等模型的内部机制,以及Hugging Face、LangChain 等工具的实际应用,力求为读者呈现一个理论与实践并重的知识体系。
全书内容涵盖人工智能的多个重要领域。基础理论部分(第1 ~2章) 详细解析了人工智能的三大学派和发展历程,深入探讨了机器学习和深度学习的核心算法,包括监督学习、无监督学习、强化学习等经典方法,以及卷积神经网络、循环神经网络、Transformer 等深度学习架构。特别对大模型技术进行了重点剖析,包括GPT 系列模型的内部机制、预训练与微调方法,以及国产DeepSeek 模型的创新架构。
技术应用部分(第3 ~ 6 章) 聚焦多个前沿领域:在大模型训练与优化方面,介绍了分布式训练框架、超参数调整策略和模型压缩技术;在AI 与物联网融合方面,详细讲解了AIoT 技术栈和边缘计算;在人形机器人领域,阐述了运动规划算法和强化学习方法;在自动驾驶章节,系统分析了技术发展路线和系统构成要素。
工具与实践部分(第7 ~ 8 章) 重点介绍了当前流行的AI 开发工具和框架,包括Hugging Face Transformers 库的使用方法、LangChain 的应用实践,以及如何通过Ollama进行模型融合和服务化部署。特别提供了阿里云企业级部署DeepSeek 模型的实战指南。
发展趋势部分(第9 章)深入探讨了AI 伦理、法律与安全问题,分析了AI 与物联网、区块链、5G、量子计算等新兴技术的融合创新趋势,展望了AI 对未来社会经济结构和个人生活方式的影响,并特别关注了中国开源大模型对行业生态的推动作用。
对个人而言,学习AI 不仅可以拓宽职业发展路径,还能增强解决问题的能力。在企业层面,利用AI 技术可以实现更高效的运营管理和更加精准的市场预测,从而在激烈的市场竞争中占据有利位置。因此,无论你是学生、研究人员还是企业界人士,掌握AI 知识都将为你打开一扇通往未来的大门。
本书旨在为读者提供一个全面而深入的视角,探索AI 技术的核心原理及其在实际中的应用。本书不仅适合对AI 感兴趣的初学者,也适用于希望深入了解AI 领域最新进展和技术细节的专业人士。
希望通过本书的学习,每一位读者都能成为这场科技变革中的参与者和推动者,共同迎接更加智慧美好的未来。
编者
第1章 人工智能概述 001-025
1.1 AI 的发展历程与现状 001
1.1.1 人工智能的三大学派 001
1.1.2 人工智能的发展历程 003
1.1.3 人工智能的前景展望 010
1.2 AI 的主要分支与关键技术体系概述 010
1.2.1 机器学习 011
1.2.2 计算机视觉 013
1.2.3 自然语言处理 014
1.2.4 知识图谱 014
1.2.5 人机交互 015
1.2.6 生物特征识别 016
1.2.7 机器人技术 017
1.2.8 专家系统与认知计算 018
1.2.9 模糊逻辑和模糊识别 019
1.2.10 AI 芯片与计算架构 020
1.2.11 大数据处理与分析 022
1.2.12 云计算与边缘计算 023
1.2.13 AI 操作系统与中间件 023
1.2.14 AI 安全与伦理 024
第2章 人工智能核心算法与大模型技术 026-137
2.1 机器学习基础算法体系 026
2.1.1 监督学习 026
2.1.2 无监督学习 045
2.1.3 强化学习 068
2.2 深度学习架构与深层原理探析 073
2.2.1 前馈神经网络 074
2.2.2 全连接网络 074
2.2.3 卷积神经网络 080
2.2.4 循环神经网络 083
2.2.5 生成对抗网络 086
2.2.6 自编码器 088
2.2.7 Transformer 090
2.2.8 编码器- 解码器架构 090
2.2.9 胶囊网络 092
2.2.10 残差网络 094
2.2.11 图神经网络 096
2.2.12 深度信念网络 098
2.2.13 双向循环神经网络 098
2.2.14 多层感知机 099
2.2.15 密集连接网络 100
2.3 GPT 模型的内部机制及实现方法解读 101
2.3.1 GPT 模型介绍 101
2.3.2 GPT 模型核心工作原理 103
2.3.3 Transformer 工作流程 109
2.3.4 GPT 预训练与微调 111
2.4 DeepSeek创新开源的典范 118
2.4.1 混合专家系统架构 118
2.4.2 多头潜注意力 119
2.4.3 多令牌预测 121
2.4.4 强化学习训练方法 123
2.4.5 模型蒸馏技术 125
2.4.6 双管道流水线与FP8 混合精度 126
2.4.7 开源与社区贡献 127
2.4.8 DeepSeek 和GPT 对比 127
2.5 算力在AI 领域的重要性 130
2.5.1 算力的定义 130
2.5.2 算力的度量单位 130
2.5.3 算力在AI 领域的重要性 132
2.5.4 英伟达在算力方面的领先优势 135
第3章 大模型训练与优化策略 138-193
3.1 大数据预处理与特征工程技术 138
3.1.1 大数据预处理 138
3.1.2 特征工程 153
3.1.3 常见的大数据处理软件 163
3.1.4 初学者入门建议 166
3.2 分布式训练框架的选择与优化 167
3.2.1 分布式训练策略 167
3.2.2 主流的分布式训练框架 168
3.2.3 分布式训练优化策略 173
3.3 超参数调整策略与模型压缩技术 176
3.3.1 典型的大模型超参数 176
3.3.2 调整超参数的实验性方法 188
3.3.3 大模型超参数调整主要步骤 189
3.3.4 大模型压缩技术 190
第4章 物联网与AI 的深度融合 194-212
4.1 AIoT 技术栈关键组成 194
4.1.1 感知层 194
4.1.2 网络层 195
4.1.3 平台层 196
4.1.4 应用层 198
4.1.5 AI 层 199
4.1.6 安全层 200
4.1.7 服务管理层 202
4.2 AIoT 边缘计算操作系统及处理海量数据方式 203
4.2.1 AIoT 边缘计算操作系统 203
4.2.2 边缘计算处理海量数据的方式 208
4.3 AIoT 应用案例 209
4.3.1 智慧城市 209
4.3.2 智能制造 210
4.3.3 智慧农业 211
4.3.4 健康监护 211
第5章 人形机器人与AI 智能交互 213-264
5.1 机器人操作系统与多模态感知模块设计 213
5.1.1 机器人操作系统介绍 213
5.1.2 常见的机器人操作系统 214
5.1.3 机器人多模态感知模块 221
5.1.4 基于英伟达Project GROOT 简要代码示例 225
5.2 人形机器人运动规划与路径优化算法 231
5.2.1 环境建模 231
5.2.2 运动规划 244
5.3 强化学习在机器人自主行为学习与决策中的应用 251
5.3.1 马尔可夫决策过程 252
5.3.2 机器人与环境互动模型 258
5.3.3 强化学习在机器人路径规划与导航中的应用 259
5.3.4 机器人强化学习的技术要点 262
5.3.5 未来展望 264
第6章 自动驾驶与AI 265-308
6.1 自动驾驶级别划分与技术发展路线 265
6.1.1 自动驾驶级别划分详细描述 265
6.1.2 自动驾驶技术发展路线介绍 267
6.2 自动驾驶系统构成要素与功能模块详解 269
6.2.1 国内外主要厂商的自动驾驶系统介绍 269
6.2.2 构成要素与功能模块详解 271
6.2.3 车辆控制 286
6.2.4 动力学建模 288
6.2.5 人机交互提升用户体验的关键 292
6.2.6 通信V2X 开启新纪元 295
6.2.7 云服务支持 297
6.2.8 系统架构综合考虑的安全与性能 301
6.3 特斯拉自动驾驶技术 303
6.3.1 感知技术 304
6.3.2 BEV 304
6.3.3 3D 重建与占用网络 305
6.3.4 深度学习与神经网络 307
6.3.5 端到端方案 307
第7章 Hugging Face Transformers 与AI 大模型的集成 309-333
7.1 Hugging Face Transformers 309
7.1.1 Hugging Face Transformers 概述 309
7.1.2 Hugging Face Models、Datasets 和Spaces 310
7.2 Hugging Face Transformers 库 311
7.2.1 Hugging Face Transformers 库介绍 311
7.2.2 Hugging Face 开发环境 312
7.2.3 Hugging Face Transformers 库跨语言处理 313
7.2.4 Hugging Face Transformers 库性能优化方法 315
7.3 如何选用并训练适合的预训练模型 321
7.3.1 为什么使用预训练模型 321
7.3.2 Hugging Face 的预训练模型库 322
7.3.3 如何选择合适的预训练模型 322
7.3.4 数据准备 322
7.3.5 模型微调 326
7.3.6 模型评估 327
7.3.7 模型部署 328
7.3.8 持续优化 329
7.4 如何通过Hugging Face Transformers 接口进行AI 大模型封装和调用 331
第8章 LangChain 与Ollama 334-348
8.1 LangChain 334
8.1.1 LangChain 概述 334
8.1.2 LangChain AI 模型准备 335
8.1.3 LangChain 和 LLaMA 3 搭建聊天机器人系统 336
8.2 Ollama 341
8.2.1 Ollama 介绍 341
8.2.2 Ollama 模型融合功能 343
8.2.3 Ollama 模型服务化 345
8.3 阿里云企业级部署DeepSeek 模型 347
第9章 AI 技术的发展趋势与挑战 349-370
9.1 AI 伦理、法律与安全问题的探讨 349
9.1.1 AI 伦理问题 349
9.1.2 AI 法律问题 350
9.1.3 AI 安全问题 351
9.1.4 未来展望 352
9.2 AI 与其他新兴科技的融合创新趋势 353
9.2.1 AI 与物联网的融合 353
9.2.2 AI 与区块链的融合 357
9.2.3 AI 与5G 通信的融合 360
9.2.4 AI 与边缘计算的融合 362
9.2.5 AI 与量子计算的融合 363
9.2.6 AI 与虚拟现实和增强现实的融合 364
9.2.7 AI 与生物技术的融合 365
9.2.8 未来展望 365
9.3 AI 对未来社会经济结构及个人生活方式的影响 366
9.3.1 对社会经济结构的影响 366
9.3.2 对个人生活方式的影响 369
9.4 中国开源大模型DeepSeek 对整个AI 行业及国产软硬件的影响 369