生成式人工智能是当今科技领域的前沿热点技术。本书从生成式AI入手,系统介绍了人工智能基础知识。全书分为四个部分共15个项目,包含35个学习任务,全面系统地介绍了生成式AI的基础理论、核心技术、应用场景以及社会影响,既突出生成式AI和AIGC技术,又重视AIGC应用,旨在为读者提供一个全面、深入且实用的学习平台,帮助读者快速掌握生成式AI和AIGC技术的精髓及其在各领域的应用实践。本书内容丰富、结构清晰、理论与实践相结合,既适合高等职业院校各专业的师生作为教材使用,也适合AI领域从业者、研究人员以及对AI技术感兴趣的读者自学参考。通过阅读本书,读者将能够全面了解AI和生成式AI的核心技术与应用实践,掌握其在各领域的创新应用,为未来的职业发展和个人成长奠定坚实基础。
采用项目式编写形式,面向高等职业院校的人工智能通识教育需求。详细介绍LLM技术、提示工程、文本生成、图像生成、音频生成以及多模态生成等关键领域。展示生成式AI在文化创意、金融服务、智能制造、科学研究等领域的广泛应用。配套提供电子课件、微课视频、教学大纲、教案、教学指导、作业集与答案。
2022年11月30日,美国OpenAI公司对外发布了基于大语言模型(LLM)的AI聊天机器人程序ChatGPT,它展现出绝妙的人机交互体验,能够充分理解人类自然语言,可以用人类自然对话的方式来交互。此外,它还可以用于更为复杂的语言工作,如自动生成文本、自动问答、自动摘要等多种任务。一时间,人们对其背后技术的了解和研究,对LLM和生成式AI技术的关注冲向了顶 峰。很快,中国的AI初创企业如雨后春笋般不断涌现。2025 年年初,发布了低成本、高性能生成式AI的DeepSeek(深度求索公司)在全世界爆红,成为在互联网巨头的资金和学术机构的人才支撑下茁壮成长的“中华AI”,原本以美国企业为中心的AI性能竞争迎来全新局面。生成式AI已经成为当今科技领域极具影响力和变革性的力量之一。它不仅推动了技术的进步,更深刻地改变了人们的生活方式、工作模式以及对世界的认知。本书旨在为读者提供一个全面、系统且深入的生成式AI知识体系,帮助读者更好地理解这一前沿技术,并探索其在各个领域的广泛应用。本书分为四个部分。在基础理论篇(项目1、2)中,深入探讨了人工智能(AI)的起源、大数据的特征以及机器学习与深度学习的关系,为读者构建起理论框架。同时,通过对生成式AI的定义、层次和应用场景的介绍,帮助读者初步了解这一技术的核心概念和价值。核心技术篇(项目3~8)是本书的重点,详细介绍了LLM技术、提示工程与技巧、文本生成技术、图像生成技术、音频生成技术以及多模态生成技术等关键领域。通过对技术的剖析,读者能够掌握生成式AI的核心原理和实现方法,并了解如何通过技术创新推动其发展。应用场景篇(项目9~13)展示了生成式AI在文化创意、金融服务、智能制造、科学研究与设计以及智慧城市等领域的广泛应用。通过丰富的案例和实践分析,读者将看到AI和生成式AI如何为各个行业带来创新和变革,同时也将了解到其在实际应用中面临的挑战和未来的发展方向。最后,社会影响篇(项目14、15)深入探讨了AI和生成式AI所带来的伦理、法律和社会问题。从数据隐私保护到知识产权保护,从AI伦理原则到AGI(通用人工智能)的未来发展,将引导读者思考如何在技术进步的同时,确保其符合人类的价值观和社会利益。在撰写本书的过程中,我们力求保证内容的全面性、准确性和可读性。希望本书不仅能够成为高校各专业人工智能通识教材和专业人士的参考书籍,也能为那些对AI和生成式AI感兴趣的读者提供一个清晰易懂的入门指南。同时,我们鼓励读者在阅读本书的过程中,积极参与相关技术的研究和实践,探索AI和生成式AI的无限可能。AI和生成式AI的概念、技术与应用是一门理论性和实践性都很强的必修课程。本书精心设计教学过程,每个项目都有针对性地设计了课后作业以及实训与思考环节。本书的教学进度设计见课程教学进度表,该表可作为教师授课参考。实际执行时,教师可按照教学大纲安排教学进度,确定本课程的教学进度。本课程的教学评测可以从以下几个方面入手,即:(1)每个项目的课后作业(15项)。(2)每个项目的“实训与思考”活动(14项)。(3)项目15的“课程学习与实训总结”。(4)学生针对每个项目的内容写下的阅读笔记(建议)。(5)平时考勤情况。(6)授课老师认为有必要的其他评测方法。本书特色鲜明、易读易学,适合高等职业院校各专业学生学习,也适合对AI以及LLM、生成式AI、AIGC、AGI相关领域感兴趣的读者阅读参考。本书配有授课电子课件、20讲微课教学视频以及丰富的教学资源,需要的教师可登录www.cmpedu.com免费注册,审核通过后下载,或联系编辑索取。本书微课视频二维码的使用方式:1)刮开教材封底处的“刮刮卡”,获得“兑换码”。2)关注微信公众号“天工讲堂”,选择“我的”-“使用”。3)输入“兑换码”和“验证码”,选择本书全部资源并免费结算。4)使用微信扫描教材中的二维码观看微课视频。本书由湖南财经工业职业技术学院张小寒、谢超担任主编,湖南财经工业职业技术学院王成、黄承明担任副主编。参加本书编写工作的还有湖南财经工业职业技术学院王帅、罗争、唐腾、胡迎春、匡孟秋,浙大城市学院周苏。本书在编写过程中得到了湖南财经工业职业技术学院领导、同事,以及中慧云启科技集团有限公司、新道科技股份有限公司、东软睿新科技集团、北京博导前程信息技术股份有限公司等企业的大力支持和帮助,在此表示衷心的感谢!欢迎教师与作者交流并索取与本书配套的相关教学资料。由于作者水平有限,书中难免有疏漏之处,恳请读者批评指正。
张小寒,男,汉族,1979年出生,湖南财经工业职业技术学院副教授,信息工程学院院长。中共党员,大学本科学历,硕士学位。参加工作以来一直从事职业教育工作,先后主编教材3部、专著1部,参编教材10余部,主持省市校级课题近10项,发表论文40余篇。先后参与多项企业项目,有较丰富的实战经验和较强的实践能力。
前言第一部分 基础理论篇项目1 人工智能基础 2任务1.1 熟悉计算机基础 21.1.1 通用电子计算机 31.1.2 图灵测试及其发展 31.1.3 大数据定义 41.1.4 大数据的3V特征 51.1.5 人工智能的定义 61.1.6 人工智能发展的“中国风” 6任务1.2 进入人工智能时代 91.2.1 强人工智能 91.2.2 弱人工智能 101.2.3 实用型AI 111.2.4 机器学习 111.2.5 深度学习 131.2.6 机器学习与深度学习的关系 14【作业】 14【实训与思考】探索AI在日常生活中的应用 16项目2 生成式AI与AIGC 18任务2.1 从自然语言处理起步 182.1.1 Blockhead思维实验 182.1.2 NLP研究内容 192.1.3 深度学习的影响 202.1.4 LLM崛起 212.1.5 LLM的幻觉 22任务2.2 熟悉生成式人工智能 242.2.1 关于判别式AI 242.2.2 关于生成式AI 252.2.3 生成式AI的层次 262.2.4 定义AIGC 282.2.5 生成式AI与AIGC的关系 292.2.6 AIGC应用场景 29【作业】 31【实训与思考】熟悉阿里云大模型“通义千问” 32第二部分 核心技术篇项目3 大语言模型技术 36任务3.1 熟悉算法、算力与算料概念 363.1.1 算法:人工智能的智慧之源 363.1.2 算力:人工智能的动力引擎 373.1.3 算料:人工智能的燃料之源 373.1.4 DeepSeek带来的启示 37任务3.2 熟悉LLM工作原理 383.2.1 词元及其标记化 383.2.2 基础模型 383.2.3 词嵌入及其含义 393.2.4 生成和理解 403.2.5 预训练与微调 40任务3.3 熟悉关键生成模型 413.3.1 语言模型基础 413.3.2 生成对抗网络GAN 413.3.3 变分自编码器VAE 443.3.4 流模型 463.3.5 接入LLM的几种方法 47【作业】 49【实训与思考】LLM典型案例分析 51项目4 提示工程与技巧 54任务4.1 熟悉提示工程技术 544.1.1 提示的原理 554.1.2 提示词的分类和调优 564.1.3 链式思考提示 574.1.4 生成知识提示 584.1.5 少样本提示 584.1.6 自一致提示 584.1.7 思维树提示 59任务4.2 掌握提示工程技巧 604.2.1 提示词的原则 604.2.2 提示学习 614.2.3 语境学习 624.2.4 提示词框架推荐 634.2.5 提示词实践技巧 65【作业】 66【实训与思考】练习撰写提示词 68项目5 文本生成技术 71任务5.1 熟悉典型语言模型方法 715.1.1 基于规则的方法 725.1.2 统计语言模型 735.1.3 循环神经网络及其变体 745.1.4 Transformer模型 755.1.5 Transformer结构 805.1.6 Transformer模块 815.1.7 混合模型 82任务5.2 掌握典型文本生成技术 835.2.1 文本摘要 835.2.2 诗歌生成 835.2.3 简单对话系统 845.2.4 翻译任务中的应用 84【作业】 85【实训与思考】熟悉AI助手Kimi 87项目6 图像生成技术 90任务6.1 熟悉图像生成模型 906.1.1 扩散模型 916.1.2 自回归模型 916.1.3 典型图像生成模型 926.1.4 图像生成应用场景 92任务6.2 熟悉图像与视频生成技术 946.2.1 图像风格迁移 956.2.2 超分辨率重建 966.2.3 视频生成 986.2.4 医疗影像合成 996.2.5 挑战与未来发展 100【作业】 101【实训与思考】基于深度学习的图像生成 103项目7 音频生成技术 105任务7.1 熟悉音频生成技术 1057.1.1 音频与音乐 1067.1.2 音频生成核心技术 1067.1.3 语音合成 1077.1.4 音乐旋律生成 1097.1.5 波形建模 1107.1.6 用户交互与自动化 111任务7.2 掌握音频增强与修复 1127.2.1 噪声减少 1127.2.2 回声消除 1137.2.3 音频修复 1137.2.4 动态范围压缩 1137.2.5 等化 1147.2.6 时间拉伸与音高转换 115【作业】 116【实训与思考】探索音乐旋律生成模型 117项目8 多模态生成技术 120任务8.1 熟悉多模态生成的概念 1208.1.1 多模态生成技术基础 1208.1.2 模型结构融合策略 1218.1.3 多模态生成的应用场景 1228.1.4 技术挑战与发展趋势 124任务8.2 掌握典型多模态生成技术 1268.2.1 视觉与文本结合 1268.2.2 跨媒体内容生成 1278.2.3 智能感知与响应 1298.2.4 生成中的情感一致性 1318.2.5 案例:Muse文生图模型 131【作业】 132【实训与思考】多模态生成技术应用—情感音乐可视化 133第三部分 应用场景篇项目9 AIGC促进文化创意 137任务9.1 文化创意应用场景 1379.1.1 AIGC用于文学创作 1389.1.2 自动化写作工具 1399.1.3 激发创意灵感 1399.1.4 AIGC带来新商业模式 1409.1.5 版权保护与交易机制 140任务9.2 视觉艺术创作 1419.2.1 图像生成与编辑 1419.2.2 艺术风格迁移 1419.2.3 VR与AR 1429.2.4 AI绘图工具 1429.2.5 视频生成典型工具 144任务9.3 音乐与音频制作 1459.3.1 自动作曲 1459.3.2 效果迁移与融合 1469.3.3 音频处理与配乐 1469.3.4 智能混音与母带处理 1469.3.5 互动式音乐体验 146任务9.4 影视娱乐开发 1489.4.1 剧本开发与优化 1489.4.2 视觉效果生成 1489.4.3 智能剪辑与叙事结构 1489.4.4 互动式影视体验 149【作业】 149【实训与思考】文生图:注册使用Midjourney绘图工具 151项目10 AIGC提升金融服务 153任务10.1 智慧金融服务 15310.1.1 金融服务概述 15310.1.2 智能客服 15510.1.3 风险评估 15610.1.4 个性化推荐 15710.1.5 智能投顾 15910.1.6 反欺诈系统 161任务10.2 金融服务应用AIGC典型案例 16210.2.1 智投宝智能投顾平台 16210.2.2 智安盾金融反欺诈系统 163【作业】 164【实训与思考】AIGC在金融服务中的应用探索 166项目11 AIGC助力智能制造 169任务11.1 智能制造基本概念 16911.1.1 智能制造系统 17011.1.2 综合特征 17111.1.3 智能技术 17211.1.4 测控装置 17311.1.5 运作过程 173任务11.2 将AIGC应用于智能制造 17411.2.1 产品设计与创新 17411.2.2 工艺规划生产流程优化 17511.2.3 生产调度与资源配置 17511.2.4 数据驱动精准需求预测 17611.2.5 生产流程模拟与优化 17611.2.6 生产过程监控与质量控制 17711.2.7 设备维护与故障预测 177任务11.3 AIGC优化智能制造供应链 17711.3.1 需求预测与库存管理 17711.3.2 物流与运输 17811.3.3 供应商管理与协同 17911.3.4 生产过程质量控制 17911.3.5 面临的挑战与应对 179【作业】 180【实训与思考】AIGC在智能制造中的应用探索 182项目12 AIGC赋能科学研究与设计 185任务12.1 AIGC应用于设计 18512.1.1 AIGC设计应用场景 18512.1.2 与设计师的协同模式 18612.1.3 跨学科合作 18912.1.4 科研文献管理 19012.1.5 开放科学与共享平台建设 191任务12.2 AIGC典型科研应用 19212.2.1 数据增强 19212.2.2 科学模拟 19212.2.3 自动化实验设计 19312.2.4 模型训练与改进 19312.2.5 理论验证与假设测试 194任务12.3 AIGC科研应用案例 19512.3.1 加速药物发现 19612.3.2 生命科学案例 19712.3.3 材料科学案例 19712.3.4 环境科学案例 19712.3.5 社会科学案例 19812.3.6 物理科学案例 198【作业】 198【实训与思考】AIGC在科研中的应用探索 200项目13 AIGC造就智慧城市 203任务13.1 智能交通概念 20313.1.1 智能交通要素 20413.1.2 智能交通关键技术 20513.1.3 车联网技术 20613.1.4 AIGC应用于智能交通 20813.1.5 AIGC应用于自动驾驶 209任务13.2 智慧城市发展与AIGC 21113.2.1 智慧城市组成与特点 21213.2.2 AIGC应用于智慧城市 21213.2.3 AIGC应用于医疗服务 21313.2.4 个性化健康管理 21413.2.5 康复与治疗支持 215【作业】 215【实训与思考】AIGC智能交通应用案例分析 217第四部分 社会影响篇项目14 伦理与法律考量 222任务14.1 AIGC面临的伦理挑战 22214.1.1 AIGC伦理问题 22214.1.2 数据主权和数据权问题 22314.1.3 数据利用失衡问题 22414.1.4 构建隐私保护伦理准则 22414.1.5 健全道德伦理约束机制 225任务14.2 AI伦理原则与知识产权 22514.2.1 职业伦理准则的目标 22514.2.2 创新发展道德伦理宣言 22614.2.3 欧盟可信赖的伦理准则 22714.2.4 封禁存在“不可接受风险”AI系统 22814.2.5 LLM的知识产权保护 22814.2.6 边缘群体的数字平等 232【作业】 232【实训与思考】AI独立完成的视觉艺术品无法获得版权 234项目15 面向AGI 236任务15.1 生成式AI进步 23615.1.1 生成式AI的关键方面 23715.1.2 AGI的定义 23815.1.3 龙头企业对AGI的认识 23915.1.4 LLM与AGI 24015.1.5 生成式AI与AGI 240任务15.2 从生成式AI迈向AGI 24115.2.1 迈向AGI的关键步骤 24115.2.2 迈向AGI的关键要素 24115.2.3 面临的挑战 24215.2.4 潜在的发展路径 24215.2.5 AI的未来发展 243【作业】 244【课程学习与实训总结】 245参考文献 249