本书系统地讲解了如何利用ChatGPT赋能数据分析。全书共11章,层层递进,既涵盖理论方法,也注重实践操作:首先讲解ChatGPT的使用与高质量提示词的构建,然后探讨如何使用ChatGPT学习业务知识、分析方法、分析工具,最后通过多个行业实战案例的讲解,帮助读者真正将AI技术融入数据分析,提高分析效率和决策能力,抓住行业变革带来的机遇。
本书适合数据分析师、数据科学家、数据运营人员和商业分析师阅读,也适合所有需要运用数据分析优化工作、学习、研究的职场人士、学生和教研人员阅读。
前言
1. 数据分析的新时代
在数字化转型和智能技术飞速发展的今天,数据早已成为企业竞争的核心资源。它不仅支撑着业务运营,更驱动着市场创新和战略决策。从制造业到金融业,从电商到游戏,数据分析无处不在,它可以帮助企业洞察趋势、优化策略、预测未来。然而,随着数据规模的爆炸式增长、业务场景的日趋复杂,以及对实时决策的高要求,传统数据分析的方式正面临前所未有的挑战。
传统数据分析的困境
传统数据分析是一项需要跨学科能力的工作,要求从业者既懂业务,又精通技术,能熟练运用Excel、SQL、Python等工具,同时具备扎实的统计学和数据建模能力。然而,面对当今庞杂的数据环境,这种方法的局限性逐渐暴露——数据来源越来越多样,分析过程越来越复杂,结果要求越来越实时,而学习曲线依然陡峭,让初学者难以快速上手。即便是经验丰富的分析师,也经常感到力不从心,难以高效应对变化迅速的业务需求。
生成式AI的崛起:改变数据分析的游戏规则
在这种背景下,生成式AI成为数据分析师的新武器。以ChatGPT为代表的AI工具,极大地降低了技术门槛,让分析师仅凭自然语言交互就能完成SQL查询、数据清洗、建模等复杂的任务,从而大幅提升分析效率。不仅如此,AI还能辅助业务洞察,帮助分析师快速构建指标体系、识别关键趋势,并打破技术壁垒,使更多非技术人员也能轻松参与数据分析。通过精准的提示词(Prompt)设计,数据分析师可以把更多精力放在业务理解和战略决策上,而不是被烦琐的代码和工具操作所束缚。
数据分析师的角色重塑
生成式AI的普及,推动数据分析行业迈入智能化时代。AI的介入,不只是让分析流程更高效,更重要的是,它改变了数据分析师的角色定位。从过去专注于技术执行的“工具操作者”,到如今兼具技术和业务洞察的“战略伙伴”,数据分析师已不再局限于解决特定问题,而是利用AI提供深层次的业务洞察,实现从数据到决策的快速转化。未来,懂AI、会写提示词(Prompt)、善于解读数据并结合业务思考的分析师,将成为最有竞争力的人才。
2. 为什么写这本书?
尽管生成式AI已经在数据分析领域展现出巨大的潜力,但市场上的学习资源仍然存在不少短板。许多书籍和教程要么专注于传统数据分析技能(SQL、Python、统计学等),要么只介绍生成式AI的基本概念,缺乏对两者结合的系统性指导,尤其是在实际业务应用层面,现有资料往往过于理论化,难以真正帮助分析师将AI技术落地到工作中。此外,行业对数据分析师的要求正在快速升级,传统的学习路径已难以满足职场竞争的需要。
本书的写作目的就是填补这一空白,帮助数据分析师真正掌握如何在工作中高效运用生成式AI,让AI成为自己的生产力工具,而不仅仅是“锦上添花”的辅助工具。
打通技术与业务之间的鸿沟
生成式AI的价值,不仅在于提高技术效率,更在于帮助分析师更快地理解业务、搭建指标体系、优化数据分析流程。本书将手把手教你如何利用AI构建电商、金融等行业的核心分析模型,并结合业务需求做出更科学的决策。
降低学习门槛,缩短上手时间
传统数据分析学习成本高,而生成式AI可以让这一过程变得更高效。本书将通过系统化的提示词(Prompt)设计,快速生成SQL查询、Python数据清洗代码、高质量的数据可视化方案,让AI成为你的智能导师,减少对传统编码技能的依赖。
提供真实的业务案例,让你学了就能用
本书不是一本纯技术手册,而是一本实战指南。我们将通过电商、金融、互联网等多个行业的典型案例,展示如何利用生成式AI辅助完成从数据探索到决策支持的全流程。例如:如何用AI优化用户分层分析?如何让ChatGPT辅助信用评分建模?这些案例将帮助你在真实场景中学会如何高效应用AI,而不是“纸上谈兵”。
帮助你在AI时代构建职业竞争力
AI正在重新定义数据分析师的能力模型,本书不仅教授技术,更关注你的职业发展。你将学会如何利用生成式AI优化简历、准备技术面试、制定长期职业规划,让自己在求职、跳槽、晋升的过程中脱颖而出,避免被行业变革甩在后面。
AI不仅是一种工具,更是一种思维方式
生成式AI的出现,不仅为数据分析提供了更强大的工具,而且改变了整个数据行业的工作方式。本书的核心理念就是让你掌握如何借助AI提升工作效率、优化分析方法、增强业务洞察力,最终让数据分析从单一的技术执行真正升级为业务决策的驱动力。
无论你是刚入门的数据分析师,还是希望在行业变革中保持竞争力的资深从业者,本书都将为你提供最前沿、最实用的AI数据分析方法。希望这本书能成为你在AIGC时代的得力助手,让你不只是适应变化,更是站在技术变革的前沿,主动塑造自己的职业未来。
3. 本书的核心亮点
这本书不只是一本单纯的技术手册,更是帮你真正用上生成式AI、提升数据分析效率的“实战指南”。它既教技术,也教你如何在AI时代更有竞争力。以下是几个核心亮点。
完整覆盖数据分析全流程
从业务知识、指标体系,到数据清洗、建模、可视化,再到行业案例,本书系统地讲解了数据分析的全过程。例如,电商的用户生命周期分析、金融的信用评分模型,都有实战拆解,让你学得透、用得上。
学会如何让AI高效“干活”
生成式AI的关键在于提示词(Prompt),本书手把手教你如何精准提问,让AI帮忙生成SQL查询、优化数据分析、自动化清洗数据,而不是“随便回复”。只有学会高效对话,你才能真正掌控AI。
真实业务案例,学了就能用
书中覆盖多个行业的实际案例,比如:
电商:如何通过数据分析提高转化率?
金融:如何构建信用评分模型?
互联网:如何发现业务指标异动?
这些案例让你掌握技术的同时,也能在实际工作中灵活运用。
不仅学技能,还帮你职业进阶
AI正在改变数据分析师的职业路径,本书不仅教你技能,还会帮你用AI提升个人竞争力。
简历优化:用ChatGPT提炼项目亮点,让简历更有吸引力。
面试模拟:练习SQL、Python、数据思维等常见面试问题。
职业规划:如何从传统分析师进阶到“数据+AI工程师”?
这些内容能帮你在求职、跳槽、职业发展上抢占先机。
实操为主,提供可直接复用的提示词(Prompt)模板
本书不是纯理论,而是“学了就能用”。每章都有可复制的提示词(Prompt)模板,帮你快速上手,比如:
如何优化SQL查询?
如何让ChatGPT生成完整的数据分析报告?
如何用AI提升数据可视化效果?
你不需要死磕代码,只要跟着练习,就能让AI高效地辅助数据分析。
紧跟行业趋势,避免被淘汰
AI发展太快,今天的“高科技”可能明天就成了行业标配。本书会帮你看清趋势,提前布局,比如:
哪些数据分析能力是AI替代不了的?
未来的数据分析师应该具备什么新技能?
如何利用AI提升自身价值,而不是被AI取代?
通过这些内容,你能更好地应对变化,在AI时代稳住脚跟,甚至走在前列。
4. 目标读者群体
这本书适合所有希望提升数据分析能力,并借助生成式AI优化工作方式的读者。
对于在职数据分析师与数据科学家,本书不仅帮助你掌握ChatGPT等AI工具,还能提升你的SQL、Python、统计建模等核心技能,优化数据清洗、分析和可视化的流程,让你把更多精力放在业务洞察和复杂问题的解决上,而不是被烦琐的代码和报表困住。同时,书中还会探讨AI在用户增长、
李朝成,本科和研究生毕业于同济大学,毕业至今一直从事数据分析工作,8年数据分析经验、资深数据分析师、数据科学家。近一年也在深度参与AIGC产品的开发,对AIGC产品非常熟悉。作者主导了多个从0到1产品的数据分析项目,并负责过千万级月活产品的数据分析项目。在互联网、电商零售、在线教育、广告营销等ToB、ToC领域有着丰富的数据分析及业务驱动经验,尤其擅长数据分析思维方法、数据分析工具以及数据分析项目的落地。此外,作者还是公众号/小红书/知乎/B站等平台优质创作者,全网约8w粉丝,作品点赞收藏分享次数超100w。
目录
第1章?智识初窥:AIGC与ChatGPT基础认知
1.1 AIGC的简介与发展
1.1.1 AIGC的定义与背景
1.1.2 AIGC的发展历程与技术演进
1.2 主流AIGC产品简介及对比
1.3 ChatGPT在数据分析中的应用场景
1.4 ChatGPT账号注册及使用基本流程
1.4.1 注册ChatGPT账号
1.4.2 使用ChatGPT的基本流程
1.5 互动练习题
第2章?精要Prompt:构建优质指令策略与应用
2.1 Prompt的基本概念和作用
2.2 构建高质量Prompt的策略
2.3 Prompt在数据分析中的实践
2.4 Prompt实践案例
2.5 自动生成Prompt的工具及使用示例
2.6 互动练习题
第3章?行业洞察:用ChatGPT学习业务知识和指标体系
3.1 利用ChatGPT学习行业知识
3.2 各行业Prompt示例
3.3 构建科学的业务指标体系
3.4 ChatGPT在业务指标优化中的应用
3.5 互动练习题
第4章?方法研习:用ChatGPT学习数据思维和分析方法
4.1 数据思维
4.2 指标异动分析
4.3 描述性分析
4.4 对比分析
4.5 细分分析
4.6 预测分析
4.7 相关性分析
4.8 漏斗分析
4.9 RFM用户分层分析
4.10 同期群分析
4.11 假设检验
4.12 互动练习题
第5章?统计进阶:用ChatGPT探索统计学知识
5.1 描述性统计
5.1.1 描述性统计的概念
5.1.2 集中趋势
5.1.3 离散程度
5.1.4 分布特性
5.1.5 数据可视化
5.1.6 ChatGPT案例:描述性统计分析
5.1.7 小结
5.2 概率论基础
5.2.1 什么是概率论
5.2.2 基本概率规则
5.2.3 常见概率分布
5.2.4 ChatGPT案例:正态分布的绘制与概率计算
5.2.5 优缺点与适用场景
5.2.6 小结
5.3 抽样与估计
5.3.1 抽样方法
5.3.2 区间估计与点估计
5.3.3 大数定律与中心极限定理
5.3.4 ChatGPT案例:置信区间计算
5.3.5 优缺点与适用场景
5.3.6 小结
5.4 假设检验
5.4.1 什么是假设检验
5.4.2 假设检验的步骤
5.4.3 常见的假设检验方法
5.4.4 ChatGPT案例:t检验示例
5.4.5 ChatGPT案例:卡方检验示例
5.4.6 ChatGPT案例:方差分析(ANOVA)示例
5.4.7 一类错误和二类错误
5.4.8 优缺点与适用场景
5.4.9 小结
5.5 相关性分析与回归分析
5.5.1 相关性分析
5.5.2 常见相关性系数
5.5.3 ChatGPT案例:皮尔逊相关系数计算
5.5.4 回归分析
5.5.5 常见的回归分析方法
5.5.6 ChatGPT案例:简单线性回归分析
5.5.7 优缺点与适用场景
5.5.8 小结
5.6 时间序列分析
5.6.1 什么是时间序列
5.6.2 平稳性与平稳性检验
5.6.3 时间序列建模方法
5.6.4 ChatGPT案例:时间序列分析与ARIMA模型
5.6.5 优缺点与适用场景
5.6.6 小结
5.7 A/B测试与因果推断
5.7.1 什么是A/B测试
5.7.2 A/B测试的步骤
5.7.3 ChatGPT案例:A/B测试的t检验
5.7.4 因果推断
5.7.5 ChatGPT案例:Uplift模型构建
5.7.6 优缺点与适用场景
5.7.7 小结
5.8 数据分布与假设检查
5.8.1 数据分布及常见分布类型
5.8.2 常见的假设检查
5.8.3 ChatGPT案例:正态性和同方差性检验
5.8.4 多重共线性检测
5.8.5 ChatGPT案例:VIF检测多重共线性
5.8.6 优缺点与适用场景
5.8.7 小结
5.9 数据降维
5.9.1 什么是数据降维
5.9.2 常见的降维方法
5.9.3 优缺点与适用场景
5.9.4 小结
5.10 互动练习题
第6章?玩转SQL:用ChatGPT展开SQL学习与实战
6.1 数据分析中要掌握的SQL技能
6.2 SQL Prompt的技巧
6.3 ChatGPT Prompt for SQL:案例设计与实现
6.4 SQL生成的插件与工具
6.5 互动练习题
第7章?玩转Python:用ChatGPT展开Python学习与实战
7.1 数据分析中要掌握Python的哪些技能
7.2 Python Prompt技巧
7.3 ChatGPT Prompt for Python:案例设计与实现
7.4 Python AI辅助工具:PandasAI和JupyterAI
7.4.1 PandasAI使用指南
7.4.2 JupyterAI使用指南
7.5 互动练习题
第8章?可视解读:用ChatGPT实现数据可视化与分析
8.1 数据可视化的核心概念
8.2 使用ChatGPT生成数据可视化代码
8.3 数据结果解读
8.4 完整可视化项目:销售数据分析
8.5 互动练习题
第9章?项目实战:多场景数据分析项目解析
9.1 DAU异动分析项目
9.2 用户行为路径分析项目
9.3 用户生命周期分析项目
9.4 运营活动效果分析项目
9.5 手游广告投放效果分析项目
9.6 内容消费偏好分析项目
9.7 产品功能使用分析项目
9.8 用户社交行为分析
9.9 金融信用评分卡预测
9.10 传统制造业产品销量预测
9.11 滴滴出行A/B Test效果分析
9.12 美团 DID因果推断项目
9.13 在线教育NLP文本挖掘项目
第10章?求职助力:借助ChatGPT开启求职之路
10.1 优质阶段:简历准备
10.2 第二阶段:面试前的准备
10.3 第三阶段:面试后复盘
10.4 第四阶段:Offer谈判与选择
第11章?未来可期:AIGC时代数据分析师的转型与突破
11.1 数据分析师的角色转变
11.2 数据分析师如何应对未来