本书从 Python 基础开始,深入浅出地介绍Python在财务数据分析领域的应用,旨在帮助读者从零基础开始,逐步掌握Python编程技能,并将其应用于财务数据的分析与挖掘。
本书分为三篇。第一篇Python基础篇(第1章~第3章):介绍从Python入门到Python语言基础,以及数据分析基础。第二篇财务数据分析篇(第4章~第7章):深入探讨财务数据的获取及分析、可视化、挖掘,以及会计文本分析与词云图绘制等,并通过丰富的实战案例,展现如何使用Python进行财务数据分析。第三篇综合应用篇(第8章~第10章):通过实际财务案例,将理论与实践相结合,以提升读者的实际操作能力,展示数据分析在财务领域的广泛应用。
本书配有PPT课件、教学大纲、电子教案、源代码、数据文件、课后习题答案、实战演练参考答案等教学资源,读者可在人邮教育社区免费下载。
本书可作为高等院校会计学、财务管理等相关专业的数据分析或大数据财务相关课程的教材,也可作为财务领域工作人员学习数据分析基础知识的参考用书。
1.系统性:本教材从Python的基础知识讲起,逐步深入到财务数据分析的应用,形成了一套完整的知识体系,更适合读者学习。
2.实用性:本教材不仅教授理论知识,更侧重于实际操作,通过大量的案例演示,讲解如何使用Python进行财务数据分析,让读者能够学以致用。
3.案例丰富:本教材提供了多个真实的上市公司财务数据分析案例,使读者能够通过案例加深理解,提高自己的财务数据分析能力。
4.互动学习:本教材包含了练习题、章节实训、实战演练和综合应用,鼓励读者动手实践,通过互动学习提高自己的财务数据分析能力。
张俊丽,教授,西安交通大学博士生,陕西师范大学硕士,西安欧亚学院数据科学与大数据专业负责人,全国青年统计学家协会理事,陕西省数学建模优秀指导教师,国家工信部认证高级大数据分析师。发表论文20余篇,主编教材3部,主持省部级课题10余项,主持政府以及企业咨询课题10余项,研究方向为数据分析与商业价值实现。
第 一篇 Python基础篇
【篇引言】 1
第 1章 Python入门 2
【学习导读】 2
【学习目标】 2
【思维导图】 3
1.1 初识Python 3
1.1.1 Python语言发展历程 3
1.1.2 Python的特点 4
1.2 初识Anaconda 4
1.2.1 Anaconda的下载与安装 4
1.2.2 Jupyter Notebook入门 6
1.2.3 Python库的安装 9
1.3 Python在财务数据中的应用 9
【课后习题】 11
第 2章 Python语言基础 12
【学习导读】 12
【学习目标】 12
【思维导图】 13
2.1 Python基本语法 13
2.1.1 Python编码规范 13
2.1.2 Python常量、变量与标识符 15
2.2 Python的数据类型 16
2.2.1 数值型 16
2.2.2 布尔型 17
2.2.3 字符型 17
2.3 Python的数据结构 17
2.3.1 列表 17
2.3.2 元组 21
2.3.3 字典 22
2.4 Python的运算符与表达式 25
2.4.1 运算符 25
2.4.2 表达式 29
2.5 基本程序结构 31
2.5.1 顺序结构 31
2.5.2 选择结构 32
2.5.3 循环结构 34
2.6 Python的函数 35
2.6.1 Python内置函数 35
2.6.2 自定义函数 35
【课后习题】 38
第3章 数据分析基础 40
【学习导读】 40
【学习目标】 40
【思维导图】 41
3.1 数据分析的基本流程 41
3.2 数组运算NumPy 42
3.2.1 NumPy介绍 42
3.2.2 数组的创建与数据类型 43
3.2.3 数组的常用属性 44
3.2.4 数组的索引与切片 44
3.3 数据处理pandas 45
3.3.1 pandas介绍 45
3.3.2 Series的创建 45
3.3.3 Series索引及切片 47
3.3.4 DataFrame的创建 48
3.3.5 文件的读取和写入 50
3.3.6 数据查看与筛选 52
3.3.7 数据拼接 53
【课后习题】 55
第二篇 财务数据分析篇
【篇引言】 57
第4章 财务数据获取及分析 58
【学习导读】 58
【学习目标】 58
【思维导图】 59
4.1 财务数据获取 59
4.1.1 使用第三方数据接口获取数据 59
4.1.2 从HTML网页中获取数据 60
4.1.3 从PDF文件中获取数据 61
4.2 数据分析 62
4.2.1 数据类型 62
4.2.2 基本统计分析 63
4.2.3 数据分组统计 66
4.2.4 数据相关分析 68
4.2.5 数据比较分析 69
【课后习题】 72
【本章实训】上市公司的利润表批量获取及分析 73
【实战演练】上市公司的资产负债表批量获取及分析 78
第5章 财务数据可视化 79
【学习导读】 79
【学习目标】 79
【思维导图】 80
5.1 Matplotlib绘图基础 80
5.1.1 Matplotlib绘图基本流程 80
5.1.2 中文字体配置 81
5.1.3 坐标轴刻度标注 82
5.2 Matplotlib常用图形绘制 85
5.2.1 折线图 85
5.2.2 柱形图 87
5.2.3 直方图 90
5.2.4 散点图 91
5.2.5 饼图 92
5.3 seaborn可视化进阶 93
5.3.1 箱线图 93
5.3.2 热力图 95
5.3.3 组合图 96
【课后习题】 98
【本章实训】上市公司的利润指标可视化分析 98
【实战演练】上市公司的资产负债可视化分析 102
第6章 财务数据挖掘 103
【学习导读】 103
【学习目标】 103
【思维导图】 104
6.1 线性回归 104
6.1.1 一元线性回归模型 104
6.1.2 多元线性回归模型 105
6.1.3 线性回归模型案例实践 107
6.2 逻辑回归 111
6.2.1 逻辑回归模型 111
6.2.2 逻辑回归模型案例实践 113
6.3 K均值聚类 116
6.3.1 K均值聚类的基本原理 117
6.3.2 K均值聚类案例实践 119
【课后习题】 121
【本章实训】个人信用风险预测 122
【实战演练】上市公司营收预测 123
第7章 会计文本分析与词云图绘制 124
【学习导读】 124
【学习目标】 124
【思维导图】 125
7.1 文本分析基础 125
7.1.1 文本分析的概念 125
7.1.2 文本分析的基本步骤 125
7.2 会计文本预处理 126
7.2.1 中文分词 126
7.2.2 建立词典 128
7.2.3 去除停用词 129
7.3 关键词提取与词频统计 131
7.3.1 关键词提取 131
7.3.2 词频统计 132
7.4 词云图绘制 132
7.4.1 基础词云图绘制 132
7.4.2 自定义词云图绘制 133
【课后习题】 135
【本章实训】基于《中国注册会计师职业道德守则(2020)》的文本分析 135
【实战演练】基于监管规则适用指引文件的文本分析 138
第三篇 综合应用篇
【篇引言】 139
第8章 上市公司财务数据获取与财务状况分析 140
【学习导读】 140
【学习目标】 140
【思维导图】 141
8.1 财务数据概述 141
8.1.1 财务数据的基本概念 141
8.1.2 财务数据的分类 141
8.2 数据获取与预处理 142
8.3 财务状况分析 146
8.3.1 盈利能力分析 146
8.3.2 营运能力分析 147
8.3.3 成长能力分析 149
8.3.4 偿债能力分析 150
8.4 案例报告上市公司财务数据获取与财务状况分析 151
8.4.1 背景介绍 151
8.4.2 数据说明 152
8.4.3 财务状况分析 152
8.4.4 总结与建议 157
第9章 某行业财务数据可视化与对比分析 159
【学习导读】 159
【学习目标】 159
【思维导图】 160
9.1 行业财务分析概述 160
9.2 数据获取与预处理 161
9.3 财务状况对比分析 164
9.3.1 盈利能力对比分析 164
9.3.2 营运能力对比分析 167
9.3.3 成长能力对比分析 169
9.3.4 偿债能力对比分析 172
9.4 案例报告白酒行业财务数据可视化与对比分析 175
9.4.1 背景介绍 175
9.4.2 数据获取与预处理 176
9.4.3 财务状况对比分析 177
9.4.4 总结与建议 186
第 10章 基于K均值聚类的上市公司盈利能力分析 187
【学习导读】 187
【学习目标】 187
【思维导图】 188
10.1 盈利能力概述 188
10.2 数据处理 189
10.3 盈利能力指标的描述性统计与可视化分析 192
10.3.1 盈利能力指标的描述性统计 192
10.3.2 盈利能力指标的可视化分析 193
10.4 基于盈利能力指标的K均值聚类与评价 196
10.4.1 K值确定 196
10.4.2 K均值聚类 197
10.4.3 聚类效果评价 197
10.4.4 模型结果展示 199
10.5 案例报告基于K均值聚类的上市公司盈利能力分析 199
10.5.1 背景介绍 199
10.5.2 数据说明 200
10.5.3 描述性分析 200
10.5.4 模型训练 202
10.5.5 总结与建议 204