|
关于我们
新书资讯 新书推荐 |
Python爬虫与数据分析
这是一本让你学完立马就能上手的实用指南。本书从零开始带你玩转Python网络爬虫与数据分析,全书分为基础篇、进阶篇和实战篇三部分。基础篇手把手教你搭建Python 环境掌握核心语法、数据处理和文件操作,为数据分析打下坚实基础。进阶篇介绍实用技能,涵盖网络爬虫开发、数据解析、高效存储,以及数据分析利器NumPy和pandas,更有炫酷的数据可视化方法。实战篇通过两大真实项目,完整演示从数据采集、清洗存储到分析可视化的全流程。本书内容清晰实用,特别适合想快速掌握Python爬虫技术与数据分析的读者,让你学完就能用!
·核心亮点:B 站超受欢迎课程纸质化!全网播放超过500 万!
·学习优势:转为初学者设计的丝滑学习曲线,理论 + 案例 + 练习,轻松从听得懂到用得上
·知识覆盖:无死角知识网络覆盖,基础语法、反爬应对、数据清洗、可视化、实战分析全流程
·额外福利:附赠电子版完整案例!
李巍,中国计算机学会会员,哔哩哔哩科技UP主(IT私塾),B站课堂签约教师,华为开发者学堂认证讲师。
基础篇
第1章 Python数据分析准备工作 ............1
1.1 搭建Python数据分析环境 .................1
1.1.1 下载Python ............................1
1.1.2 正确安装Python .....................3
1.1.3 配置环境变量 ..........................5
1.1.4 配置开发环境PyCharm ...........7
1.1.5 测试Python和开发环境是否能正常工作 .......................9
1.2 编写第一个Python程序 ..................12
第2章 Python基本语法 ..........................15
2.1 注释 ..................................................15
2.1.1 单行注释 ...............................15
2.1.2 多行注释 ...............................16
2.2 标识符和关键字 ................................16
2.2.1 每个数据或者信息都有名字——标识符 .....................17
2.2.2 关键字 ...................................17
2.3 变量及变量的数据类型 .....................18
2.3.1 变量到底是什么 .....................18
2.3.2 变量的数据类型 .....................19
2.4 输入和输出 .......................................22
2.4.1 处理来自键盘的输入 .............22
2.4.2 输出的几种情况 .....................23
2.5 运算符 ..............................................24
2.5.1 算术运算符 ............................24
2.5.2 比较运算符 ............................25
2.5.3 赋值运算符 ............................25
2.5.4 位运算符 ...............................26
2.5.5 逻辑运算符 ............................26
2.5.6 成员运算符 ............................28
2.5.7 身份运算符 ............................28
2.5.8 运算符优先级 ........................28
2.6 实战演练 ...........................................31
第3章 流程控制语句 .................................32
3.1 条件判断语句....................................32
3.1.1 单分支结构 ............................32
3.1.2 双分支结构 ............................33
3.1.3 多分支结构 ............................34
3.1.4 嵌套条件语句 ........................35
3.1.5 条件判断语句实例 .................36
3.2 循环控制语句....................................38
3.2.1 for循环 .................................38
3.2.2 while循环 .............................39
3.2.3 break和continue语句 .........41
3.2.4 循环控制语句实例 .................42
3.3 实战演练 ...........................................44
第4章 常用的容器数据类型 .....................47
4.1 字符串——文字也可以进行运算 .......47
4.1.1 定界符 ...................................47
4.1.2 转义字符 ...............................48
4.1.3 字符串的截取和连接 .............50
4.1.4 字符串的常见操作 .................52
4.1.5 字符串的格式化操作 .............53
4.1.6 字符串实例 ............................55
4.2 列表 ..................................................56
4.2.1 列表的创建与访问 .................57
4.2.2 列表的常见操作 .....................58
4.2.3 列表的嵌套 ............................62
4.2.4 列表实例 ...............................63
4.3 元组 ..................................................64
4.3.1 元组的创建与访问 .................64
4.3.2 元组的常见操作 .....................65
4.4 字典 ..................................................66
4.4.1 字典的创建与访问 .................66
4.4.2 字典的常见操作 .....................68
4.4.3 字典实例 ...............................72
4.5 集合 ..................................................72
4.5.1 创建集合 ...............................73
4.5.2 集合的常见操作 .....................73
4.6 实战演练 ...........................................74
第5章 函数 .................................................77
5.1 定义和调用函数 ................................77
5.1.1 定义函数 ...............................77
5.1.2 调用函数 ...............................78
5.1.3 函数参数 ...............................79
5.1.4 函数返回值 ............................81
5.1.5 实例 ......................................81
5.2 局部变量和全局变量 .........................82
5.2.1 局部变量 ...............................82
5.2.2 全局变量 ...............................83
5.2.3 全局变量和局部变量重名怎么办 ...................................84
5.2.4 匿名函数 ...............................85
5.2.5 实例 ......................................85
5.3 实战演练 ...........................................86
第6章 文件操作和异常处理 .....................89
6.1 文件操作 ...........................................89
6.1.1 文件的打开与关闭 .................89
6.1.2 文件读写操作 ........................91
6.1.3 访问模式 ...............................94
6.1.4 上下文管理器 ........................96
6.1.5 文件操作实例 ........................96
6.2 错误与异常 .......................................97
6.2.1 几种常见错误与异常 .............97
6.2.2 找出并处理异常 ..................100
6.3 实战演练 .........................................104
第7章 模块和库 .......................................105
7.1 模块和库的介绍 ..............................105
7.2 库的安装和导入 ..............................105
7.2.1 安装库 .................................106
7.2.2 导入库 .................................106
7.3 常用标准库 .....................................107
7.3.1 随机模块 —— random ........108
7.3.2 日期时间模块——datetime ...109
7.3.3 操作系统模块——os ...........110
7.3.4 json模块 .............................112
进阶篇
第8章 网络与前端技术基础 ...................115
8.1 网络基本概念..................................115
8.2 网页的构成 .....................................116
8.2.1 网页结构与内容 ...................117
8.2.2 HTML网页常用标签 ............118
8.2.3 网页样式 .............................120
8.2.4 网页交互 .............................128
8.3 实战演练 .........................................132
第9章 网络数据爬取技术 .......................134
9.1 网络爬虫概述..................................134
9.1.1 网络爬虫的基本概念 ...........134
9.1.2 合法合规使用网络爬虫技术 ....................................135
9.1.3 数据爬取流程 ......................135
9.2 Requests库 ...................................135
9.2.1 发送HTTP请求 ...................136
9.2.2 获取HTTP响应的内容 ........137
9.2.3 爬取图片文件 ......................139
9.3 Selenium库 ..................................139
9.3.1 安装浏览器驱动 ...................139
9.3.2 查找单个元素 ......................142
9.3.3 获取元素属性信息 ...............143
9.3.4 等待 ....................................144
9.3.5 网页的前进和后退 ...............145
9.4 实战演练 .........................................145
第10章 网站数据解析 .............................147
10.1 lxml库 .........................................147
10.2 Beautiful Soup库 ........................150
10.2.1 BeautifulSoup对象的属性 ................................151
10.2.2 beautifulsoup4库标签对象的属性 ......................152
10.2.3 find()方法和find_all()方法 ................................153
10.2.4 select()方法 ....................154
10.3 re库 ............................................154
10.3.1 re库常用方法 ..................156
10.3.2 re库基本操作示例 ...........156
10.4 实战演练 .......................................158
第11章 存储数据 .....................................165
11.1 把数据保存到Excel ......................165
11.1.1 基础的xlwt库 .................165
11.1.2 强大的xlwings库 ............166
11.1.3 跨平台的openpyxl库 ......170
11.2 把数据保存到MySQL ...................173
11.3 实战演练 .......................................179
第12章 科学计算库NumPy .................181
12.1 NumPy库的基本使用方法 ...........181
12.1.1 创建数组的基本流程 ........181
12.1.2 NumPy数组的运算..........182
12.1.3 NumPy数组的属性..........183
12.2 创建数组 .......................................184
12.2.1 根据现有数据创建数组 ....184
12.2.2 根据形状或数值创建数组 ................................185
12.3 获取数组元素 ................................186
12.3.1 通过索引获取元素 ...........186
12.3.2 通过切片获取元素 ...........187
12.4 数组的操作 ...................................188
12.4.1 修改数组形状 ...................188
12.4.2 数组扁平化 ......................189
12.4.3 数组转置 ..........................190
12.4.4 数组去重 ..........................191
12.4.5 数组合并 ..........................191
12.4.6 数组分割 ..........................192
12.4.7 数组复制 ..........................193
12.4.8 数组元素的修改 ...............193
12.5 数组的运算 ...................................196
12.5.1 广播机制 ..........................196
12.5.2 基本运算 ..........................197
12.6 常用API .......................................199
12.6.1 数组统计 ...........................199
12.6.2 文件读写 ...........................202
12.7 实战演练 .......................................202
第13章 数据处理库pandas .................208
13.1 pandas入门 .................................208
13.1.1 pandas数据结构及相关方法 ................................208
13.1.2 pandas访问数据 .............213
13.2 数据处理常用操作 ........................217
13.2.1 缺失值处理 ......................217
13.2.2 运算 .................................218
13.2.3 合并与分组 ......................222
13.2.4 堆叠和透视 ......................224
13.2.5 时间序列和分类数据 ........226
13.3 数据的读入与写出 ........................228
13.4 实战演练 .......................................230
第14章 静态图表可视化 .........................235
14.1 Matplotlib实现静态图表 ..............235
14.2 基础绘图功能 ...............................237
14.2.1 Matplotlib图像结构 ........237
14.2.2 添加辅助元素 ...................238
14.2.3 绘制多条折线 ...................241
14.2.4 绘制子图 ..........................242
14.3 常见图形绘制 ...............................246
14.3.1 折线图 .............................246
14.3.2 散点图 .............................247
14.3.3 柱形图 .............................248
14.3.4 三维图形 ..........................250
14.4 实战演练 .......................................252
第15章 动态图表可视化 .........................254
15.1 Pyecharts.....................................254
15.1.1 Pyecharts的安装和基本使用 ................................254
15.1.2 Pyecharts绘制其他基本图形 ................................257
15.1.3 组合图表 ..........................260
15.1.4 设置主题 ..........................261
15.1.5 轮播图 .............................265
15.2 实战演练 .......................................266
第16章 Flask框架实现数据可视化系统 .............................................269
16.1 完成第一个网站 ............................269
16.2 路由与网页 ...................................270
16.3 页面动态加载后台数据 .................273
16.3.1 Flask在页面上显示表格 ................................273
16.3.2 数据来自Excel文件 .........274
16.3.3 数据来自数据库 ...............276
16.4 Flask接收参数,分页显示数据 ....276
实战篇
第17章 豆瓣电影Top250信息爬取实战..............................289
17.1 项目概述.................................289
17.2 准备工作.................................290
17.2.1 分析页面....................292
17.2.2 新建项目....................293
17.2.3 引入模块....................295
17.3 数据爬取.................................296
17.4 数据解析.................................296
17.5 数据存储.................................297
17.5.1 保存到Excel文件......298
17.5.2 保存到SQLite数据库.......................299
17.6 数据分析与展现......................301
17.7 实战小结.................................302
第18章 招聘网站信息爬取实战.......303
18.1 项目概述.................................303
18.2 准备工作.................................30418.2.1 分析页面....................306
18.2.2 新建项目....................307
18.2.3 引入模块....................308
18.2.4 定义全局变量.............308
18.3 获取数据.................................309
18.3.1 首页输入搜索关键词.......................309
18.3.2 爬取列表页信息.........312
18.3.3 爬取详情页信息.........313
18.4 解析内容.................................314
18.4.1 解析列表页数据.........314
18.4.2 解析详情页数据.........316
18.5 保存数据.................................318
18.6 项目小结.................................320
你还可能感兴趣
我要评论
|

新书资讯





