多元统计分析——R与Python的实现(第2版)(基于R应用的统计学丛书)
定 价:49 元
丛书名:基于R应用的统计学丛书
- 作者:吴喜之 张敏
- 出版时间:2025/9/1
- ISBN:9787300342689
- 出 版 社:中国人民大学出版社
- 中图法分类:
- 页码:
- 纸张:
- 版次:2
- 开本:16
-
商品库位:
本书特色:
1.语言通俗,受众广泛:采用简单通俗的语言阐述多元统计分析的基本概念,便于非数学背景的读者理解。
2.注重应用,结合案例:考虑到读者的应用需求,通过案例帮助理解各种方法的概念及计算,同时包含传统多元分析教材的多数内容及详尽数学公式,以满足不同读者需求。
3.兼顾主流软件实现:基于数据驱动思维,正文中通过R软件解释方法及计算输出,书末还尽量给出相应或类似的Python代码。
4.内容全面,新旧结合:既涵盖最新发展的优秀机器学习算法,也包含传统多元统计分析教材的常见内容,如多重回归(分类)、主成分分析、因子分析、聚类分析、典型相关分析、对应分析等。
5.结构安排以需求为导向:以数据分析目的为主线,将具体模型分属于相应的课题需求之下。
6.理念先进,灵活实用:摆脱传统多元统计教材模型驱动的固有问题,同时兼顾习惯于模型驱动的教师使用;倡导问题驱动或数据驱动的 “拉动式学习” 模式,让学习目标明确、所学知识实用。
7.强调综合能力培养:重视统计学习中数学严密逻辑思维能力、计算机编程能力(包括针对特定软件及泛型编程能力)、批判性思维以及对实际问题的理解能力的培养。
吴喜之 北京大学数学力学系本科毕业,北卡罗来纳大学统计学博士。中国人民大学统计学院教授,博士生导师。曾在南开大学、北京大学、加利福尼亚大学、北卡罗来纳大学等多所著名学府执教。
张 敏 重庆工商大学讲师。作为第一(通讯)作者在CSSCI/CSCD/SCI等期刊发表多篇学术论文,主持(参与)多项国家级及省部级课题,以第二作者身份合作出版多部关于统计与数据科学的教材。
第 1 章 引 言
1.1 数据科学
1.2 多元分析的对象
1.3 需要的工具
1.4 各章的安排
1.5 软件和编程
1.6 如何教学
第 2 章 矩阵代数和一些数学概念回顾
2.1 矩 阵
2.2 矩阵的分解
2.3 二次型
2.4 矩阵的导数
2.5 数据集的不纯度
2.6 相关系数理解的误区
2.7 习 题
第 3 章 有监督学习: 分类及回归
3.1 有监督学习的目标和过程
3.2 交叉验证
3.3 有监督学习过程汇总
3.4 最小二乘线性回归
3.5 为二分类任务的logistic回归
3.6 决策树
3.7 集成算法: bagging
3.8 集成算法: 随机森林
3.9 增强算法: AdaBoost分类模型
3.10 增强算法: Xgboost模型
3.11 神经网络概述
3.12 习 题
第 4 章 降 维
4.1 主成分分析降维
4.2 因子分析降维
4.3 自编码器降维*
4.4 习 题
第 5 章 聚 类
5.1 聚类分析概述
5.2 分层聚类
5.3 k均值聚类、k众数聚类、k原型聚类
5.4 基于密度聚类的思想*
5.5 基于模型的聚类*
5.6 聚类数目的选择
5.7 更多的聚类实例计算
5.8 习 题
第 6 章 相关和关联
6.1 典型相关分析
6.2 对应分析
6.3 习 题
第 7 章 正文中没有的代码
7.1 第2章的代码
7.2 第3章的代码
7.3 第 4 章的代码
7.4 第 5 章的代码
参考文献