在数字时代,数据已无可争议地成为驱动各领域发展的核心要素。在面对海量且纷繁的数据时,如何从中提取有价值的信息,并做出精准且明智的决策,成为横亘在各领域研究者和决策者面前的关键挑战。
SPSS(Statistical Product Service Solutions)作为最早采用图形菜单驱动界面的统计分析软件,其突出特点是简单易用,且输出高效美观。用户只需要有基本的计算机操作技能,熟悉统计原理,便可很快上手SPSS并开展数据分析相关工作。因此,SPSS在社会调查、市场研究、健康研究等领域都得到了广泛的应用与认可。
尽管SPSS的界面化操作称得上简单,但在实践中,不同读者仍难免会遇到各类问题,诸如数据处理方面的问题、选择各类统计分析方法时的疑惑、对具体分析操作选项的不熟悉,以及对分析结果理解的偏差等。为此,编者结合相关工作与培训实践,通过丰富的案例,以详细的图文步骤对SPSS统计分析的基础应用进行解读,力求帮助读者快速掌握SPSS,并实现学以致用。
本书的特色
·零基础入门:本书从最基础的SPSS操作开始,介绍SPSS的常用分析方法与图表绘制等内容,零基础新手也可轻松入门。
·注重实用性:以简单的实例指导SPSS使用和数据分析方法,适当穿插易于理解的统计学基础。
·赠送资源:本书提供配套的数据集,并赠送讲解视频(注:视频内容与本书存在部分差异),可帮助读者高效、直观地学习重点内容。读者可访问www.cip.com.cn/Service/Download搜索本书并获取相关资源的下载链接。
本书的主要内容
第1章带领读者快速了解SPSS的相关操作及运行方式与工作原理。
第2章从数据入手,介绍SPSS中的变量特征,以及数据的读取与输出等。
第3章介绍SPSS的数据处理与数据转换,内容包括数据的排序、筛选、重编码,以及数据分箱等。
第4章和第5章主要介绍SPSS的图表绘制。
第6章从描述性统计角度切入,介绍数据频率、分布、描述、异常值等的分析方法。
第7章主要介绍常用的假设检验方法,包括卡方检验、t检验等。
第8章介绍相关性检验以及回归模型的应用等。
第9章介绍方差分析与事后检验。
第10章介绍实现非参数检验的方法,包括单样本、独立样本、相关样本非参数检验。
第11章介绍如何在SPSS中应用逻辑回归、决策树、神经网络等统计机器学习模型。
第12章主要介绍二阶聚类和K均值聚类的应用。
第13章介绍了几种生存模型的应用。
本书读者对象
·SPSS零基础入门人员
·社会学、经济学、管理学、医药等专业的师生
·数据挖掘、数据分析等数据科学相关领域的从业人员
·其他对SPSS统计分析感兴趣的读者
本书在编写过程中力求兼顾严谨性与易读性,但限于编者水平有限,疏漏之处在所难免,望广大读者批评指正。
编者
第1章 初识SPSS 1
1.1 SPSS的运行方式 2
1.2 SPSS的工作原理 2
1.3 在需要时获得帮助 4
1.4 快速了解界面与操作 4
第2章 SPSS 数据 14
2.1 变量定义 15
2.1.1 变量名称 16
2.1.2 变量类型 17
2.1.3 宽度、小数点位和标签 18
2.1.4 值 19
2.1.5 缺失 20
2.1.6 列、对齐和测量 20
2.1.7 角色 20
2.2 SPSS读取数据 21
2.2.1 从文本文件获取数据 23
2.2.2 读取Excel文件 25
2.3 SPSS输出分析结果 26
2.3.1 复制和粘贴输出 30
2.3.2 导出输出 31
2.3.3 打印数据 32
第3章 数据处理与数据转换 33
3.1 排序案例 34
3.2 筛选数据集中的行 35
3.3 拆分数据 37
3.4 重新编码变量 40
3.4.1 重新编码成不同的变量 40
3.4.2 自动重新编码 43
3.5 数据分箱 44
3.6 最优分箱 48
3.7 计算新变量 50
3.7.1 使用条件计算新变量 51
3.7.2 使用系统变量 53
3.8 合并数据 54
3.8.1 按行合并 54
3.8.2 按列合并 55
第4章 SPSS 绘图 58
4.1 使用图表构建器绘图 59
4.1.1 基本元素 63
4.1.2 组/点ID 63
4.1.3 标题/脚注 65
4.1.4 元素属性 66
4.1.5 图表外观 67
4.1.6 选项 67
4.2 使用图形画板模板选择器绘图 68
4.3 常见图形绘制 70
4.3.1 散点图与折线图 70
4.3.2 点图 73
4.3.3 条形图 74
4.3.4 直方图 75
4.3.5 面积图 77
4.3.6 堆积条形图 79
4.3.7 饼图 81
第5章 SPSS 图表优化 83
5.1 修改图表 84
5.2 修改表格 87
第6章 描述性统计 90
6.1 测量水平 91
6.2 汇总统计 92
6.3 分类变量的频率 93
6.4 变量的分布 95
6.5 描述过程 97
6.6 异常值分析 98
第7章 假设检验 101
7.1 样本与总体 102
7.2 交叉表 104
7.3 卡方检验 106
7.4 t检验 107
7.4.1 平均值与单样本t检验 107
7.4.2 独立样本t检验 109
7.4.3 摘要独立样本t检验 111
7.4.4 配对样本的t检验 112
第8章 相关性检验 114
8.1 绘制散点图 115
8.2 双变量分析 116
8.3 简单线性回归 118
8.4 多元线性回归 122
第9章 方差分析 127
9.1 单因素方差分析 128
9.2 事后检验 130
第10章 非参数检验 133
10.1 单样本非参数检验 134
10.2 独立样本非参数检验 137
10.3 相关样本非参数检验 140
第11章 常用统计机器学习模型 144
11.1 逻辑回归 145
11.2 决策树 150
11.3 神经网络 156
第12章 聚类分析 165
12.1 二阶聚类 166
12.2 K均值聚类 168
第13章 生存分析 171
13.1 寿命表 172
13.2 Kaplan-Meier模型 177
13.3 Cox生存模型 179