《数据决策》是为普通人打造的一本数据思维急救手册。作者艾伦?唐尼现任奥林学院荣誉教授、PyMC实验室首席数据科学家,他非常擅长用通俗的语言解析深奥的统计学原理。
本书以反直觉的数据为切入点,通过数十个真实有趣的案例,带领读者逐步认清统计悖论。比如:吸烟孕妇生出的低体重儿更健康,这其实是混淆了相关性与因果性的典型谬误;疫苗接种者死亡率更高也只是统计假象,实则是统计者的年龄结构差异导致的。这些案例将颠覆我们的认知,从而引发读者对数据解读的深入思考。
更重要的是,作者没有在书中空谈理论,而是将统计学方法转化为可复用的决策工具。例如:基本比率法则能帮我们避免医学检测导致的过度恐慌或轻视;因果图模型可区分直接影响与间接干扰,避开相关性等于因果性的陷阱;长尾分布思维则提醒决策者需要为极端事件预留出容错空间;等等。这些工具能渗透到生活中的各种日常场景,使抽象的方法具有可实践性。此外,书中对数据伦理的探讨也提醒我们,数据不是冰冷数字,数据记录着社会进步的轨迹,并承载着重要的社会价值。
这本书像一把解码数据的钥匙,能重塑我们看待世界的方式,让我们在数据泛滥的时代,避开统计陷阱,保持清醒思考,做出理性决策。
在数据泛滥的时代,这本书是你最需要的批判性思维指南让数字回归真相,让决策回归理性。
·当数据揭开真相:一场重塑思维的决策革命
你是否曾因大多数人都这么选而随波逐流?是否被权威数据误导过判断?《数据决策》正是一本为普通人打造的数据思维急救手册,用20余个鲜活案例,带你识破统计悖论,掌握数据时代的生存法则。
·决策工具箱:从数据到行动的科学框架
本书拒绝空谈理论,而是将统计学转化为可复用的决策工具。如因果图模型、长尾分布思维,这些工具并非束之高阁的理论,而是渗透在生活场景中:如何解读体检报告的假阳性?怎样评估职场决策的潜在风险?书中用超市促销、法庭审判等日常案例,让抽象方法落地生根。
·数据伦理:理性背后的人文温度
数据不仅是冰冷的数字,更承载着社会价值。书中对算法偏见的探讨振聋发聩:COMPAS系统因训练数据的历史偏差,将黑人被告误判为高风险的概率是白人的两倍。这种数据正义的缺失,直指技术中立的假象。作者呼吁:当我们用算法预测犯罪时,更应追问数据是否裹挟了历史偏见。
·写给每一个人的数据宣言
无论你是职场人、学生,还是关心公共事务的公民,本书都将重塑你看待世界的方式。
对职场决策者:学会用分层分析避免平均数暴政,如评估团队绩效时,关注个体分布而非整体均值。
对普通读者:在医疗选择、消费决策中,不再盲从大数据结论,而是追问样本是否有偏因果是否成立。
对思考者:透过数据看到社会的复杂性,如老年人更保守实为代际价值观差异,而非年龄导致的思想僵化。
[美]艾伦·唐尼(Allen Downey)
拥有加州大学伯克利分校(U.C. Berkeley)的博士学位,以及麻省理工学院(MIT)的硕士和学士学位。他曾在奥林学院(Olin College)、科尔比学院(Colby College)和韦尔斯利学院(Wellesley College)任教,目前担任奥林学院的荣誉教授,也是PyMC实验室的首席数据科学家。
他已出版多本与编程和数据科学相关的书,包括《思考Python》(Think Python)、《思考统计》(Think Stats)和《思考贝叶斯》(Think Bayes)等系列作品。这些书背后的核心理念是:你如果懂得如何编程,就可以利用这一技能去学习其他领域的知识。
中文版序 VII
引言 用证据和理性指引我们的决策 IX
第1章 人人都不正常吗?高斯曲线与中心极限定理 001
高斯曲线与高斯分布 004
中心极限定理 007
各种分布与偏差 010
偏差到底有多大? 013
平均人神话 014
大五人格测试 017
我们都是怪异的! 022
但有些人更正常 024
第2章 犯过罪的人一定会再犯?检验悖论与友谊悖论 027
检验悖论与过度抽样 030
无偏数据与有偏数据 032
尖锋厚尾 034
友谊悖论 037
寻找超级传播者 039
比我快的和比我慢的 041
被高估的刑期 043
重复犯罪率到底有多高? 045
无处不在且隐蔽的检验悖论 047
第3章 如果每位女性都少生一个孩子?普雷斯顿悖论 049
原生家庭规模 053
大萧条和婴儿潮 055
不断下降的生育率 056
普雷斯顿悖论 059
如果每位女性比其母亲少生一个孩子 061
新的生育模式 062
第4章 顶级牛人有什么特别之处?对数正态分布与 SPC 框架 065
成年人的体重不符合高斯分布 068
新生儿出生体重符合高斯分布 071
模拟增加体重后 072
速度的对数正态分布 076
国际象棋的积分分布 080
顶尖人物的异常值 084
用 SPC 框架找工作 086
第5章 如何活到300岁?预期新比旧优与预期旧比新优 089
新灯泡还是旧灯泡的寿命长? 093
第39、40、41周孕妇的分娩时间 095
肿瘤病人的存活时间 097
出生时的预期寿命 102
不同区域的儿童死亡率 104
让死亡率骤降且长寿的秘密 106
第6章 你应该点菜单上那道最让人没食欲的菜?伯克森悖论与伯克森偏倚 113
数学能力和语言能力 116
精英大学与二流大学里的相关性 118
胆囊炎和糖尿病之间的相关性 121
新冠病毒感染和伯克森悖论 124
抑郁症和伯克森悖论 126
位置不好的餐馆更值得去! 127
第7章 吸烟对胎儿更有利?出生体重悖论,多胞胎悖论与肥胖悖论 129
母亲吸烟与婴儿死亡率之间的关系 134
高海拔地区的母亲与矮个子母亲 136
低出生体重悖论的终结 138
多胞胎悖论与早产 139
肥胖悖论也是不存在的 140
伯克森烤面包机与因果图 142
第8章 黑天鹅事件的发生有规律性吗?尾端分布与对数 t 模型 147
灾害损失的尾端分布 150
地震震级的尾端分布 155
太阳耀斑通量的尾端分布 159
月球上的陨石坑 164
小行星直径的尾端分布 166
股市崩盘的规模分布 169
黑天鹅与灰天鹅 171
在长尾的世界里醒来 173
第9章 到底要不要接种疫苗?基率谬误与假阴性率 177
医学检测的准确性 181
如果提高灵敏度与特异度 183
患病率和假阳性率 186
酒驾和毒驾的筛查 188
别怀疑疫苗的有效性 191
预测犯罪风险 197
比较组 200
算法比人类更容易纠错 203
公平很难实现 206
第10章 不敢独自走夜路的人,更害怕离婚?辛普森悖论与数据开放 211
乐观的老年人和悲观的年轻人 214
实际收入下降,总体收入却上升? 218
企鹅 221
要不要开刀取肾结石 223
接种疫苗和老年人的死亡率 228
是的,疫苗挽救了很多人的生命 232
开放数据,公开讨论 235
第11 章 你相信世界上存在蜥蜴人吗?年龄时代世代分析及奥弗顿之窗 237
种族歧视和蜥蜴人 240
年龄效应、时代效应和世代效应 244
我们越来越不恐同 248
变化缘于思想的改变 251
世代效应还是时代效应? 252
固执己见的群体和奥弗顿之窗 253
第12章 老年人的观念更保守?奥弗顿之窗转移和追逐奥弗顿之窗 257
年老的保守派,年轻的自由派? 260
保守派是什么意思? 262
奥弗顿之窗移向自由主义 265
中间并非一成不变 266
我们是否变得更加两极分化? 269
追逐奥弗顿之窗 270
附录 区分自由派和保守派的问题 273
结语 问题、数据和方法 275
致谢 279
译后记 281
参考文献 285