《体育分析与数据科学——用方法和模型制胜》通过对体育产业经济学、市场营销、管理、绩效评价和竞争分析等方面的实例进行分析,能够非常完整和实用地指导体育数据科学和建模教学。
美国西北大学预测性分析项目的教务主任托马斯.W.米勒展示了如何使用衡量个人绩效和球队绩效的高级指标来判断运动员个人和球队的竞争地位,并更准确地预测其未来表现。
米勒的建模技术借鉴了经济学、会计学、金融学、贝叶斯经典统计、机器学习、仿真和数学编程等方法。米勒通过真实案例,使用R与Python完整示例程序来展示这些建模技术。
对于想要认真研究和准确分析球员、球队和体育企业绩效的学生、教师、体育分析师、体育迷、培训师、教练、球队和体育企业的经理来说,《体育分析与数据科学》一书都将是宝贵的资源。同时,该书对所有想要通过熟悉和可触及的体育应用培养技能并学习分析和数据科学的学生也很有价值。
企业吸引顾客,政治家说服选民,网站招徕访客,运动队吸引球迷。无论要实现什么样的目标,数据和模型在当下都是至关重要的。
本书关注如何打造制胜的运动队和成功的体育企业,而依赖数据和模型决策能够提高取得胜利和获得成功的可能性。因此,体育分析是竞争优势的来源。
本书为运动员、运动队经理和老板及爱好者等希望了解体育分析的人,提供了易于理解的、有关体育分析的指南。同时,本书也可以作为分析师、数据科学家和开发人员的参考书。本书在数据科学这一融合了商业洞察、信息技术和建模技术等学科背景下来介绍体育分析。
为了在体育中有效地使用数据分析,我们必须首先理解体育,包括产业、企业及赛场和球场上发生的事情。我们需要了解如何使用数据,包括识别数据来源、收集数据及组织和准备分析所需的数据。我们还需要了解如何用数据构建模型。数据不能自解释,有价值的预测也不会凭空产生。体育分析所做的正是从数据中学习,并构建有用的模型。
学习体育分析和数据科学的最佳方式是通过案例来理解掌握。本书提供了有关建模技术的资源和参考指南。本书会向开发人员展示如何通过可靠的方法和代码来解决现实问题。
代码可以说明我们所做的事情。读者都可以查看或者调试这些代码。本书中使用的数据集和计算机程序可以从“建模技术”系列的网站或者GitHub上获取。
在分析体育问题时,有时使用R语言更方便,有时则使用Python更容易。此外,有时同时使用两种语言更好,因为可以对使用两种语言得到的分析结果进行比对。
本书有别于体育分析领域的其他著作,其独特之处在于数据来源和所讨论话题的范围。许多研究人员关注的是量化的运动队和运动员的运动表现数据。本书则从更广泛的视角,即数据科学的视角来讨论体育分析。体育数据既有文本数据,也有数值数据。同时,随着互联网的发展,数据来源变得越来越丰富。人们可以通过互联网的爬取、抓取和利用应用程序编程接口等,从公开数据来源中获得许多数据。
笔者从为职业体育组织提供的咨询工作中学习到了许多。面向研究的出版商及其相应部门推出了“数据科学服务”。学术研究和模型只能让我们了解当下模式,最终,我们还是需要通过实现自己的想法和模式,并通过相互分享来变得与众不同。
这些年来,许多人对笔者的心智发展产生过影响。笔者永远感激那些优秀的思想家、善良的人、老师和导师。不幸的是,乌尔辛纳斯学院杰拉德·哈恩·欣克尔(Gerald Hahn Hinkle)和语言学家艾伦·莱克·赖斯(Allan Lake Rice)、明尼苏达大学的哲学家赫伯特·费格尔(Herbert Feigl)已经永远离开了我们。笔者非常感谢明尼苏达大学的心理测量学家大卫·J.韦斯(David J.Weiss)和俄勒冈大学的经济学家凯利·埃金(Kelly Eakin)。
笔者的学术之家是西北大学职业研究学院(美国)。“体育研究方法和量化分析” “营销分析” “数据库系统与数据准备” “网络和计算机数据科学” “网络信息检索与实时分析” “数据可视化”等课程为本书的写作提供了灵感。感谢许多学生和同事,从他们身上,笔者学到了许多。笔者很感谢负责预测分析理科硕士、体育管理文学硕士、信息系统理科硕士和数据科学高级证书等优秀研究生课程的同事和工作人员。
洛雷娜·马丁(Lorena Martin)审阅了本书,并提供了有价值的反馈。同时,她还编著了与本书配套的《运动成绩测量和分析》(2016)一书。亚当·格罗斯曼(AdamGrossman)和汤姆·鲁滨孙(Tom Robinson)对体育商业管理相关的内容提供了有价值的反馈。罗伊·桑福德(Roy Sanford)提供了与统计相关内容的建议。德科纳米(Texnology)公司的埃米·亨德里克森(Amy Hendrickson)的技术,使得本书中的文字、表格和图看起来非常美观。这是开源的另一个胜利。坎迪斯·布拉德利(Candice Bradley)在“建模技术”丛书中担任编审和文字编辑。安迪·比斯特(Andy Beaster)为本书最终付印提供了帮助。笔者非常感谢大家的指导和鼓励。
感谢本书的编辑珍妮·格拉瑟·莱文(Jeanne Glasser Levine)和出版商培生/(英国)金融时报出版社。他们使本书得以出版。当然,所有写作问题、错误或者未完成的内容都是笔者的问题。
笔者的好友布里特妮(Brittney)和她的女儿珍妮娅(Janiya)在时间允许的情况下一直陪伴着笔者。风雨兼程,丹尼尔一直陪伴在我身边,亦子亦友。他们是如此相信我,以至于让我深感歉疚。
[美]托马斯·W.米勒,美国西北大学预测性分析项目的教务主任。他负责项目的课程设计。该项目的课程包括体育管理分析、市场营销分析、高级建模技术、数据可视化、网络与网络数据科学、数据库系统与数据准备以及顶点课程等。托马斯·W.米勒在预测性分析项目中教授多门课程。同时,他还与其他40多位教师共同开展预测性分析和数据科学方面的培训。
米勒也是Research Publishers有限责任公司的所有者和总裁。他拥有超过30年应用预测性模型的经验,并提供有关零售网站选择、产品定位、市场细分、文本和情感分析以及竞争市场定价等领域的咨询服务。
米勒的著作包括《营销数据科学:使用R和Python进行预测性分析的建模技术》《网络与网络数据科学》《使用R和Python进行预测性分析的建模技术:数据科学指南》以及讨论体育领域中预测性建模的《无须吹捧:如何选择优胜球队》。
在进入学术界之前,米勒在计算机行业和运输行业从事近15年与信息技术相关的工作。他还领导了A.C.尼尔森市场研究中心,并在威斯康星大学麦迪逊分校教授市场研究和商业策略。
他拥有明尼苏达大学的心理学(心理测量学)博士学位和统计学硕士学位,以及俄勒冈大学的工商管理硕士和经济学硕士学位。
杜炤,博士,北京体育大学体育商学院副教授、硕士生导师。本科毕业于北京交通大学计算机科学与技术系,获工学学士学位;研究生毕业于清华大学计算机科学与技术系和中国人民大学商学院,分别获硕士学位和管理学博士学位。主持国家自然科学基金项目1项,作为子项负责人参与教育部一中国移动科研基金项目1项,参加国家自然科学基金重点项目、国家973项目、国家863项目、国家重点研发计划项目、教育部软科学研究项目等1 0余项;发表学术论文60余篇;获得软件著作权登记40多项,授权专利2项;出版图书2本。
第一章 理解体育市场
第二章 运动员评估
第三章 球队排名
第四章 预测比分
第五章 制定比赛日决策
第六章 制作消息
第七章 推广品牌和产品
第八章 实现收入增长
第九章 管理财务
第十章 做假设游戏
第十一章 使用体育数据
第十二章 在分析上竞争
附录A 数据科学方法
附录B 职业联盟和球队
参考文献