关于我们
![]() ![]() |
大规模数据管理 本书的主要内容有:研究数据管理趋势,包括技术发展、法规要求和隐私问题。深?了解可拓展架构,学习各组件之间如何协同?作。探索数据治理和数据安全、主数据管理、?助式数据市场,以及元数据的重要性。 编辑推荐 前言近年来数字化已经极大地改变了我们的生活方式,社交媒体、流媒体直播和智能手机仅仅是冰山一角,而且这个变化速度仍在加快。数字化转型影响到音乐和电视、购物和旅游等许多行业,同时在人工智能和机器学习的推动下,像无人机和自动驾驶汽车这样的自动化机器(autonomous machine)的也在迅速增长。那么是什么推动了这个数字社会的发展呢?答案是数据。在20 世纪,石油曾是世界上最有价值的资源。如今,数据成为了新的石油。随着分析的增长,对数据的需求迟早会达到我们前所未见的水平。同时,数据不仅在飞速扩充而且变得愈加复杂。云计算、API 管理、微服务、开放数据、软件即服务(SaaS)以及新的软件交付模式等也正在兴起,过去几年涌现了无数新的数据库和分析应用程序。这些大量新的数据处理方法不断分化(fragment)数字景观。我们看到了更多的点对点接口、无休止的关于数据质量和所有权的讨论,以及众多与隐私和安全有关的道德和法律困境。敏捷性、系统长期的稳定性和清晰的数据治理的理念与迅速发展新业务的需求互相冲突。我们行业迫切需要一个关于数据管理和数据集成未来发展的清晰愿景。本书关于数据管理和数据集成的观点得益于我的个人经验。作为一家大型企业的首席数据架构师,我推动了数据架构议程。这一角色帮助我清楚地看到了良好的数据策略可以对大型组织产生何种影响。在这之前,我还曾担任战略顾问,设计了许多架构,并参与了大型数据管理项目,同时作为自由职业应用开发人员将这些心得付诸实践。简而言之,我在最近十年一直在寻找能帮助企业成为数据驱动的最佳方案。如今,我的雇主荷兰银行(ABO AMRO)注1 正在构建大家描述的未来状态架构注2。我们已经将本书的想法付诸于生产,并从实践中积累经验。我知道并且已经了解了其中哪些行之有效,哪些无效。这些经验使我能为你呈现一种开创性的数据管理和数据集成方法,此方法远远超越了传统方法。在这里,你将发现新的方法和发展趋势正不断相互对接和融合,这其中包括了企业架构、业务架构、软件架构、领域驱动设计、应用集成、微服务和云计算。本书是一本关于构建现代化、可拓展数据景观的综合指南。它提供了丰富的蓝图、原则、标准化模式、观察、示例和最佳实践。它将教你如何避开复杂且紧密耦合的数据景观陷阱,以及怎样把敏捷和控制注入组织的DNA 中。它从多个尽可能新的角度审视了数据管理和数据集成。你可以根据你组织的成熟情况来选择适合自己的操作。无数的公司在如何妥善进行数据管理方面失败了,考虑到持续变化的数据景观、迅猛增加的数据量和随之而来的集成挑战,这是可以理解的。在本书中我都牢记这点,并密切关注常见的障碍。值得一提的是,我设想的内容能通过许多不同的方式来实现。我将会提到一些产品和供应商,但总体理念还是保持技术中立译注1。有些概念会特别复杂,所以很难开发。由于数据管理领域和数据集成在许多方面高度交织在一起,因此我将慢慢构建本书的愿景,从定义数据管理的核心学科开始,回顾整体架构,然后深入各个领域。我所设想的是一种持久的、现代的、基于领域的分布式架构,它能帮助组织快速找到和集成数据来满足业务对敏捷性的需求,同时保持对数据的控制。我称之为可拓展架构。可拓展架构和其他架构的不同之处在于它能务实地(pragmatically)得到创建。其各个组成部分可以独立且逐步地设计,而无需大量的前期投资。这也是我所推荐的,从小处着手,观察进展情况,然后继续前进。这种方法与许多执行失败的数据仓库项目形成了鲜明对比,后者可能数年都无法产生价值。本书面向的读者对象这个可拓展架构是为了大型企业服务的,然而较小的组织也可以从中发现很多有价值的内容。本书尤其适合于:? 管理层和架构师:首席数据官,首席科技官,企业架构师和数据架构师。? 合规以及监管团队:首席信息安全官,数据保护官,信息安全分析师,数据专家和商业分析师。? 分析团队:数据科学家,数据工程师,数据分析师,以及分析管理者。? 开发团队:数据工程师,商业智能工程师,数据建模师和设计师以及其他数据专业人士。我能学到什么学完本书之后,你将理解:? 什么是数据管理及为何它很重要。? 哪些数据景观的内容受到了业务和技术趋势的影响。? 数据管理的核心部分是哪些,以及它们是如何互相影响的。? 如何大规模地管理复杂的数据景观。? 为何数据集成如此困难。? 为何企业数据仓库不再能满足其目的。? 你需要哪些工具才能搭建大规模的数据架构。? 如何理解分发数据的核心模式、它们的特征和一些用例。? 在管理架构中元数据扮演了何种角色。? 如何在大规模应用中实施主数据和参考数据的管理。? 如何利用自助模式来扩展数据消费。? 混合云和跨网络将如何影响你的架构。? 如何应用最佳实践以及在各式环境下最适宜的模式。本书的组织结构本书第1 章提供了一个背景视角,它展示了什么是数据管理以及正在发生怎样的变化。这个视角评估了2020 年初数据管理的当前状态,并追溯了企业中央数据平台的兴起与衰落。在第2 章,我们将深入探讨可拓展架构的细节。此章介绍了该架构,并为模型搭建提供了理论基础。后续章节将讨论构成整体数据架构的各种集成架构的具体细节,其中第3 章聚焦于只读数据架构,第4 章讨论API 架构,第5 章涵盖流式架构。第6 章将所有内容整合在一起,提供了一个全面的总览。随后的章节将更深入地探讨这种架构是如何运用数据管理和其各个分支更高级的内容。第7 章考察了即使在快速变化的时代,该如何以实用且可持续的方式处理数据治理和安全问题。第8 章讨论了可拓展架构的业务案例,准确展示了它如何帮企业将数据转化成价值。第9 章提供了关于使用主数据管理来保持分布式、广泛资产中数据一致性的指导,而第10 章深入探讨了元数据的使用、重要性以及民主化的潜力。第11 章以对数据管理和企业架构未来的展望结束了本书。排版约定本书使用了下述排版约定。斜体(Italic)表示新术语、URL、电子邮件地址、文件名扩展名。等宽字体(Constant Width)用于程序列表(program listing),以及在段落中引用程序元素,如变量或函数名称、数据库、数据类型、环境变量、语句和关键字。OReilly 在线学习平台(OReilly Online Learning)近40 年来,OReilly Media 致力于提供技术和商业培训、知识和卓越见解,来帮助众多公司取得成功。公司独有的专家和改革创新者网络通过OReilly 书籍、文章以及在线学习平台,分享他们的专业知识和实践经验。OReilly 在线学习平台按照您的需要提供实时培训课程、深入学习渠道、交互式编程环境以及来自OReilly 和其他200 多家出版商的大量书籍与视频资料。更多信息,请访问网站:https://www.oreilly.com/。联系我们任何有关本书的意见或疑问,请按照以下地址联系出版社。美国:OReilly Media, Inc.1005 Gravenstein Highway NorthSebastopol, CA 95472中国:北京市西城区西直门南大街2 号成铭大厦C 座807 室(100035)奥莱利技术咨询(北京)有限公司本书有一个专属网页,在那里我们列出了勘误表、示例和任何附加信息。你可以通过https://oreil.ly/data-mgmt-at-scale 来访问。如有意见或询问技术问题请发送邮件至errata@oreilly.com.cn。如寻求关于我们书籍、课程、会议和消息的更多信息,请访问我们的网站 http://www.oreilly.com。我们的Facebook:http://facebook.com/oreilly。我们的Twitter:http://twitter.com/oreillymedia。我们的YouTube:http://youtube.com/oreillymedia。致谢我想感谢Jessica Strengholt-geitenbeek 允许我来写这本书。在这个写作过程中,她一直支持我,照顾孩子并腾出空间让我可以工作,她是我生活中的挚爱。我还想感谢ABN AMRO 银行的首席架构师和数据管理负责人Santhosh Pillai,感谢他的信任和在我的职业生涯中的指导。很多想法源于他的思考。如果没有他和我之间的无数的讨论,这本书不会出现。此外,还有许多其他人给本书提供了支持和反馈:特别是Bas Van Gils、Danny Greefhorst、Gabriele Rossi、Noor Spanjaard、Bas Van Holsenbeck、Jacek Offierski、Robbert Naastepad、Neil Baxter,以及所有提供支持的人。最后我想感谢OReilly 团队的所有人的支持和信任,他们非常杰出。Sarah Grey,和你一同工作非常愉快,你的积极能量、敏锐的观察和开心的微笑激励我完成这本书。Kim Sandoval,谢谢你的全局的宏观视角,Katherine Tozer,非常感激你在最后阶段对本书的管理。Michelle Smith 和Melissa Potter,感谢你们在入职期间的支持。 Piethein Strengholt喜爱为复杂问题寻找实?且持久的解决?案。在担任战略顾问和?由职业应?程序开发?员超过?年之久后,他作为?席架构师加?了荷兰银?(ABN AMRO),推进数据管理、云计算和系统集成等领域的发展。在这个激动??的职位上,他负责监督公司的数据战略及其对组织的影响。他和家??前住在荷兰。 目录
你还可能感兴趣
我要评论
|