数据挖掘与商务智能
本书系统介绍大数据技术的原理与应用,主要内容包括基本概念、分布式计算编程基础、Hadoop系统、分布式文件系统HDFS、分布式数据库HBase、分布式计算框架MapReduce、数据仓库Hive、流计算SparkStreaming、数据可视化、大数据的电商精准营销案例、好友推荐案例等章节,涵盖了海量数据的高效存储、非结
这是一本能为数字化转型企业的数据治理提供全面指导的著作。它基于国际主流的数据治理框架和用友多年的数据治理经验,从道、法、术、器4个维度全面而深入地展开,不仅有数据治理在战略层面的顶层设计,还有数据治理在执行层面的实施方法,既可以作为数据治理的纲领性指南,又可以作为数据治理的实操手册。从数据治理的战略规划到落地实施,本书
本书是第一本兼顾编程和统计学基础技能的书籍,涵盖了整个数据科学生命周期。它面向那些希望成为数据科学家或与数据科学家合作的读者,以及希望跨越“技术/非技术”界限的数据分析师。如果具备基本的Python编程知识,你将学到如何使用像pandas这样的行业标准工具来处理数据。
数据治理是指通过建立组织架构,明确相关部门职责要求,制定和实施系统化的制度、流程和方法,确保数据统一管理、高效运行,并在经营管理中充分发挥价值的动态过程。数据治理有助于控制数据的开发和使用,降低与数据相关的风险,使相关主体可以战略性地利用数据,并从数据治理中获得价值。数据治理应从以下三个方面进行理解:第一,数据治理的对
本书针对当代社会日益复杂的应急管理挑战,以时空感知大数据为核心,系统探讨了一系列模型、技术和应用。本书内容分为模型篇、技术篇和应用篇。模型篇重点研究时空大数据的表征与提取模型,以及时空感知大数据的存储和查询模型,为读者在处理和管理海量时空感知数据方面提供指导。技术篇关注于利用时空感知大数据支持应急管理决策和行动的核心技
本书主要阐述多自主体系统分布式优化控制的基本内容和方法,介绍国内外相关领域的最新研究成果。本书主要内容如下:讨论基于领航-跟随的线性连续多自主体系统和离散多自主体系统的分布式优化控制问题;设计无领航者线性多自主体系统分布式平均一致性优化协议;研究未知环境干扰作用下和模型参数不确定下线性多自主体系统的鲁棒分布式优化控制策
本书以数字经济发展为背景,围绕数据要素估值,从数据要素概念界定入手,介绍数据要素经济价值、数据要素市场发展及管理、相关研究前沿知识等。本书以数字经济发展为背景,围绕数据要素估值,结合实务界探索成果与理论界研究成果,构建了数据资产评估框架和数据要素定价知识体系。本书内容编排体现关于数据要素市场改革的重点:数据开放共享、提
本书以初学者的角度详细介绍Spark架构的核心技术,主要围绕Spark的架构、Spark的开发语言、Spark模块的主要功能展开;以IDEA为主要开发工具,CentOS为运行环境,采用理实一体化授课模式。本书内容包括Spark导论,Spark环境搭建与使用,Scala语言,Spark弹性分布式数据集,SparkSQL、
本书以BI负责人的视角介绍BI分析师的核心工作和应具备的核心技能,并分析BI创造价值的专题,理论和实例并重。全书分为四部分: 第一部分(第1、2章)为BI概述与团队组建,从介绍BI分析的基本概念说起,包含BI职责与数据驱动的概述,以及组建团队时需要考虑的能力模型、团队选型、团队管理。第二部分(第3、4章)为BI