本书介绍了大数据的基本概念,探索了大数据对科学研究、思维方式及人才培养等的影响,讨论了大数据的关键技术和计算模式;对计算机大数据平台数据采集系统的处理组件部署模块、配置采集组件模块、采集监控模块等的设计与实现进行了分析,阐述了计算机大数据交互式分析的特点和大数据批处理技术,论述了大数据机器学习系统的技术特征、学习平台总
本书结合作者一线开发实践,循序渐进地介绍了ApacheSpark3的应用开发技术,全书共10章,第1章和第2章主要介绍Spark基本概念、安装,并介绍如何来编写最为简单的Spark程序。第3章介绍Spark核心组件RDD。第4章介绍SparkSpark集群管理,主要是为了便于读者解集群管理,主要是为了便于读者解Spar
本书从数据流通的背景、基础、场景应用、市场生态体系、机制体制、趋势展望六个方面对数据流通的基础知识与实际应用进行介绍。综合本书内容可见,第一,本书是理论与实践的结合。以数据和数字经济的基础理论为出发点,再论述数据发挥作用的途径以及具体的实践应用,有助于对数据流通问题的理解。第二,内容覆盖了数据流通的各个环节、多个行业,
本教材共分为十章。其中第一章为绪论,介绍大数据时代新闻传播学学术研究和业务实践的创新;第二章介绍数据的获取,为数据分析进行准备;第三章是对大数据分析作用的介绍,大数据分析这门技术是如何带来了社会科学研究的新范式。第四章到第九章是教材的主要内容,每一章介绍了一种计算传播中常用的大数据分析方法。每一章都包括技术原理、技术操
本书基于Spark新版本展开,符合企业目前开发需要。本书全面讲解SparkSQL相关知识和实战应用,各章均提供较为丰富的案例及其详细的操作步骤,并配套示例源码、PPT课件和教学大纲。本书共分10章。第1-3章为SparkSQL的基础准备部分,包括SparkSQL的发展和简介、Spark的典型数据容器及关系、Spark概
本书旨在建立和推动“动力学刻画的数据科学”理论和应用研究。全书共六章,内容包括:复杂动力系统理论基础、高维数据的临界预警理论及方法、短时间序列的预测理论及方法、动力学因果检测理论及方法、基于动力学的势能景观构建理论及方法、混沌反馈学习理论及深度学习方法等。全书交叉融合了数学理论、统计学方法、人工智能、计算系统生物学方法
本书系统地阐述鲁棒控制理论中的时域方法,综合国内外相关文献资料,并结合作者多年来的教学实践,以Lyapunov稳定性理论为基础,以矩阵代数Riccati方程、线性矩阵不等式(LMI)、矩阵运算及其性质等为工具,深入浅出地介绍不确定系统及时滞不确定系统在鲁棒稳定性分析与鲁棒控制器设计方面的基本概念及分析设计方法。全书共9
本书的主要特点是专业性、针对性较强,主要针对工科专业,特别是自动控制相关专业研究人员学习。涵盖了概率论基础与随机过程的基本概念,泊松过程、离散时间马尔可夫过程、连续时间马尔可夫过程、鞅、布朗运动、伊藤微积分、随机系统的最优估计、随机系统的最优控制与优化控制等,涵盖了工科专业所需的随机过程的基本内容.同时,本书配有大量与
本书阐述数据驱动的工业过程监控与故障诊断的理论与应用方法,主要内容包括:过程监控必要的基础知识、常见测量方法、检测指标、控制限设计和仿真平台;面向间歇过程的故障检测方法,包括软过渡PCA监控、基于核费希尔包络分析的故障识别、基于局部特征相关性的故障诊断;面向质量监控的全局与局部特征融合的故障诊断方法,包括基于全局加局部
"本书从初学者的角度,介绍如何运用R语言进行基本的数据处理和分析,以及一些数据科学技术。通过学习,读者可了解数据输入、数据清洗、数据可视化、数据分析、数据分析报告等大数据分析的一般流程与相应的R语言操作。全书除了提供大量的实际数据,还提供了每一步分析的R语言代码,可作为数据分析的R语言参考书。本书适合普通高等学校统计学