从数据分析方法到数据科学基础知识,你需要了解的知识全部在这本图解书中! 当下,利用数据为自己的业务和服务提供支持是大势所趋。但是,分析数据需要广泛的知识,自己很难成体系地学习。 本书介绍了数据科学的基础知识及周边知识,包括数据、图表的类型以及统计学、人工智能的基本知识等,网罗信息社会中数据活用的问题点,结合生动插图,让
随着时代的发展和信息技术的进步,信息技术已经是社会发展的动力之一,尤其是大数据技术对社会的发展起到促进作用。在人们的生活、生产中,大数据的应用能够给人们带来便利性,同时在大数据中也会存储人们的个人信息。随着科技的发展和进步,我们逐渐进入大数据时代。本书首先对大数据相关概念和应用问题进行了简述,进而论述了大数据的异化分析
Spark数据处理引擎是一个惊人的分析工厂:输入原始数据,输出洞察。PySpark用基于Python的API封装了Spark的核心引擎。它有助于简化Spark陡峭的学习曲线,并使这个强大的工具可供任何在Python数据生态系统中工作的人使用。《Python和PySpark数据分析》帮助你使用PySpark解决数据科学的
从信息资源管理协同创新视角,分析了大数据治理面临的挑战、机遇和焦点议题,大数据治理研究的视角、立场及代表性观点,大数据治理的框架类型及其构成要素。以公共价值理论、数字连续性理论、利益相关者理论和协同创新理论为主要理论支持,从大数据治理目标、主体、治理客体、治理活动、治理环境等多个维度,分析了大数据治理的政策、标准和技术
首先,本书在内容选择上坚持“经典”与“前沿”并重。一方面,系统全面地讲述了无约束和有约束最优化问题的常用求解方法,包括负梯度方法、牛顿方法、拟牛顿方法、共轭梯度方法、罚函数方法等。另一方面,加入近几年在数据科学领域受到广泛关注的一些新型一阶最优化方法,例如随机梯度下降方法、小批量随机梯度下降、动量方法、Nesterov
本书从理论上论述非线性系统的全局能控性.主要介绍平面仿射非线性系统和几类特殊的高维非线性系统的全局能控性判据,以及几类多项式系统全局能控性的判别算法.另外,本书也对平面仿射非线性系统的全局渐近能控性及全局镇定性做一点讨论.
鲁棒预测控制是在预测控制的基础上考虑到实际系统存在着模型不精确或者参数时变、未知扰动等各种不确定性而发展起来的先进控制技术。如何在鲁棒预测控制的基础上有效处理时变时滞对系统的影响成为工业过程控制亟待解决的问题。本书针对具有时变时滞的工业过程可能存在参数时变、强干扰、执行器故障、非线性、多阶段切换、时变跟踪轨迹等问题,重
本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了电商行业Flink实时数据仓库的搭建过程。在整个项目的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并穿插了大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、电商业务概述、数据仓库理论介绍和数据仓库建模等。最核
本书全面介绍了SparkSQL语言如何建表、导入数据、查询分析数据、统计数据,以及如何使用函数处理数值、字符串、时间日期等常用数据元素,让学生能够在单机上学习企业分布式集群环境中的大规模数据分析方法。本书还介绍了如何用Scala语言编写数据分析应用,并编译成可以提交到分布式集群上执行的程序。本书旨在帮助学员入门,想进一
通过完成书本中的实践内容及课后练习,学生能够深度理解大数据平台Hadoop、HDFS、MapReduce的运行原理,并能从实际业务环境出发,将知识点与业务结合,提高实战开发能力。本书共分为八章,主要介绍了大数据Hadoop平台下的HDFS、MapReduce、Hbase的使用特点和使用方法。前四章主要介绍平台架构的核心