ApacheSpark是专为大规模数据处理而设计的快速通用的计算引擎。这是一本专门介绍Spark的图书,旨在教会读者利用Spark构建实用的数据科学解决方案。 本书内容包括14章,由浅入深地介绍了数据科学生态系统、数据获取、输入格式与模式、探索性数据分析、利用Spark进行地理分析、采集基于链接的外部数据、构建社区、构
本书以数据处理为主线,介绍数据处理的基本原理、常见的算法思想、算法设计的可视化以及编程实现python语言。 全书共13章,主要内容包括数据科学基础实践概论、数据表示、数据计算、数据分析、数据可视化、算法可视化工具、算法设计基础、Excel中的算法、Python程序设计基础、算法在Python中的实现、Word文档处理
《过程控制及自动化仪表》以过程自动化监控为基本内容,将参数检测变送、分布式控制系统(DCS)及执行器作为组成过程检测控制系统的相应环节,力求完整体现过程监控的整体内容。在参数检测方面,深入浅出地介绍了检测原理及方法;依据其代表性及发展趋势,介绍了目前生产中广泛应用的检测仪表;在控制仪表方面,根据生产实际情况,介绍了电动
本书主要内容包括认识大数据、大数据技术基础、大数据管理、大数据统计分析技术、数据挖掘、大数据可视化、大数据安全、大数据应用案例实操等。
本书为开放教育教材,涉及:Python基础,数据探索与预处理,模型结果评估,相关与关联分析,回归分析,分类,聚类分析,时间序列分析。
本书分三个部分,共十一章。第一部分是数据分析与挖掘概述,包括第1章,主要介绍数据分析与挖掘的基本概念。第二部分是基础理论和基本技术,包括第2章到第10章,内容涉及数据仓库、多维数据分析OLAP、线性回归模型等。第三部分是数据分析与挖掘的操作与应用,包括第12章,以SQLSERVER和R语言为实践平台,介绍多维数据分析O
本书主要内容包括:数控技术与数控机床的基本知识、数控技术的现状与发展趋势、数控技术在国民经济中的地位和作用、数控技术应用型人才需求、数控技术专业概况等。
本书以典型厂家及型号的计算机控制系统为对象,基于项目导向、任务驱动的理念,从生产过程控制系统工程案例出发,引入企业典型工作案例,主要介绍集散控制控制器的软硬选型、设备安装、组态设计以及系统运行调试以及现场总线和SIS的构成、特点和网络通信等内容。本教材不仅可作为高职高专生产过程自动化技术、电气自动化技术、机电一体化技术
大数据平台搭建与配置管理课程是大数据技术与应用专业的必修核心课程。本书重点培养读者深入认识和使用Hadoop平台,学习并掌握Hadoop大数据平台的搭建与配置管理,并利用Hadoop知识处理和解决实际问题的能力。主要内容为Hadoop安装与配置、分布式文件系统HDFS、分布式编程框架MapReduce、分布式服务框架Z
绘制海量信息的知识图谱是当代大学生必备的信息素养和技能。“文本挖掘与可视化”作为知识图谱分析的核心内容,是一门实践性很强的课程,需要学习者了解和掌握常用的CiteSpace、BICOMB、Ucinet、Pajek、Carrot2等文本挖掘与可视化软件的安装、调试以及在具体研究问题中的实际应用。本书通过简要的理论讲解和详