近年来,以ApacheSpark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以ApacheSpark框架为核心,总结了大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。本书分9章,主要包含四部分内容。第一部分大数据处理框架的基础知识(第1~2章):介绍大数据处理框架的
本书以独特的方式讲解数据科学,不仅让读者可以轻松学习数据科学理论,又可以动手(手算和机算)进行数据科学实战。本书特色:全彩印刷,图形、表格、思维导图丰富;避免深奥的数学证明,采用简单的数学说明;用各种学习图将本书内容贯穿起来;实战计算,包含小型数据的演算和大型数据的实战程序。 本书共13章,内容涵盖丰富的数据科学
概述了OPCUA;介绍如何操作已经建立好的OPCUA信息模型;OPCA的应用程序架构和系统架构,*后本书对OPCUA协议子集进行介绍,并对OPCUA与传统OPC的性能进行了对比。对于那些需要进一步查询OPCUA详情的读者,本书的附录给出了参考。
本书由国际数据挖掘领域泰斗、UIUC韩家玮教授和其学生张超博士(现为佐治亚理工学院助理教授)合著。介绍了将非结构化文本数据转换为多维知识的数据挖掘技术,并讲解了他们开发的文本多维数据集框架的原理和使用方法。
本书是根据我国当前测控技术与仪器专业教学改革和教材建设的需要而编写的一本关于自动检测技术及仪表的教材。全书共分4篇19章,深入、系统地介绍了自动检测技术及仪表的相关理论、原理、技术及其应用等知识。第1篇介绍了检测技术及仪表的基本概念及基础理论,包括检测技术及仪表概述、检测误差及其处理、信号的描述及其分析、检测系统及其特
《数据清洗》主要介绍数据清洗技术的基本概念与应用。全书共有8章,分别讲述了数据清洗基础、数据清洗方法、文件类型、数据采集与抽取、Excel数据清洗与转换、ETL数据清洗与转换、Python数据清洗、R语言数据清洗。《数据清洗》将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据清洗的相关技术。针对书中重要
本书根据《教育部关于深化职业教育教学改革全面提高人才培养质量的若干意见》精神编写,以“课程思政”为指导思想,全面介绍了与课程知识体系相关的国家新政策、行业新动态和专业新知识。主要内容包括传感器与智能检测技术基础、电阻式传感器、电容式传感器、电感式传感器、压电式传感器、热电式传感器、光电式传感器、霍尔式传感器与其他磁敏传
在过去几年中,互联网、在线营销以及广告经历了巨大的变革,然而大家处理数据的方式跟几十年前相比还是大同小异。数据分析领域的领跑者(AvinashKaushik)通过《谷歌数据分析方法》提出了下一代数据分析的框架,将能很大程度地帮助你提高组织的能动性和对市场的反应速度。本书阐述了如何去衡量、分析目前互联网上出现的新技术和应
本书主要介绍数据可视化分析相关知识,所使用的工具为Tableau。本书基于以多个实际案例为背景的具体数据,介绍了常用的商务数据分析图形的制作,以及如何利用图形获得见解,得出结论。读者通过本书可掌握数据可视化分析理论,并且能够制作可视化分析图表,基于图表获得分析结论,从而为企业经营提供指引。本书可作为高职高专学校师生学习
本书以任务驱动为主线,围绕企业级应用进行项目任务设计,介绍了平台的本地模式安装、伪分布式模式安装及完全分布式模式安装,并基于Hadoop2.X生态系统,全面讲解了Hive环境搭建与基本操作、ZooKeeper环境搭建与基本操作、HBase环境搭建与基本操作、Hadoop常用工具组件的安装与应用、集群搭建与管理,以及Ha