本书选材广泛,共12个单元,主要内容涉及什么是大数据,大数据分析,数据模型,结构化数据、半结构化数据和非结构化数据,大数据存储,数据提取、转换、加载,数据备份,Python编程语言与R编程语言,数据库基本概念,数据库管理系统,数据仓库,云存储,数据处理,数据挖掘及其算法,Hadoop与Spark,大数据可视化,商业智能
本教材以数据挖掘的经典算法为主线,基础部分讲清楚数据挖掘的过程和经典算法:数据探索、数据预处理、分类与回归、聚类分析、关联规则挖掘、偏差检测等。同时增加实现应用部分,在应用实现部分,以Python作为描述语言,以解决某个应用的挖掘目标为前提,介绍案例背景,阐述分析方法与过程,完成模型构建,给出算法的具体实现,通过此项目
《数据分析思维:分析方法和业务知识》分为两大部分:“方法篇”和“实战篇”。“方法篇”介绍了数据分析中常用的业务指标、分析方法以及如何用数据分析解决问题的步骤。“实战篇”讲解了如何应用第一篇的方法来解决工作中的问题,分享十二个行业(国内电商、跨境电商、金融信贷、金融第三方支付、家政、旅游、在线教育、运营商、内容、房产、汽
全书以理论够用、实用,实践为第一的原则,采用案例方式讲授大数据技术基础的应用,使读者能够快速、轻松地掌握大数据技术基础。内容包括大数据概述;大数据处理架构Hadoop;分布式文件系统HDFS;分布式数据库HBase;NoSQL数据库;云数据库;MapReduce;Hadoop再探讨;Spark;流计算;图计算;数据可视
本书立足于机械工程和电气工程类人才培养目标,在理论教学基础上,阐述利用西门子STEP7、PLCSIM以及WinCC组态软件实现分布式控制系统课程设计的方法,集基础知识、设计、实验于一体,旨在培养学生应用能力、工程设计能力和创新开发能力,是分布式控制系统课程设计的配套指导教程。全书分基础知识、课程设计的要求与备选题目、综
全书共分7章。第1章为非线性系统控制概论,第2章为基于算子理论的控制系统设计基础,第3章为基于鲁棒右互质分解和PI控制的鲁棒跟踪控制,第4章为基于鲁棒右互质分解和滑模控制的鲁棒跟踪控制,第5章为基于鲁棒右互质分解与算子理论观测器的跟踪控制,第6章为基于算子理论的液位系统控制研究,第7章为基于算子理论的故障诊断与优化控制
在全世界不同的文化中,数据的收集与组织都有着悠久的历史,甚至在计算机思想出现之前很久就已存在。但只是到了互联网时代,日常产生的数据量才开始变得非常巨大,而且继续呈指数级增长,其中包括我们上传的文件、视频、照片、社交媒体信息、在线购物,甚至我们汽车的GPS导航数据。大数据这一术语所代表的不仅仅是一种量变,而是一种质变;其
本书共九章,其中一~四章为基础篇,主要介绍大数据技术的基本概念、关键技术以及大数据在实际业务场景中的应用状况。基础篇内容主要包括大数据处理架构、大数据存储与管理以及大数据处理与分析的主要原理和方法。该篇内容是学习后续内容的基础。第五~九章为应用篇,主要介绍大数据技术与金融业融合发展及其实际应用。首先从大数据金融的治理与
本书遵循结构化和综合性的方法,介绍了文本和语言语法、结构和语义的基础概念和高级概念。从自然语言和Python的基础开始,进而学习先进的分析理念和机器学习概念。全面提供了自然语言处理(NLP)和文本分析的主要概念和技术。包含了丰富的真实案例实现技术,例如构建分类新闻文章的文本分类系统,使用主题建模和文本摘要分析app或游
无论是在新闻报道还是纪录片中,我们常常会看到“大数据”三个字,它无处不在。在信息社会发展的几十年中,大数据究竟改变了什么?流媒体巨头奈飞公司通过大数据成功打造影视爆款;欧洲核子研究中心利用大数据发现希格斯玻色子;甚至医药领域还可以利用大数据分析红酒是否真的有益身体。不那么积极的一面是:企业利用大数据发送定向广告从而获益