本书融合作者多年的教学与实践经验,是一本全面且实用的大数据分析与处理教材。全书分为六部分共20章,内容循序渐进,从大数据的基本概念出发,逐步深入探讨数据采集和预处理、数据存储、数据处理、大数据分析平台以及大数据应用等关键环节。本书详细介绍了PyTorch、TensorFlow和SparkMLlib等热门大数据分析平台,
本书内容翔实,结构清晰,主要分为三大部分。第一部分:基础概念篇。此部分将引领您踏入实践真实数据科学的门槛,详细解析PCS框架的精髓,并对DSLC进行全面概述。同时介绍一系列计算概念,这些概念将成为您后续实施示例和技术的坚实基石。此外,本书还将指导您如何在计算机上高效组织数据科学项目,传授编写高效代码的经验,并助您熟练运
2022年中央全面深化改革委员会审议通过《关于构建数据基础制度更好发挥数据要素作用的意见》,数据资产治理和管理已成为国家战略。本书讨论了数据资源如何资产化、企业数据资源资产化路径、企业数据资源的确权和管理、“两法”背景下企业数据分类分级策略与合规使用方案、企业数据资源会计处理与数据资产入表等问题。从理论与实践相结合这一
本书致力于培养具备数字技能和数据思维的商科人才。通过深入浅出的方式,将大数据理论、技术与应用进行系统讲解,帮助学生掌握从数据认知到实际应用的全面能力,通过对业务场景与数据分析的紧密结合,洞察数据的商业价值,成为负责任的数据使用者和决策者。本书的编写坚持产教深度融合、校企双元协同,采用“项目引领,任务驱动”的理念,将复杂
本书系统阐述大数据的常用技术原理和框架,并精选实战案例深化大数据技术运用。全书共12个单元,内容包含大数据与Hadoop概述、大数据处理平台Hadoop的安装与配置、分布式文件系统HDFS、MapReduce和YARN技术、分布式数据库HBase、数据仓库Hive、大数据迁移工具Sqoop、分布式协调服务ZooKeep
本书第一章为读者揭示了数据的魅力以及其在日常生活中的无处不在。随后的章节详细介绍了数据的成长、存储和处理方式。从早期的磁带和光盘,到现代的Hadoop、Spark和分布式系统,读者将对大数据技术有一个全面的了解。中间章节着重于大数据在不同领域中的应用,如社交媒体、金融市场和电商,展示了数据如何被转化为有价值的洞察和解决
本书以“电影网站用户影评分析”项目为导向,较为全面地介绍Hadoop大数据技术及其生态系统组件Hive、HBase的相关知识。本书共6个项目,具体内容包括分析电影网站用户影评需求及环境搭建、存储电影网站用户影评分析数据、统计电影网站用户影评数据、多维度分析电影网站用户影评、基于Hive实现电影网站用户影评分析和基于HB
本书内容包括:大数据的认知,虚拟化技术的认知,Hadoop在购物网站中的应用,购物网站中的数据存储,购物网站中的数据分析,购物网站中海量数据库存储技术,购物网站中数据仓库技术,购物网站中的实时数据分析,购物网站中的数据迁移,购物网站中的数据展示等子项目。
本书从数据科学概念入手,系统介绍数据处理的统计学基础、数据处理的方法及Python程序设计。整套教材体现了数据处理的各个阶段:数据采集、数据整理、数据存储、数据分析和数据可视化。教材内容的安排适合培养学生的计算机思维、互联网思维和数据思维能力,有利于让数据科学与学生专业深度融合,促进计算机基础课程与其他学科的深度交叉,
本教材以亚龙YL-566D生产型产线为载体,结合“工业机器人集成系统应用”和“智能制造应用技术技能”大赛内容,采用项目引领,任务驱动的编写模式,将自动化生产线单模块操作和多模块调试所需的理论知识和实践技能分解到不同项目和任务中,形成“单机操作到多机联调,理论教授到技能实操”的学习进阶体系。本教材主要内容包括智能制造概述