本书阐述信息技术飞速进步,数据的产生、收集、存储和分析规模呈爆炸式增长,大数据环境下,数据不仅体量庞大、类型繁多,而且价值密度低、处理速度快,要求我们必须探索更为高效、智能的数据处理技术。本文旨在深入探索大数据环境下的计算机数据处理技术,从数据处理的基础理论、大数据处理技术、大数据安全等多个维度展开分析。通过梳理当前技
本书共6章。第1章数据的含义,介绍了数据的概念、分类、分布、用途等内容;第2章数据的来源,包含了从观察法、调查法、测量法、抽样法等;第3章数据的质量体现与保证,介绍了高质量的数据可以真实反映客观对象,可以由抽样反映全貌、可用于预测趋势等;第4章数据的异常概括了导致数据发生异常的情形;第5章介绍了数据缺失的情形;第6章数
本书从工程实际出发,介绍了计算机控制系统中各种软、硬件的应用技术。共九章:第一章介绍计算机控制系统的产生及原理、计算机控制系统的构成和分类、计算机控制的典型应用;第二章介绍过程通道设计需要注意的一些问题;第三章介绍如何分析计算机控制系统是否达到性能指标;第四章介绍数字PID控制器设计;第五章介绍数字控制器的几种直接设计
本书基于数据挖掘、机器学习和深度学习技术,对数据表示与分析预测的若干关键技术进行了研究,内容包括基于概念的数据表示技术、基于神经网络的非线性降维技术、社交网络话题传播热度预测技术、社交网络水军检测和推手发现等。
"本书内容包含了大数据分析和应用的全过程,从数据的预处理,到数据的存储,以及数据分析结果的可视化,整个实验按数据处理、数据分析和应用场景案例一共分为数据处理、数据分析、实验案例与应用场景三大部分。数据处理即利用Kettle工具进行数据抽取、数据清洗、数据集成、数据变换,向读者介绍数据处理采集的方法与技巧。数据分析即通过
本书主要围绕大数据处理技术Spark展开讲解,旨在引导读者深入了解大数据分析处理的全流程,并剖析每个环节中所使用的关键技术及其原理。全书共八个实战项目。项目一介绍了如何搭建一个稳定且高效的Spark集群环境,探讨了Spark的基本概念、特点及应用场景,同时与Hadoop进行了对比分析。项目二通过实现一个完整的人事管理系
本书以培养工程实践能力为目标,以霍尼韦尔新一代DCS系统PKS为平台,介绍其基础应用技术和工程应用技术。全书分为两篇,第一篇介绍DCS基础知识及PKS硬件组态、控制策略组态和人机界面组态技术等。第二篇介绍DCS系统应用案例,主要包括通用设备和典型化工单元的DCS系统,天然气净化厂的DCS系统。其中,第7、8章重点介绍通
本书介绍了数据全生命周期安全风险、安全技术及典型应用案例,可帮助读者较全面地掌握数据安全理论知识和实践技能。全书共9章:第1章为数据安全概述;第2章介绍数据安全风险,包括数据在采集、存储、共享和使用过程中的风险;第3章至第5章分别详细介绍数据采集、存储、共享与使用安全技术;第6章介绍跨领域数据汇聚面临的安全风险及相应的
本书详细阐述了大数据领域数据采集与预处理的相关理论和技术。全书共8章,内容包括概述、大数据实验环境搭建、网络数据采集、分布式消息系统Kafka、日志采集系统Flume、数据仓库中的数据集成、ETL工具Kettle、使用pandas进行数据清洗。本书包含丰富的实践操作和应用案例,以帮助读者更好地学习和掌握数据采集与预处理
随着信息技术的飞速发展,大数据已经成为驱动全球经济转型的关键因素。本书从大数据的基本概念入手,系统介绍了大数据架构、大数据预处理、大数据分析等核心技术,并深入探讨了这些技术在用户行为分析、金融与投资、消费领域及财税与贸易等领域的实际应用。本书内容不仅涵盖了技术层面的详细介绍,还通过丰富的案例分析展示了大数据在实践中的具