本书以基础、模型及应用为主线,介绍数据分析的基础知识、经典模型以及相关应用.内容包括非负矩阵分解、张量分解、深度学习、宽度学习的经典模型与学习方法,以及作者对相关模型的扩展及其在多视角聚类、地理传感数据预测、信息级联预测及蛋白质二级结构预测中的应用研究.本书内容全面,深入浅出,既详细介绍了基本概念、思想和算法,也提供了
本书将以太网交换机电路的设计与实现作为完整案例,分别介绍了介质访问控制(MAC)控制器、数据帧合路电路、MAC帧处理电路、基于哈希散列的查表电路、简易队列管理器、基于链表的队列管理器、变长分组的分割与重组电路等通信和网络中常用的电路,并以此为基础,采用循序渐进、由简单到复杂的方式,给出了两个版本的完整以太网交换机电路。
本书通过实践操作介绍大数据爬取、清洗与可视化的具体实施方案,共10章,包括大数据爬取、清洗与可视化概述,爬虫概述,Requests库,BeautifulSoup爬虫,自动化测试工具Selenium,中型爬虫框架Scrapy,数据存储,数据清洗,Matplotlib可视化,Pyecharts可视化。书中的案例均经过实践验
数据挖掘技术在文本等数据上的应用研究
作者均为一线资深架构师和技术顾问,具有丰富的云数据管理实践经验。因此,本书具有很好的实践指导意义。从数据保护解决方案出发,结合云时代数据管理的特点,基于来自VeeamSoftware的工具和软件详细阐述了在云数据管理中各种新技术的实现方法和应用方式。针对云数据管理所面临的挑战和问题,通过一些工具的组合使用给出了相应的实
过程控制系统及工程(孙洪程)(第四版)
本书从检测系统设计与应用工程师需要掌握的核心技能出发,系统介绍了检测技术基础知识及基本概念,包括检测系统组成、检测系统特性分析、静动态特性测试、误差分析、经典传感器技术、传感器信号调理与采集等,并对近年来广泛应用的数字脉冲传感器、半导体集成传感器、辐射测温技术、激光测距技术、机器视觉等现代检测系统做了较为深入的阐述。为
我国提出新基建概念,要加快大数据中心、人工智能等新型基础设施的建设进度,这无疑需要更多的大数据人才。PySpark可以对大数据进行分布式处理,降低大数据学习门槛,本书正是一本PySpark入门教材,适合有一定Python基础的读者学习使用。本书分为7章,第1章介绍大数据的基本概念、常用的大数据分析工具;第2章介绍Spa
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概
MATLAB及其模块化仿真工具Simulink是当今世界上*的数值计算和系统仿真软件之一。本书充分考虑自动化专业课程设置的情况,以MATLABR2015b为主要工具,较为全面地介绍了自动控制系统的建模、分析、仿真与设计的基本原理和方法。全书共分8章,内容包括:自动控制系统仿真概述、控制系统计算机数字仿真基础、MATLA