Python因其拥有强大的第三方软件库,广泛应用在人工智能开发、科学计算和数据分析中。而pandas就是一款基于NumPy的解决Python数据分析任务的软件库。在机器学习和数据科学中,因为很少有数据可以直接使用,所以对数据进行预处理就成为必不可少的工作。《Pandas数据预处理详解》就利用数据处理必需的pandas库
本书的主角是在大数据时代应运而生的数据处理与分析利器Spark。你将通过丰富的示例学习如何使用Spark的结构化数据API,利用SparkSQL进行交互式查询,掌握Spark应用的优化之道,用Spark和DeltaLake等开源工具构建可靠的数据湖,并用MLlib库实现机器学习流水线。随着Spark从2.x版本升级到3
本书主要内容如下:产品经理职业发展和个人职业品牌打造的6要素模型,并针对产品需求洞察、产品规划、产品设计、产品研发跟踪等提供了一系列工具模板供参考使用;产品经理工作的整个过程,将其分解为7大类工具模板,供0基础读者直接上手参考使用;针对产品经理实际的工作场景,梳理总结提炼出各种工具模板;针对每个工具模板给出案例讲解,通
本书是“十二五”职业教育国家规划教材的修订版。本书内容包括:水位控制系统设计,加热反应炉系统设计,液力变扭箱数据采集系统设计,水塔供水的变频控制,点胶机器人生产线现场总线网络的设计等。通过实际工程项目,详细介绍了组态控制技术通用版、嵌入版的运用方法,组态软件与PLC控制系统,组态软件与板卡控制系统,组态软件、下位机PL
本书系统介绍了大数据的内涵、特征、技术及应用。全书共10章,其中第1~8章为技术篇,主要从大数据处理流程出发,围绕大数据体系架构,详细阐述大数据采集与预处理、大数据存储、大数据分析挖掘、大数据可视化等关键技术。第9、10两章为应用篇,对大数据在电信、文娱、教育、医疗等行业的具体应用进行了论述,并通过典型案例与Pytho
智能控制是自动控制发展的高级阶段,是人工智能、控制论、系统论、信息论、仿生学、神经生理学、进化计算和计算机等多种学科的高度汇聚,是一门新兴的边缘交叉学科。本书系统地介绍了智能控制的内涵、理论和主要方法,包括模糊控制、神经网络控制、专家控制系统、遗传算法、基于DNA的软计算、粒子群算法、深度学习等,着重介绍了智能控制方法
复杂数据分析是大数据研究领域的重要课题。纵向数据是复杂数据的一种,往往产生于对个体随着时间的变化而进行的重复观测,该类数据不同于横截面数据和时间序列数据,便于研究个体的时间效应,广泛出现在诸多科研领域。纵向数据非参数半参数分析是统计研究的热点领域。在本书中,作者利用非参数模型、半参数模型(部分线性模型、单指标模型、部分
本书共5章,第1章阐述了本书研究的背景,分析信息物理融合系统研究现状及其技术的发展趋势;第2章讨论信息物理融合系统物理体系结构模型,并分析不同层次体系结构的特点及其典型应用;第3章对信息物理融合系统进行分析;第4章研究了信息物理融合系统的优化问题;第5章主要分析了信息物理融合系统的安全问题。
本书共七章,内容包括:大数据与数据分析、大数据存储、大数据分析工具、大数据与信息安全、基于二部图网络的电子商务推荐算法研究、基于位置的社交网络好友推荐算法研究、基于稀有类分类的信用卡欺诈识别研究。
数据科学概论(第2版)(普通高等学校应用型教材·数据科学)