本书是一本全面介绍数据挖掘与机器学习的大数据专业类图书,阅读本书可以提升读者对大数据分析与挖掘的认知以及动手能力。本书共有10章,由浅入深地讲解数据挖掘与机器学习的基本概念与流程、相关算法与实现工具。本书理论与实践相结合,既有技术的深度,也有行业应用的广度,使读者可以全面掌握数据挖掘与机器学习的相关技术。
本教材是计算机类专业的专业必修课教材和教育公共必修课教材。大数据涉及知识面广,应用场景多种多样,需要培养大数据思维,继而才能运用大数据思维展开分析应用技术。这就需要学习者能够宏观构建大数据环境的认知,掌握大数据处理的流程和相关技术,继而在明确应用思路引导下融汇知识,才能进一步结合大数据应用场景展开研究和探索。但是,目前
在数字化浪潮中,大数据技术无处不在,包括互联网、体育、工业、医疗、交通等在内的社会各行各业,都融入了大数据的印迹,大数据对人类的社会生产和生活产生了重大而深远的影响。一早醒来,多篇你感兴趣的推送文章早已占领手机屏幕;走在路上,智能手环实时监测着你的健康信息;想点外卖,小程序优先推荐最符合你口味的商家;骑车出行,导航系统
本书首先,结合新媒体技术专业培养体系,从新媒体行业需求出发开展教材编写,注重培养学生关于大数据及新媒体的理论基础和实践能力。其次,结合传统数据挖掘基础理论及大数据处理技术,以新媒体行业需求为切入点进行教材的编写。最后,结合新媒体技术专业的知识体系总体构架,来设计大量新媒体案例,为新媒体技术专业的教学工作提供实践支撑。
本书主要分七部分,涉及七个水果加工与包装等具体的生产线项目,每个项目均自成体系,对相关生产线的整个设计过程进行详尽的解析,论述其研究方案的确立、工艺流程的制定、全线总体及关键设备设计等。通过本书学习可使读者全面了解自动化生产线项目分析与设计的完整工作流程。
本书围绕着数字安全的基本概念、技术应用和产业现状,主要介绍了数字安全的本质与特性、数字安全能力的定义、相关应用实践案例及数字安全未来的发展方向。本书核心内容是基于数字安全基础理论研究并结合我国数字化实际环境,提供一套可供数字化组织建设和评估数字安全能力的模型框架。本书通过对在数字中国建设过程中数字安全能力供需两端的研究
本书共12章,主要包括大数据的基础知识、价值挖掘、管理和利用、常见构架、精准营销、风险控制,以及商业数据的解读和大数据在互联网、金融行业、销售行业和智慧城市中的应用等内容。读者学后可以融会贯通、举一反三,从零开始快速了解大数据的相关信息。
本书从基本的理论出发,详细讲解了数据标注从“入门”到“应用”的过程,对数据标注的基本概念、与人工智能的关系以及数据标注的基本流程进行讲解,使读者掌握数据标注的应用场景、标注文件的结构、数据的采集,了解提供数据标注的平台,重点学习数据标注的使用方法。读者在完成了语音数据标注、图像数据标注、视频数据标注、文本数据标注等项目
本书主要内容包括Hadoop平台的软件环境部署与使用,核心内容包括Hadoop伪分布式集群、Hadoop单机运行、Hadoop分布式集群、Hadoop高可靠集群、Hive数据仓库的环境部署以及相关的HadoopJAR程序包的编程。全书分为三个部分,共15章:第一部分介绍了Hadoop环境搭建与运维,第二部分介绍了基于H
大数据正在成为人类社会最重要的生产要素和基础资产之一,并对管理决策理论与实践产生深远影响。本书汇编了国家自然科学基金“大数据驱动的管理与决策研究”重大研究计划的部分项目研究成果,就研究体系和重要研究方向上的新知贡献进行阐释与讨论。首先,本书系统性讨论了大数据管理决策研究挑战和应对,并介绍了顶层设计研究体系及凝练的全景式