Spark作为新兴的、应用范围广泛的大数据处理开源框架,吸引了大量的大数据分析与挖掘从业人员进行相关内容的学习与开发,其中ML是Spark3.0机器学习框架使用的核心。本书用于Spark3.0ML大数据分析与挖掘入门,配套示例源码、PPT课件、数据集、思维导图、开发环境和作者答疑服务。本书共分13章,从Spark3.0
深度学习是基于多层神经网络的机器学习的一个子集,可以解决自然语言处理和图像分类等领域中特别困难和大规模的问题。《ApacheSpark深度学习实战》解析了技术和分析部分的复杂性,以及在ApacheSpark上实施深度学习解决方案的速度。书中首先介绍了ApacheSpark和深度学习的基础知识,包括为深度学习设置Spar
《数据科学与智能技术概论》涵盖了计算思维与信息处理技术,云计算,大数据,人工智能及应用,虚拟现实、增强现实、混合现实以及游戏开发工具Unity3D等内容。本书每部分内容都经过反复讨论和多次审议,结构紧凑、内容合理且通俗易懂。本书力求让读者理解和掌握全新的数据科学和智能技术知识,具有更广阔的现代化、信息化视野,符合时代发
我们每天都要接触大量资料:短信、邮件、微信、发票、订单、股票价格、天气预报、员工资料、原材料存量、应收账款……这些都是数据。我们每人每天都生活在数据的海洋中,无论是工作还是生活,都离不开数据,离不开手机、电脑,乃至承载大数据的云端。没有它们,我们根本无法正常工作与生活。但所有这些数据在特定的时空下都同样有用吗?你曾否在
CDPSE认证全称为CertifiedDataPrivacySolutionsEngineer,旨在评估技术专业人员通过设计实现隐私的能力,以使组织能够增强隐私技术平台和产品,从而为消费者带来利益,建立信任,以及促进数据隐私。ISACA协会发现在众多企业中,负责隐私政策落地和实施的IT人员缺乏相应的专业知识和培训。大部
戴跃,华东师范大学紫江特聘教授,从教于通信与电子工程学院和体育与健康学院。2002年毕业于马尼托巴大学医学院生理系,师从LarryJordan教授,获神经生理学博士学位;2002在美国华盛顿大学(UniversityofWashington)医学院生理与生物物理学系师从MarcBinder教授,从事博士后研究。2004
本书主要内容包括:MCGS初级应用、MCGS中级应用、MCGS实训应用、MCGS触摸屏应用、附录。
本书以实战案例为先导,协助读者选定合适的大数据预处理工具和方法进行多源异构数据的集成、归约和存储,完成数据探索、数据分析过程和数据分析结果的可视化;针对敏感指标进行数据脱敏以及对大数据治理实施过程中产生的体系、方法、软件、模型等进行归纳整理,形成知识库。
本实训教材共包含9个实训。实训1-7介绍了Linux的安装和配置、Hadoop的安装和配置、HDFS操作方法和基础编程、HBase与Hive的安装和配置、MapReduce基础编程、Spark的安装和配置、Hadoop开发环境的安装和部署。实训8和实训9通过两个综合案例对全书进行了总结。每个实训均设置了实训目的、实训要