| 
					题名:
				 | Python大数据处理库PySpark实战 [ 专著] Python da shu ju chu li ku PySpark shi zhan / 汪明著 , | 
| 
					ISBN:
				 | 978-7-302-57508-5 价格: CNY79.00 | 
| 
					语种:
				 | chi | 
| 
					载体形态:
				 | 310页 26cm | 
| 
					出版发行:
				 | 出版地: 北京 出版社: 清华大学出版社 出版日期: 2021 | 
| 
					内容提要:
				 | 本书分为7章,第1章介绍大数据的基本概念、常用的大数据分析工具;第2章介绍Spark作为大数据处理的特点和算法;第3章介绍Spark实战环境的搭建,涉及Windows和Linux操作系统;第4章介绍如何灵活应用PySpark对数据进行操作;第5章介绍PySpark ETL处理,涉及PySpark读取数据、对数据进行统计分析等数据处理相关内容;第6章介绍PySpark如何利用MLlib库进行分布式机器学习(Titanic幸存者预测);第7章介绍一个PySpark和Kafka结合的实时项目。 | 
| 
					主题词:
				 | 数据处理 | 
| 
					中图分类法:
				 | TP27 版次: 5 | 
| 
					主要责任者:
				 | 汪明 wang ming 著 |