奇迹小说
数据采集与预处理技术应用

数据采集与预处理技术应用

作者: 安俊秀等 编著

9.64万66人 正在读

已完结现代当代当代文学
目录 (148章)
倒序
正文
001 数据采集与预处理概述002 数据采集与预处理概述-1.1 大数据简介003 .1.1 数据的概念、类型、组织形式004 .1.2 大数据的概念、特点与作用005 .1.3 大数据的技术应用006 数据采集与预处理概述-1.2 数据分析简介007 .2.1 数据分析的基本流程008 .2.2 数据分析的方法与技术009 数据采集与预处理概述-1.3 数据采集简介010 .3.1 数据采集的三大方式及工具011 .3.2 数据采集的应用场景012 数据采集与预处理概述-1.4 数据预处理简介013 .4.1 数据预处理的目的与意义014 .4.2 数据预处理的流程015 .4.3 数据预处理的工具介绍016 数据采集与预处理概述-习题017 大数据开发环境的搭建018 大数据开发环境的搭建-2.1 安装Python与JDK019 .1.1 Java和Python概述020 .1.2 Python的安装与配置021 .1.3 JDK的安装与配置022 .1.4 Python与Java的IDE介绍023 大数据开发环境的搭建-2.2 MySQL数据库的安装与配置024 .2.1 SQL概述025 .2.2 安装MySQL数据库026 .2.3 MySQL数据库的基本使用027 大数据开发环境的搭建-2.3 Hadoop的安装与配置028 .3.1 单节点环境029 .3.2 伪分布式环境030 .3.3 节点间免密通信031 .3.4 Hadoop的启动和测试032 大数据开发环境的搭建-2.4 在Hadoop集群上运行WordCount033 .4.1 运行Java版本WordCount实例034 .4.2 运行Python版本WordCount实例035 大数据开发环境的搭建-习题036 使用Flume采集系统日志数据037 使用Flume采集系统日志数据-3.1 Flume概述038 使用Flume采集系统日志数据-3.2 Flume的安装运行039 使用Flume采集系统日志数据-3.3 Flume的核心组件040 .3.1 Agent041 .3.2 Source042 .3.3 Sink043 .3.4 Channel044 .3.5 Event045 使用Flume采集系统日志数据-3.4 Flume拦截器与选择器046 .4.1 Flume内置拦截器047 .4.2 自定义拦截器048 使用Flume采集系统日志数据-3.5 Flume负载均衡与故障转移049 使用Flume采集系统日志数据-3.6 实践案例:使用Flume采集数据上传到HDFS050 使用Flume采集系统日志数据-习题051 使用Kafka采集系统日志数据052 使用Kafka采集系统日志数据-4.1 Kafka概述053 .1.1 消息队列054 .1.2 Kafka的特点055 .1.3 Kafka与Flume的区别056 使用Kafka采集系统日志数据-4.2 Kafka的安装部署057 .2.1 集群规划058 .2.2 安装Zookeeper059 .2.3 安装Kafka060 使用Kafka采集系统日志数据-4.3 Kafka的基本架构061 .3.1 Kafka的消息系统062 .3.2 Producer与Consumer063 .3.3 主题与分区064 .3.4 Broker与Kafka集群065 .3.5 Zookeeper在Kafka中的作用066 使用Kafka采集系统日志数据-4.4 实践案例:使用Kafka采集本地日志数据067 使用Kafka采集系统日志数据-4.5 实践案例:Kafka与Flume结合采集日志数据068 使用Kafka采集系统日志数据-习题069 其他常用的系统日志数据采集工具070 其他常用的系统日志数据采集工具-5.1 Scribe071 .1.1 Scribe简介072 .1.2 Scribe的配置文件073 .1.3 实践案例:使用Scribe采集系统日志数据074 其他常用的系统日志数据采集工具-5.2 Chukwa075 .2.1 Chukwa简介076 .2.2 Chukwa架构与数据采集077 .2.3 实践案例:使用Chukwa采集系统日志数据078 其他常用的系统日志数据采集工具-5.3 Splunk079 .3.1 Splunk概述080 .3.2 Splunk的安装与基本使用081 .3.3 实践案例:使用Splunk采集系统日志数据082 其他常用的系统日志数据采集工具-5.4 日志易083 .4.1 日志易的特点084 .4.2 注册日志易账号085 .4.3 实践案例:使用日志易采集搜索本地日志文件086 其他常用的系统日志数据采集工具-5.5 Logstash087 .5.1 Logstash简介088 .5.2 Logstash的工作原理089 .5.3 Logstash安装与部署090 .5.4 实践案例:使用Logstash采集并处理系统日志数据091 .5.5 实践案例:使用Logstash将数据导入Elasticsearch092 其他常用的系统日志数据采集工具-5.6 Fluentd093 .6.1 Fluentd简介094 .6.2 Fluentd的安装与配置095 .6.3 Fluentd的基本命令096 .6.4 实践案例:使用Fluentd采集系统日志数据097 其他常用的系统日志数据采集工具-习题098 使用网络爬虫采集Web数据099 使用网络爬虫采集Web数据-6.1 网络爬虫概述100 .1.1 网络爬虫的基本原理101 .1.2 网络爬虫的类型102 使用网络爬虫采集Web数据-6.2 网络爬虫基础103 .2.1 网络爬虫的基本爬取方式104 .2.2 使用正则表达式进行字符串匹配105 .2.3 使用解析库解析网页106 .2.4 Ajax数据的爬取107 .2.5 使用selenium抓取动态渲染页面108 使用网络爬虫采集Web数据-6.3 常见的网络爬虫框架109 .3.1 Scrapy框架110 .3.2 WebMagic框架111 .3.3 Crawler4j框架112 .3.4 WebCollector框架113 使用网络爬虫采集Web数据-6.4 实践案例:使用Scrapy爬取电商网站数据114 使用网络爬虫采集Web数据-习题115 Python数据预处理库的使用116 Python数据预处理库的使用-7.1 Python与数据分析117 .1.1 Python的特点118 .1.2 为何使用Python进行数据分析119 Python数据预处理库的使用-7.2 NumPy:数组与向量计算120 Python数据预处理库的使用-7.3 Pandas:数据结构化操作121 Python数据预处理库的使用-7.4 SciPy:科学化计算122 Python数据预处理库的使用-7.5 Matplotlib:数据可视化123 Python数据预处理库的使用-7.6 实践案例:使用Python预处理旅游路线数据124 Python数据预处理库的使用-习题125 使用ETL工具Kettle进行数据预处理126 使用ETL工具Kettle进行数据预处理-8.1 Kettle概述127 使用ETL工具Kettle进行数据预处理-8.2 Kettle的安装与配置128 使用ETL工具Kettle进行数据预处理-8.3 Kettle的基本使用129 .3.1 Kettle的使用界面130 .3.2 新建转换与任务131 .3.3 数据获取132 .3.4 数据清洗与转换133 .3.5 数据迁移和装载134 使用ETL工具Kettle进行数据预处理-8.4 实践案例:使用Kettle处理某电商网站数据135 使用ETL工具Kettle进行数据预处理-习题136 其他常用的数据预处理工具137 其他常用的数据预处理工具-9.1 Pig138 .1.1 Pig概述139 .1.2 Pig的安装和配置140 .1.3 Pig Latin的基本概念141 .1.4 使用Pig进行数据预处理142 其他常用的数据预处理工具-9.2 OpenRefine143 .2.1 OpenRefine概述144 .2.2 OpenRefine创建项目145 .2.3 OpenRefine的基本使用146 其他常用的数据预处理工具-9.3 实践案例:使用Pig和OpenRefine预处理二手房数据147 其他常用的数据预处理工具-习题148 参考文献
精选推荐
销售心理学

销售心理学

[中国纺织出版社]

兰华

已完结当代文学

销售就是玩转情商

销售就是玩转情商

[中国纺织出版社]

王威

已完结当代文学

销售员情商实战训练

销售员情商实战训练

成功的销售需要高智商,更需要高情商。一个销售员的销售业绩,往往与他的情商成正比。本书从十个方面详细讲述了有效运用情商,提高销售业绩的方法和技巧。通过实际销售案例和销售心理学理论指导,以及实战点拨和情商拓展训练,帮助读者全方位、快速提高情商。故事性、多版块、碎片化的内容设置,有效降低读者阅读疲劳,提高阅读兴趣,不论是奔波在路上的销售小白,还是带领团队奋勇向前的销售经理,都能从中找到适合自己的销售软技巧。

刘军

已完结当代文学

让未来的你,感谢现在勇敢的自己

让未来的你,感谢现在勇敢的自己

[中国纺织出版社]

王介威

已完结当代文学

行为心理学入门(完全图解版)

行为心理学入门(完全图解版)

行为心理学入门(完全图解版)是以作者多来年的心理辅导和咨询数据为素材,对现实生活中的行为心理学应用进行了形象、深入、全面的论述和解读。本书与日本心理学图解书形式相同,浅显易读,有趣又益。

武莉

已完结当代文学

自制力:道理我都懂,为什么就是过不好人生

自制力:道理我都懂,为什么就是过不好人生

[中国纺织出版社]

邱开杰

已完结当代文学

能力与格局

能力与格局

[中国纺织出版社]

龙泽

已完结当代文学

羊皮卷

羊皮卷

[中国纺织出版社]

赵文武

已完结当代文学

组织领导力:组织高效运营与领导策略

组织领导力:组织高效运营与领导策略

[中国纺织出版社]

谢良鸿

已完结当代文学