奇迹小说
数据挖掘(第2版)

数据挖掘(第2版)

作者: 王朝霞 主编

19.76万33人 正在读

已完结现代当代当代文学
作品简介

本书是《数据挖掘》的第2版,系统地介绍了数据挖掘的理论、方法与应用,包括数据特征分析及预处理、经典数据挖掘算法(分类、回归、聚类、关联规则和集成学习等)、大数据新常态下催生的数据分析方法(推荐系统、链接分析与网页排序、互联网信息抽取、日志挖掘与查询分析等)理论与方法。在此基础上,除第1章外,每章均有基于Python语言的实例应用。

目录 (188章)
倒序
正文
第1章绪论1.1.1数据挖掘的概念1.1.2大数据环境下的数据挖掘1.1.3数据挖掘的特性1.1.4数据挖掘的任务和功能1.1.5数据挖掘的对象1.1.6数据挖掘的过程第1章绪论-1.2数据挖掘的起源及发展第1章绪论-1.3数据挖掘的常用工具1.3.1商用工具1.3.2开源工具第1章绪论-1.4数据挖掘的应用第1章绪论-习题第2章数据特征分析及预处理第2章数据特征分析及预处理-2.1数据类型2.1.1属性与度量2.1.2数据集的类型2.2.1描述数据集中趋势的度量2.2.2描述数据离散程度的度量2.2.3数据相关性分析第2章数据特征分析及预处理-2.3数据预处理2.3.1数据清洗2.3.2数据集成2.3.3数据规范化2.3.4数据规约2.3.5数据离散化第2章数据特征分析及预处理-2.4数据的相似性2.4.1数值属性的相似性度量2.4.2标称属性的相似性度量2.4.3组合异种属性的相似性度量2.4.4文本的相似性度量第2章数据特征分析及预处理-习题第3章分类3.1.1分类的基本概念3.1.2分类的过程3.1.3分类器性能的评估方法第3章分类-3.2决策树3.2.1决策树的基本概念3.2.2决策树的用途和特性3.2.3决策树的工作原理3.2.4决策树的构建步骤3.2.5决策树算法原理(1)3.2.5决策树算法原理(2)3.2.5决策树算法原理(3)第3章分类-3.3贝叶斯分类3.3.1贝叶斯定理3.3.2朴素贝叶斯分类3.3.3贝叶斯分析3.3.4贝叶斯决策3.3.5贝叶斯估计第3章分类-3.4支持向量机3.4.1支持向量机的主要思想3.4.2支持向量机的基础理论3.4.3支持向量机的原理第3章分类-3.5实战:Python支持向量机分类第3章分类-习题第4章回归4.1.1回归分析的定义4.1.2回归分析的步骤4.1.3回归分析要注意的问题4.2.1一元回归分析的模型设定4.2.2回归参数的最小二乘估计4.2.3基本假设下OLS估计的统计性质4.2.4误差方差估计4.2.5回归系数检验(t检验)4.2.6拟合优度和模型检验(F检验)4.3.1多元线性回归模型4.3.2多元线性回归模型的假定4.3.3多元线性回归模型的参数估计4.3.4显著性检验4.3.5回归变量的选择与逐步回归4.4.1逻辑回归模型4.4.2logit变换4.4.3估计回归系数4.4.4Logistic分布4.4.5列联表的Logistic回归模型4.5.1多项式回归4.5.2逐步回归4.5.3岭回归4.5.4套索回归4.5.5弹性网络第4章回归-4.6实战:获得最大有效率时的药物用量第4章回归-习题第5章聚类第5章聚类-5.1聚类基本概念第5章聚类-5.2划分聚类方法5.2.1k-平均算法5.2.2k-中心点算法第5章聚类-5.3层次聚类方法5.3.1层次聚类方法的分类5.3.2BIRCH算法第5章聚类-5.4密度聚类方法第5章聚类-5.5实战:Python聚类分析5.5.1Python实现k-平均划分聚类5.5.2Python实现BIRCH层次聚类5.5.3Python实现DBSCAN密度聚类第5章聚类-习题第6章关联规则6.1.1啤酒与尿布的经典案例6.1.2关联规则的概念6.1.3频繁项集的产生第6章关联规则-6.2Apriori算法:通过限制候选产生发现频繁项集6.2.1Apriori算法的频繁项集产生6.2.2Apriori算法描述第6章关联规则-6.3FP-growth算法6.3.1构造FP树6.3.2挖掘FP树6.3.3FP-growth算法第6章关联规则-6.4其他关联规则算法6.4.1约束性关联规则6.4.2增量式关联规则6.4.3多层关联规则6.5.1背景与挖掘目标6.5.2分析方法与过程6.5.3总结第6章关联规则-习题第7章集成学习第7章集成学习-7.1集成学习的概念7.1.1集成学习的构建7.1.2集成学习的优势第7章集成学习-7.2Bagging算法与随机森林算法7.2.1Bagging算法基本思想7.2.2Bagging算法流程7.2.3随机森林算法第7章集成学习-7.3Boosting算法7.3.1Boosting算法流程7.3.2Boosting系列算法第7章集成学习-7.4结合策略7.4.1投票方法7.4.2叠加方法第7章集成学习-7.5多样性7.5.1多样性的概念7.5.2多样性的作用7.5.3多样性的度量7.5.4多样性的构建第7章集成学习-7.6实战案例7.6.1鸢尾花数据集7.6.2集成学习算法7.6.3集成学习在鸢尾花数据集上的应用第7章集成学习-7.7本章小结第7章集成学习-习题第8章推荐系统8.1.1什么是推荐系统8.1.2推荐系统评测指标8.1.3推荐系统中的冷启动第8章推荐系统-8.2基于内容的推荐8.2.1物品表示8.2.2物品相似度8.2.3用户对物品的评分8.2.4基于向量空间模型的推荐第8章推荐系统-8.3协同过滤推荐8.3.1协同过滤的基本概念8.3.2基于用户的协同过滤8.3.3基于物品的协同过滤8.3.4隐语义模型和矩阵因子分解模型(1)8.3.4隐语义模型和矩阵因子分解模型(2)8.3.4隐语义模型和矩阵因子分解模型(3)第8章推荐系统-8.4基于标签的推荐8.4.1数据标注与关键词提取8.4.2标签分类8.4.3基于标签的推荐系统原理第8章推荐系统-8.5实战:搭建一个电影推荐系统8.5.1数据准备与导入8.5.2电影热度值计算8.5.3电影相似度计算8.5.4指定标签下的电影统计第8章推荐系统-习题第9章互联网数据挖掘9.1.1PageRank9.1.2PageRank的快速计算9.1.3面向主题的PageRank9.2.1互联网信息深度挖掘概述9.2.2典型应用模型构建9.2.3挖掘、存储与网络技术分析9.2.4数据信息采集管理9.2.5信息抽取方法与知识发现9.2.6智能决策9.2.7行业案例研究9.3.1互联网日志分析概述9.3.2挖掘分析技术方法9.3.3工具比较9.3.4海量数据挖掘过程展现与分析9.3.5行业应用举例第9章互联网数据挖掘-9.4Python实战案例9.4.1PageRankPython实现9.4.2跨境电商运营潜在市场选择9.4.3天池“双11”日志数据挖掘示例第9章互联网数据挖掘-习题
精选推荐
领导力法则

领导力法则

[中国纺织出版社]

陆禹萌

已完结当代文学

销售心理学

销售心理学

[中国纺织出版社]

兰华

已完结当代文学

销售就是玩转情商

销售就是玩转情商

[中国纺织出版社]

王威

已完结当代文学

销售员情商实战训练

销售员情商实战训练

成功的销售需要高智商,更需要高情商。一个销售员的销售业绩,往往与他的情商成正比。本书从十个方面详细讲述了有效运用情商,提高销售业绩的方法和技巧。通过实际销售案例和销售心理学理论指导,以及实战点拨和情商拓展训练,帮助读者全方位、快速提高情商。故事性、多版块、碎片化的内容设置,有效降低读者阅读疲劳,提高阅读兴趣,不论是奔波在路上的销售小白,还是带领团队奋勇向前的销售经理,都能从中找到适合自己的销售软技巧。

刘军

已完结当代文学

让未来的你,感谢现在勇敢的自己

让未来的你,感谢现在勇敢的自己

[中国纺织出版社]

王介威

已完结当代文学

行为心理学:华生的实用心理学课

行为心理学:华生的实用心理学课

[中国纺织出版社]

(美)约翰·华生著.倪彩

已完结当代文学

行为心理学入门(完全图解版)

行为心理学入门(完全图解版)

行为心理学入门(完全图解版)是以作者多来年的心理辅导和咨询数据为素材,对现实生活中的行为心理学应用进行了形象、深入、全面的论述和解读。本书与日本心理学图解书形式相同,浅显易读,有趣又益。

武莉

已完结当代文学

自卑与超越

自卑与超越

《自卑与(全译插图典藏版)》是个体心理学研究领域的著作,也是人本主义心理学先驱阿尔弗雷德·阿德勒的很好著作。阿德勒的学说以“自卑感”与“创造性自我”为中心,并强调“社会意识”。全书立足个人心理学的观点,从教育、家庭、婚姻、伦理、社交等多个领域,以大量的实例为论述基础,阐明了人生意义的真谛,帮助人们克服自卑、不断超自己,正确对待职业,正确理解社会与性。本书直接促进了亲子教育、人格培养、婚姻与爱情、职业生涯、家庭建设、人际关系等诸多领域的长足发展,成为人们了解心理学的经典读物。

(奥)阿尔弗雷德·阿德勒

已完结当代文学

自制力:道理我都懂,为什么就是过不好人生

自制力:道理我都懂,为什么就是过不好人生

[中国纺织出版社]

邱开杰

已完结当代文学