数据分析原理与实践 ——基于经典算法及Python编程实现
作者: 朝乐门 主编14.36万字24人 正在读
已完结现代当代当代文学
目录 (216章)
倒序
正文
001 数据分析概述002 .1 数据分析的基本类型003 .2 数据分析与机器学习004 .2.1 统计学与机器学习005 .2.3 机器学习中的算法、模型、参数和超参数006 .2.4 数据分析中的基础算法007 .2.5 数据分析中的高级算法008 .3 数据分析的主要流程009 .4 数据分析中的算法选择010 .5 数据分析中常用的Python包011 .5.1 NumPy012 .5.2 pandas013 .5.3 matplotlib014 .5.4 Seaborn015 .5.5 statsmodels016 .5.6 scikit-learn017 .5.7 jieba018 .5.8 OpenCV019 .5.9 TensorFlow和PyTorch020 .6 数据分析的注意事项021 .7 数据分析的现状与趋势022 .8 习题023 .9 主要参考文献及推荐阅读书目024 关联规则分析025 .1 应用场景026 .2 算法原理027 .2.1 Apriori算法的假设028 .2.2 Apriori算法的流程029 .3 核心术语030 .3.1 事务型数据031 .3.2 项集032 .3.3 支持度033 .3.4 置信度034 .3.5 提升度035 .3.6 关联规则036 .4 Python编程实践——购物车分析037 .4.1 业务理解038 .4.2 数据读入039 .4.3 数据理解040 .4.4 数据预处理041 .4.5 生成频繁项集042 .4.6 计算关联度043 .4.7 可视化044 .5 重点与难点解读045 .6 习题046 .7 主要参考文献及推荐阅读书目047 回归分析048 .1 应用场景049 .2 算法原理050 .2.1 基本思路051 .2.2 评价方法052 .3 核心术语053 .3.1 回归分析中常用的统计量054 .3.2 特征矩阵与目标向量055 .3.3 过拟合与欠拟合056 .3.4 高杠杆点、离群点和强影响点057 .4 Python编程实践058 .4.1 线性回归——女性身高与体重数据分析059 .4.2 多元回归——广告收入数据分析060 .4.3 泊松回归——航班数据分析061 .5 重点与难点解读062 .5.1 参数解读——线性回归算法063 .5.2 Z-Score标准化064 .5.3 方差065 .5.4 相关系数066 .5.5 泊松分布067 .5.6 L1和L2正则化068 .5.7 闵氏距离、欧氏距离、曼哈顿距离和切比雪夫距离069 .6 习题070 .7 主要参考文献及推荐阅读书目071 分类分析072 .1 应用场景073 .2 算法原理074 .1.1 KNN075 .1.2 贝叶斯分类076 .1.3 支持向量机077 .1.4 逻辑回归078 .3 核心术语079 .3.1 偏差和方差之间的权衡080 .3.2 学习曲线081 .3.3 混淆矩阵082 .3.4 ROC曲线与AUC面积083 .3.5 贝叶斯理论084 .3.6 核函数及核技巧085 .4 Python编程实践——病例自动诊断分析086 .4.1 使用KNN算法实现087 .4.2 使用贝叶斯分类算法实现088 .4.3 使用SVM算法实现089 .4.4 使用逻辑回归算法实现090 .5 重点与难点解读091 .5.1 参数解读——KNN、贝叶斯分类、SVM和逻辑回归算法092 .5.2 数据标准化处理093 .5.3 混淆矩阵及分类算法的评价指标094 .5.4 最大似然估计095 .5.5 判别模型与生成模型096 .5.6 类别不平衡问题097 .5.7 KD Tree与Ball Tree098 .5.8 GridSearchCV及其原理099 .5.9 GaussianNB、MultinomialNB和BernoulliNB的区别100 .5.10 LabelEncoder及其原理101 .6 习题102 .7 主要参考文献及推荐阅读书目103 聚类分析104 .1 应用场景105 .2 算法原理106 .2.1 k-means算法107 .2.2 聚类效果的评价108 .3 核心术语109 .4 Python编程实践——蛋白质消费特征分析110 .4.1 业务理解111 .4.2 数据读入112 .4.3 数据理解113 .4.4 数据准备114 .4.5 模型训练115 .4.6 模型评价116 .4.7 模型调参117 .4.8 模型预测118 .5 重点与难点解读119 .5.1 参数解读——k-means算法120 .5.2 k-means++方法121 .5.3 elkan方法122 .6 习题123 .7 主要参考文献及推荐阅读书目124 集成学习125 .1 应用场景126 .2 算法原理127 .2.1 随机森林128 .2.2 XGBoost129 .3 核心术语130 .4 Python编程实践——房屋价格预测分析131 .4.1 使用随机森林算法实现(1)132 .4.1 使用随机森林算法实现(2)133 .4.2 使用XGBoost实现134 .5 重点与难点解读135 .5.1 参数解读——随机森林和XGBoost136 .5.2 纯度最大化137 .5.3 数据标准化138 .5.4 泰勒展开式139 .5.5 集成学习中几个注意事项140 .6 习题141 .7 主要参考文献及推荐阅读书目142 自然语言处理143 .1 应用场景144 .2 算法原理145 .2.1 中文分词146 .2.2 词袋模型147 .2.3 N-grams模型148 .2.4 TF-IDF算法149 .2.5 文本规范化150 .2.6 词性标注151 .3 核心术语152 .4 Python编程实践——2021年政府工作报告分析153 .4.1 业务理解154 .4.2 数据读入155 .4.3 分词处理156 .4.4 添加自定义词汇157 .4.5 词性标注158 .4.6 停用词处理159 .4.7 词性分布分析160 .4.8 高频词分析161 .4.9 关键词抽取162 .4.10 绘制词云图163 .5 重点与难点解读164 .5.1 NLTK的词性标注165 .5.2 NLTK的功能模块166 .6 习题167 .7 主要参考文献及推荐阅读书目168 图像处理169 .1 应用场景170 .2 算法原理171 .2.1 建模阶段172 .2.2 检测阶段173 .3 核心术语174 .4 Python编程实践——人脸检测分析175 .4.1 安装并导入OpenCV-python包176 .4.2 读取图像文件177 .4.3 将RGB图像转换为灰度图178 .4.4 人脸检测与矩阵标识179 .4.5 图像显示180 .4.6 图像保存181 .5 重点与难点解读182 .5.1 参数解读——OpenCV183 .5.2 AdaBoost算法184 .5.3 基于OpenCV和CNN的图像处理的对比185 .5.4 Haar特征和LBP特征的对比分析186 .5.5 AdaBoost算法和XGboost算法的主要区别187 .6 习题188 .7 主要参考文献及推荐阅读书目189 深度学习190 .1 应用场景191 .2 算法原理192 .2.1 全连接神经网络及其缺点193 .2.2 全连接神经网络的改进及卷积神经网络的提出194 .2.3 卷积神经网络的基本思路195 .2.4 CNN的整体流程196 .3 核心术语197 .4 Python编程实践——手写数字识别分析198 .4.1 业务理解199 .4.2 数据读入及理解200 .4.3 数据准备201 .4.4 数据理解202 .4.5 定义CNN的学习框架203 .4.6 执行CNN学习及模型训练204 .4.7 模型评价205 .4.8 模型预测206 .5 重点与难点解读207 .5.1 参数解读——CNN算法208 .5.2 机器学习中的性能与可解释性的矛盾209 .5.3 随机梯度下降及学习率210 .5.4 One-hot encoding211 .5.5 端到端的学习212 .5.6 CNN与其他深度学习方法的区别及联系213 .5.7 CNN算法设置超参数的经验法则214 .6 习题215 .7 主要参考文献及推荐阅读书目216 附录 习题参考答案
精选推荐
领导力法则
[中国纺织出版社]
陆禹萌
已完结当代文学
销售心理学
[中国纺织出版社]
兰华
已完结当代文学
销售就是玩转情商
[中国纺织出版社]
王威
已完结当代文学
销售员情商实战训练
成功的销售需要高智商,更需要高情商。一个销售员的销售业绩,往往与他的情商成正比。本书从十个方面详细讲述了有效运用情商,提高销售业绩的方法和技巧。通过实际销售案例和销售心理学理论指导,以及实战点拨和情商拓展训练,帮助读者全方位、快速提高情商。故事性、多版块、碎片化的内容设置,有效降低读者阅读疲劳,提高阅读兴趣,不论是奔波在路上的销售小白,还是带领团队奋勇向前的销售经理,都能从中找到适合自己的销售软技巧。
刘军
已完结当代文学
让未来的你,感谢现在勇敢的自己
[中国纺织出版社]
王介威
已完结当代文学
行为心理学:华生的实用心理学课
[中国纺织出版社]
(美)约翰·华生著.倪彩
已完结当代文学
行为心理学入门(完全图解版)
行为心理学入门(完全图解版)是以作者多来年的心理辅导和咨询数据为素材,对现实生活中的行为心理学应用进行了形象、深入、全面的论述和解读。本书与日本心理学图解书形式相同,浅显易读,有趣又益。
武莉
已完结当代文学
自卑与超越
《自卑与(全译插图典藏版)》是个体心理学研究领域的著作,也是人本主义心理学先驱阿尔弗雷德·阿德勒的很好著作。阿德勒的学说以“自卑感”与“创造性自我”为中心,并强调“社会意识”。全书立足个人心理学的观点,从教育、家庭、婚姻、伦理、社交等多个领域,以大量的实例为论述基础,阐明了人生意义的真谛,帮助人们克服自卑、不断超自己,正确对待职业,正确理解社会与性。本书直接促进了亲子教育、人格培养、婚姻与爱情、职业生涯、家庭建设、人际关系等诸多领域的长足发展,成为人们了解心理学的经典读物。
(奥)阿尔弗雷德·阿德勒
已完结当代文学
自制力:道理我都懂,为什么就是过不好人生
[中国纺织出版社]
邱开杰
已完结当代文学