Python机器学习技术:模型关系管理
作者: 丁亚军15.19万字30人 正在读
已完结现代当代当代文学
目录 (188章)
倒序
正文
第1部分 机器学习概念与特征工程第1章 机器学习的基础概念1.1 数据源1.1.1 数值:单元格1.1.2 图像:像素点1.1.3 文本:词向量1.2 模型的基本形式:回归1.2.1 文氏图:方差分解1.2.2 分布图:分布与随机1.2.3 角色:监督与非监督1.2.4 模型应用:归因与预测1.3 模型与算法1.3.1 模型进化:从1.0到4.01.3.2 算法驱动:参数与超参数1.4 SMD学习技术1.4.1 统计学习:线性回归1.4.2 机器学习:支持向量机1.4.3 深度学习:神经网络1.5 机器学习误差源1.5.1 误差源1.5.2 偏差与方差窘境1.6 模型拟合诊断1.6.1 模型拟合1.6.2 模型的评估指标1.7 数据分区技术1.7.1 数据分区:训练与评估1.7.2 交叉验证:分区的升级1.8 集成学习方法1.8.1 强分类器:特征工程+模型1.8.2 弱分类器:模型+模型1.8.3 混合专家:神经网络1.9 运算加速度1.9.1 大数据挑战1.9.2 数据的高效运算第2章 特征工程技术2.1 数据变换2.1.1 特征规范化:对中处理2.1.2 样本规范化:距离相似度2.2 数据编码2.2.2 数据分箱:业务标签2.3 缺失值填补2.3.1 中位数填补:稳健2.3.2 最近邻填补:高维2.3.3 随机森林填补:“贤内助”2.4 异常值诊断2.4.1 单变量异常值:描述2.4.2 多变量异常值:监督2.4.3 多变量异常值:非监督2.4.4 非结构式异常值:自编码器2.5 共线性的危害2.5.1 双变量共线:新特征2.5.2 多变量共线:特征分解2.5.3 特征组合技术2.6 特征筛选技术2.6.1 经验:“站在谁的肩膀上”2.6.2 相关:相关系数2.6.3 回归:特征筛选2.6.4 降维:线性与非线性2.6.5 工具:“指南针”2.7 聚类技术:市场细分第2部分 机器学习技术第3章 机器学习准备3.1 机器学习的数学基础3.1.1 微积分基础3.1.2 向量运算:相关分析3.1.3 矩阵运算:回归模型3.1.4 张量运算:神经网络3.2 机器学习理解3.2.1 连续型因变量:线性回归3.2.2 分类型因变量:逻辑回归3.3 机器学习算法3.3.1 最小二乘法:准确度3.3.2 最大似然估计法:测量3.3.3 随机梯度下降法:大数据第4章 统计学:回归“进化”4.1 大数据与回归模型4.1.1 统计学的烦恼4.1.2 线性回归的进化4.2 正则化约束4.2.1 正则化技术的原理4.2.2 LASSO回归与岭回归4.2.3 弹性网的特征4.3 案例:随机梯度下降回归与归因解释第5章 神经网络模型:预测5.1 感知器模型5.1.1 与或四门通往何方5.1.2 感知器=线性回归5.1.3 激活函数为何是非线性的5.1.4 感知器=CPU5.2 神经网络模型5.2.1 感知器集成:网络结构5.2.2 前向传播技术:联立方程5.2.3 反向传播技术:自动微分5.2.4 网络结构设计:隐含层5.2.5 神经网络专题1:特征工程5.2.6 神经网络专题2:维度灾难5.3 案例:数据分析流与神经网络第6章 决策树:归因与可视化6.1 决策树模型原理6.1.1 熵与相关性6.1.2 决策树概览6.1.3 特征分叉运算6.1.4 特征选择运算6.1.5 决策树与剪枝6.2 树模型的特征6.3 两类归因:决策树与逻辑回归6.3.1 树形图解释6.3.2 S形图解释第7章 支持向量机:高维数据7.1.1 超平面7.1.2 点距超平面7.2.1 硬间隔:严格边界7.2.2 软间隔:松弛边界7.3.1 理解核技巧7.3.2 核函数及其应用7.3.3 支持向量机:经验汇总7.4 支持向量机模型运算7.5 案例:图像识别与预测分类第8章 关联分析8.1 数据源格式8.1.1 标准数据格式8.1.2 概念的层级性8.2 关联规则与度量指标8.2.1 关联规则度量8.2.2 频繁项集8.2.3 Apriori算法8.2.4 强关联规则8.3 案例:商品关联过滤与营销推荐第3部分 模型关系管理第9章 集成学习方法:弱集成9.1 集成学习:弱分类器9.1.1 自抽样法9.1.2 套袋法与随机森林9.1.3 套袋法的运算9.1.4 随机森林与特征工程9.1.5 提升法与提升树9.1.6 提升法的运算9.1.7 XGBoost的原理与应用9.2 集成学习:聚合策略9.2.1 简单投票法9.2.2 堆叠法9.2.3 理论判断法9.2.4 元分析法9.2.5 结构方程模型第10章 多阶段模型管理:强集成10.1 特征工程与模型集成10.1.1 机器学习与模型关系管理10.1.2 “主成分+”与“聚类+”模式10.2 多阶段模型管理与案例解析10.2.1 线性与非线性:决策树+回归10.2.2 异常诊断一:异常评分+主次归因+规则归因10.2.3 异常诊断二:异常规则+复杂归因10.2.4 经验法:贝叶斯规则+回归10.2.5 不平衡修正:平衡性抽样+模型集成10.2.6 数据源:问卷+数据库第11章 深度学习模型:混合专家11.1 全连接神经网络:数值分析11.1.1 全连接神经网络规则11.1.2 梯度爆炸与梯度消失11.1.3 全连接层:正则化11.1.4 构建全连接神经网络11.2 卷积神经网络:图像识别11.2.1 卷积层:核运算11.2.2 池化层:标准化11.2.3 全连接层:信息传递11.2.4 构建卷积神经网络11.3 循环神经网络:自然语言处理11.3.1 概率语言模型11.3.2 循环神经网络11.3.3 长短期记忆网络11.3.4 构建循环神经网络第12章 自动化机器学习12.1 自动化与集成学习12.1.1 自动化集成12.1.2 TPOT配置12.1.3 案例:模型复杂度评估12.2 数据分析流水线12.2.1 数据分析流12.2.2 模型失效周期12.2.3 知识发现与模型12.2.4 流水线技术准备12.2.5 创建复杂流水线12.3 超参数与高效运行12.3.1 热启动12.3.2 随机搜索12.3.3 贝叶斯搜索12.3.4 增量学习总结与展望
精选推荐
领导力法则
[中国纺织出版社]
陆禹萌
已完结当代文学
销售心理学
[中国纺织出版社]
兰华
已完结当代文学
销售就是玩转情商
[中国纺织出版社]
王威
已完结当代文学
销售员情商实战训练
成功的销售需要高智商,更需要高情商。一个销售员的销售业绩,往往与他的情商成正比。本书从十个方面详细讲述了有效运用情商,提高销售业绩的方法和技巧。通过实际销售案例和销售心理学理论指导,以及实战点拨和情商拓展训练,帮助读者全方位、快速提高情商。故事性、多版块、碎片化的内容设置,有效降低读者阅读疲劳,提高阅读兴趣,不论是奔波在路上的销售小白,还是带领团队奋勇向前的销售经理,都能从中找到适合自己的销售软技巧。
刘军
已完结当代文学
让未来的你,感谢现在勇敢的自己
[中国纺织出版社]
王介威
已完结当代文学
行为心理学:华生的实用心理学课
[中国纺织出版社]
(美)约翰·华生著.倪彩
已完结当代文学
行为心理学入门(完全图解版)
行为心理学入门(完全图解版)是以作者多来年的心理辅导和咨询数据为素材,对现实生活中的行为心理学应用进行了形象、深入、全面的论述和解读。本书与日本心理学图解书形式相同,浅显易读,有趣又益。
武莉
已完结当代文学
自卑与超越
《自卑与(全译插图典藏版)》是个体心理学研究领域的著作,也是人本主义心理学先驱阿尔弗雷德·阿德勒的很好著作。阿德勒的学说以“自卑感”与“创造性自我”为中心,并强调“社会意识”。全书立足个人心理学的观点,从教育、家庭、婚姻、伦理、社交等多个领域,以大量的实例为论述基础,阐明了人生意义的真谛,帮助人们克服自卑、不断超自己,正确对待职业,正确理解社会与性。本书直接促进了亲子教育、人格培养、婚姻与爱情、职业生涯、家庭建设、人际关系等诸多领域的长足发展,成为人们了解心理学的经典读物。
(奥)阿尔弗雷德·阿德勒
已完结当代文学
自制力:道理我都懂,为什么就是过不好人生
[中国纺织出版社]
邱开杰
已完结当代文学