白话大数据与机器学习
作者: 高扬等26.21万字8人 正在读
已完结现代当代当代文学
目录 (233章)
倒序
正文
001 大数据产业002 .1 大数据产业现状003 .2 对大数据产业的理解004 .3 大数据人才005 .3.1 供需失衡006 .3.2 人才方向007 .3.3 环节和工具008 .3.4 门槛障碍009 .4 小结010 步入数据之门011 .1 什么是数据012 .2 什么是信息013 .3 什么是算法014 .4 统计、概率和数据挖掘015 .5 什么是商业智能016 .6 小结017 排列组合与古典概型018 .1 排列组合的概念019 .1.1 公平的决断——扔硬币020 .1.2 非古典概型021 .2 排列组合的应用示例022 .2.1 双色球彩票023 .2.2 购车摇号024 .2.3 德州扑克025 .3 小结026 统计与分布027 .1 加和值、平均值和标准差028 .1.1 加和值029 .1.2 平均值030 .1.3 标准差031 .2 加权均值032 .2.1 混合物定价033 .2.2 决策权衡034 .3 众数、中位数035 .3.1 众数036 .3.2 中位数037 .4 欧氏距离038 .5 曼哈顿距离039 .6 同比和环比040 .7 抽样041 .8 高斯分布042 .9 泊松分布043 .10 伯努利分布044 .11 小结045 指标046 .1 什么是指标047 .2 指标化运营048 .2.1 指标的选择049 .2.2 指标体系的构建050 .3 小结051 信息论052 .1 信息的定义053 .2 信息量054 .2.1 信息量的计算055 .2.2 信息量的理解056 .3 香农公式057 .4 熵058 .4.1 热力熵059 .4.2 信息熵060 .5 小结061 多维向量空间062 .1 向量和维度063 .1.1 信息冗余064 .1.2 维度065 .2 矩阵和矩阵计算066 .3 数据立方体067 .4 上卷和下钻068 .5 小结069 回归070 .1 线性回归071 .2 拟合072 .3 残差分析073 .4 过拟合074 .5 欠拟合075 .6 曲线拟合转化为线性拟合076 .7 小结077 聚类078 .1 K-Means算法079 .2 有趣模式080 .3 孤立点081 .4 层次聚类082 .5 密度聚类083 .6 聚类评估084 .6.1 聚类趋势085 .6.2 簇数确定086 .6.3 测定聚类质量087 .7 小结088 分类089 .1 朴素贝叶斯090 .1.1 天气的预测091 .1.2 疾病的预测092 .1.3 小结093 .2 决策树归纳094 .2.1 样本收集095 .2.2 信息增益096 .2.3 连续型变量097 .3 随机森林098 .4 隐马尔可夫模型099 .4.1 维特比算法(1)100 .4.1 维特比算法(2)101 .4.1 维特比算法(3)102 .4.2 前向算法103 .5 支持向量机SVM104 .5.1 年龄和好坏105 .5.2 “下刀”不容易106 .5.3 距离有多远107 .5.4 N维度空间中的距离108 .5.5 超平面怎么画109 .5.6 分不开怎么办110 .5.7 示例111 .5.8 小结112 .6 遗传算法113 .6.1 进化过程114 .6.2 算法过程115 .6.3 背包问题(1)116 .6.3 背包问题(2)117 .6.3 背包问题(3)118 .6.4 极大值问题(1)119 .6.4 极大值问题(2)120 .6.4 极大值问题(3)121 .7 小结122 关联分析123 .1 频繁模式和Apriori算法124 .1.1 频繁模式125 .1.2 支持度和置信度126 .1.3 经典的Apriori算法127 .1.4 求出所有频繁模式128 .2 关联分析与相关性分析129 .3 稀有模式和负模式130 .4 小结131 用户画像132 .1 标签133 .2 画像的方法134 .2.1 结构化标签135 .2.2 非结构化标签136 .3 利用用户画像137 .3.1 割裂型用户画像138 .3.2 紧密型用户画像139 .3.3 到底“像不像”140 .4 小结141 推荐算法142 .1 推荐思路143 .1.1 贝叶斯分类144 .1.2 利用搜索记录145 .2 User-based CF146 .3 Item-based CF147 .4 优化问题148 .5 小结149 文本挖掘150 .1 文本挖掘的领域151 .2 文本分类152 .2.1 Rocchio算法153 .2.2 朴素贝叶斯算法154 .2.3 K-近邻算法155 .2.4 支持向量机SVM算法156 .3 小结157 人工神经网络158 .1 人的神经网络159 .1.1 神经网络结构160 .1.2 结构模拟161 .1.3 训练与工作162 .2 FANN库简介163 .3 常见的神经网络164 .4 BP神经网络165 .4.1 结构和原理166 .4.2 训练过程167 .4.3 过程解释168 .4.4 示例169 .5 玻尔兹曼机170 .5.1 退火模型171 .5.2 玻尔兹曼机172 .6 卷积神经网络173 .6.1 卷积174 .6.2 图像识别175 .7 深度学习176 .8 小结177 大数据框架简介178 .1 著名的大数据框架179 .2 Hadoop框架180 .2.1 MapReduce原理181 .2.2 安装Hadoop182 .2.3 经典的WordCount183 .3 Spark框架184 .3.1 安装Spark185 .3.2 使用Scala计算WordCount186 .4 分布式列存储框架187 .5 PrestoDB——神奇的CLI188 .5.1 Presto为什么那么快189 .5.2 安装Presto190 .6 小结191 系统架构和调优192 .1 速度——资源的配置193 .1.1 思路一:逻辑层面的优化194 .1.2 思路二:容器层面的优化195 .1.3 思路三:存储结构层面的优化196 .1.4 思路四:环节层面的优化197 .1.5 资源不足198 .2 稳定——资源的可用199 .2.1 借助云服务200 .2.2 锁分散201 .2.3 排队202 .2.4 谨防“雪崩”203 .3 小结204 数据解读与数据的价值205 .1 运营指标206 .1.1 互联网类型公司常用指标207 .1.2 注意事项208 .2 AB测试209 .2.1 网页测试210 .2.2 方案测试211 .2.3 灰度发布212 .2.4 注意事项213 .3 数据可视化214 .3.1 图表215 .3.2 表格216 .4 多维度——大数据的灵魂217 .4.1 多大算大218 .4.2 大数据网络219 .4.3 去中心化才能活跃220 .4.4 数据会过剩吗221 .5 数据变现的场景222 .5.1 数据价值的衡量的讨论223 .5.2 场景1:征信数据224 .5.3 场景2:宏观数据225 .5.4 场景3:画像数据226 .6 小结227 附录A VMware Workstation的安装228 附录B CentOS虚拟机的安装方法229 附录C Python语言简介230 附录D Scikit-learn库简介231 附录E FANN for Python安装232 附录F 群众眼中的大数据233 参考文献
精选推荐
领导力法则
[中国纺织出版社]
陆禹萌
已完结当代文学
销售心理学
[中国纺织出版社]
兰华
已完结当代文学
销售就是玩转情商
[中国纺织出版社]
王威
已完结当代文学
销售员情商实战训练
成功的销售需要高智商,更需要高情商。一个销售员的销售业绩,往往与他的情商成正比。本书从十个方面详细讲述了有效运用情商,提高销售业绩的方法和技巧。通过实际销售案例和销售心理学理论指导,以及实战点拨和情商拓展训练,帮助读者全方位、快速提高情商。故事性、多版块、碎片化的内容设置,有效降低读者阅读疲劳,提高阅读兴趣,不论是奔波在路上的销售小白,还是带领团队奋勇向前的销售经理,都能从中找到适合自己的销售软技巧。
刘军
已完结当代文学
让未来的你,感谢现在勇敢的自己
[中国纺织出版社]
王介威
已完结当代文学
行为心理学:华生的实用心理学课
[中国纺织出版社]
(美)约翰·华生著.倪彩
已完结当代文学
行为心理学入门(完全图解版)
行为心理学入门(完全图解版)是以作者多来年的心理辅导和咨询数据为素材,对现实生活中的行为心理学应用进行了形象、深入、全面的论述和解读。本书与日本心理学图解书形式相同,浅显易读,有趣又益。
武莉
已完结当代文学
自卑与超越
《自卑与(全译插图典藏版)》是个体心理学研究领域的著作,也是人本主义心理学先驱阿尔弗雷德·阿德勒的很好著作。阿德勒的学说以“自卑感”与“创造性自我”为中心,并强调“社会意识”。全书立足个人心理学的观点,从教育、家庭、婚姻、伦理、社交等多个领域,以大量的实例为论述基础,阐明了人生意义的真谛,帮助人们克服自卑、不断超自己,正确对待职业,正确理解社会与性。本书直接促进了亲子教育、人格培养、婚姻与爱情、职业生涯、家庭建设、人际关系等诸多领域的长足发展,成为人们了解心理学的经典读物。
(奥)阿尔弗雷德·阿德勒
已完结当代文学
自制力:道理我都懂,为什么就是过不好人生
[中国纺织出版社]
邱开杰
已完结当代文学