奇迹小说
大型网站运维:从系统管理到SRE

大型网站运维:从系统管理到SRE

作者: 顾贤杰,徐赟,颜中冠 著

21.43万74人 正在读

已完结现代当代当代文学
作品简介

运维发展到现在,与最初相比发生了巨大的变化。10多年的互联网发展,让国内的运维经历了快速的变革,开始和国外接轨,甚至在部分场景有单独的演化。DevOps和SRE作为运维领域的两个演化方向,在最近几年获得了很多关注,也有很多公司进行了相关的实践。与DevOps遍地开花的情况相比,SRE在国内的发展稍显低调。《SRE:Google运维解密》一书对国内外运维领域有很大冲击。本书作者作为一直工作在一线的运维工程师,理所当然地对SRE相关理念进行了实践,本书可以说是对SRE领域阶段性的实践总结。 本书主要对传统运维和SRE进行不同对比,让大家了解运维工程师在实践SRE理念时,关注的点和具体的实践经验。本书的前半部分更多地注重SRE在实际工作中对融入开发团队、监控建设、变更管理、容量管理、异常响应、稳定性治理、事故复盘、用户体验管理等方面的实践和落地。 在对SRE的工作有了一定了解后,本书会针对重要业务保障场景进行实战讲解。本书最后部分对SRE工作中涉及的一些技术进行了概述,以便有兴趣的同学了解SRE相关的技术点。

目录 (178章)
倒序
正文
第1章关于SRE1.1为什么会引入SRE1.2DevOps和SRE对比1.2.1DevOps的发展1.2.2SRE的发展1.3选择SRE1.4SRE的未来第2章SRE在组织内部的定位2.1如何介入组织2.2SRE工作着力点2.3如何衡量工作2.4贡献价值第3章监控建设3.1什么是好的监控服务3.1.1稳定3.1.2准确3.1.3易用3.2监控系统的设计逻辑分析3.2.1数据生产3.2.2数据上报3.2.3数据处理3.2.4数据存储3.2.5数据使用3.3典型监控应用场景3.3.1系统监控3.3.2应用监控3.3.3终端监控3.3.4秒级监控3.3.5监控大盘3.3.6链路监控3.4报警治理3.5容器监控3.6监控智能化第4章变更管理4.1变更管理机制4.1.1传统运维的变更管理4.1.2DevOps的变更管理4.1.3SRE的变更管理4.1.4变更管理实践总结4.2变更控制4.2.1如何建设好的变更控制4.2.2制定符合业务需求的变更控制机制4.3稳定性和迭代速度的权衡4.4变更风险控制4.5总结第5章异常响应5.1异常的定义5.2事故/事件定义5.2.1区分事件和事故5.2.2事故等级制度5.3异常响应流程5.4如何处理值班过程中的异常响应5.5应急沟通机制5.6关于线上问题的ROC第6章服务稳定性治理6.1SLI/SLO/SLA的制定和落地6.1.1SLI的制定和应用6.1.2SLO的计算和应用6.1.3SLA的计算和应用6.2故障预防6.3抑制不可控因素6.4故障演练6.4.1故障梳理6.4.2故障预案6.4.3混浊工程6.5故障自愈6.6业务MTTR6.6.1关于故障修复MTTR6.6.2关于故障解决MTTR6.7灾备建设6.8总结第7章事故复盘7.1关于事故复盘7.1.1事故复盘初级阶段7.1.2事故复盘中级阶段7.1.3事故复盘成熟阶段7.2如何提升事故复盘质量7.2.1事故复盘深度7.2.2事故复盘报告7.3事故分析的逻辑和原则7.4事故责任的划分逻辑7.5事后跟进7.6基于事故/事件的学习第8章容量管理8.1容量管理的目标8.2容量管理的方法和策略8.2.1传统评估方法8.2.2IT资源成本的构成8.2.3容量水位的定义8.2.4容量管理策略8.3容量分析系统建设8.3.1业务负载平台8.3.2巡检管理平台8.3.3监控系统和CMDB系统8.4容量优化方式8.4.1业务容量优化8.4.2资源容量优化8.4.3架构容量优化8.5容量预案8.6总结第9章用户体验9.1外部用户体验和内部用户体验9.1.1外部用户体验9.1.2内部用户体验9.2影响用户体验的要素9.3外部用户体验的改进策略9.4内部用户体验的改进策略9.4.1数据兼容性9.4.2工作流程9.4.3执行效率第10章重要业务活动保障10.1重要业务活动的资源准备10.1.1容量规划10.1.2资源交付规划10.1.3技术优化10.2参与运营活动评估10.3重要业务活动稳定性预案10.4重要业务活动准备阶段的工作重点10.5重要业务活动的变更执行要求10.6重要业务活动的运维人力10.7重要业务活动的收尾第11章运维操作基础11.1网络基础11.1.1ARP11.1.2路由11.24/7层协议11.2.14层协议11.2.27层协议11.3内核参数调优11.3.1TCP网络堆栈内存11.3.2TCP连接数优化11.3.3TCP高并发优化11.3.4网络参数额外调整项11.3.5TCP拥堵算法11.4常见命令行11.4.1查看数据指标11.4.2网络数据包分析11.5配置管理工具11.5.1Ansible11.5.2CFEngine11.5.3Chef11.5.4Puppet11.5.5Salt11.5.6配置管理工具的汇总说明11.5.7云环境下的配置管理工具演化11.6基础设施即代码11.7关于运维操作的未来第12章基础组件运维12.1负载均衡中间件12.1.1算法逻辑的影响12.1.2附加特性的作用12.1.3负载均衡方案12.1.4负载均衡总结12.2消息队列中间件12.2.1消息队列方案的技术决策12.2.2消息队列的技术演化12.3缓存中间件12.3.1缓存中间件的技术关注点12.3.2缓存中间件的选型策略12.3.3缓存中间件的技术演化12.4数据库12.4.1SQL数据库技术的选择12.4.2SQL数据库的配置注意事项12.4.3NoSQL数据库技术的选择12.5组件运维第13章云计算和容器13.1云计算基础13.1.1云计算平台运维13.1.2云计算平台上的产品运维13.2虚拟化13.3容器13.4云存储13.5云网络13.6混合云13.7云原生13.7.1云原生的需求情况13.7.2云原生的发展13.7.3云原生的展望
精选推荐
领导力法则

领导力法则

[中国纺织出版社]

陆禹萌

已完结当代文学

销售心理学

销售心理学

[中国纺织出版社]

兰华

已完结当代文学

销售就是玩转情商

销售就是玩转情商

[中国纺织出版社]

王威

已完结当代文学

销售员情商实战训练

销售员情商实战训练

成功的销售需要高智商,更需要高情商。一个销售员的销售业绩,往往与他的情商成正比。本书从十个方面详细讲述了有效运用情商,提高销售业绩的方法和技巧。通过实际销售案例和销售心理学理论指导,以及实战点拨和情商拓展训练,帮助读者全方位、快速提高情商。故事性、多版块、碎片化的内容设置,有效降低读者阅读疲劳,提高阅读兴趣,不论是奔波在路上的销售小白,还是带领团队奋勇向前的销售经理,都能从中找到适合自己的销售软技巧。

刘军

已完结当代文学

让未来的你,感谢现在勇敢的自己

让未来的你,感谢现在勇敢的自己

[中国纺织出版社]

王介威

已完结当代文学

行为心理学:华生的实用心理学课

行为心理学:华生的实用心理学课

[中国纺织出版社]

(美)约翰·华生著.倪彩

已完结当代文学

行为心理学入门(完全图解版)

行为心理学入门(完全图解版)

行为心理学入门(完全图解版)是以作者多来年的心理辅导和咨询数据为素材,对现实生活中的行为心理学应用进行了形象、深入、全面的论述和解读。本书与日本心理学图解书形式相同,浅显易读,有趣又益。

武莉

已完结当代文学

自卑与超越

自卑与超越

《自卑与(全译插图典藏版)》是个体心理学研究领域的著作,也是人本主义心理学先驱阿尔弗雷德·阿德勒的很好著作。阿德勒的学说以“自卑感”与“创造性自我”为中心,并强调“社会意识”。全书立足个人心理学的观点,从教育、家庭、婚姻、伦理、社交等多个领域,以大量的实例为论述基础,阐明了人生意义的真谛,帮助人们克服自卑、不断超自己,正确对待职业,正确理解社会与性。本书直接促进了亲子教育、人格培养、婚姻与爱情、职业生涯、家庭建设、人际关系等诸多领域的长足发展,成为人们了解心理学的经典读物。

(奥)阿尔弗雷德·阿德勒

已完结当代文学

自制力:道理我都懂,为什么就是过不好人生

自制力:道理我都懂,为什么就是过不好人生

[中国纺织出版社]

邱开杰

已完结当代文学