专栏名称: IT大咖说
大咖干货,不再错过。 让不在大会现场的程序猿、攻城狮也能体验现场的精彩瞬间。
目录
相关文章推荐
Python面试官  ·  华为员工爆料:在华为,绩效C基本就会被劝退, ... ·  11 小时前  
Python面试官  ·  华为员工爆料:在华为,绩效C基本就会被劝退, ... ·  11 小时前  
终码一生  ·  面试官问:你写代码会复用公共 SQL 么? ·  22 小时前  
半岛网官微  ·  微信、快手公告:这些账号永久封禁! ·  昨天  
半岛网官微  ·  微信、快手公告:这些账号永久封禁! ·  昨天  
程序员鱼皮  ·  刚刚 B站又血崩了?!我来告诉你真正原因 ·  昨天  
程序员鱼皮  ·  刚刚 B站又血崩了?!我来告诉你真正原因 ·  昨天  
51好读  ›  专栏  ›  IT大咖说

新浪微博平台自动化运维演进之路

IT大咖说  · 公众号  · 科技自媒体  · 2017-07-31 20:47

正文

请到「今天看啥」查看全文


微博业务部署结构

我们对于核心业务要求多机房部署,电信和联通机房都部署了完整的链路。


服务保障——服务治理(开发主导)


在这样一个复杂的架构下,运维和开发需要紧密配合。我们内部组织架构调整后,运维团队属于开发团队,配合起来就非常紧密。


内部分为了两个方向。第一个方向的部分是开发主导,运维参与。比如建立完善的SLA体系,我们这个SLA体系做在应用层上,从开发和运维层面在代码上做一些改造,在数据层面上做收集。降级/封禁也是相似的方法,开发在代码上做降级/封禁的入口,具体提供的功能和平台是在运维做的系统里。

服务保障——防御体系(运维主导)


第二个方向就是由运维全程主导,开发参与。例如容量、监控、干预还有运维的部署架构。


架构要做到极简、稳健、美丽;


监控要求具有实时性,报警快、准,覆盖全面;


容量的性能要好,冗余足够,能快速动态扩容,有压测、容量预警;


干预的预案要全,手段多,操作快速,方案细致,要做到干预行之有效。


整体的防御体系要由标准化转化为可视化、自动化,最后升级到智能化。

微博平台运维进化历程


微博平台的运维进化历程大概分成四个阶段。


最早是人工阶段,所有的脚本都要依赖于人工,也就是所谓的脚本时代;


第二阶段是工具系统。当规模有一定的成长之后,做到了工具系统化和运维标准化;


下一个阶段就是综合运维平台。要把很多运维系统做成一个运维平台,就需要让系统平台化、数据API化和运维服务化;


目前我们比较推崇的是利用混合云DCP的思路来做一些系统。


百台规模运维标准化

百台规模——一切皆需求


这个阶段主要的工作就是日常的需求对接、完善监控警报、代码的发布和回滚、还有服务的扩缩容以及之前的一些配管工具。


这些工作都要做到快速迭代、快速上线、快速响应。







请到「今天看啥」查看全文


推荐文章