正文
感谢当时的领导能接纳了“半路出家”的我。当时服务器已经有一千多台了,我就觉得来对地方了,至少是规模比较大,运维也有了几十人的队伍,一看都是很年轻有朝气的。
携程从07年做到现在基本上十年的时间,我就是一直做安全运维,后面就跟大家分享一下这个运维经历一些什么。我自己的一些体会。今天的携程是目前全球市值第二的旅行服务公司 OTA,也是中国最大的旅行服务公司。员工有三万多人,有17个分支机构,全世界各地。
2、传统运维下的携程
我到携程开始做的就是传统运维。什么是传统运维,什么是互联网运维,我这里只谈一下当时的携程,这两个图是2010年和2011年我们当时在技术运营部做的项目时间周期表。
从浅色到深色,小于三个月最浅,然后是三到六个月,六到12个月。在2010年少于三个月项目只有12%,其他都是三个月以上,甚至是大于一年有26%,这是做的34个项目。
2010年少于三个月的项目已经没有了,做一个项目是三到六个月,六到12个月,大于一年的,6到12个月大概就是接近12个月。从项目周期来看当时的情况是这样的。
安全做的一些项目,比如说 DMZ 项目,数据库的安全项目,分公司安全项目,这些项目周期都是大于一年的。WAF 项目,是6到12个月,项目内容也比较清晰,就是评估 WAF 测试一下,然后采购部署,非常传统的一个流程,不涉及自己二次开发。当时看的最多的 Gartner 的报告。
刚才提到的采购部署项目,这些设备上线以后,经常会涉及到各个系统比如说某品牌的防火墙,需要写架构、配置、运维、排障四个文档,需要自己整理厂商文档去写,整个工作节奏和变化都比较慢。
之前听到某个演讲里谈到当前的很多系统,当文档写出来这个系统就会面临失效。刚去携程的时候,有四台防火墙,一个 VPN 还有一个日志记录的设备。
3、我们的团队
图片是我团队的照片,09年,11年,12年。这里面可能有熟悉的身影,到时候会跟大家说一下这些人后来都在哪做什么。当时比较难的事情,有数据库的安全,还有建设 DMZ 也比较难。
-
遇到最大的问题就是对未来的预估不准
当时我们采购设备,领导要求评估买个设备能用三四年,不能今年买明年就要换。就按携程的业务增长量来估,当时增长是每年40%增长,那我们认为防火墙指标也是40%或50%增长。
然后按这个原则采购的防火墙上线,只过了一年多各项指标就快超过标称了,这是在公司快速的发展过程中会遇到的。我们需要赶紧再换一个设备,很多时间就耗费这上面了。
-
还有难点一个就是推进应用安全
我们开始是从网络安全做起来的,后来推应用安全,开发流程里加相关的工序做代码检验,运维和开发是两个不同的部门,推进的也是比较难的。
通过克服各种困难,团队和自身都有了很大成长和进步。大约在2012年底之前都是在传统的阶段,团队的人员也从我刚刚去2007年的三个人,发展到2012年11位。