专栏名称: 刘超的通俗云计算
刘超,网易云解决方案首席架构师,代码级略懂OpenStack、Hadoop、Docker、Lucene、Mesos等开源软件,曾出版《Lucene应用开发揭秘》,个人博客可搜索popsuper1982。
目录
相关文章推荐
美团技术团队  ·  JDK高版本特性总结与ZGC实践 ·  14 小时前  
美团技术团队  ·  NoCode技巧分享:巧用提示词,做一个赛博 ... ·  14 小时前  
高可用架构  ·  AIGC浪潮下的技术盛宴|第12届GIAC开 ... ·  23 小时前  
高可用架构  ·  微信读书后台架构演进之路 ·  2 天前  
架构师之路  ·  全球软件工程技术大会,送福利! ·  2 天前  
51好读  ›  专栏  ›  刘超的通俗云计算

这个一个月没有更新的公众号的作者,他在支撑双十一

刘超的通俗云计算  · 公众号  · 架构  · 2017-11-16 01:16

正文

请到「今天看啥」查看全文



从基础设施层面,也即容器,云主机,云网络,云硬盘层面来说,由于我们的容器是部署在云主机里面的,用的也是云主机的CPU,对于需要高性能的核心模块所在的云主机,尽量不要超售,如果超售就会存在资源竞争的问题,一个核让跑多个虚拟机,而虚拟机上下文切换的代价实在太大,因而会造成性能的大幅度下降,竞争不激烈感觉不出来,竞争一激烈各种steal,相应时间和网络吞吐量就下去了。


除了设置不超售,其实还不够,因为虚拟CPU还是会随机的分配到不同的物理CPU上,这个时候CPU绑定非常的重要。CPU是最最重要的资源,除了业务需要CPU,物理机的中断需要CPU,虚拟机的中断需要CPU,OVS解析流表需要CPU,网络队列和存储队列的处理都要CPU,所以CPU还是最好绑定,各用个的,互不干扰,仔仔细细的当宝贝一样的规划。


云网络也是重中之重,当然网络包的处理能力是严重依赖CPU的。一般我们测试网络的时候,总是在测带宽,其实在电商场景下,横向流量很多,而且小包很多,所以PPS也很重要,PPS上不去,仅仅带宽开的大,流量就是压不上去。所以DPDK和SR-IOV是必须的选择了。


二层的广播包是很讨厌的,非常影响一个集群下的云主机的数量,随着同一租户云主机的数目越来越大,原来使用ARP做发现的方法实在撑不住了,所以就需要采取通过管理平面加速用户平面的做法,实现真正的SDN。


云存储还是最好和云网络的流量完全分离,不然写云存储还会占用网络的队列,本来就不够用。当然应用层最好做成无状态的,少向云盘里面写入数据,都通过远程写入数据库,消息队列,大数据平台。







请到「今天看啥」查看全文