专栏名称: 细说云计算
关注云平台的网络技术、存储技术,以及少量架构技术。
目录
相关文章推荐
51好读  ›  专栏  ›  细说云计算

Azure Stack设计哲学之物理架构探秘

细说云计算  · 公众号  · 架构  · 2017-08-16 21:45

正文

请到「今天看啥」查看全文


在前面几篇 Azure Stack 系列文章中,我们已经介绍过 Azure Stack 将以一体机 / 集成系统的方式销售。我们先从提供一体机方案的一家供应商入手来了解这款新的混合云产品的物理架构,如下图所示为 Lenovo 即将推出的新一代 Azure Stack 一体机方案中 4-8 个节点的硬件系统图(更多详情可以访问联想官网)。

进一步参见如下示意图,Azure Stack 的一体机中包含的主要硬件有每个机柜一个 BMC 交换机、两台架顶交换机(Top of Rack,ToR)、4-12 个超融合服务器节点(截至 GA 一个集群的最大容量为 12 个节点)以及一台 1U 的生命周期管理节点(Hardware Lifecycle Host, HLH)。

在硬件架构上,随着超融合架构的日益成熟,其实很多私有云平台也会采用类似的架构,甚至可以把所有资源集成在 3 台甚至 2 台服务器上承载,在部署方面也有类似单独拿出一台节点来进行部署包的分发,后续可以直接作为服务节点提供服务。抛开这些通用的设计哲学,我们来重点关注如下几个方面的内容。

生命周期管理节点

在最初的 Azure Stack 硬件系统设计阶段,Azure Stack 的物理拓扑里面没有单独拿出一个节点来作为生命周期节点,但需要占用超融合服务器中的一个物理节点,由于后续的更新、维护都会用到这个节点,所以本质上这个节点是无法完全用于提供计算资源的。在联想给出的集成系统中通过一台 1U 的 System x3550 M5 来实现管理节点,主要提供对硬件资源的管理(包括软件部署和固件、软件更新),主要搭载了如下服务:

• 一台部署虚拟机,提供前期软件包的分发及部署服务

• 联想的管理软件虚机 Lenovo Xclarity,提供硬件监控和管理服务

在一体机的集成方案中, 对于硬件部分的监控是不受 Azure stack 软件来直接监管的,而把这部分能力和服务交付给了各个硬件服务商,因为一方面硬件服务商更熟悉自己的硬件配置及固件管理方式,另外多家硬件厂商在前期已经拥有自己成熟的硬件管理系统。这也是在一体机设计中需要考虑的很重要的一点。关于近期即将发布 Azure Stack 一体机的三家硬件厂商的对比可以参考我们上一篇推出的 Azure Stack 系列文章。下面简单列出 Lenovo XClarity 在 Azure Stack 一体机方案中的主要功能点供参考:

• 自动发现和监控管理节点,超融合节点和交换机

• 固件更新和合规执行

• 基于预定模式的配置管理

• 裸机部署操作系统和 hypervisor

• 通过 SNMP、syslog、Email 进行外部报警及通知

• 与管理节点的安全连接,基于 NIST 800-131A/ FIPS 140-2 加密标准

• 通过 REST API 集成到现有的更高级管理系统,如云自动化和业务流程工具,提供广泛的外部可见性和硬件资源控制

特别地,HLH 节点本身没有提供高可用的方案,也没有必要采用高可用方案,理论上部署结束之后 HLH 节点是可以关闭的,当然为了监控和未来升级的需求建议保持运行状态。

规模及扩展

Tips:在 Azure Stack GA 阶段初期,只支持一个 Region 一个 Scale Unit 的 Azure Stack 集群配置和三种规模集群配置,即 4 个节点,8 个节点和 12 个节点。而且特别说明的一点是在这个阶段不支持集群的扩展功能,比如购买了 4 个节点的集群部署系统,无法通过额外添加四个节点来扩展集群规模。Tips 中提到的规模限制仅限于 Azure Stack GA 阶段,实际上在扩展性方面,Azure Stack 采用了与 Azure 一致的规模扩展架构,本质上每个 Azure Stack 的 region 等价于 Azure reigon,原则上可以无限扩展。本节我们将通过几个概念来描述 Azure Stack 的规模及扩展方式。如下图所示为 Azure Stack 在扩展性方面的架构及几个主要的概念示意图:

Scale Unit

在 Azure Stack 中,一个 Scale Unit 定义为一组计算、存储和网络资源的集合(服务器节点集合),代表一个独立的扩展单元、一个 Azure 的故障域和一组完全同构的硬件设备集合。一个 Azure Stack Region 可以包括一个或多个 Scale Unit。

注意:在 Azure Stack 中一个 Scale Unit 与一个 Windows Server 2016 的 Failover Cluster 一一对应,组成一个完整的故障域。

Region

虽然 Azure Stack 在 GA 阶段只支持一个 region,但并不代表 Azure Stack 在技术架构上不支持多个 region,而更多的是处于稳定性的考虑人为做的限定。region 在 Azure Stack 中的概念与 Azure 中一致,代表同一地理位置的物理资源的集合。







请到「今天看啥」查看全文