您的位置 首页 > 数码极客

【com1】ZStack深入评估:部署、体系结构和网络以及与OpenStack的比较

[编辑] CSDN前面介绍的ZStack是使用OpenStack部署云平台的复杂性的另一个解决方案。本文档是ZStack的深度评估报告。从部署、体系结构和网络三个级别介绍作者的评估经验,与OpenStack进行简单比较后,文章也思考了ZStack的改进方向。以下是全文内容。

"这是最好的时代,也是最坏的时代."这句名言也是对当前云计算大环境的真实描述。云计算不仅可以充分利用现有资源,还可以释放资源(计算、存储、网络),使资源能够像自来水一样快速准确地使用,从而形成新的资源计费(业务)模式。但是如何高效快速地管理资源是摆在管理者和技术人员面前的难题。目前,整个云生态系统中最成功的例子是Amazon AWS和开源OpenStack。AWS可以说是云计算的援助。它的成功无疑引领了云计算的时代。但是它是封闭的,我们不能窥探其内部的实现逻辑。在开源OpenStack出现之前,云计算可以说是“飞向普通人的家”。OpenStack开始繁荣整个云市场,各种云如雨后春笋般涌现。

随着对OpenStack的深入普及,它在某些方面的弊端被管理层和技术人员不断提及。随着OpenStack服务组件的整体增加、新功能的扩展、供应商之间的角逐、OpenStack的方向(符合自己的利益),中小企业由于技术能力不足,无法取笑越来越大的OpenStack,期待的易用性、稳定性似乎逐渐变成了希望。偶然发现了一个名为ZStack的云平台,它的主页上突然出现了“we name our project as z stack because we hope it ' s the last effort to make a simple,reliable

说到

部署篇

部署,我在吐OpenStack。对于第一个体验者来说,从OpenStack庞大的分发手册来看,预计部分体验者会害怕。被强烈的求知欲驱使继续部署的人,一步一步地“复制”、“粘贴”手册上的命令(有些可能还不懂),硬着头皮继续前进。最后,充满期待的DASH界面被“error”弄得满目疮痍。毕竟很少有人能正常进入web界面。现在也出现了很多第三方自动化部署工具,如RDO、fuel等,但涉及到复杂的配置(主要是OpenStack的很多知识集成),对早期经验者也不熟悉。

ZStack的部署指南看起来非常简洁明了。“Installation”部分只有三页:“Quick Installation”、“Maunual Installation”和“Multi-node Installation”,对于初学者来说。ZStack作者提供了一键安装脚本,更加细致地定制了适合国内“特殊”网络环境的打包方案。

现在开始一键安装和部署旅行。

Wget -O in bash in -a -R -f“人品”差一点就可能出现以下景象

解决方法:将www.w3.org解析为本机“欺诈”即可。

ECHO ' 127 . 0 . 0 . 1 www . w3 . org '/ETC/HOSTS再次继续我们的道路。(提示目录已存在。删除就可以了。)

大约10-20分钟(提高网络质量)完成部署,按照说明打开浏览器(通过身份认证),将显示管理界面。

总体来说,ZStack的整个部署过程非常熟悉,没有复杂的配置(部分自定义可以查看IP指定等脚本的帮助)。

架构篇

部署的简便性只是ZStack的外部特征。ZStack真正的核心价值仍然在于其结构。(以下内容只是本人的个人观点,如果有赞成的话,我很荣幸。~

_^)

全异步架构

传统的云管理平台在扩展方面有其特有的软肋--slow task。在并发不高的情况下,体现不是很明显,但批量的任务创建时(如创建虚拟机),就会出现任务失败或超时。想必许多OpenStack使用者都会有这样的经历,满心期待能够顺利创建虚拟机,却被一行行显眼的红色字体浇灭了热忱的心。其中的原因如下:

  1. OpenStack里任务(或者说消息)传递的路径很长,比如以创建VM为例 ,一个任务要经历 " service --> scheduler --> image service --> storage service --> network service --> hypervisor " 这条传递路径,每一环节都要一定的耗时,大批量任务执行时,延迟效应就更明显,最后就出现任务失败。
  2. 任务传递并非全异步。某些环节同步传递就会出现等待,进一步增加了任务时间。(关于同步与异步的区别,详见 )。下图展示一个实例:

ZStack在这方面做了改进,把服务之间的消息调用(或者API请求),以及服务内部代码方法之间的调用全部实现异步架构,如下图所示:

全异步架构带来了效率上的提升,本人没有系统地测试(与OpenStack对比),但仅从感官上讲,在ZStack上创建一台虚拟机,秒秒钟dash就显示创建成功了,那种享受,不言而喻。

无状态服务

在讲无状态服务之前,我先讲下有状态服务下的请求机制。 这里的状态是指在有多个管理节点时,每个管理节点都会有多个相同的微服务。那么微服务之间就要对自己管理资源的数量进行分配协商,向微服务发送请求的请求者也必须知道是哪个微服务在管理哪个资源。话多必失,还是上图看看(我大学老师说过,一图胜千言):

而在无状态服务下,这些事情交给hash ring处理,微服务之间无需知道自己或别人管了哪些资源。在请求里只需含一个唯一的UUID,不再需要指出把请求提交给哪个微服务,集群内部会把请求“路由”到指定的微服务 。如下图所示:

ZStack里,管理节点之间形成一个强一致的hash ring,每个节点都有一份包含所有节点信息(如节点UUID)的副本。当新节点加入或者节点退出时,都会产生广播消息通知到其他节点,整个集群会重新动态平衡,形成新的强一致的hash ring 。

ZStack自身强一致性的特性是其他IaaS软件(包括OpenStack)不可比拟的。OpenStack要实现服务的HA特性,必须借助第三方高可用方案,比如keepalived+Haproxy或者pacemaker方案。诚然这些都承受了生产环境的考验,但无疑给整个平台增加了复杂度。

微服务体系

云平台是个复杂的系统,管理着各种子系统(如计算、存储、网络、认证等)。每一次的请求任务都需要在各个子系统之间来回协调。比如说创建虚拟机,需要在计算、存储、网络、认证各环节都走通,任何一换出问题,都将导致创建失败。如下图为OpenStack各个子系统的调度关系图:

OpenStack服务之间不但有Http交互,也有RPC交互。整个系统错综复杂。另一方面,随着OpenStack的发展,修改代码有时候会变得不那么容易,甚至不得不重构整个子系统的代码,就像Neutron已经重构了。

反观ZStack,服务之间的交互就简单明了多了,所有交互统一走消息队列,整个拓扑结构不再紧密,实现星状的架构。如下图所示:

星状架构中,各服务之间只有消息的交互,服务之间基本完成独立,添加或者删除某个服务不会影响怎么个架构(只会失去某些功能)。

OpenStack与ZStack两者虽然都是微服务架构,但在实现上有本质的区别。

OpenStack的微服务是以独立进程分散到各个节点,这在一定程度实现了负载均衡的效果,但存在以下问题:

  1. 服务边界扩大
  2. 给部署、升级、维护带来困难
  3. 纷杂凌乱的配置
  4. 增加额外的监控负担
  5. 当扩展时,会生成更多的微服务

鉴于以上原因,ZStack采取 all in one process的实现方式,这就带来下列特点:

  1. 更简洁的依赖关系;所有微服务都集中在一个进程中,相关代码都在一个包里,给部署、升级、维护、扩展带来了极大的便利。
  2. 集中式的配置管理;OpenStack每个服务都有自己的配置,而且还分散在不同的主机上,维护成本较大;ZStack就容易多了。
  3. 微服务只需要关注自己的业务逻辑,高可用、负载均衡、监控都可以交管理节点来完成。
  4. 进程级的应用扩展。从代码层讲,ZStack的微服务都是一个个独立的JAR包,且有自己独立的API,错误代码,全局配置,全局属性和系统标签。开发人员可以直接导入包,来实现自己的需要的功能。

综上所述,ZStack拥有一个清晰的、解耦的架构,这是实现健壮IaaS平台的基石。

插件机制

一个软件的扩展性是评价软件的重要指标之一。当前OpenStack主要支持两种插件扩展机制。

这是一种通用的扩展模式,通过API接口,实现功能扩展。比如OpenStack里Nova Hypervisor Driver 、Cinder Storage Driver等驱动都是通过这种形式实现的。这是一种通过已经定义好的协议来实现插制跟核心交互的。如下图所示:

  • The out-of-process service (进程外服务)

这种模式的典型就是外部服务(监控)通过消息监听,获取平台的消息。在OpenStack里,Ceilometer 服务里有很多监控的实现机制就是如此,示意图如下:

以上两种插件机制是OpenStack和ZStack所共有的,下面要提的机制是ZStack独有的。

在这种模式下,插件会深入到监控应用内部的业务逻辑的事件。当应用内部发现事件时,插件会对此事件做出自己的响应,在插件自身的代码里执行相应的业务流。这种实现,对终端用户是完全透明的,是纯粹的内部实现。举个 Observer pattern 案例,在OpenStack里Security Group(安全组)功能是集成在Neutron里,不能单独剥离出来。而在ZStack里,Security Group是一种 Observer pattern plugin,你可以单独提取,而不影响整个网络功能的实现。这种插制的实现如下图所示:

独特的插件机制,给ZStack带来了更灵活的实现。开发者可以根据自己业务需求扩展功能,而ZStack 开发者只需维护核心代码。如此带来的好处就是,整个云平台可以快速更迭,功能逐步完善,而整个架构还是健壮的。

以上这些架构特点并非ZStack的全部,比如说ZStack还有回滚机制,一但超时或出错,整个任务流就会回滚(包括数据库的修改,比如VM创建失败,IP会被回收,VM不会停留在errror状态而是直接被删除;而OpenStack会出现僵尸VM)。更多ZStack的架构方面的信息,详见ZStack官网。

网络篇

在云时代,用户对网络提出了更高的要求。云中的网络不再是固定不变的,而应该可以随时根据业务进行调整,对网络的隔离性也有更进一步的要求。另外,传统网络的功能(如LB、VPN、FW等)也被引入到了云中,更高级的SDN网络、NFV功能现在也开始集成了到了云中。OpenStack是网络集大成者,各种传统设备厂商、新型SDN公司以及各大运营商都在极力向Neutron靠拢,OpenStack的网络功能可谓包罗万象。

ZStack从一开始就把自己定位是私有云解决方案,它没有像OpenStack那么强大的网络功能,但基本已经能够满足私有云对网络的需求。ZStack 借鉴了CloudStack的网络解决方案,把网络功能都集成到Virtual Router来实现,实现计算、网络实现良好的隔离。比如说,端口转发和SNAT功能,OpenStack利用iptables在宿主机上来实现的,这导致宿主机的iptables更加纷杂(即有宿主机自身的规则,也有VM的规则)。而ZStack把这些实现(也是iptables)转移到了VR,排错相对比较容易。ZStack把CloudStack的基础网各和高级网络融合在了一起,可谓 “打破这种无理的分割”——来自某CS资深用户(@Star华星_FreeBSD)的肺腑感慨。ZStack在网络方面更让人倾心的是,它提供了丰富网络应用场景向导,基本上囊括了私有云常见的应用声场景。下面列举几个场景应用:

1. Amazon EC2 classic EIP

EIP(弹性IP)是当前云环境中最常见的应用。创建虚拟机的时候会分配一个private IP,当虚拟机绑定EIP的时候,虚拟机就可以实现公网路由了——这是在公有云场景。对应于私有云时,单纯private IP无法访问公网,只有绑定EIP,才能实现公网访问。EIP是动态的,用户可以实现更变绑定到不同的虚拟机上。这是云特性之一,弹性!(操作详见 )

2.Flat network

Flat network是一般企业内部很流行的应用场景。所有虚拟机共处一个广播域,虚拟机访问外网通过本地网关出去。如果L3子网在公网是可路由的,那虚拟机就可以直接分配公网IP。(操作详见 )

更多场景详见 ,在此不再一一举例。

ZStack以上的各种网络场景是可以共存的,通过Zone设置,可以形成独立的网络环境,这大大增强了网络的灵活性。更多的功能,有待使用者挖掘。

疑惑篇

说了这么多ZStack优势,也得扒一扒ZStack相关薄弱或者说隐患的地方 。(个人鄙见,^_^)

  1. 融合的单进程架构,诚然存在很多优势,但也有隐患。本人看来,最大的隐患就是核心代码的处理逻辑,如果核心代码出现严重bug,直接导致进程挂掉,那整个集群就失控了(所有管理节点都是一致的)。ZStack是JAVA编写的,bug修复与部署都得重来,整个耗时就长了。OpenStack是Python脚本语言,直接线上修改即可,而且OpenStack是分散式微服务架构, bug只会影响具体某项功能,不会对整个集群产生毁灭性打击。
  2. ZStack当前的认证体系是融合在核心代码里的(至少我还没发现是否可以认证接口可以引入第三方认证),这对认证扩展带来了许多不便。比如说,不能集成现有的认证方式(比如AD、LDAP等),一般企业都有自己的认证体系。而OpenStack的Keystone在这方面做得不错,它可以无缝衔接第三方的认证(主要是AD、LDAP、Kerberos等)。统一的认证体系给企业在管理上带来不少的便利。
  3. 当前ZStack的版本(0.62)对存储支持有限,只支持NFS存储(最新的0.7 预览版支持iSCSI)。企业对存储的需求很大,从我目前观察来看,大部分企业还是挺看重本地存储。另外,当前的大数据时代,数据不再是线性增长,几乎可以说是指数增长曲线,所以企业对存储的扩展性要越来载高,ZStack应该支持更多的存储插件,比如GlusterFS、Ceph等分布式存储。
  4. ZStack的VR网络机制,满足中小型私有云那是没有问题,但是否能承受规模化私云的网络需求,有待考证。最好的方式就是引入SDN解决方案,彻底解决网络瓶颈。
  5. ZStack的L2网络当前还只支持VLAN,下一步可以考虑引下VXLAN、GRE等overlay的隔离,如此一来,网络功能就更加完善了。

外篇

在我看来,ZStack未来的商业模式就是提供私有云咨询服务,深耕私有云市场,与厂商进行接恰合作,提供专业的存储、网络服务。当然前提是做好ZStack的生态圈,让更多的企业和开发者来参与ZStack的发展。

此文是本人近期对ZStack的体验一些感受与想法,期间特别感谢ZStack的作者 张鑫、尤永康的帮助,也感谢ZStack社区 (QQ群:410185063 )的各位朋友的帮助。特别是群管理员 @Star华星_FreeBSD (网名 群小助)的鼎力协助。希望ZStack越来越好,受到市场的关注。

作者简介:沈志伟,某游戏公司云计算负责人,OpenStack用户。QQ:1360848475,weibo: 一页空纸,微信: jayway8023

第七届中国云计算大会将于6月3日-5日在北京国家会议中心举办。目前主会演讲嘉宾名单和议题方向已经公布,众多中国科学院/中国工程院院士、BAT云技术领军人、三大运营商云计算负责人、中国银联执行副总裁、青云联合创始人等嘉宾届时都将带来精彩演讲。欢迎大家访问【 大会官网】,了解更多详情。

关于作者: luda

无忧经验小编鲁达,内容侵删请Email至wohenlihai#qq.com(#改为@)

热门推荐