近些年,企业上云浪潮从初期的泡沫期逐步进入理性期,客户的关注点更加聚焦于云厂商的产品稳定性和服务能力。
同时,国家在信息安全领域的相关政策,也较大影响了企业在数字化转型中的决策逻辑。在包括IaaS、PaaS、SaaS在内的云计算产业体系中,私有云IaaS厂商作为整个云计算生态中提供底层基础设施的关键一环,也是企业IT架构安全的重要一环。
这些因素既给私有云厂商带来了新的机会,也提出了新的挑战。能否基于安全可信、可持续迭代的云计算技术,同时结合企业上云场景中的真实痛点,为企业提供一套完整、标准、可复制的解决方案,是IaaS私有云厂商在商业化过程中的成败关键。
在IaaS层的云计算技术中,存在开源与闭源两条技术路径。相比于VMWare、Microsoft Azure等国外厂商的闭源技术,以OpenStack为代表的开源技术,因具备开放的社区生态,能够支撑云上技术的不断迭代创新,且不被特定厂商所绑定,曾经是IBM、惠普、戴尔、华为等私有云厂商的选择,并同时催生了大量基于OpenStack的创业型公司。
但是,由于OpenStack的技术架构和社区生态较为复杂,创业型公司往往难以充分掌控其技术内核和发展方向,导致后期落入重人力、高定制化开发的困局中,产品化、规模化进程受阻,就连惠普、思科、SUSE等国际巨头也都先后宣布放弃以OpenStack为主的战略。
为了避免陷入类似困境,国内著名的私有云厂商ZStack(上海云轴)走了一条与OpenStack创业公司截然不同的发展路径。
ZStack创始人兼CEO张鑫曾供职于英特尔及著名开源IaaS云平台CloudStack。CloudStack较早由Cloud.com公司开发,于2011年被Citrix公司收购,之后被贡献给Apache软件基金会,并于2013年成为Apache的正式开源项目。
ZStack在创立之初,定位是通过高度产品化的私有云来降低企业上云门槛。ZStack的最终目的是成为一家产品公司,而非成为依靠堆积人力来进行定制化开发和后期运维支持的项目公司。但是,要想实现私有云和混合云的产品化,技术路径的正确选择至关重要。
OpenStack公司的产品化困境,主要在于OpenStack技术诞生之初缺乏针对产品化实现的顶层架构设计。同时,由于OpenStack社区生态中的贡献方较多,且多为IBM、惠普、戴尔、华为等大公司,不但其发展路径无法被创业型公司所掌控,还造成版本向后兼容性较差,严重影响了产品交付后的升级。因此,OpenStack给云厂商的学习、研发和部署过程,以及客户的运维和升级过程带来了大量痛点和难点。
因此,作为国内较早从事虚拟化技术研发的一批工程师,张鑫并没有选择任何现有开源平台作为产品的核心技术基础,而是走了一条完全自主创新的技术路径。早在2015年4月,张鑫的技术团队就在GitHub上发布了自研的开源云计算管理平台项目ZStack 0.6,提供针对企业数据中心基础设施的计算、存储、网络等资源的管理。
据张鑫介绍,ZStack打造的IaaS平台的消息传输层能够可靠地处理数万条并发请求,多功能插件系统能够在不修改现有模块的情况下轻松添加新功能,各种自动化的机制能够较大的减轻系统管理员从安装部署到升级维护IaaS的负担,精密的流水线引擎可以完全回退任何错误事件造成的影响,充分体现了云计算的4S优势,即:简单Simple、健壮Strong、弹性Scalable、智能Smart。
通过这套自主创新的云计算技术,ZStack能够完全掌控自身产品的迭代进度,而不被由巨头引导的开源社区所影响。从ZStack 0.6到目前的ZStack 3.7.0,ZStack平均一到两个月发布一次新版本。同时,ZStack也十分注重自身的开源社区生态建设,目前已发展为国内较大的IaaS开源社区。
另外,针对近年来国家政策对信息安全技术体系的推动,ZStack在内核研发阶段,就充分考虑了对芯片、操作系统和存储设备等底层基础设施的可扩展性支持。目前ZStack对各类基础设施的支持已经十分完善:
在芯片方面,ZStack不但可适配x86、ARM等主流架构CPU,还与飞腾、鲲鹏、兆芯、海光等国内芯片厂商完成兼容性互认证,并支持指纹识别、虹膜识别等特殊领域设备。
在操作系统方面,ZStack不但支持Ubuntu、CentOS等主流服务器操作系统,也已完成对中标麒麟、银河麒麟、深度等国产操作系统的兼容适配。
在存储设备方面,ZStack不但提供自研的基于标准x86架构服务器的SDS分布式存储存储系统,还可适配SAN、NAS等传统网络存储架构,也对其他第三方的SDS分布式存储系统持开放态度,只需提供标准存储协议就可实现对接。
在近些年国家政策大力推动信息安全的背景下,ZStack在核心技术上的自主创新,和在对国产化基础设施的有效支持,已经成为ZStack进入政府、金融、公检法、能源交通、教育、广电、电信等泛政府领域的有力助推器。除此之外,ZStack在制造业、互联网科技企业也实现了大量落地案例。
从较早的开源社区版一路走来,ZStack目前已经形成包括ZStack私有云(ZStack企业版、ZStack社区版)、ZStack混合云、ZStack Mini超融合一体机、ZStack CMP多云管理平台、ZStack企业级分布式存储的产品体系。
在有企业上云需求的客群中,有两类特点比较明显的客户,一类是传统行业内的大型客户,尤其集中于泛政府领域,还有一类是新兴的互联网公司、科技创新公司。新兴的互联网、科技创新公司,其特点是IT自研能力较强,研发人员占很高比例,但IT架构相对简单,不存在大量面向生产制造环节的IT系统,测试和生产环境已经大量采用云架构。针对这类客户,企业IT研发人员可以自行基于ZStack进行二次开发设计,更关注的是ZStack上线快、管理开销低、可无缝融合公有云、平台易扩展等产品特性。另一类客户是传统行业的大型客户,主要集中在政府、交通、能源、电信、金融、制造、医疗等行业,其特点是IT自研能力相对薄弱,但一般拥有非常庞大而完善的IT架构,包括各类用于生产、制造、运营环节的专业软件和硬件设备,产生的大量数据一般通过IDC数据中心的存储网络进行集中存储。这类客户更关注的是ZStack云平台上手快、可实现从少量到大量业务的IT逐步上云、后期可无缝融合公有云等产品特性。为了更好地支撑这两类客户的需求,2016年3月,ZStack在开源社区版的基础上,进一步推出了ZStack企业版,提供了企业管理、容灾备份、裸金属管理、可视化资源编排等一些列企业级标准化功能。除了功能层面的标准化,ZStack还实现了交付方式的标准化、便捷化。目前,市面上的各类企业级IaaS产品,一般需要进行线下的部署实施。而ZStack则实现了全线上的交付流程,客户可直接通过官网下载ZStack,并在30分钟内即可通过可视化安装引导完成部署,较大降低了客户的使用门槛和部署成本。在传统大型企业的数字化转型过程中,由于不同业务线的特点不一,在进行上云的时候,往往会选择多个厂商、多种技术方案。在此背景下,企业希望将不同业务、不同应用分别部署在私有云和公有云上,以实现多业务线分离、性能弹性扩容和容灾备份,这对企业IT架构的统一性造成了较大挑战。
为此,ZStack联合阿里云推出了混合云版本,真正实现了控制面和数据面的完全打通,从而做到公有云和私有云间的无缝连接,还可以有效实现业务灾备、一键迁云和统一管控等应用场景。同时,针对部署了多套ZStack的大型集团客户,ZStack还提供多云管理平台,可实现对管理多种公有云、私有云及多种异构云基础设施,包含强大的运维和运营能力,提供统一的一站式多云管理服务,是ZStack在IaaS领域的重要延伸和补充。随着物联网技术的应用成熟度不断提升,智慧物联正在被各个传统行业所接纳,成为其在数字化转型过程中,实现线上线下连接、发掘数据价值的核心驱动力。比如,交通运输管理部门的ETC系统、地铁公司的闸机系统,通过对物联网设备的云化改造,包括边缘端的云化改造,可实现大数据的有效采集、分析和处理。ZStack面向物联网中的边缘端的云化改造场景,推出超轻量级的私有云平台——ZStack Mini超融合一体机,两节点起步,将高度集成化的双子星硬件与ZStack灵活强大的核心引擎互相结合,实现开箱即用,助力边缘计算等创新场景,实现企业上云零门槛。综上所述,ZStack具有非常成熟的产品化水平和完善的产品体系,针对企业级客户在私有云、混合云及多云管理、边缘计算等各类应用场景均有完善的解决方案,在企业级应用场景中具有较强竞争力。
2017年下半年,全球较大的四家公有云厂商GoogleCloud Platform、微软Azure、阿里云、亚马逊AWS依次与私有云厂商建立战略合作关系。这预示着公有云厂商与私有云厂商共同打造混合云,已经成为云计算行业的一种典型商业模式。其中,阿里云在私有云领域的合作伙伴ZStack,双方共同推出了ZStack混合云版。在实际落地中,混合云面对的应用场景主要有三类,分别是多业务线分离、性能弹性扩容、容灾备份。第一种情况是多业务线分离,即客户希望将多条属性存在明显差异的业务线,按照核心业务、非核心业务的区分方式,分别部署在私有云和公有云上,典型的客户案例是富力地产。在富力地产的IT架构中,财务管理系统(ERP)等系统属于核心业务系统,客户希望部署在私有云上,而对外的互联网平台属于非核心业务系统,客户希望部署在公有云上,并且由公有云提供性能弹性扩容。第二种情况是性能弹性扩容,即客户的业务系统存在明显的访问峰值,需要通过公有云来弹性部署,典型的客户案例是某互联网订餐平台,作为年订单量达千万级的外卖订餐平台,在中午、晚上存在两个明显的下单高峰期,IDC机房的服务器架构难以满足服务性能弹性扩张的需求,因此迫切需要在高峰期启动一部分公有云节点来分担流量,同时又能够在高峰期结束后快速回收资源,主要依靠私有云来进行服务,减少资源浪费。第三种情况是容灾备份,即客户希望借助公有云实现业务系统的灾备,典型的客户案例是农信互联。农信互联分别在北京和上海建设了IDC,由ZStack进行私有云改造,并对业务流量进行分担,同时希望通过阿里云来实现业务系统的灾备,一旦IDC中私有云服务出现故障,阿里云中的备份服务可以及时启动,从而保证业务连续性。在这三类混合云应用场景中,系统的平滑跨云迁移是大部分混合云平台的一大痛点。首先,大部分混合云平台仅能实现部件控制面的打通,无法实现数据面的打通。另外,公有云和私有云在存储网络架构等底层技术上存在明显差异。因此,两方面因素使得系统在混合云的跨云迁移中,常常需要对存储网络结构进行重构。但是与常见的局限于管控面打通的混合云不同,ZStack由于与合作伙伴阿里云进行了数据面的打通,实现了深度融合的“无缝混合云”。基于数据面打通,ZStack混合云完全免去了客户寻找第三方来建设高速通道,并对网络结构进行配置的过程,较大降低了实施成本,同时能够实现系统在公有云和私有云的异构存储网络之间的一键迁云,业务完全无需中断,较大降低了迁云成本。在大型传统企业的IT架构中,一个明显的特点是基于传统架构的应用和基于云环境开发的云原生应用同时存在。云原生应用主要集中在基于大数据和AI做数据分析的应用场景。这部分应用的迁移相对比较容易,但仍然需要对AI运算的计算性能和网络性能进行优化。ZStack目前采用的GPU资源管理模式有硬件穿透和虚拟化两种,他们为上层的TensorFlow等计算框架提供算力支持,因此对GPU的有效管理决定了AI运算的算力性能。传统应用的类型十分多样,比如制造业的MES系统、ERP系统,医疗行业的HIS系统等。针对这类应用,ZStack同样需要做大量性能优化工作,以提升其在云环境下的服务性能。在泛政府领域的传统应用,比如广东等地的高速公路的ETC系统、地铁的闸机系统的云化改造项目,常常和公共服务密切相关,因此对于稳定性的要求更加严苛。如果服务出现故障,那么将造成车辆、人流堵塞的严重后果。因此,在上云迁移之前,为了保证应用的稳定性,ZStack需要进行大量测试和POC,以向客户证明原来部署在物理机、工控机上的系统在迁移到云上依然能够稳定运行。在上云的过程中,为了保持业务连续性,ZStack通常有两种方法来解决。如果客户能够允许业务短暂中断,可以使用P2V工具进行迁移。如果客户的业务一秒钟都不能停止,ZStack会通过专门的云迁移合作厂商来进行迁移。无论是哪类应用,其上云迁移过程都需要ZStack来提供大量服务。因此,如何实现迁移上云服务的标准化、可复制就非常重要。为此,ZStack成立了专门的架构师团队,主要工作是性能调优和架构设计,同时协助和引导ZStack在PaaS和SaaS层的生态合作伙伴,共同形成整体的、可复制的解决方案。一旦遇到同类型客户,ZStack就可以实现解决方案的快速复制,从而提升交付效率。对于IaaS云厂商来说,是否有能力借助自身生态建设,为客户提供面向全场景的“端到端”解决方案,是其商业天花板高度的决定性因素。因此,ZStack在自身的合作生态中引入了三类合作伙伴,分别是销售服务类合作伙伴、生态资源类合作伙伴、战略合作类合作伙伴,并提出三种合作模式:对销售服务类合作伙伴进行认证授权、对生态资源类合作伙伴进行集成整合,对战略合作类伙伴进行从产品到市场销售等全方位对接。对于销售服务类合作伙伴,ZStack采用总代理的模式扩大分销客户的覆盖面,同时招募各类集成商、服务商、转售商,为客户提供优质的服务。为了加强他们自身的服务能力,保证其为客户提供更好的服务,ZStack对其进行培训认证。在线上,ZStack开通12门ZCCT认证课程;在线下,ZStack分别在各二三线城市举办ZCCC初级销售培训,培养本地的合作伙伴的竞争力,并面向核心授权合作伙伴开展为期一周的线下中级认证培训(ZCCE)。截至2019年底,ZStack已经累计完成18期ZStack中期培训,覆盖174家渠道伙伴,总计484人获得ZCCE证书。生态资源类合作伙伴主要指云计算生态中有能力与ZStack联合推出解决方案的服务器硬件厂商、运营商、网络资源提供商、第三方软件提供商。针对这类合作伙伴,ZStack会与其进行方案和商务层面的合作,注重相互资源整合,为客户提供完整的解决方案。战略合作类的合作伙伴,主要指某一专门领域或垂直行业具有很强影响力的合作伙伴,如阿里云、天翼云。ZStack一般采取从产品到市场销售全方位的合作模式与这类合作伙伴进行合作。比如对于阿里云,ZStack将企业云产品与阿里云旗下的天擎、天鹰、安骑士、混合云存储阵列等产品进行融合,在各条业务线、全国范围进行联合推广,在多个大型项目,如城市大脑等项目实现落地。ZStack多层次的合作生态有助于拓展客群类型和数量,并增强其解决方案整合能力和客户服务能力。近日,爱分析专访ZStack(上海云轴)创始人&CEO张鑫,就ZStack的业务模式、客户落地情况、发展战略,以及现阶段私有云行业发展状况进行了深入的交流,现摘取部分内容如下。技术自客户认知逐步成熟,云厂商的“内功”比“外功”更重要爱分析:ZStack目前主要的客群是泛政府领域,这个领域的客户早期往往对上云缺乏认识。最近两年,随着客户逐步认可上云的价值,他们对云平台的需求有哪些比较突出的变化?张鑫:前几年的时候,云计算还在泡沫期,客户都在关注哪家云厂商的功能多,关注的是“外功”,但在实际使用过程中并不会用到那么多功能。比如我们的ZStack企业版有上千个功能,里面有些功能是偏公有云的,一般是大规模集团客户才需要。而在客户实际使用中,可能只需要30~50%的功能。现阶段一个比较明显的变化就是,客户更加关注云平台如何才能更好地承载业务,关注业务的稳定性,也就是“内功”。尤其是在泛政府领域,客户的应用场景都是关乎国计民生的,它更多关注的是你产品在长期运行过程中的稳定性。比如各省ETC系统的上云,如果服务出问题了,所有收费站的车都过不去,车流就会出现拥堵。再比如地铁站里面的闸机支付系统出问题了,人流就会出现拥堵。所以,我们要让客户安心的把重要的应用放在我们的云上,就要通过案例、实验室数据、POC来向客户证明我们的稳定性。爱分析:企业在选择公有云或者私有云的时候会有哪些考虑?很多企业本身业务量并不大,更适合选择公有云,一开始上私有云可能是出于数据安全考虑。所以从长期来看,只要数据安全的问题得到解决,私有云的市场是否会被公有云逐渐蚕食?张鑫:很多人会对私有云和公有云的差异有一些误解,认为企业选择私有云的出发点是数据的安全,而选择公有云的出发点则是为了在业务量不大前提下节省运维成本。但是在很多情况下,影响企业选择的因素其实是业务的形态。我们还是举ETC这个例子。为什么各地的ETC服务器都是部署在私有云而不是公有云上?如果ETC服务器部署在公有云上,那么意味着ETC设备与服务器的通信一定要走互联网,那么网络的稳定性能不能保证?如果稳定性不能保证,那么交通可能会发生瘫痪。另外就是延迟、带宽能不能保证?如果延迟太高,那么原来一辆车可能一秒钟就能过去,现在必须要十几秒才能过去,这也是不能接受的。其次,对于很多大型传统企业来说,公有云的运维成本未必比私有云更低。因为这类企业以往都建设了传统网络架构的IDC,而私有云的很多网络架构,其实和传统网络架构是类似的。因此,在私有云上建设一套涵盖不同地域的网络架构,有很多经典解决方案可以参考。但是,如果要想把传统的网络架构完全搬到公有云上来,中间有非常多的工作,比如VPC怎么用,它的防火墙和路由怎么配置,是一个十分复杂的过程,基本上也只有互联网公司能够做到,传统公司一般是搞不懂的。最后,从财务的视角来看,公有云的支出是持续性,而且是不断增长的,在财务报表里面,这部分支出对政府和企业来说属于运营成本。但是如果是私有云就不一样,他对客户来说属于固定资产。所以,客户到底是用公有云还是私有云,并不是由业务规模大小来决定的,它受到业务形态等方方面面影响。
爱分析:您觉得在私有云的产品化过程中,相比于项目型的公司来说,有哪些难点和挑战?张鑫:主要的难点就是怎么把产品的安装和使用门槛降到足够低,以适应客户运维水平的差异性。首先,现在中国大部分的软件公司,官网根本不提供产品下载链接,产品必须通过线下途径来销售和交付,而且经常无法做到无缝升级。而且,私有云本身和公有云的商业属性不一样。公有云天然就是一个线上销售的产品,维护工作完全托管给公有云厂商来进行。私有云则需要将运维工作全部交给客户,但客户的运维水平差距也很大,比如三四线城市的运维水平就比一二线要薄弱一些。所以,怎么才能把私有云产品做得符合大多数客户的使用需求和习惯,是一个很大的挑战。爱分析:在产品交付过程中,遇到的非标准化需求多吗?张鑫:我们做的是IaaS这个层面,本质和操作系统做的事情类似,非标准化的需求相对来说是比较少的。像ERP这样与客户业务强相关的SaaS产品,非标需求会更多一些。而且亚马逊已经把IaaS的范畴定义得非常清楚了,所以客户对于IaaS的需求也跑不出这个范围。所以,我们在实际服务客户的过程中,面临IaaS层面非标需求,一部分是适配一些特殊的硬件,这对我们来说也比较简单,因为我们的产品是个插件架构,通过插件就能够很快的适配一些领域特殊的硬件。另一部分的非标需求是在运维流程方面,客户可能会希望把我们的产品集成到现有的运维体系里面去。我们的做法是向客户提供标准的API接口和接口文档,让客户通过二次开发,调用我们的API接口来实现集成。如果客户自己没有开发能力,那么我们会请我们的合作伙伴来做这个事情。
爱分析:今年,边缘计算领域比较受到关注,ZStack会专门投入一些资源去拓展这个方向吗?张鑫:当然,边缘计算是我们今年的一个重点,而且取得了巨大成绩,我们年初发布的ZStack Mini 超融合一体机也是主要面向这个领域,在电力行业、制造业也有了很多不错的落地案例。我们的超融合一体机的优势就是能够大规模部署,同时能够在无人值守的条件下保持长时间稳定运行。在边缘云技术上,我们并不需要投入大量的产品和技术人员进行研发,更多的工作还是通过架构师团队输出解决方案,与合作伙伴一起解决客户的需求。爱分析:我们最近了解到国外的超融合一体机厂商Nutanix,目前已经不再强调超融合的产品形态了,而是定位于多云场景的企业云打造,并加大了对纯软件解决方案的推广力度。所以,您怎么看待超融合的发展前景,它会是私有云的一种过渡形态吗?张鑫:我认为超融合只是私有云的一种部署形态。虽然它是一套包括了硬件、分布式存储和虚拟化IaaS层的一体化方案,相对于纯软件方案更加独立,但是对客户来说,它带来的价值仍然是云的价值。因此,超融合进入的市场,仍然是云的市场,只是产品形态是以软硬一体化的方式来输出的。我觉得,从市场发展来看,超融合这种形态仍然会长期存在,份额也会逐渐上升。
爱分析:现在ZStack的竞争对手主要是哪一类公司?是OpenStack创业公司吗?张鑫:我们其实和OpenStack创业公司不太一样,我们是走的产品化模式,不是项目制的模式。产品化模式用一句话来概括,就是产品脱离原厂能不能大规模复制。对于OpenStack公司来说,这是比较难的,但我们可以做到。所以,我们直接的竞争对手不是OpenStack公司,而是华为、VMWare这些大厂,他们也可以实现大规模复制。我们比较关注怎么能够在数字化转型这波浪潮里,在于大厂的竞争中获得更多的市场份额。爱分析:相比于这些大厂,ZStack具有哪些优势?张鑫:相比于VMWare这类外资厂商,我们的优势在于我们提供的是一套整体性的解决方案,一次性购买就可以了,并不需要像VMWare那样分别去购买很多产品,然后像搭积木一样把整套平台搭起来,这更符合中国企业的使用习惯。另外,针对一些国产的软硬件,我们的适配性是要超过VMWare的。再次,对于需要更多云计算功能的场景,ZStack会比以提供传统虚拟化功能为主的VMWare更加符合用户的需求,最近我们成功落地澳大利亚本地大型IDC客户就是一个很好的证明。相比于华为这样的国内巨头,我们的优势也有两个,首先我们是软硬件解耦的,我们的软件可以适配大部分第三方硬件设备,可以充分利旧,提高硬件资源利用率。但是华为是软硬件一体的销售方式。其次,如果客户需要混合云的产品,我们现有的和阿里云、天翼云的解决方案能更好的满足他们的需求。