采访王刚(Galen)是在北京东四环的一个共享办公写字楼WeWork。
“Cloudera在中国的总部在上海,在那里我们有传统的办公室。”从2021年3月开始履职Cloudera大中华区域副总裁的王刚说,将自己在北京的办公室选在这里,完全是看中了这种新兴工作模式所带来的灵活性、弹性。然而从某种意义上说,Cloudera和共享办公之间似乎的确存在一些微妙的相似之处——Cloudera是一家同样强调共享的基于开源社区的软件公司。
大神云集
Cloudera成立于2008年,但是其历史却可以追溯到2004年。当时,被业界普遍称为“技术大神”级人物的Doug Cutting开发了一套开源搜索引擎Nutch。在该套系统中,包括一个分布式计算框架 MapReduce和一个分布式存储系统HDFS——这就是后来大名鼎鼎的Hadoop的雏形。
此后,在2006年发布了开源Hadoop后,Doug Cutting在进入雅虎后遇到了另外一位大神级人物Amr Awadallah,时任雅虎副总裁。Amr Awadallah在基于Hadoop构建了一套更高效的数据处理系统后,从Hadoop非凡的数据处理能力中看到了创业的可能性。
于是,在2008年,Amr Awadallah邀请了来自谷歌的Christophe Bisciglia、来自脸书的Jeff Hammerbacher,以及同样拥有多次创业经验,正在甲骨文担任高管的Mike Olson共同创业:自己担任 CTO,Mike Olson担任CEO,一年后,Doug Cutting也正式加入,担任首席架构师——这家“大神云集”的公司,就是Cloudera。
作为一家基于开源技术的软件公司,Cloudera在最初几年发展得相当迅速:在连续获得大笔投资后,也先后获得包括Oracle、戴尔、Intel、SAP、TeraData、微软等在内的传统IT大厂的青睐。直到2017年4月28日上市,Cloudera用了非常短的时间,获得了技术领域和市场用户最普遍的认可,称为IT领域公认的独角兽企业。
开源2.0时代
作为开源软件的一分子,Cloudera更众多的该领域的软件企业一样,在技术路线和商业逻辑上都在学习以往该领域的成功者:强调深度参与开源社区,并且坚持代码全部开源,以提供企业版订阅作为需要营收手段。但是当云计算时代到来以后,众多公有云厂商也开始大量采用Hadoop构建自身的大数据能力后,市场的竞争格局开始变得“混乱”起来。
“我曾经在一些场合讲过:红帽是开源1.0,关注的更多是IaaS层面,是在操作系统层面的开源。在这个层面上,实际上不需要很多家公司,就像手机操作系统,除了安卓和iOS,几乎没有第三家的生存空间。同样的情况比如操作系统有了Windows、Linux以后,基本市场就不再需要其他操作系统了。”王刚认为,以往开源软件的用户往往更多是IT技术人员,开源软件企业更像是为IT技术人员提供工具和方法的角色。但是随着云计算技术的出现,尤其是随着公有云服务被大量采用,底层基础操作系统和平台已经趋近饱和,因此开源软件将“被迫”进阶到一个全新的2.0时代。
在王刚看来,开源2.0时代最明显的特征,就是更加关注企业业务,以及企业业务人员的需求:从技术产品上,处于开源2.0时代的开源软件应该从底层基础操作系统向上迁移,从IaaS层向PaaS层、SaaS层迁移,从关注企业IT技术能力向关注企业业务场景迁移,从而以直接满足企业各种业务场景的方式,赢得更多发挥能力的空间。
“因此我们更该考虑:如何让客户成功?如何贴近业务场景?具体到Cloudera,就需要考虑大数据技术该怎样赋能企业用户的业务。”王刚说,开源2.0与开源1.0时代的软件不同:开源2.0时代的软件,企业“更能摸得到”。
2018年,在同样基于Hadoop的MapR被HPE收购以后,Cloudera合并了Hortonworks——另外一家基于Hadoop的大数据技术提供商——并很快在2019年很快推出整合了Cloudera 和 Hortonworks产品线的CDP(Cloudera Data Platform)。这个号称是第一个基于混合云的企业数据平台,从某种程度上讲,就是Cloudera实践自身开源2.0技术商业模式转型的开始。
“市场上,解决企业数据管理和存储单点问题的技术和解决方案,的确是有一些的。但是,这些都是解决方案,或者是单一产品,只能解决企业关于数据的单点需求。真正能称为是企业级大数据平台的公司和产品,客观来讲,基本上就只有Cloudera一家。”接受采访时,王刚谈到CDP(Cloudera Data Platform)是如何从终端用户和业务的角度,考虑软件本身的价值。
他举例说:对于一个大型集团型企业来说,不同部门可能会用到各种不同的数据技术和产品来解决各自的问题,虽然各自的业务需求都能暂时得到满足,但是由于技术栈不统一,不仅运维成本会很高,而且企业效率将受到极大地影响。“但是如果利用了CDP,那么企业所有的业务部门,都可以用一套统一的解决方案来覆盖;同时由于CDP是基于混合云部署,因此企业内所有的业务部门都可以无缝使用。”
王刚强调,利用CDP实现IT能力与业务需求结合的基本点,是要关注到企业对于大数据管理的业务场景需求:“CDP是一个标准化产品,也就是说,大数据平台是一样的,但是不同企业类型对于大数据的业务需求是不一样的,应用场景也不一样,数据源不一样,数据的标签不一样,数据类型不一样……所以,要分析展现出来的结果就是不一样的,包括智能分析结果呈现、预测方向、警告方式等也会不一样。”而Cloudera解决问题的方法,是通过行业解决方案的提供商、行业的ISV、行业合作伙伴,为企业用户做“行业定制化”,解决最后一公里的问题。
通过合作伙伴直达用户业务,CDP与以往的开源软件相比,实现了相当程度的跃升。
中国计划
Cloudera在中国市场最近一次的“大事件”,是在2021年6月,宣布与阿里云签署合作协议:CDP将正式入驻阿里云。这件事发生在王刚正式入职Cloudera三个月以后。
“Cloudera与阿里云现阶段的合作还是比较简单、也是国内用户最容易接受的层次,就是基于IaaS层面的合作:通过在阿里云部署CDP基础版,实现标准的托管模式。目前通过大量的定制化开发和适配,产品已经上线。最近我们就会开始着手进行大规模公测,并开始销售。未来相关最新的PaaS产品和SaaS服务,可能会是Cloudera与阿里云合作的第二期、第三期所涉及的内容。”
除了逐渐向中国本土市场释放CDP从IaaS到PaaS、SaaS的技术产品能力,王刚认为,就现阶段来说,与阿里云的合作对于现实的业务拓展价值更大:Cloudera原本在中国市场的基础非常好,绝大多数头部的金融机构、电信、汽车行业的企业,都已经是Cloudera的用户。所以Cloudera在国内市场并不缺少灯塔用户。但与此同时,中国本土市场实在太大了,加上Cloudera以往的产品在技术门槛和成本方面都比较高,所以Cloudera目前对于中国本土市场的覆盖范围、以及对于中小企业的覆盖面还远远不够。王刚强调,通过与阿里云的合作,“地理上的覆盖,完全可以靠互联网来实现——借助阿里云,就可以把Cloudera的延伸覆盖到全国,甚至给到一些中国出海的企业。与此同时,通过与阿里云的合作,Cloudera也拓展了用户的部署方式:以往Cloudera在中国本土市场更多支持的是本地化部署,则可以满足企业用户混合云的部署需求。”
在总结其关于中国本土市场的推进策略时,王刚强调:“Cloudera在中国的市场策略,与国外的市场策略不太一样,主要是因为:第一,中国本土市场的用户多、市场大、潜力大,因此首要要解决覆盖面和覆盖深度的问题;第二,Cloudera在中国本土市场的客户行业多,有需求的行业客户也很多,所以未来一项重要的工作,是大力发展合作伙伴团队;第三,云计算将是Cloudera在中国本土市场关注的重点,随着与阿里云合作的不断深入,我们相信在云方面的经验积累和发展速度,中国本土市场未来可能比Cloudera在其他国家做得更快、更大、更强。”
写在最后
作为一个在硅谷炙手可热了十多年的Cloudera,一直不太为企业用户所知,主要原因是其一直坚持走技术路线,坚持沿着开源软件的模式,将IT技术人员作为服务对象,成了躲在巨人背后的“技术大神”。如今,这位技术大神终于决定要亲自面对用户了。然而这并不容易,企业用户日渐挑剔的选择标准,区域用户的个性化特点,都是其市场化进程中必须解决的问题。
“坦白讲,我自己对Cloudera在大数据市场是非常有信心的:第一,Cloudera在大数据这个行业里多年的积累,是其他人短时间内难以企及的;第二,今后的大数据技术不再是大企业专有的东西,Cloudera在这方面的探索也为自己未来的市场竞争赢得了更多的机会。所以,我实际上对Cloudera在中国未来前景是非常看好的。”有20年中国 本土IT行业经验,从十几年前开始就在中国本土推动SaaS应用,相继在Salesforce、SAP和甲骨文从事业务拓展的工作经历,让王刚对未来的工作很有信心——这或许也是Cloudera选择其来实践自身业务转型的根本原因。