Cloudera谈上云挑战:什么样的平台能够将数据转化为真正可见的价值?

陈伊凡2020-06-28 17:00

经济观察网记者 陈伊凡 “企业如今面临最大的挑战是,什么样的平台能够真正赋能业务,并把数据转化为真正可见的价值,这也是现在几乎所有CEO、CIO们面临的挑战。”Cloudera大中华区总经理徐晋在近期举行的产品发布会上说。

成立于2008年的企业数据云公司Cloudera(NYSE:CLDR),被视为大数据行业的明星公司,曾与Hortonworks、MapR称为北美大数据三驾马车,聚焦在基于Hadoop等开源大数据基础软件领域。2019年,Couldera和Hortonworks合并。

6月23日,Cloudera发布了私有云产品——Cloudera Data Platform Private Cloud,旨在解决企业在上云过程中面临的问题。这也是Couldera和Hortonworks合并后推出的新一代数据平台产品,选取原来Cloudera的CDH和Hortonworks的HDP产品中的精华部分。

“两家公司在合并的时候做过研究,发现两家公司的产品80%的源代码是重叠的,都是基于Apache的社区,20%是不一样。所以我们在把这20%的地方做了一些选择题,把最好的产品留下来,放到新一代产品里。”徐晋表示,在后续的产品中,所有源代码都是100%开源。

如果说疫情之前,企业上云是一个可选项,疫情之后,上云将成为必须,这意味着企业需要面对纷繁复杂的上云情况和新挑战。没有人能够比提供云技术解决方案的厂商,更了解企业们上云的需求和困境。

徐晋说,这款产品,更像是这些数据中台的底座,“企业们会将数据存放在不同环境中进行运维和管理,数据越来越多,数据存放的地方无处不在,企业需要一个统一的数据管理方式,将这些生产要素提炼成真正的业务价值。”

数据安全

安全问题是企业上云过程中首要考虑的问题。2020年初,微盟删库事件影响了百万商户,紧接着,办公软件Zoom也出现了重大安全漏洞。

“数据防护分应用层、中间层和底层。应用层的数据防护主要看apsdk层面有没有漏洞,有没有可能在应用层被人攻破或从内部攻破。PaaS这一中间层,需要处理大量数据的分发、调度并进行计算,中间层也有可能被人黑掉。在底层IaaS层面,就是我们理解云平台是分布式存储,传统的数据中心是集中式存储。”商汤产业战略研究院院长、阿里云研究院创始人田丰曾说过。

一些云厂商会选择做安全认证,剩下事情依靠企业自己的流程化管控、处理,“如果我是靠流程化去管控,数据本身如何使用的追溯,并不能从产品层面追溯出来,以实现安全机制。”刘隶放说,他是Cloudera的大中华区技术总监。

“我们希望客户不管在哪里运行,其数据资产都能够确保安全性,能够实现有效的治理,对数据的血缘关系进行有效追踪。”徐晋说,“包括对数据进行有效的治理,对数据的访问、加密的来龙去脉进行跟踪,能够在整个企业范围内确保数据的安全,形成数据资产化。”

Cloudera的产品能够提供整个生命周期每一步所需要的工具,包括基础架构的支持,以确保数据的安全和可管理型。

管控影子IT

很多时候,IT往往在跟随业务需求方面有一定的迟缓,这造成一些业务部门会自己在外部采购很多业务系统,带入一些数据平台,这就会造成很多数据孤岛,对企业实现统一的数据战略形成障碍。

影子IT是指企业员工使用没有经过IT批准的应用程序,调查发现,企业超过85%的云应用程序没有经过IT部门批准。

举个例子,安全供应商CipherCloud对其企业客户的云计算使用数据分析发现,北美企业平均使用大约1245款云应用程序。其中86%的应用程序是未经IT部门批准的应用程序,并且员工从企业内部网络访问这些应用程序。

这项研究表明,52%的发布云应用、42%的社交媒体应用程序和40%的职业云应用给企业构成高风险。如何管理影子IT,成为了企业们都会面临的难题。

“如何解决好业务部门和IT部门之间不同步的问题,这需要通过诸如云原生数据技术来增加整个IT部门的敏捷性。”徐晋说。

“Cloudera的私有云版本跟传统方式不同在于,我们会借用容器话的私有云方式,一次性安装CDP的私有云版本。其中SDX这个组件能够帮助我们打通数据在公有云、私有云以及私有平台版本之间的数据共享。”

换句话说,如果业务方只是使用方的话,他不会去感触到现在所开发的应用到底是要为公有云去做还是为私有云去做。对他来说,只要正常开发SQL应用或者开发即可,将来至于部署在哪里,怎么去部署,是IT人员的事情,这个有效的隔离可以帮业务人员更好的完成数据分析。 

跨不同云平台

企业数字化转型过程中,还需要考虑如何在不同云计算系统上进行部署,在私有云和公有云上来回切换。因为没有那家企业会放心把自己所有的数据都交给一家厂家。这是企业数据云公司需要面临的问题——适配任务会更加繁重。

徐晋发现,国内客户更多可能上云的时候还是在私有云,特别是一些头部客户,还是以建设私有云作为下一阶段上云的发展方向。

容器技术可以将传统企业的IT系统打包进容器,然后部署到云环境中。目前,容器成为了解决不同云平台问题的方法。

Cloudera如今和许多国内的数据中台厂商有合作,用徐晋的话说,Cloudera 做的是这些数据中台的底座,以及做底座和上层的链接。

Cloudera采用在大数据层面的容器化方式,在容器化上面部署大数据的分析应用。SDX这个组件则能够打通数据在公有云、私有云以及私有平台版本之间的数据共享的经验,同时因为有私有云了,所以可以做弹性的灵活的计算扩展。 

目前,CDP私有云正在与特定客户进行技术预览,预计将在2020年第三季度公开面市。

版权声明:以上内容为《经济观察报》社原创作品,版权归《经济观察报》社所有。未经《经济观察报》社授权,严禁转载或镜像,否则将依法追究相关行为主体的法律责任。版权合作请致电:【010-60910566-1260】。