2024年10月11日,可信的数据、分析和AI混合平台厂商肯睿Cloudera今天宣布与AI数据云公司Snowflake集成,为企业提供由Apache Iceberg支持、开放且统一的混合数据湖库。两家公司强强联手,利用双方在数据采集、处理和使用方面的创新工具,为企业提供涵盖数据、分析和AI工作负载的单一可信来源。
数据是企业的强大资产,能够推动明智决策,带来竞争优势并发掘创新机遇。2022年的一项研究显示,80%的企业凭借实时数据分析提高了收入,98%的企业利用数据提高了客户的好感度。但要充分发挥数据的力量,企业需要单一且统一的可信来源,用于存储、管理和治理位于各个地点的企业数据。
Cloudera已将其开放数据湖库的互通性扩展到Snowflake,支持双方客户通过Apache Iceberg REST目录无缝访问Cloudera的数据湖库。凭借由Apache Iceberg支持的优化数据平台,客户能够使用先进工具采集、准备并处理其数据。此外,Snowflake用户现在可以直接从Snowflake查询存储在Cloudera Ozone(与 AWS S3 兼容的本地对象存储解决方案)上的数据。客户可以通过连贯协作、本地、平台即服务(PaaS)和软件即服务(SaaS)的方式访问所有主要的数据存储形态。
除了提高两个系统之间的互通性外,Cloudera客户还将体验到Snowflake商业智能引擎带来的便利。Snowflake引擎无需复制或传输数据,即可访问Cloudera开放数据湖库数据。既降低了复杂性,简化了操作,同时又保持了数据的完整性。
此外,此次合作还降低了企业集成堆栈的总体拥有成本。这主要是因为消除了数据和元数据孤岛,合理规划了数据管道,并且简化了操作。上述改进有助于提高大规模数据分析和AI用例的效率,进一步增加了企业同时使用Cloudera 和 Snowflake解决方案获得的价值。此次战略集成不仅优化了数据分析工作流程,还为企业提供了一个既能推动创新、又能在各自市场获得竞争优势的强大框架。
此次集成的其他优势包括:
● 可管理的Iceberg表:Iceberg表提高了数据性能和可靠性。无论数据存储在何处,双方客户都能通过更合理的安排、更快的查询速度和经过简化的数据管理流程,发掘数据潜力。
● 先进引擎:双方客户借助先进的引擎采集、准备和管理其数据,从而无缝管理AI和商业智能工作负载。
● 统一的安全措施和治理:此次集成整合了整个数据生命周期内的数据安全措施和治理。双方客户可以采用一致的安全措施,追踪数据来源和移动,并在一个平台内管理位于本地或云端的元数据。
Cloudera首席战略官Abhas Ricky表示: “通过Apache Iceberg将我们的开放数据湖库功能扩展到Snowflake,我们不但能够支持客户优化其数据工作流程,同时还为其带来了推动创新、提升效率和促进业务发展的新机遇。此次合作将帮助客户简化数据架构,尽可能减少数据管道的数量,降低数据资产的总体拥有成本以及安全风险。Snowflake和Cloudera将一同为现代化企业开辟一个由数据驱动决策的新时代。”
Snowflake技术联盟主管Tarik Dwiek表示: “追求开放数据标准的客户将Apache Iceberg作为其首选,而Cloudera一直是Iceberg项目不可或缺的一部分。我们的合作为选择在Iceberg表上实现标准化的客户带来了新的可能性。我们十分高兴能够打破数据孤岛,并为客户提供具有多种分析功能的统一混合数据云体验。”
SanjMo分析师Sanjeev Mohan表示: “通过双方合作,客户可以访问一个统一而强大的数据管理平台。该平台将成为客户数据的单一可信来源,无论数据位于云端,还是本地。这样,客户就能够简化数据操作,并保证数据操作的安全性。同时在整个数据生命周期(从数据采集到数据分析和AI)内提供高效数据分析,并提炼数据洞察。两大行业巨头的战略合作将为企业带来更多价值。”
此外,为了加强我们推广Iceberg的力度,Cloudera推出Cloudera Lakehouse Optimizer技术预览版。这项新服务能够自主优化客户的Iceberg表,在进一步降低成本的同时,显著提高客户的数据湖库性能。