2020年3月24日,亚马逊旗下公司Amazon Web Services, Inc. (AWS) 今天宣布,Amazon Athena在由西云数据运营的AWS中国 (宁夏) 区域正式上线。Amazon Athena是一种交互式查询服务,它让客户可以使用标准SQL语言、轻松分析Amazon Simple Storage Service (Amazon S3) 中的数据。由于Athena是一种无服务器服务,因此客户不需要管理基础设施,而且只为他们运行的查询付费。Athena可以自动扩展,并行执行查询,所以即便是大型数据集和复杂的查询,也能很快获得查询结果。
AWS提供了诸如Amazon Redshift和Amazon Elastic MapReduce (Amazon EMR) 等分析服务,让各种规模的公司都可以实现PB级数据的分析。通过Amazon Redshift,客户可以对大规模的结构化数据执行复杂的查询,并获得超高速的性能。对于非结构化数据,Amazon EMR使用流行的分布式框架,例如Apache Spark、Presto、Hive和Pig,横跨多个可动态伸缩的集群,处理和分析大量数据,快速又经济。虽然这些服务是可伸缩的,而且足够强大到可以处理大且复杂的大数据应用,但是,许多客户也希望能够很快地查询Amazon S3上的数据,例如web日志、点击流、原始日志文件等,而无需开启、配置和管理Hadoop集群或数据仓库。现在,使用Athena分析Amazon S3中的数据就像编写SQL查询一样简单。Athena使用完整支持标准SQL的Presto,可以处理各种标准数据格式,包括CSV、JSON、ORC和Parquet。因为Athena使用多个可用区的计算资源执行查询,而且使用Amazon S3作为底层数据存储,所以它具有高可用性和持久性,数据冗余存储在多处基础设施中,并且是每处基础设施上的多个设备上。
“客户经常问我们,是否可以让他们方便地对Amazon S3数据湖中的数据执行查询,而不用关心配置和管理服务器、集群这些事情。”AWS全球副总裁及大中华区执行董事张文翊表示,“现在,我们很高兴由西云数据运营的AWS中国(宁夏)区域推出Amazon Athena,以响应AWS中国客户的需求。Amazon Athena完全不需要管理基础设施,任何能够编写SQL查询的人都能以高性价比的方式快速分析他们在Amazon S3中的数据。”
茄子快传数据运营负责人何诚表示,“茄子快传作为一家全球化互联网科技公司,全球累计有18亿用户,我们搭建了一个数字内容连接入口,帮助全球200多个国家和地区的用户获取优质数字内容。茄子快传的数据量大,分析维度多,业务也非常复杂,所以经常需要多维度多颗粒度的高并发分析,AWS的分析工具很好地满足了我们日常的数据提取和分析需求。使用Amazon Athena,我们可以轻松地运行交互式查询,分析数据,不必构建和部署额外的集群。同时,我们运行新数据分析所需的时间缩短了30%,大幅减少了成本与运维方面的风险。”
大宇无限是一家专门从事移动应用程序开发的公司,主要为中东、东南亚和拉丁美洲等新兴市场提供移动短视频服务。“每个月,我们的业务运营都需要花费大量人力,分析全球十亿用户的海量数据。“大宇无限平台技术负责人李睿表示,”使用Amazon Athena交互式查询服务之后,我们可以用SQL语言直接在 Amazon S3 中轻松查询、分析用戶数据,节省了成本,减轻了运营压力,普通的工程师与业务部门人员都可以方便地自助查询各类业务数据,极大地提高了生产效率。”
除了茄子快传和大宇无限外,Amazon Athena因其快速、易用、经济和灵活的特性还备受像汇量科技、壳木软件等诸多中国客户的信赖。