《用于数据分析的“零拷贝混合云” ——战略、架构和基准测试报告》

此白皮书详细介绍了如何利用公有云(如Amazon AWS、 Google GCP或Microsoft Azure)直接在本地数据上扩展分 析工作负载,而无需通过人工干预将数据复制和同步到 云中。我们将以实例展示如何通过部署在公有云上的 Alluxio,来自动把数据从HDFS缓存到运行Presto和Hive 的机器内存上。此外,我们也将展示如何在位于两个不 同位置的Amazon EMR集群中设置和执行性能基准,并给 出我们的研究结果概述。 

 

 

立即下载白皮书,了解更多精彩内容!

Alluxio S3 写缓存介绍

借助 Alluxio S3 写缓存,小对象 PUT 延迟降至约 4-6 毫秒,提升幅度达到 5-8 倍;而大对象写入在低延迟且稳定状态下,每个 Alluxio worker 可持续保持 6GB/s 以上速度,随着 Alluxio worker 的增加,性能几乎呈线性扩展。