大数据分析场景

依托Alluxio构建安全、高效的基于对象存储的数据湖架构

在大数据分析场景下,在Alluxio可以协助企业快速的进行数据湖架构升级,基于Alluxio构建安全、高效的基于对象存储的数据湖架构:

    • Alluxio的统一命名空间:Alluxio可以集成多个对象存储以及HDFS存储形成统一数据视图,可以有效降低Table的Location的维护成本。
    • Alluxio的安全集成:Alluxio可以有效的继承原有的Kerberos、Ranger等安全配置,有效的弥补对象存储安全体系不完善的问题,降低安全体系的改造成本;
    • Alluxio的缓存加速:Alluxio可以有效利用K8S集群的SSD等存储资源,贴近计算构建可以被多个计算引擎共享的缓存层,提升计算性能,解决对象存储数据访问性能不佳的问题;
    • Alluxio的数据迁移:Alluxio既可以和原有的hdfs cli集成使用,也可以通过alluxio cli实现hdfs和对象存储之间的数据交互,提高了运维的便捷性;
    • Alluxio的数据湖支持:Alluxio既可以完整的集成Flink、Spark、Presto等开放式计算引擎,也能很好地支持Paimon、Iceberg、Hudi等数据湖的存储和读写逻辑。