Alluxio 自动驾驶解决方案

为自动驾驶企业提供高性能数据访问能力

趋势与挑战

* 海量多模态数据：在自动驾驶的模型训练环节中，数据集通常由数十亿到数百亿个小文件组成，每次训练需要使用数千万到数亿个文件。存储系统面临着管理数十亿到数百亿个小文件的挑战
* 各类型数据资产管理困难：自动驾驶系统的相关数据来自不同模块，比如感知、定位、决策、规划，其中，数据类型、处理方式、数据规模都不相同，处理相应数据的工作量非常大且没有考虑到协同效应
* 数据存储成本高，尤其是全闪NAS成本高昂：Robotaxi单台车每天产生4000GB数据量，按照一般云厂商的收费标准，存储一年的成本约35万美元（折合人民币约244万元）。一般自动驾驶企业都会把训练数据分布在多个低性能对象存储集群；在GPU服务器和对象存储之间一般会采用高性能全闪NAS作为缓存系统，从而维持高GPU利用率。但是全闪NAS成本高昂，随着训练数据集不断增长，扩容成本无法承受。
* GPU利用率较低：由于数据量较大且分布在不同的地方，每次训练之前都需要进行数据拉取和准备，因此模型训练的很多时间都浪费在了等待数据的过程中，从而造成GPU利用率低的问题，间接地造成了资源浪费。

方案优势

AI场景

一种高ROI方案，无需购买昂贵的NAS，利用GPU上的闲置SSD盘提高闲置资源的利用率，训练任务的性能和耗时与NAS+小文件合并方案相当。
能够缩短快速定位和打开自动驾驶场景下普遍存在的海量小文件所需的时间，对于自动驾驶场景普遍存在海量小文件的管理能起到优化的作用。
简化整体架构和端到端训练过程，提高模型训练的效率，降低模型训练的数据拉取和数据准备的时间，加快模型训练的迭代速度。

大数据分析场景

性能保障：Alluxio的缓存层可以有效的规避从hdfs迁移到对象存储后的数据访问性能下降、对象存储网络波峰等问题。
安全保障：Alluxio可以提供迁移到对象存储后的Kerberos、Ranger等安全保障，确保数据安全。
降低改造成本：Alluxio可以大大降低迁移对象存储的改造成本，包括安全改造成本、业务改造特别是DDL的改造成本、数据迁移成本等。

解决方案一
解决方案二

Edit Content

AI场景

使用Alluxio提供统一命名空间下，基于小文件、无状态、可扩展的分布式缓存

Alluxio可以和GPU节点混合部署，介于GPU和对象存储之间，利用GPU节点的CPU、NVMe资源，提供以下能力：

Alluxio的统一命名空间，Alluxio可以集成不同对象存储、不同bucket向上提供统一的数据视图，实现统一访问。
Alluxio + 对象存储 + NVMe，可以实现和高性能NAS存储可比的性能，在性能相当的情况下，节省高性能NAS的费用，起到降本增效的作用，并提供了更好的可扩展性，Alluxio 可以无状态扩展，可以支撑十亿、百亿量级数据的高性能访问需求。在海量小文件数量快速扩张的情况下，依然能保持良好的数据访问性能。
Alluxio可以提供更丰富的接口，比如S3 API、RESTful API，可以支撑更丰富的场景。

Edit Content

大数据分析场景

依托Alluxio构建安全、高效的基于对象存储的数据湖架构

在大数据分析场景下，在Alluxio可以协助企业快速的进行数据湖架构升级，基于Alluxio构建安全、高效的基于对象存储的数据湖架构：

Alluxio的统一命名空间：Alluxio可以集成多个对象存储以及HDFS存储形成统一数据视图，可以有效降低Table的Location的维护成本。
Alluxio的安全集成：Alluxio可以有效的继承原有的Kerberos、Ranger等安全配置，有效的弥补对象存储安全体系不完善的问题，降低安全体系的改造成本；
Alluxio的缓存加速：Alluxio可以有效利用K8S集群的SSD等存储资源，贴近计算构建可以被多个计算引擎共享的缓存层，提升计算性能，解决对象存储数据访问性能不佳的问题；
Alluxio的数据迁移：Alluxio既可以和原有的hdfs cli集成使用，也可以通过alluxio cli实现hdfs和对象存储之间的数据交互，提高了运维的便捷性；
Alluxio的数据湖支持：Alluxio既可以完整的集成Flink、Spark、Presto等开放式计算引擎，也能很好地支持Paimon、Iceberg、Hudi等数据湖的存储和读写逻辑。

辉羲智能 x Alluxio 应用案例

辉羲智能致力打造创新车载智能计算平台，提供高阶智能驾驶芯片、易用开放工具链及全栈自动驾驶解决方案，助力车企实现优质高效的自动驾驶量产交付，构建低成本、大规模和自动化迭代能力，引领数据驱动时代的高阶智慧出行。

查看更多 →

吉利汽车 x Alluxio 应用案例

吉利汽车主营乘用车及核心零部件的研发、生产和销售。公司主要拥有三类业务，即乘用车、汽车零部件的研发、生产和销售，以及知识产权许可。公司乘用车业务形成了三个子品牌系列：吉利、几何及领克（合营公司）品牌。

查看更多 →

WeRide x Alluxio 应用案例

文远知行是全球领先的L4级自动驾驶技术研发公司。文远知行成立于2017年，总部位于中国广州，并在北京、上海、南京、郑州、深圳以及美国圣何塞设有研发和运营中心。文远知行文远知行推出国内首个商用Robotaxi服务，并于2019年全面向公众开放。目前，文远知行文远知行在Robottaxi、Mini...

查看更多 →