分类

《Spark + Alluxio 解决方案概览》白皮书

Alluxio与Spark联合部署实现一个可扩展、敏捷和经济有效的方案,打造现代化的数据平台。 本文提供了Spark + Alluxio这个技术栈/解决方案的概述,你将会了解到系统架构、实践案例和性能及成本基准测试的结果。

《使用Alluxio实现Apache Spark DataFrame缓存》

Alluxio 与 Spark 是来自加州大学伯克利分校 AMP 实验室的姊妹项目。为了提升性能和简化数据管理,许多企业如中国联通、BOSS直聘、WeRide文远知行、去哪儿等将Alluxio 与 Spark 部署在一起。

探索Alluxio经济化数据存储策略

通过这篇文章,我们希望可以对经济化数据存储策略做一个初步探索,首先我们将具象化两个关键特性,然后通过几组实验对技术可行性进行一个讨论。

将数据编排技术用于AI模型训练

人工智能(AI)和机器学习工作负载依赖大型数据集,并且对数据吞吐量有较高的要求,两者都可以通过优化数据工作流来实现。 当进行AI模型训练时,我们需要高效的数据平台架构来快速生成分析结果,而模型训练在很大程度上依赖于大型数据集。执行所有模型训练的第一步都是将训练数据从存储输送到计算引擎的集群,而数据工

Spark + Alluxio 解决方案概览

了解像BOSS直聘、知名对冲基金等成功案例,基于解决方案应用的性能基准测试和成本节约测算,以及关于新手的部署引导。