快速计算丨在混合云上使用Alluxio可为您节省的基础设施投入成本 →

010-82449668

EN 中文

《使用Alluxio实现Apache Spark DataFrame缓存》

Apache Spark 是目前最流行的分布式计算框架之一。Spark DataFrame 是一个以命名列方式组织的分布式数据集,在执行时间和内存使用上进行了底层优化,成为了Spark主流数据API,得到了普遍应用。Alluxio 与 Spark 是来自加州大学伯克利分校 AMP 实验室的姊妹项目。为了提升性能和简化数据管理,许多企业如中国联通、BOSS直聘、WeRide文远知行、去哪儿等将Alluxio 与 Spark 部署在一起。

 

其中,去哪儿网(Qunar)在生产环境中部署了 Alluxio,其 Spark streaming 作业平均提速了15 倍,高峰时段的性能提升更是高达 300 倍。原先一些变慢或无法完成的 Spark 作业,在使用 Alluxio后都能够快速完成。想了解如何实现?点击下载白皮书:

 

Alluxio 可实现多重优势,帮助 Spark 更有效地执行作业,如何进行配置和操作。立即点击下载白皮书,获悉更多精彩内容。

辉羲智能 x Alluxio 应用案例

辉羲智能致力打造创新车载智能计算平台,提供高阶智能驾驶芯片、易用开放工具链及全栈自动驾驶解决方案,助力车企实现优质高效的自动驾驶量产交付,构建低成本、大规模和自动化迭代能力,引领数据驱动时代的高阶智慧出行。

望石智慧 x Alluxio 应用案例

望石智慧(StoneWise),成立于2018年,是一家使用人工智能技术驱动新药研发的科技公司,旨在用技术与创新力为医药行业带来新视角,打造世界领先的小分子创新药研发平台。

【济南超算】超算互联网统一存储平台技术研究

国家超级计算济南中心(简称“济南超算”)由国家科技部批准成立,创建于2011年,是从事智能计算和信息处理技术研究及计算服务的综合性研究中心,也是我国首台完全采用自主处理器研制千万亿次超级计算机“神威蓝光”的诞生地。