快速计算丨在混合云上使用Alluxio可为您节省的基础设施投入成本 →

望石智慧 x Alluxio 应用案例

关于望石智慧

望石智慧(StoneWise),成立于2018年,是一家使用人工智能技术驱动新药研发的科技公司,旨在用技术与创新力为医药行业带来新视角,打造世界领先的小分子创新药研发平台。借助丰富的药物研发行业认知、创新的数据集成方法和强大的软件与工程能力,公司搭建了以靶点口袋研究、分子生成、超高通量虚拟筛选、理性设计、成药性优化为核心的一体化技术平台,用于提升新药研发中从苗头化合物发现至临床前候选化合物流程中多个关键环节的效率与成功率。
望石智慧汇聚了一批来自医药行业、人工智能、互联网等领域的国内外专家和优秀人才,具备强大的科研实力和产品研发能力。自成立以来,凭借已被验证的商业模式、扎实的技术根基、综合的团队,望石智慧已与国内外高校、研究机构、药企达成广泛的联系与合作,并获得了多个AI和医药领域一线投资机构的认可。

 

遇到的主要挑战

望石智慧在模型训练的过程中,架构情况如图,其基础数据是放在对象存储OBS上的,基础数据以小文件(几百KB到1MB之间)为主。为了解决小文件读的问题,引入了NAS存储,并且将小文件压缩合成了一个大文件,通过基于大文件的NAS随机读的方式支撑模型训练。
但是这种方式带来了以下的问题:
  • 对象存储以及NFS在处理海量小文件时性能不满足预期,需要额外的数据处理成本将数据从对象存储加工后放到NFS以保证性能;
  • 额外的数据处理任务开发和维护成本,不同的训练数据集需要独立的数据处理任务;
  • 额外的NFS存储成本以及维护成本,数据需要额外存储2份以上,同时需要定时清理。
 

Alluxio解决方案及带来的价值

望石智慧经过严苛调研,最后选择Alluxio,架构方案如下:

 

 
从性能结果来看,我们看到 Alluxio + NVMe盘 + OBS 的性能能够满足望石智慧的预期——保障模型训练的数据读性能,这样可以节省客户采购高性能NAS的成本。在测试对标NAS的过程中,同样的模型训练代码,基于Alluxio模型训练的时间和基于NAS的模型训练的时间对比,两者基本持平。

 

 

同时在性能相当的情况下,Alluxio带来了更多的价值:

 

  • 缓存加速,基于模型训练集群的本地高性能SSD盘资源,通过缓存保障模型训练的数据读取性能;
  • 解绑NAS,使用Alluxio + OBS直接支撑模型训练,在保障性能的基础上,降低架构复杂度,减少不必要的ETL代码,能够更实时的感知数据源头的变化;
  • 在训练任务性能相当的情况下,既节省了用户额外购买NAS的成本,又将GPU服务器上空闲的SSD盘利用了起来,

吉利汽车 x Alluxio 应用案例

吉利汽车主营乘用车及核心零部件的研发、生产和销售。公司主要拥有三类业务,即乘用车、汽车零部件的研发、生产和销售,以及知识产权许可。公司乘用车业务形成了三个子品牌系列:吉利、几何及领克(合营公司)品牌。

WeRide x Alluxio 应用案例

文远知行是全球领先的L4级自动驾驶技术研发公司。文远知行成立于2017年,总部位于中国广州,并在北京、上海、南京、郑州、深圳以及美国圣何塞设有研发和运营中心。文远知行文远知行推出国内首个商用Robotaxi服务,并于2019年全面向公众开放。目前,文远知行文远知行在Robottaxi、Mini Robotbus、Robotvan等领域提供全方位的产品组合。我们提供网约车、按需交通和城市物流等多种服务。

辉羲智能 x Alluxio 应用案例

辉羲智能致力打造创新车载智能计算平台,提供高阶智能驾驶芯片、易用开放工具链及全栈自动驾驶解决方案,助力车企实现优质高效的自动驾驶量产交付,构建低成本、大规模和自动化迭代能力,引领数据驱动时代的高阶智慧出行。