新闻稿




Alluxio简化数据预处理和加载阶段数据编试器2.6


Alluxio,用于大规模工作负载的开源数据编排软件的开发人员,正在释放其数据编排平台的2.6版,具有增强的系统架构,可使AI / ML平台团队使用GPU来加速其数据流水线,适用于商业智能数据管道机器学习和模型培训。

“寻求竞争优势的企业正在更大地利用机器学习和AI从大规模数据集获得洞察力,”Alluxio浩源李,创始人兼首席执行官。“这些数据集通常分布在混合云环境中,使得从AI / ML计划中实现价值更为一致和有效的数据访问权限。”

在最新版本中,Alluxio将改善其系统架构,以使用POSIX界面最佳支持AI / ML应用程序。

根据供应商的说法,通过删除进程间延迟开销来最为严重化系统性能,这对于启用Compute Resources的充分利用至关重要。

除了I / O性能之外,通过Alluxio的数据管理功能很好地支持数据预处理,加载,培训和结果写入的端到端工作流程。新利游戏

Alluxio 2.6社区和企业版具有新功能,包括:

  • 具有大量小文件的数据访问更快:Alluxio 2.6统一Alluxio Worker和Fuse进程。通过耦合两者,由于在流程间通信中减少,实现了显着的性能改进。
  • 简化的数据管理和可操作新利游戏性:Alluxio 2.6增强了将数据加载到Alluxio管理存储中的机制,并引入更容易可操作性的可追溯性和度量标准。该分布式负载操作是AI / ML工作流程的关键部分,已经进行了对内部机制的调整,以优化用于为模型训练加载准备的数据的常见情况。
  • 改进的系统可见性和控制:Alluxio 2.6添加了一大一的度量标准和可追溯性功能,使用户能够钻取系统的操作状态。这些范围从系统的聚合吞吐量汇总在服务客户端请求时汇总元数据延迟。

有关这些更新的更多信息,请访问www.alluxio.io.