Kubeflow V1.2发布:全部功能特性综述


作为面向Kubernetes构建的开源机器学习工具包,Kubeflow如今正式迎来1.2版本。新版本的主要更新包括对模型构建、训练调优以及机器学习管道进行了增强;引入自动配置超参数机制以提高准确度;提供Kubernetes上的无服务器接口;提供交互式编码环境以更好地进行模型开发等等。下面来看其中一些重要内容。

Katib 0.10

Katib是基于Kubernetes的超参数调优与神经架构搜索系统,能够支持TensorFlow、XGBoost以及Pytorch等多种机器学习框架。

新版本的Kubeflow引入了带有v1bet1 AP1的升级版Katib,旨在通过自动超参数配置(控制模型训练过程中的变更)以更强大的基础架构交付更加准确的模型成果。Katib 0.10中的一些重要功能包括:
  • 提前停止:此功能有助于节约集群资源。此功能无需修改任何训练源代码即可使用。
  • 在亲模板中支持定制化资源定义(CRD):CRD API资源允许用户定义自己的定制化资源。借助这一新功能,用户可以通过简单的步骤将各项定制化资源整合至Katib当中。
  • 恢复实验:用户现在可以使用自定义存储卷中保存的原有建议数据,快速恢复Katib实验。
  • 指标提取:在此之前,Katib试验控制器只能采用实验中可用的最佳指标值。在此次更新之后,用户能够为实验指定更为灵活的指标策略。


KFServing 0.4.1

KFServing用于提供Kubernetes CRD,借此在任意框架上支持机器学习模型。它提供GPU Autoscaling(自动规模伸缩)、Scale to Zero(扩展归零)以及Canary Rollouts(金丝雀测试发布)等功能,并为Tensorflow、XGBoost以及PyTorch等其他机器学习框架提供高性能抽象接口。

在更新之后,KFServing v0.4.1现可在Red Hat开发的OpenShift容器平台上运行;此外,新版本还提供一项附加功能,允许您以边车模式添加批处理模块。借助此功能,KFServer Batcher能够一次性接受并批量处理所有用户请求,而后将其发送至“InterferenceService”。这不仅能够节约大量时间,现时也可加快对干扰请求的响应速度,并提高基础设施的资源利用率。

其他新增功能,包括引入Triton干扰服务器重命名与集成支持,并允许自定义URL路径。

Kubeflow Pipelines

Kubeflow Pipelines是基于容器的机器学习工作流部署平台。这些平台包含用于管理并跟踪实验的用户界面;安排多步骤机器学习工作流的引擎;使用软件开发套件(SDK)与系统进行交互;并提供用于管道及组件定义的SDK。新的Kubeflow Pipelines将支持并简化机器学习管道的端到端编排,同时简化实验与重复使用等常规流程。

新的Kubeflow Pipelines还支持Tekton。源自谷歌云的Tekton是一套基于Kubernetes的灵活开源平台,专门用于创建持续集成与交付(CI/CD)系统。

其他重要公告

除了以上讨论的主要功能之外,Kubeflow v1.2还引入了用于模型开发的交互式、实验性编码环境Notebooks,可供个人及团队通过Kubernetes命名空间用于调度各类资源。

另一项重要的附加功能,是使用经过更新的模型管理技术对各个版本及其子组件(例如元数据)进行建模。这种模型管理技术将大大降低模型组织与识别的难度。此外,新版本还在尝试为机器学习模型及数据定义数据类型,借此在更为广泛的元数据标准及不同框架之间建立起良好的互操作性。

总结

在今年3月刚刚发布v1.0时,之前提到的多项功能(例如Notebooks、用于机器学习工作流的Pipelines以及用于超参数调优的Katib等)尚处于“开发阶段”。

但在此次v1.2当中,这些功能得到用户及开发者社区的积极参与及贡献,并逐步迈向成熟。目前,Kubeflow团队已经开始对v1.3的升级方向开展讨论,也欢迎各位用户及贡献者提供建议与反馈。

原文链接:Kubeflow V1.2 Released: All The Features Introduced

0 个评论

要回复文章请先登录注册