Path: blob/master/site/zh-cn/tfx/guide/evaluator.md
25118 views
Evaluator TFX 流水线组件
Evaluator TFX 流水线组件能够对模型的训练结果进行深入分析,以帮助您了解模型在数据子集上的表现。Evaluator 还能帮助您验证导出的模型,确保它们“足够好”,可以推送到生产环境。
启用验证后,Evaluator 会将新模型与基准(如当前应用的模型)进行比较,以确定它们相对于基准是否“足够好”。它通过在评估数据集上评估两个模型并根据指标(例如 AUC、损失)计算其性能来实现这一点。如果新模型的指标满足开发者指定的相对于基准模型的标准(例如,AUC 不低于标准),则模型会被“祝福”(标记为良好),向 Pusher 表示可以将该模型推送到生产环境。
使用:
来自 ExampleGen 的评估拆分
来自 Trainer 的训练模型
先前被祝福的模型(如果要执行验证)
发出:
ML Metadata 的分析结果
ML Metadata 的验证结果(如果要执行验证)
Evaluator 和 TensorFlow Model Analysis
Evaluator 利用 TensorFlow Model Analysis 库执行分析,而分析又使用 Apache Beam 进行可扩展处理。
使用 Evaluator 组件
Evaluator 流水线组件通常非常易于部署,而且几乎不需要自定义,因为所有工作均由 Evaluator TFX 组件完成。
设置 Evaluator 需要以下信息:
要配置的指标(仅在与模型一起保存的指标之外添加其他指标时需要)。有关详情,请参阅 Tensorflow Model Analysis 指标。
要配置的切片(如果未提供切片,则会默认添加“整体”切片)。有关详情,请参阅 Tensorflow Model Analysis 设置。
如果要包括验证,则需要以下附加信息:
要与之比较的模型(最新被祝福的模型等)。
要验证的模型验证(阈值)。有关更多信息,请参阅 Tensorflow Model Analysis 模型验证。
启用后,将针对定义的所有指标和切片执行验证。
典型的代码如下所示:
Evaluator 会生成 EvalResult(如果使用了验证,可以选择生成 ValidationResult),可以使用 TFMA 加载它。下面是一个将结果加载到 Jupyter 笔记本中的示例:
有关更多详细信息,请参阅 Evaluator API 参考。