Path: blob/master/site/zh-cn/tensorboard/hyperparameter_tuning_with_hparams.ipynb
25115 views
Copyright 2019 The TensorFlow Authors.
使用 HParams 信息中心进行超参数调节
构建机器学习模型时,您需要选择各种超参数,例如层中的随机失活率或学习率。这些决策会影响诸如准确率等模型指标。因此,为您的问题确定最佳超参数是机器学习工作流中的一个重要步骤,这通常需要进行实验。此过程被称为“超参数优化”或“超参数调节”。
TensorBoard 中的 HParams 信息中心为此过程提供了多种工具,可帮助确定最佳实验或最可行的超参数集。
本教程将重点关注以下步骤:
试验设置和 HParams 摘要
调整 TensorFlow 运行以记录超参数和指标
开始运行并将其全部记录在一个父目录下
在 TensorBoard 的 HParams 信息中心中可视化结果
注:HParams 摘要 API 和信息中心界面尚处于预览阶段,因此会随着时间而变化。
首先,安装 TF 2.0 并加载 TensorBoard 笔记本扩展程序:
导入 TensorFlow 和 TensorBoard HParams 插件:
下载 FashionMNIST 数据集并对其进行缩放:
1. 试验设置和 HParams 实验摘要
在模型中试验三个超参数:
第一个密集层中的单元数
随机失活层中的随机失活率
优化器
列出要尝试的值,并将实验配置记录到 TensorBoard 中。此为可选步骤:您可以提供域信息以便在界面中更精确地筛选超参数,并且可以指定应显示哪些指标。
如果您选择跳过此步骤,可以在使用 HParam
值的地方使用字符串字面量(例如,使用 hparams['dropout']
代替 hparams[HP_DROPOUT]
)。
2. 调整 TensorFlow 运行以记录超参数和指标
该模型将非常简单:两个密集层之间有一个随机失活层。尽管不再对超参数进行硬编码,但训练代码仍然相似。超参数将改为在 hparams
字典中提供,并用于整个训练函数:
对于每次运行,记录包含超参数和最终准确率的 Hparams 摘要:
训练 Keras 模型时,可以使用回调来代替直接编写:
3. 开始运行并将其全部记录在一个父目录下
现在,您可以尝试多个实验,使用不同的超参数集训练每个模型。
为简单起见,请使用网格搜索:尝试使用离散参数的所有组合,以及仅使用实值参数的上界和下界值。对于更复杂的场景,随机选择各个超参数值可能更加有效(这称为随机搜索)。也有更高级的方法可以使用。
运行一些实验,这将需要几分钟时间:
4. 在 TensorBoard 的 HParams 插件中可视化结果
现在可以打开 HParams 信息中心。启动 TensorBoard,然后点击顶部的“HParams”。
信息中心的左侧窗格提供了筛选功能,该功能在 HParams 信息中心的所有视图中均有效:
筛选在信息中心中显示哪些超参数/指标
筛选在信息中心中显示哪些超参数/指标值
筛选运行状态(正在运行、成功…)
在表格视图中按超参数/指标排序
设置要显示的会话组数(在包含大量实验时可有效提高性能)
HParams 信息中心具有三种不同的视图,包含了各种实用信息:
表格视图将列出运行、其超参数及其指标。
平行坐标视图将每次运行显示为一条穿过每个超参数和指标轴的线。点击并拖动任何轴可标记一个区域,这将仅突出显示通过该区域的运行。需要确定哪些超参数组最为重要时,这种模式非常实用。轴本身可以通过拖动来重新排序。
散点图视图将显示每个超参数/指标与每个指标相比较的图。这种视图可以帮助识别相关性。点击并拖动以选择特定图中的区域后,将在其他图中突出显示相应的会话。
可以点击表格行、平行坐标线和散点图市场,作为该会话训练步骤的函数查看指标图(在本教程中,每次运行仅使用一个步骤)。
要进一步了解 HParams 信息中心的功能,请下载一组包含更多实验的预生成日志:
在 TensorBoard 中查看这些日志:
您可以尝试在 HParams 信息中心中使用不同的视图。
例如,切换到平行坐标视图,然后点击并拖动准确率轴,您可以选择准确率最高的运行。当这些运行通过优化器轴上的 'adam' 时,您可以得出结论,在这些实验中 'adam' 的性能优于 'sgd'。