Path: blob/main/diffusers_doc/zh/schedulers.ipynb
5550 views
加载调度器与模型
Diffusion管道是由可互换的调度器(schedulers)和模型(models)组成的集合,可通过混合搭配来定制特定用例的流程。调度器封装了整个去噪过程(如去噪步数和寻找去噪样本的算法),其本身不包含可训练参数,因此内存占用极低。模型则主要负责从含噪输入到较纯净样本的前向传播过程。
本指南将展示如何加载调度器和模型来自定义流程。我们将全程使用stable-diffusion-v1-5/stable-diffusion-v1-5检查点,首先加载基础管道:
通过pipeline.scheduler
属性可查看当前管道使用的调度器:
加载调度器
调度器通过配置文件定义,同一配置文件可被多种调度器共享。使用SchedulerMixin.from_pretrained()
方法加载时,需指定subfolder
参数以定位配置文件在仓库中的正确子目录。
例如加载DDIMScheduler
:
然后将新调度器传入管道:
调度器对比
不同调度器各有优劣,难以定量评估哪个最适合您的流程。通常需要在去噪速度与质量之间权衡。我们建议尝试多种调度器以找到最佳方案。通过pipeline.scheduler.compatibles
属性可查看兼容当前管道的所有调度器。
下面我们使用相同提示词和随机种子,对比LMSDiscreteScheduler
、EulerDiscreteScheduler
、EulerAncestralDiscreteScheduler
和DPMSolverMultistepScheduler
的表现:
使用from_config()
方法加载不同调度器的配置来切换管道调度器:
LMSDiscreteScheduler
通常能生成比默认调度器更高质量的图像。
EulerDiscreteScheduler
仅需30步即可生成高质量图像。
EulerAncestralDiscreteScheduler
同样可在30步内生成高质量图像。
DPMSolverMultistepScheduler
在速度与质量间取得平衡,仅需20步即可生成优质图像。




多数生成图像质量相近,实际选择需根据具体场景测试多种调度器进行比较。
Flax调度器
对比Flax调度器时,需额外将调度器状态加载到模型参数中。例如将FlaxStableDiffusionPipeline
的默认调度器切换为超高效的FlaxDPMSolverMultistepScheduler
:
[!警告]
FlaxLMSDiscreteScheduler
和FlaxDDPMScheduler
目前暂不兼容FlaxStableDiffusionPipeline
。
利用Flax对TPU的兼容性实现并行图像生成。需为每个设备复制模型参数,并分配输入数据:
模型加载
通过ModelMixin.from_pretrained()
方法加载模型,该方法会下载并缓存模型权重和配置的最新版本。若本地缓存已存在最新文件,则直接复用缓存而非重复下载。
通过subfolder
参数可从子目录加载模型。例如stable-diffusion-v1-5/stable-diffusion-v1-5的模型权重存储在unet子目录中:
也可直接从仓库加载:
加载和保存模型变体时,需在ModelMixin.from_pretrained()
和ModelMixin.save_pretrained()
中指定variant
参数:
使用from_pretrained()
的torch_dtype
参数指定模型加载精度:
也可使用torch.Tensor.to方法即时转换精度,但会转换所有权重(不同于torch_dtype
参数会保留_keep_in_fp32_modules
中的层)。这对某些必须保持fp32精度的层尤为重要(参见示例)。