1750 字
9 分钟
StableDiffusion:参数设定

1. 参数说明#

​ AI绘图过程主要涉及 基础模型Models)、 提示词Prompts)、 迭代步数Steps)、 采样方法Sampler & Scheduler)、 图像分辨率Width & Height)、 每次生成图片数量Batchsize)、 提示词相关性CFG)、 随机种子Seed)、 重绘幅度Denoise)等参数。

  • WebUI的参数

参数设定

  • ComfyUI的参数

参数设定

2. 基础模型#

  • WebUI

模型

  • ComfyUI

模型

模型分类#

  • 基础模型必须):决定AI作品的呈现风格
系列生成速度生图标准尺寸提示词理解能力缺点
SD 1.5系列512 * 512、768 * 768短语,简单语句人物容易崩坏(手部错乱、姿态错乱)
SDXL系列768 * 768、1024 * 1024短语,简单语句风格随机,需要手动约束画面风格
SD 3.5系列1024 * 1024短语,复杂语句硬件资源消耗大
FLUX系列1024 * 1024短语,复杂语句硬件资源消耗大,画面容易油腻
  • 辅助模型可选):约束AI作品的画面形象、画面风格

    • Embendding 模型:精准地指向个别字词的含义,给AI提供一个极其高效的索引
    • HyperNetwork 模型:改善生成图像的整体风格
    • Lora模型:向AI传递一个特征准确、主体清晰的形象
    • ControlNet模型:基于一些额外的输入信息,给AI图像的生成提供明确的指引
  • 美化模型可选):影响AI作品的色彩和质感

    • VAE模型:让图片的色彩质感变得更好,尤其是在AI图像整体发灰时需要使用

画风分类#

  • 动漫插画风:具有鲜明的动漫笔触质感
    • 代表模型:Anything V5CounterfeitAbyssOrangecetusMix
  • 写实风拟真化程度高,对现实世界还原度强
    • 代表模型:DeliberateRealisticVisionDreamGirlmajicMIX realistic
  • 模型渲染风三维渲染效果
    • 代表模型:ReVAnimated
  • 综合型支持多种风格,通过提示词方式进行切换
    • 代表模型:SDXLSD 3.5FLUX

3. 提示词#

  • WebUI:分为Prompt(正向提示词)和Negative Prompt(反向提示词)

提示词

  • ComfyUI:使用CLIP文本编码节点,接入positive即为正向提示词,接入negative即为负向提示词

提示词

分类#

  • 正向提示词:希望画面里出现什么,绝大多数情况必须要有
  • 反向提示词:希望画面里不要出现什么,有些情况可以没有

建议#

  • 在使用Stable Diffusion的模型时,提示词只支持英文,如果使用中文模型,如Qwen系列,那么提示词对中英文都支持
  • 提示词不是一下子就写好的,而是先有一个雏形,再慢慢细化、补充和微调的
  • 可以先用母语描述想绘画的内容,再翻译成英文
  • 撰写提示词时,可以使用推荐的提示词
  • 可以通过提示词平台的协助,更方便地确定提示词

4. 迭代步数#

  • WebUI

迭代步数

  • ComfyUI

迭代步数

功能#

  • 理论迭代步数越多,成像效果越清晰
  • 实际采用步数大于25之后,成像效果提升不大

建议#

  1. 算力中等:设定在25-30之间推荐28
  2. 算力充足:想追求更高的细致度,设定在25-40之间推荐35
  3. 对于SD TurboFlux Schnell快速生图模型:设定在4-10之间推荐6

5. 采样方法#

  • WebUI

采样方法

  • ComfyUI

采样方法

功能#

  • 采样方法决定噪声图像去除的方式
  • 采样方法包括采样器调度器两个模块,通过组合的方式,确定图像的降噪模式

常见组合#

采样器调度器
EulerSimple
EulerKarras
Eulersgm_uniform
DPM++ 2MKarras
DPM++ 2Msgm_uniform
DPM++ 2M SDEExponential
DPM++ 3M SDEExponential

6. 图像分辨率#

  • WebUI

分辨率

  • ComfyUI

分辨率

推荐分辨率#

比例小尺寸中尺寸大尺寸特大尺寸超大尺寸
1:1512 * 512768 * 7681024 * 10241280 * 12801536 * 1536
26.2 万 像素58.9 万 像素104.8 万 像素163.8 万 像素235.9 万 像素
2:3512 * 768/768 * 11521024 * 15361536 * 2304
39.3 万 像素/88.4 万 像素157.2 万 像素353.8 万 像素
3:4480 * 640600 * 800768 * 1024960 * 12801536 * 2048
30.7 万 像素48.0 万 像素78.6 万 像素122.8 万 像素314.8 万 像素
9:16/540 * 960720 * 1280900 * 16001080 * 1920
/51.8 万 像素92.1 万 像素144.0 万 像素207.3 万 像素

提高分辨率的办法#

  1. 直接生成高清图 → 会存在显存不够用、主体对象会变多等问题
    • 适用于SDXL系列、SD 3.5系列、FLUX系列
  2. 生成低分辨率图,再作高分辨率修复处理
    • 适用于SD 1.5系列

7. 每次生成图片数量#

  • WebUI

批

  • ComfyUI

每批数量

功能#

  • 总批次数让AI一直不断地按照同一组提示词和参数出图,运行总批次数的次数
  • 单批数量(WebUI)、批量大小(ComfyUI)每批次绘制的图像数量
    • 数量增大,可以一次生成更多的图,提升生图效率
    • 数量过大,容易爆显存

8. 提示词相关性#

  • WebUI

提示词相关性

  • ComfyUI

提示词相关性

功能#

  • 提示词相关性数值越高,AI反映提示词的程度越高

标准值参考#

  • SD 1.5:7
  • SDXL:7
  • SD 3.5:3.5
  • FLUX:3.5

9. 随机种子#

  • WebUI

随机种子

  • ComfyUI

随机种子

功能#

  • 随机种子控制画面内容的一致性
    • 同一个随机种子,实现的图像风格相似度较高

模式#

模式WebUIComfyUI
随机🎲:-1randomize
固定123456789fixed
上一个种子♻️/
  • 随机:软件会将随机种子设置为随机正整数每次都会生成新的图像样式
  • 固定:软件会将随机种子设置为上一次图像的种子每次都是同一种图像样式

10. 重绘幅度 / 去噪#

  • WebUI

重绘幅度

  • ComfyUI

去噪

功能#

  • 重绘幅度:用于图生图的流程中,控制生成图和参考图的差异性

推荐值参考#

  • 推荐值:一般在 0.4 ~ 0.9 之间
    • 值很小,生成图和原图很接近
    • 值很大,生成图和原图的差异会很大

11. 对比示例图#

对比:不同的模型#

  • 正向提示词masterpiece, best quality, wallpaper forced, high quality, 1 girl, short hair, auburn hair, midday, clear sky, upper body, head and shoulders, natural lighting, blue eyes,
  • 负向提示词worst quality, grayscale, simple background, bad hands, bad feet, bad anatomy
  • 种子:456698801858549
  • 步数:30
  • 提示词相关性SD:7.0,FLUX:1.0
  • 采样器:DPM++ 2M
  • 调度器:sgm_uniform
AnythingV5CetusMixCuteYukiMixDreamGirl
AnythingV5CetusMixCuteYukiMixDreamGirl
SDXLSD3.5_LargeFLUX
SDXLSD3.5_LargeFLUX

对比:不同的迭代步数#

  • 迭代步数分别为:5、10、15、20、25、30,基础模型为FLUX

不同迭代步数

对比:不同的采样方式#

  • 多个采样方式测试,图像细节略有变化,基础模型为Anything V5
Euler + SimpleEuler + KarrasEuler + sgm_uniform
Euler+SimpleEuler+KarrasEuler+sgm_uniform
DPM++ 2M + KarrasDPM++ 2M + sgm_uniformDPM++ 2M + ddim_uniform
DPM++_2M_KarrasDPM++_2M_sgm_uniformDPM++_2M_ddim_uniform

对比:不同的提示词相关性#

  • 提示词引导系数分别为1.0、1.5、2.0、2.5、3.0、3.5,基础模型为FLUX

提示词引导系数

对比:不同的随机种子#

  • 基础模型为FLUX

不同随机种子

对比:不同的重绘幅度#

  • 重绘幅度分别为0.40、0.55、0.70、0.85、1.00

不同重绘幅度

封面
示例歌曲
示例艺术家
封面
示例歌曲
示例艺术家
0:00 / 0:00