1169 字
6 分钟
StableDiffusion:模型选择

1. 模型文件#

  • 后缀名

    • safetensors:由Hugging Face开发,主要用于存储深度学习模型的参数,这种格式可以提供更安全和更高效的模型权重存储方式。
    • checkpoint:深度学习模型训练过程中的检查点文件。在模型训练过程中,为了能够在后续回复训练或者保存模型的阶段性成果,通常会定期将模型的参数、优化器状态等信息保存到检查点文件中
    • ptpth:通常是PyTorch深度学习框架中用于保存模型权重的一种格式。
    • bin二进制文件,可以用于存储模型权重等信息,格式通用,具体的内容解读取决于存储约定
  • 文件大小

    • 大模型:一般在 2 GB以上,需要大显存支持
    • 小模型:一般在 500 MB以内,作支撑性工作,非必需

2. 模型下载#

3. 模型分类#

3.1 基础模型(必须):决定AI作品的呈现风格#

  • SD 1.5模型SDXL模型SD 3.5模型FLUX模型
    • 模型存放路径
      • WebUImodels/Stable-diffusion
      • ComfyUImodels/checkpointsmodels/unet
    • 效果决定作品的画面风格

3.2 辅助模型(可选):约束AI作品的画面形象#

  • Embendding 模型

    • 模型存放路径:models/embeddings
    • 效果:精准地指向个别字词的含义,给AI提供一个极其高效的索引
  • HyperNetwork 模型

    • 模型存放路径:models/hypernetworks
    • 效果改善生成图像的整体风格
  • Lora 模型

    • 模型存放路径:
      • WebUImodels/Lora
      • ComfyUImodels/loras
    • 效果向AI传递一个特征准确、主体清晰的形象或风格
  • ControlNet 模型

    • 模型存放路径:
      • WebUImodels/ControlNet
      • ComfyUImodels/controlnet
    • 效果:基于一些额外的输入信息,来给AI图像的生成提供明确的指引

3.3 美化模型(可选):影响AI作品的色彩和质感#

  • VAE 模型
    • 模型存放路径:
      • WebUImodels/VAE
      • ComfyUImodels/vae
    • 效果让图片的色彩和质感变得更好,尤其是在AI图像整体发灰时需要使用
    • 注意
      • 有些VAE功能已经包含在大模型里时,无需额外再使用VAE功能
      • 参考模型作者推荐的VAE模型,或者使用适用大多数模型的VAE模型

4. 基础模型#

4.1 模型导入#

WebUI / WebUI-Forge#

SD1.5

SDXL

SD3.5

FLUX

ComfyUI#

SD1.5SDXLSD3.5FLUX
SD1.5SDXLSD3.5FLUX

4.2 画面风格分类#

动漫插画风#

  • 特点插画风格具有鲜明的绘画笔触质感
  • 关键词:illustration,painting,sketch,drawing,comic,anime,cartoon
    • 代表模型Anything V5CounterfeitAbyssOrangeMixCetusMixGhostMixDarkSushiMix
Anything V5CetusMix
Anything V5CetusMix
Anything V5CetusMix
GhostXLGhostXL
GhostXLGhostXL
GhostXLGhostXL

写实摄影风#

  • 特点写实风格,拟真化程度高,对现实世界还原强
  • 关键词:photography,photo,realistic,photo-realistic,RAW photo
  • 代表模型DeliberateRealistic VisionDream Girlmajicfluspixelwave
Realistic VisionDream Girl
RealisticVisionDream Girl
RealisticVisionDream Girl

模型渲染风#

  • 特点三维渲染效果
  • 关键词:3D,render,chibi,digital art,concept art
  • 代表模型ReV Animated
示例图-1示例图-2示例图-3
ReV-AnimatedReV-AnimatedReV-Animated

自由切换风格#

  • 特点风格自由切换,成像效果更为逼真
  • 代表模型SDXLSD 3.5FLUX
动漫风写实风渲染风
FLUXFLUXFLUX

5. 辅助模型#

5.1 Embeddings模型#

介绍#

  • 意义精准地指向个别字、词的含义,提高一个极其高效的索引
  • 用途:针对特定的角色的创建,可以用于正向提示词,也可以用于反向提示词

使用方法:WebUI#

  • 提示词里直接输入embedding模型名称即可——可自动映射到对应的模型

WebUI使用Embeddings

使用方法:ComfyUI#

  • 提示词里输入embedding: embedding模型名称即可

ComfyUI使用Embeddings

应用#

  1. Deep Negative V1.7:手指错乱、肢体错乱、颜色混杂等,对真人模型有效
  2. EasyNegative:手指错乱、肢体错乱、颜色混杂、噪点、灰度异常等,对大多数二次元模型都有效
无Embeddings:EasyNegative有Embeddings:EasyNegative
无Embeddings有Embeddings

5.2 HyperNetwork模型#

介绍#

  • 目的:一般用于改善生成图像的整体风格

现况#

  • 因使用场景不足,不被主流环境接受,已逐渐被淘汰

5.3 LoRA模型#

介绍#

  • 全称:Low-Rank Adaptation Models
  • 目的:向AI传递、描述一个特征准确、主体清晰的形象
  • 用途:针对特定的角色的创建,主要用于对各种游戏角色、动漫角色进行二次创作

使用方法:WebUI#

  • 提示词里输入:<lora:模型名称:权重>

    WebUI使用LoRA

使用方法:ComfyUI#

  • 工作流的模型后面追加仅加载LoRA模型模型强度即为权重

    ComfyUI使用LoRA

权重设定#

  • 推荐使用0.4~0.8,可以确切保留特征,同时减弱对画风的影响

应用#

  • MoXin

墨心

6. 美化模型#

6.1 VAE模型#

  • 作用让图片的色彩和质感变得更好

6.2 效果对比#

无VAE有VAE
无VAE有VAE
无VAE有VAE
封面
示例歌曲
示例艺术家
封面
示例歌曲
示例艺术家
0:00 / 0:00