Stable Diffusion WebUI 使用基础

内容纲要

查看【Stable Diffusion 专题】专题可浏览更多内容

接上一篇：在 Windows 上安装 Stable Diffusion WebUI

现在打开 Stable Diffusion WebUI 画上第一张图，比如想画一只猫，在第一个输入框里输入 cat 然后按下「生成」按钮：

如上图现在得到了一张关于「猫」的图片，那么下一步是什么？

Prompt

接触 Stable Diffusion WebUI 和使用其他生成式 AI 产品类似，首先都要了解一个名为「Prompt」的概念，在中文里「Prompt」通常也被称为「提示词」，用来描述和指导模型生成图像，通俗来讲就是告诉「AI」我们想要画的是什么，如之前输入的 cat 就是 Prompt。

提示词的书写建议

一个好的「Prompt」对最终图像质量影响巨大。那么应该怎么写呢？以下是一些建议：

使用英文
在文章开头使用了猫的英文 cat 来作为提示词，尽管使用中文 猫 也是可以正常画出猫的图片的，但 Stable Diffusion 模型训练数据集主要来自英文语料库，对于英文单词、短语和语义有很好的理解和建模能力，而对于中文的理解能力相对较差。
如果英文不是很好怎么办？使用翻译工具呗，例如 DeepL 和彩云小译
使用词组
一般来说目前更多的是使用英文单词而不是自然语句书写，例如我想画一张阳光下猫咪在草坪上的图片，那么提示词可以这么写：cat, sunshine, on the lawn
英文逗号隔开或换行
每个 Prompt 使用英文逗号隔开，有时为了可读性会想要换行，那么也是在当前行的末尾的 Prompt 加上英文逗号再换行即可；
尽可能的描述
例如主体的描述，比如这是一个什么品种的猫？猫在做什么？有穿着可爱的小毛衣吗等等；
例如场景的描述，是白天吗？有没有阳光？草坪上有什么？
例如风格的描述，是 3D 还是 2D，是像素风还是漫画风？
例如画质的描述，比如说希望生成的图片是高清的：High dynamic range, vivid, rich details, clear shadows and highlights, realistic, intense, enhanced contrast, highly detailed；
权重及符号
尽管每个 Prompt 默认权重为 1，但越靠前的提示词顺序权重越高，对生成结果的影响更显著。因此将重要的提示词写在最前面可以确保它们对最终结果有更大的影响力。
另外有一些符号，如使用括号进行权重控制，() 和 {} 括号用于增加权重，[] 括号用于减少权重。
增加的方法有嵌套和指定数值两种方法：
1. 每个括号权重的倍数不同，如 () 括号增加 1.1 倍，{} 括号权重增加 1.05 倍，[] 括号减少 0.9 倍，那么 (red) 表示 red 的权重增加 1.1 倍，并且最多可以嵌套三层括号即 (((red))) 表示权重增加了 1.1 * 1.1 * 1.1 = 1.331 倍
2. 也可以指定数值，如 (red:1.5) 表示 red 权重增加 1.5 倍

正向提示词和反向提示词

第一个输入框里的正向提示词，意为你希望生成一个什么样的图片，而反向提示词也很好理解，你不希望图片里有什么。

例如希望生成一个避免不适宜的图片，那么可以在正向提示词加上 SFW 并在反向提示词加上 NSFW，也就是 Not Safe/Suitable For Work 的意思。再举个例子不希望生成的图片是丑陋的、模糊的也可以加上 ugly, blurry

提示词网站

除了一些书写建议，想要写好提示词也可以看看别人都是怎么写的，这里罗列几个网站：

图片存放目录

每次生成的图片都会保留在本地 SD WebUI 根目录下的 outputs 目录，如之前文生图功能生成的图片就存放在 outputs 的 txt2img-images 里面：

.
├── __pycache__
├── config_states
├── configs
├── embeddings
├── extensions
├── extensions-builtin
├── html
├── interrogate
├── javascript
├── localizations
├── models
├── modules
├── outputs                     # 图片输出目录
│   └── txt2img-images          # 文生图的图片存放目录
├── repositories
├── scripts
├── test
├── textual_inversion_templates
└── tmp