介绍

Stable Diffusion是一种深度学习模型,可以文字生图,拥有丰富的插件,具有较强的可控性,其中Web UI的界面更加直观,便于上手
1740364680461

软件及模型下载

秋叶整合包和部分模型:
链接: https://pan.baidu.com/s/1sDF36I4q5O7wh-eXwneXGA
提取码: i42g

常用网址

lightCC:https://lightcc.cloud/
我的邀请码:96RMBN8U9380
土司:https://tusiart.com/
哩布哩布:https://www.liblib.art/
CIVITAI:https://www.civitai.com(需外网)

生图原理

微信图片_20250224102527
微信图片_20250224105338
终止层越大,与提示词相关性越低,通常选择2终止层

参数

大模型:Checkpoint

外挂vae模型:左边适合二次元,右边适合写实,可以不使用
1740366193050

迭代步数:重复执行采样去噪的步数,超过一定步数后,质量不会明细提高

随机数种子:-1代表随机,每个图像的种子数是唯一的,可以固定种子值来对某一张图片进行调整

提示词

有本地和在线翻译,提示,历史记录,收藏,设置起手式等功能
会按提示词的顺序构建图片,一次只能理解75个token的词
微信图片_20250224111359

微调模型

1740367327267

Embedding

嵌入式
自带的几个反向模型:
1740367483053
提示词引导系数:建议4到15之间

Hypernetwork

超网络
需要触发词才能生效

LoRA

低秩效应
1740367730889
有的需要触发词

图生图

参数

尺寸,缩放,重绘幅度(越小越依赖原图,越大越依赖提示词),反推参考图提示词插件

涂鸦

提高重绘幅度(依赖提示词和大模型的想象)

局部重绘

添加蒙版,选择合适的大模型(保证重绘部分和原图风格统一)

修改重绘幅度,重绘一次只修改一个部分的内容(多个内容会让大模型不知道改哪里而出错)

修改蒙版边缘模糊度(过大会增加模糊范围)

处理方式:原版(依原图作为参考)、填充(对蒙版进行模糊处理,再重新迭代生成)、潜空间噪声(在蒙版区域生成新的噪声),空白潜空间(在蒙版处填充纯色,重新生成图像)

重绘区域:决定哪些部分对蒙版区域的重绘产生影响,边缘预留像素对蒙版边缘以外的区域产生影响

重绘非蒙版:反转蒙版区域

柔和重绘:二次重绘,使蒙版边缘融合更好,参数:schedule bias(越大蒙版与参考图融合越强),preservation strength(越小生成内容越偏向大模型和提示词,越大越接近参考图)

涂鸦重绘

有颜色选项和蒙版透明度(降低颜色蒙版的强度)

上传重绘蒙版

上传黑白图片作为蒙版

比如扩充图片时,可以使用ps裁剪扩充画布,蒙版图原图部分填充黑色。
上传扩充后的图片和蒙版图,选择原图的参数和大模型,删掉一些参数(比如扩充背景时,删除掉人物提示词),调整重绘幅度(到一个合适的数值才会生成新的内容,过大则和原图关联变小)

接缝问题(修改重绘区域,边缘模糊度,柔和重绘)

重绘部分可以用白色或简单手绘(PS)一下

批量处理

PNG图片信息,参考图片的文件名和修改图片的文件名要一致

多张参考图需要裁剪成相同尺寸,PNG图片数量和文件名要与参考图一致

高清放大

开启高分辨率,设置放大倍数,非常占用显存,设置2倍以上就可能出现显存不足的现象。所以可以使用图生图里的tiled diffusion插件,原理是将原图分割成小块分别扩充
1740385417105
参数设置
1740385711055

脚本放大
占用更小的显存,速度更快,效果较差
1740386066100

模型融合

融合后的模型也会保存在文件夹中

脚本

XYZ-plot

1740386773343

1740386872874

提示词矩阵

1740386931208

图片浏览器

快速查看之前生成的图片

LoRA训练