stable diffusion学习笔记【2023-10-2】

news/2024/7/10 19:39:04 标签: stable diffusion, 学习, 笔记

L1:界面

CFG Scale:提示词相关性
denoising:重绘幅度

L2:文生图

女性常用的负面词
nsfw,NSFW,(NSFW:2),legs apart, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (outdoor:1.6), manboobs, backlight,(ugly:1.331), (duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:1.331), mutated hands, (poorly drawn hands:1.331), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331), (more than 2 nipples:1.331), (missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many fingers:1.61051), (unclear eyes:1.331), bad hands, missing fingers, extra digit, (futa:1.1), bad body, NG_DeepNegative_V1_75T, pubic hair, glans, refraction, diffusion, diffraction, nude, open mouth, teeth,(worst quality, low quality:1.4), bad anatomy, low quality lowres, low quality lowres low polygon 3D game, low quality lowres monochrome sketch rough graffiti, low quality lowres very ugly fat obesity scar, low quality lowres chibi, low quality lowres poorly drawn bad anatomy, low quality lowres graffiti unbecoming colorfully, low quality lowres incoherent background, low quality lowres long body, low quality lowres duplicate comparison, low quality lowres sketch retro_artstyle doujinshi, low quality lowres sketch, low quality lowres text font ui error missing digit blurry, low quality lowres JPEG artifacts signature hazy bleary, low quality lowres monochrome parody meme, low quality lowres historical picture, low quality lowres disfigured mutated malformed twisted human body, low quality lowres futanari tranny, low quality lowres tentacle skeleton,watermark, signature, fewer digits, figure, nude, topless, fat,lace,rabbit,big boobs,big breast

提示词思路

请添加图片描述

权重

在这里插入图片描述
在这里插入图片描述

  • 采样步数20步以后提升效果不大
  • 采样算法 带加号的是改进过的算法,更稳定
  • 提示词帮写网站
  • 提示词和作品分享网站 另一个替代的
  • 分辨率起始为512,设置太高会出现多人问题,解决办法是使用high-resolution fix(hires fix)来提高分辨率,内容就会更加精细

L3:图生图

  • Denoising strength 重绘幅度参数:与原图差别多大
  • 随机种子:筛子-1即随机生成;循环按钮将返回上一张图的种子,按照上一张图的样子再次生成。

L4:大模型

  • 下载大模型的网站:
    • https://huggingface.co/
    • https://civitai.com/
  • 一些后缀的分类:
    • checkpoint 大模型
    • Lora:从模型网站上下载到的很多模型属于lora,要把他们放在model/Lora文件夹下,相当于一个附加修改器,需要以其他模型为基础
  • 大模型分类
    • trained:一手,原创的
    • merge:模型混合的,名字里一般都有mix

模型风格:
在这里插入图片描述
up推荐的:
在这里插入图片描述

L5:提高产图质量

高清修复

一种说法:hires.fix中的算法R-ESRGAN 4x+对真实图来说更有细节(但其实还是需要多尝试

SD放大

安装extension的方法
在img2img中的script找到对应脚本,注意需要设置重叠像素(tile)的宽高
在这里插入图片描述

附加功能放大

其实就是一个重绘幅度为0的放大,只会精细描线,并不会增加细节

L6:修改器

embedding词嵌入

  • 原理:相当于给一个指示,按照某个人物特点来进行生成,c站的模型筛选中可以找到
  • 使用方法:下载后放入embedding文件夹,在提示词中填入模型详情中的Trigger Words即可。注意看作者说的应该填入哪种提示词
  • 应用:
  1. 画某个角色的同人二创(其实更多用lora
  2. 经典应用:转身图(具体使用的时候应参考wiki
    在这里插入图片描述
  3. 画手。记录了一些手的错误案例,下次ai绘图会避开这些错误案例。

图生文

主要是img2img中的图像反推 (Interrogate) 提示词算法 (BLIP 和 DeepBooru)
生成比较慢

效果差异
比如某张照片:

BLIP

a man with no shirt and no shirt on is standing in front of a wall with his shirt off, Benjamin Marra(一个美漫艺术家), cel shading(一种三渲二的方法), a comic book panel(一个漫画面板), cobra(未找到来源)

DeepBooru(速度更快)

1boy, abs, bara(一种同性艺术风格), beach, dark-skinned male, goggles(护目镜), male focus, male swimwear, muscular, muscular male, navel(肚脐), nipples(r头), pectorals(胸脯), shorts, solo, sunglasses, toned(强壮), topless male

LORA

添加了针对LADY GAGA的角色特点,二创更多用lora
注意看有的lora的详情里面也写了推荐的trigger words

超网络hypernetwork

一般用于改变画风(有时可被lora取代
使用方法:
下载后放在\models\hypernetworks
在超网络标签中,刷新,选中即可

L7:局部重绘inpaint

参数解释:

  • 蒙版:就是涂黑的那一部分

  • 蒙版模糊度:类似ps的羽化

  • mask mode:正选反选

  • masked content:
    Fill: 基于模糊选区
    Original: 基于原图(大多数情况会选这个
    Latent Noise: 随机图像,如果想要随机生成这个选区就勾选这个选项
    Latent Nothing: 基于纯色块选区,色块是选区附近像素的平均色
    在这里插入图片描述

  • Inpaint area
    全图/Whole picture:绘制全图再拼接回去你提供的图
    仅蒙版/Only masked:只重绘选区内容,容易出错

  • inpaint和inpaint sketch似乎没有区别…

L8:扩展

介绍和安装了一些好用的扩展

  • 中文
  • tag提示
  • 中文tag
  • image browser
  • Tagger:一种更好用的图生文
  • adetailer:修复人脸/手
  • infinite zoom:生成无线循环的视频

L9:Lora

在这里插入图片描述

L10:controlNet

  • 可以用于控制人物姿势
  • 需要将controlNet的扩展装在扩展文件夹下面
  • 模型放在controlNet下的models中

参数:

  • 控制权重/Control Weight:决定这个控制效应在图片中呈现出来的程度
  • 启动控制的步数/Starting Control Step和结束控制的步数/Ending Control Step:controlnet什么时候生效,0-1代表全程生效
  • 完美匹配像素/Pixel Perfect:无脑勾选
  • 爆炸按钮:只生成动作的 骨骼图

常用的controlnet的一些细节:

  • pose:预处理中的openpose_full可以精确定位包括表情、手指、躯干所有内容,其他都是部分内容
  • Depth:用于画场景、透视。生成一个空间深度图。【有时候openpose无法生成的动作,可可以试试depth】
    在这里插入图片描述
    在这里插入图片描述
  • canny:边缘检测,注重对细节的重现。
    • 据说可以用于线稿上色
    • 效果:(很想试试2333在这里插入图片描述 - 要求精准重现某种事物(比如文字、汽车等等- sofe eage:同样边缘检测,但是只保留大概轮廓,canny更注重细节。在这里插入图片描述

http://www.niftyadmin.cn/n/5064494.html

相关文章

操作系统原理-习题汇总

临近毕业,整理一下过去各科习题及资料等,以下为操作系统原理的习题汇总,若需要查找题目,推荐CtrlF或commandF进行全篇快捷查找。 操作系统原理 作业第一次作业选择题简答题 第二次作业选择题简答题 第三次作业选择题简答题 第四次…

基于体素场景的摄像机穿模处理

基于上一篇一种基于体素的射线检测 使用射线处理第三人称摄像头穿模问题 基于体素的第三人称摄像机拉近简单处理 摄像机移动至碰撞点处 简单的从角色身上发射一条射线到摄像机,中途遇到碰撞就把摄像机移动至该碰撞点 public void UpdateDistance(float defaultDist…

BIT-7文件操作和程序环境(16000字详解)

一:文件 1.1 文件指针 每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明…

杭州亚运会观后感

弱者可以在重大的节点上战胜强者。就比如围棋,乒乓球。

java获取字符串集合中每个字符并且组成一个新的集合实现

直接怼代码&#xff0c;刚好碰到了这种需求&#xff0c;也是想了可久&#xff0c;其实想想也还是挺简单的 public static void main(String[] args) { // 原始字符串集合 List<String> originalList new ArrayList<>(); originalLi…

2024级199管理类联考之数学基础(上篇)

管理类考试介绍 管理综合200分,时间3小时 数学&#xff1a;75分/25题,是拉开差距的核心模块 问题求解题&#xff1a;15个,5选一条件充分性判断&#xff1a;10个,结合两个条件选择答案 条件一充分,条件二不充分&#xff1a;A条件一不充分,条件二充分&#xff1a;B条件一充分,条…

北大硕士7年嵌入式学习经验分享

阶段 1 大一到大三这个阶段我与大多数学生相同&#xff1a; 学习本专业知识&#xff08;EE专业&#xff09;&#xff0c;学习嵌入式软件开发需要的计算机课程&#xff08;汇编原理&#xff0c;计算机组成原理&#xff0c;操作系统&#xff0c;C语言等&#xff09;&#xff0c…

世界前沿技术发展报告2023《世界航天技术发展报告》(五)太空探索技术

&#xff08;五&#xff09;太空探索技术 1. 概述2. 月球探索规划和探索活动2.1 美国推进“阿尔忒弥斯”项目实施&#xff0c;并公布月球候选着陆区2.2 NASA“猎户座”飞船成功发射并完成无人绕月飞行任务2.3 美国拟建立“地月空间高速公路巡逻系统”以监测地月空间2.4 美国成功…