AI 创业指难(一) :Stable Diffusion AI 绘画怎么用

news/2024/7/10 20:00:13 标签: 人工智能, stable diffusion

一. 前言

一年不到,AI对生活和工作的影响已经逐步体现。所以千万别掉队了,也许 AI 不能成为我们的主要工作,但是如何借助 AI 实现副业的扩展同样值得思考。

这一篇就来讲一个 AI 绘画工具,这个工具我也是才上手不久,所以我把这其中的一些笔记分享出来,希望大家都能融入到这个新的时代。

Stable Diffusion

stable diffusion 本质上是一个 AI 绘图生成工具,我想大家肯定听说过它的竞品 : Midjourney

之所以选择 Stable Diffusion 的主要原因就是它免费,本地就可以搭建,开源资源丰富 , 适合我们这些业务人员去折腾。

实测 4060 笔记本显卡一张图 1024 大小的图大概在 10S 左右 , 如果嫌慢不要紧, 阿里云买一个抢占式的 GPU 服务器再部署一套到云环境上面,一小时也只要3块钱。

  • 欠拟合 :指模型不能在训练集上取得好的结果。学了又好像没有完全学会
  • 过拟合 :指在训练集上表现很好,但是测试集上表现很差
  • 不收敛 : 训练失败,根本没学会
  • 泛化能力 :指的AI对未知样本的推理、适应能力

二. 安装和使用

基础安装太简单了,果然玩图的大佬都是热心肠,这里推荐直接使用 sd-webui-aki Bilibili 地址。

image.png

启动的效果就是这样,入门使用只需要关注2个点 :

  • 模型管理 : 在各模型网站下载对应模型后添加进去即可
  • 一键启动 : 直接启动运行

几个好用的模型网站 :

  • 土司 : tusiart.com/
  • civitai : civitai.com/
  • liblib : www.liblib.ai/

三. 使用方式

image.png

整个主界面大致如下 ,来简单说一下其中这些关键的信息 :

👉 001 : 基础模型是什么?

模型就是我们在上述模型网站中找到的喜欢的模型,模型很多,我们只需要找到自己想要生成的去下载即可

image.png

下载完模型后,将模型添加到工具的模型管理中,然后在主界面模型旁边点击刷新就能应用上去。

模型也有对应的类型,这里简单概述下 :

  • LoRA :通常用于人物和概念,体积小且控图效果好,常用于固定角色特征
  • Checkpoint : 体积较大,用于控制画风
  • Embedding : 适用于控制画风和人物,相对速度中等
  • Dreambooth : 可以用于人物,概念和画风,对配置要求较高

对我这种新手来说基本上不关注这个,模型训练可能是后续的实践中才需要使用到。

👉 002 : VAE 模型是什么 ?

Variational autoenconder,中文叫变分子编码器 ,主要的作用就是滤镜。在出图的时候会影响颜色和线条

一般大模型里面都会自带 VAE , 出图如果有问题才可能需要用到它

image.png

尝试了一下,左边的为原厂模型,右边加了其他 VAE. 虽然不明显,但是在颜色上还是有一些色差。

👉 003 / 004 : 提示词怎么写 ?

提示词分为正向提示词和反向提示词 ,

  • 正向提示词
    • 通过提示词 来指定生成的图像
    • 提示词的顺序会影响到图像的生成 ,前面的提示词权重更大
  • 排除词
    • 用于指定图像中不期望出现的东西 (低质量,小图,五官不全)
  • 权总
    • stable diffusion 支持对提示词进行权重设置,点击提示词按 Ctrl + 上下方向键

那么提示词该怎么去找,去哪里找呢?

方案一 : 通过 Stable Diffusion 的工具反推提示词

image.png

直接把图片拖进去,就能得到对应的提示词,后续直接使用即可。

方案二 : 去模型网站或者图站查找提示词

image.png

一般下载的模型下面都能找到一些效果图,点进去就能看到对应的提示词

方案三 : 找 GPT 问或直接写

image.png

👉 005 :步数的作用是什么 ?

  • 迭代每一步都是在前一步的基础上进行处理
  • 低的采样步数会导致画面计算不完整,高的采样步数仅在细节处进行优化,对比输出速度得不偿失

👉 006 :采样方式有什么用 ?

采样方式指的是模型生成图像时所采用的策略,决定了如何从模型的输出分布中选择样本。

不是很了解,帮不了太多,但是文档我给你们找好了呀!!!

上文界面里面的采样方式主要有以下区别 :(PS 这一块网上资料也不多,只能做到这个地步了

算法速度步数优 / 缺点场景
Euler a20-301. 适当的步长出图更快 2. 步长过大会过度拟合,图像变形
3. 富有创造力ICON , 二次元,小场景
Euler20-30- 基于Karras论文
LMS30+1. 效果一般,比较抽象 , 质感OA,饱和度与对比度偏低,更倾向于动画的风格
2. 线性多步调度器(Linear multistep scheduler)
Heun20-30- 基于Karras论文
DPM220-30该采样方法对tag的利用率最高,几乎占80%+
DPM2 a25-30几乎与DPM2相同,对人物可能会有特写
DPM++ 2S a20-30
DPM++ 2M20-30
DPM++SDE
DPM++2S a Karras- 在每个时间步长中执行多次操作
- 同等分辨率下细节更多
- 步长越多细节越明显
写实人物,复杂场景
DPM++ 2M Karras20-301. 是二阶扩展概率模型求解的算法 2. 可以在速度和质量之间平衡
DPM ++ SDE Karras8-12
DDIM10-151. 步数越多细节越丰富 2. 收敛快,可以快速生成高质量图像
写实人像,复杂场景刻画
UniPc20-30
DPM adaptive10
LMS Karras20会大改成油画的风格,写实不佳
DPM2 Karras20-30
DPM2 a Karras20-30

👉 007 :关于图像大小 ?

  • 图像越大,从而需要往图片中加入更多的元素,越容易出现低质量的信息
  • 如果图像大小一样,相同的提示词可能会出现类似的结果,但是大小一旦变化,图像的变化就极大
  • 图像越大,花的时间必然就会越长
  • 总结 : 图像不是越大越好,过大的图像反而影响整体质量。

关于宽度 :

  • 推荐 512 x 512 ,一般模型都是在这个基础上进行计算的
  • 宽带必须是 8 的倍数
  • 宽度不适合太大,容易出现图像崩溃
  • 高度同理

👉 008 :CFG Scale (提示词引导系数 )

  • 控制图像与提示词之间的契合度,这个值越高,生成的图像也越接近你的提示词
  • 这个值一定程度上会降低图像质量,因为相当于限制了范围
  • 建议 7- 15

其他功能补充 :

随机种子的作用

  • 随机种子可以帮助我们锁定图像范围 ,使用相同种子的时候可以生成类似的图像
  • 相同的随机种子可以提高图像的可重复度和相似性,用于调优和优化模型
  • 当使用 -1 随机种子时图像完全随机,完全无规律

image.png

总结

首篇完成,算是对这段时间学习的一个总结,期望能对大家有所帮助。

学无止境, 这个系列也是一直会保持更新。

写在最后

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述


http://www.niftyadmin.cn/n/5477578.html

相关文章

GIT fatal: The remote end hung up unexpectedly

error: RPC failed; result18, HTTP code 200 MiB | 226.00 KiB/s fatal: The remote end hung up unexpectedly fatal: early EOF fatal: index-pack failed 错误: error: RPC failed; result18, HTTP code 200 MiB | 226.00 KiB/s fatal: The remote …

[C语言]——动态内存管理

目录 一.为什么要有动态内存分配 二.malloc和free 1.malloc 2.free 三.calloc和realloc 1.calloc 2.realloc 3.空间的释放​编辑 四.常见的动态内存的错误 1.对NULL指针的解引用操作 2.对动态开辟空间的越界访问 3.对非动态开辟内存使用free释放 4.使用free释放⼀块…

python教程(4更新中)

单元测试 如果你听说过“测试驱动开发”(TDD:Test-Driven Development),单元测试就不陌生。 单元测试是用来对一个模块、一个函数或者一个类来进行正确性检验的测试工作。 比如对函数abs(),我们可以编写出以下几个测…

WKWebView的使用

一、简介 在iOS中,WKWebView是WebKit框架提供的一个用于展示网页内容的控件,相比UIWebView有更好的性能和功能。 以下是在iOS中使用WKWebView的基本步骤: 1.1 导入WebKit框架 import WebKit1.2 创建WKWebView实例 let webView WKWebVie…

如何给MySQL数据库的所有表统一加上字段

在开发过程中,有时候慢慢的建了很多数据库表,但是后来发现需要统一增加某些字段的时候,可以通过alter语句 ALTER TABLE 表名 ADD 列名 数据类型;比如我要给t_user表增加gmt_create与gmt_modified字段,用作记录新增记录时间与更新…

一款轻量、干净的 Laravel 后台管理框架

系统简介 ModStart 是一个基于 Laravel 的模块化快速开发框架。模块市场拥有丰富的功能应用,支持后台一键快速安装,让开发者能快的实现业务功能开发。 系统完全开源,基于 Apache 2.0 开源协议,免费且不限制商业使用。 系统特性 …

k8s_入门_命令详解

命令详解 kubectl是官方的CLI命令行工具,用于与 apiserver进行通信,将用户在命令行输入的命令,组织并转化为 apiserver能识别的信息,进而实现管理k8s各种资源的一种有效途径 1. 帮助 2. 查看版本信息 3. 查看资源对象等 查看No…

docker 清理

## 查找未使用的镜像 docker image prune## 删除未使用的镜像 docker image prune -a## 查找未使用的容器 docker container prune## 删除未使用的容器 docker container prune -f## 清理Docker未使用的本地数据和缓存 docker system prune -a --volumes