AI 绘画 | Stable Diffusion 图生图

news/2024/7/10 18:42:31 标签: 人工智能, stable diffusion, AIGC, AI绘画

图生图简介

Stable Diffusion 不仅可以文生图,还可以图生图。文生图就是完全用提示词文本去生成我们想要图片,但是很多时候会有词不达意的感觉。就像我们房子装修一样,我们只是通过文字描述很难表达出准确的想要的装修效果,如果能给到一张设计图或者效果图,那么就能更加直白的表达我们的想要的意思了。

图生图原理

在这里插入图片描述
文生图很难描述出我们对画面一些细节的控制,比如设计场景,我们要对图片中出现的所有事物进行细致的描述,物体的尺寸比例等,这样的提示词非常难写,即使能写出来,AI生图的过程就像在卡牌中抽卡一样,也许很久也抽不到我们想要的那张。于是就有了图生图的功能,我们可在sd web ui里上传一张图片,通过图片文件的方式告诉Ai一些信息,但是仅仅只上传一张图片是不够的。就像你工作的时候,领导给你发了一张图片,然后一句话不说,你也不清楚,领导的意图。还有一点就是,Ai对图片的理解也不是完全没有偏差,所有还要搭配提示词一起使用,才能有更好的效果。

图生图基本步骤

在这里插入图片描述

导入图片

选择图图生图,在中间面板中,点击上传或者拖放图片到这里。即可完成图片的导入。
在这里插入图片描述

参数设置

在这里插入图片描述

图生图和文生图一样,也有迭代步数、采样算法、提示词引导系数、宽高、随机种子等参数设置,不同的是多个一个缩放模式和重绘幅度、还有原来文生图宽高设置的地方改成了重绘幅度和尺幅。感觉文生图的过程更像是在我们上传图片的基础上做的重绘,事实好像确实如此,当我们不写任何提示词,重绘尺寸和原图保持一直,迭代步数设置为2,重绘幅度设置为0时,会得到和原图一模一样的图片
在这里插入图片描述
当我们将迭代步数调大设置为20,重绘幅度也调大设置为0.5时,因为我选择的底模是真人大模型,所以生成的图像会趋近于真人。

  • 当迭代步数越大,图像就越趋近于真人且有更多细节变化。
  • 当重绘幅度越大,生成的图像就和原图的相似度越小。

在这里插入图片描述

书写提示词

如果我们像对图片的内容做一些修改,比如让美女的表情发生一些变化,比如让美女微笑,我们只需要在正向提示词输入框里输入smlie提示词,设置迭代步数是20,重回幅度为0.45,点击生成。
在这里插入图片描述
在这里插入图片描述

随机种子应用

Stable Diffusion的随机种子(seed)是一个用于生成图像的随机数字,它与其他参数一起被用于驱动扩散过程。**这个随机种子可以确保每次运行模型时,只要输入相同的参数(包括提示词和随机种子),就能得到相同的图像。**换句话说,随机种子可以看作是每个图画的唯一编码。

当随机种子设置为-1时,图画会随机生成。如果用户对生成的图片满意,他们可以复制下面的种子数值,填入随机种子框内,后续生成的图画将与之前的图画相似。

因为Stable Diffusion生成图片每次都是随机的过程,即使相同的提示词和参数设置也会得到不一样的图片,如果我们想要上一次生成的图片上加入一些元素的话,就需要用到随机种子了。

在这里插入图片描述
首先点击下这个按钮锁定下上次出图的随机种子,然后在正向提示词输入框内加入,necklace(项链)的提示词,在点击生成就能再上次的图片上将人物带上项链了,前提还要保证除了提示词以外其他参数,包括checkpoint模型保持不变。
在这里插入图片描述

图生图扩展应用

图生图还有 涂鸦、局部重绘、涂鸦重绘,蒙版重绘的功能,利用这些功能我们可以将一张原始图片发生很多变化。比如动漫人物变为真人人物、真人变化动漫人物,2d动漫人物变3d动漫人物,3d动漫变2d动漫人物,模特换装,产品场景图等,后面都会讲到,感兴趣的朋友,记得一键三连,你的支持是我更新的动力!!!
在这里插入图片描述


http://www.niftyadmin.cn/n/5154321.html

相关文章

AI视觉领域流媒体知识入门介绍(二):深入理解GOP

GOP(group of pictures) 在流行的视频编码算法中,都包含GOP这个概念,例如MPEG-2, H.264, and H.265。 背景 关于视频存储和传输的“size”: Resolution 分辨率 Uncompressed Bitrate 未压缩时的比特率 1280720 (720p…

【C++基础知识学习笔记】精华版(复习专用)

常用语法 函数重载(Overload) 规则: 函数名相同 参数个数不同、参数类型不同、参数顺序不同 注意: 返回值类型与函数重载无关 调用函数时,实参的隐式类型转换可能会产生二义性 默认参数 C++ 允许函数设置默认参数,在调用时可以根据情况省略实参。规则如下: 默认参数只能…

2023年03月 Python(三级)真题解析#中国电子学会#全国青少年软件编程等级考试

Python等级考试(1~6级)全部真题・点这里 一、单选题(共25题,每题2分,共50分) 第1题 十进制数111转换成二进制数是?( ) A: 111 B: 1111011 C: 101111 D: 1101111 答案…

基于鹰栖息算法的无人机航迹规划-附代码

基于鹰栖息算法的无人机航迹规划 文章目录 基于鹰栖息算法的无人机航迹规划1.鹰栖息搜索算法2.无人机飞行环境建模3.无人机航迹规划建模4.实验结果4.1地图创建4.2 航迹规划 5.参考文献6.Matlab代码 摘要:本文主要介绍利用鹰栖息算法来优化无人机航迹规划。 1.鹰栖息…

0002Java安卓程序设计-基于Uniapp+springboot菜谱美食饮食健康管理App

文章目录 开发环境 《[含文档PPT源码等]精品基于Uniappspringboot饮食健康管理App》该项目含有源码、文档、PPT、配套开发软件、软件安装教程、项目发布教程、包运行成功 编程技术交流、源码分享、模板分享、网课教程 🐧裙:776871563 功能介绍&#xff…

多目标优化算法:多目标霸王龙优化算法(MOTROA)MATLAB

一、霸王龙优化算法 霸王龙优化算法(Tyrannosaurus optimization,TROA)由Venkata Satya Durga Manohar Sahu等人于2023年提出,该算法模拟霸王龙的狩猎行为,具有搜索速度快等优势。 参考文献: [1]Venkata …

Golang WebView2

WebView2 是 Microsoft 提供的一种用于嵌入 Web 内容的技术,可以在应用程序中使用 Web 技术来实现用户界面。Golang WebView2 是针对 Golang 开发者而言的 WebView2 的封装库,它使得在 Golang 应用程序中嵌入 Web 内容变得更加简单和便捷。本文将介绍 Go…

力扣:151. 反转字符串中的单词(Python3)

题目: 给你一个字符串 s ,请你反转字符串中 单词 的顺序。 单词 是由非空格字符组成的字符串。s 中使用至少一个空格将字符串中的 单词 分隔开。 返回 单词 顺序颠倒且 单词 之间用单个空格连接的结果字符串。 注意:输入字符串 s中可能会存在…