AI时代-普通人的AI绘画工具对比(Midjouney与Stable Diffusion)

news/2024/7/10 20:01:27 标签: AI作画, stable diffusion, 人工智能, mj

AI时代-普通人的AI绘画工具对比(Midjouney与Stable Diffusion)

  • 前言
  • 1、基础对比
    • Stable Diffusion(SD)
      • SD界面
      • 安装与使用SD
    • Midjouney(MJ)
  • 2、硬件与运行要求对比
    • Stable Diffusion硬件要求
      • 内存
      • 硬盘
      • 显卡
    • Midjouney硬件要求
      • 要求1
      • 要求2
      • 要求3
  • 3、操作(使用)难度对比
    • Stable Diffusion
    • Midjourney
  • 4、出图效果对比
    • Stable Diffusion
    • Midjouney
  • 总结

前言

在当前技术环境下,AI大模型学习不仅要求研究者具备深厚的数学基础和编程能力,还需要对特定领域的业务场景有深入的了解。通过不断优化模型结构和算法,AI大模型学习能够不断提升模型的准确性和效率,为人类生活和工作带来更多便利。

2023年被视作人工智能领域的爆发之年,以ChatGPT为代表的AI模型如同雨后春笋般迅猛增长。基于AIGC(人工智能内容生成)技术的各类产品纷纷涌现,尤其是众多的AI绘图模型,例如Midjourney、Dreambooth、Novel AI和Stable Diffusion等,它们在社会上得到了广泛的应用。
虽然AI绘图领域,看似进入了百花齐放的时代,但目前业内的顶流,仍然是Stable Diffusion和Midjourney为代表的两大龙头。
希望大家看完这篇博客之后能够选择更为适合自己的AI绘画工具!

1、基础对比

Stable Diffusion(SD)

它由创业公司Stability AI与多个学术研究者和非营利组织合作开发。目前的SD的源代码和模型都已经开源,在Github上由AUTOMATIC1111维护了一个完整的项目,正在由全世界的开发者共同维护。
SD最大的特征,就是由于其开源的特性,可以在电脑本地上离线运行。

敏锐的捕捉关键词:
【开源】—>【免费】
【本地离线】—>【可以嘿嘿嘿不用担心社死】

SD界面

在这里插入图片描述
对于我这种白嫖党还是很友好的,基本有台电脑就能玩(你要想炼丹,那还是搞张40系吧)
简单提一嘴如何去安装:

安装与使用SD

很多大佬都弄了sd的启动器,比如:
在这里插入图片描述

详细可以参考这篇博客: stable diffusion webUI之赛博菩萨【秋葉】——工具包新手安裝与使用教程

Midjouney(MJ)

Midjourney是一款由总部位于旧金山的独立研究实验室Midjourney, Inc.创建和托管的人工智能程序和服务。Midjourney基于【Discord平台】提供服务,可以根据语言描述prompt(被称为“提示词/关键词”)生成图像,也支持图生图,AI扩图,图生文等功能。

使用MJ需要登陆Discord账号,在聊天界面发送指令后就可以直接在线得到AI图像。

Discord账号需要科学上网,而且MJ是需要马内才能使用的,30$起步,找人拼车会便宜一些。
在这里插入图片描述
在这里插入图片描述

敏锐的捕捉关键词:
【基于Discord平台】—>【有一定注册门槛】
【科学上网】—>【魔法无处不在,麻瓜速速退散】
【马内】—>【需要钞能力才能使用】

先不说MJ的注册翻墙就拦住了一大批人,每月的刀乐就是一笔不小的开支,对于新手很不友好(主要是俺穷啊~阿米诺兹!)

2、硬件与运行要求对比

Stable Diffusion硬件要求

【硬件要求较高】:这项技术或软件需要本地独立显卡,对硬件配置有较高的要求。尽管仅使用CPU也可以运行,但速度会相对较慢。

【部署相对麻烦x】:环境设置较为繁琐,需要从GitHub上下载许多文件,并且需要一定的Python知识。然而,国内的技术专家已经制作了整合包,可以简化部署过程。用户只需从网盘下载并一键安装即可。例如上面说的秋叶菩萨。

【可完全本地运行】:该技术或软件可以在没有网络连接的情况下完全在本地运行,数据仅存储在本地计算机上,只要拥有相应的硬件,就可以无限期地使用。

建议使用windows10、windows11。

内存

8GB以上,建议使用16GB或以上的内存。在内存比较小的情况下,可能需要调高虚拟内存,以容纳模型文件。

硬盘

40 GB 以上的可用硬盘空间,建议准备60GB以上空间,最好是固态硬盘。

显卡

最低最低需要显存2GB,建议显存不少于4GB,推荐8GB以上。

至于显卡型号方面,很不幸地,因为需要用到 CUDA 加速,所以只有英伟达显卡支持良好。AMD可以用,但速度明显慢于英伟达显卡,当然,如果你的电脑没有显卡也可以用 CPU 花几百倍时间生成。(无脑N卡好吧~)

Midjouney硬件要求

要求1

魔法

要求2

魔法

要求3

还是tm的魔法

MJ其实就是个网页,服务都在人家手里,你就是访问网站直接使用罢了,能有啥配置要求,哈哈。

【无硬件要求】:该技术或软件对本地硬件性能没有特定要求,只要能够使用Discord,就能在其几乎所有设备上运行。

【部署极为简单】:使用这项技术或软件非常简单,只需打开Discord即可立即开始使用,几乎没有任何技术门槛。

【必须联网运行】:该技术或软件需要全程联网才能运行,数据存储在服务器上,而不是本地保存,因此无法在离线状态下使用。

3、操作(使用)难度对比

Stable Diffusion

使用难度较高。Stable Diffusion的界面有很多内容。由于是开源软件,SD一直在更新,并且会有源源不断地便捷插件导入。如果想要熟练操作,需要花费一定时间进行深入学习。

由于俺是白嫖怪,所以我当然是用过SD啦,已经有一些浅显的见解和心得,可以参考这几篇博客:

stable diffusion 提示词进阶语法-学习小结

stable diffusion 提示词进阶语法-年龄&身材&肤色-学习小结

基础使用可以看看秋叶大佬的说明图:
在这里插入图片描述

Midjourney

使用难度较低。基本只要了解几个快捷命令,然后输入提示词就可以进行出图操作。相对SD上手速度快了很多。说的难听一点,只要你会打字,那就能使用,因为只需要往输入框输入描述,回车,就能得到多张效果还不错的图片了。
在这里插入图片描述
在这里插入图片描述

4、出图效果对比

Stable Diffusion

都说是炼丹、抽卡了,你觉得SD的出图能有多稳定,哈哈,基本就是走量,然后拼运气,抽到你满意的图。
不过,现在已经有很很多大佬在做优化,比如controlNet等,学习这些插件之后,就能很好的保证多张图能有较高的一致性(就是有些学习成本)

而且,绝大多数人的SD都是用来跑妹子的,嘿嘿嘿,SD+Controlnet无疑是上限和自由度更高的,提示词百无禁忌,可以跑绅士图,海量主模型和LoRa可以满足各路LSP的XP,如果找不到还可以自己训练。缺点也很突出,提示词门槛高,手部问题,Lora的兼容性等等。

Midjouney

Midjouney的效果是真的好,提示词门槛低,不需要特别精细的描述也可以出不错的图。 缺点是画面不太受控,而且被BAN的敏感词非常多,像bare,nude这类词就用不了。
但是,MJ的出图速度、效率都是很高的,只要你脑洞够大,用MJ绝对很划得来。
比如你想画一幅川普的AI图像,就能通过MJ很快得到一个非常非常真实的图像:
在这里插入图片描述

总结

MJ:
使用群体:更偏向大众化,适合那些出于兴趣、好玩、需要简单AI辅助寻找灵感、开课收割或者客户需求不特别细化的情况。
优点:能快速解决用户的需求,帮助缓解相关从业人士的焦虑。
缺点:需要付费,且可能存在一定的随机性或概率试错,导致结果上下波动。

SD:
使用群体:更偏向精准化,适合各类人群,因为可以产出不同内容,满足多样化需求。
优点:从商业化角度看,更适合作为商业服务,因为它可以根据具体需求定制化,这是客户愿意为之付费的重要原因。
特性:是在本地运行的服务,开源但门槛较高,可实现的效果上限极高。


http://www.niftyadmin.cn/n/5453158.html

相关文章

spring cloud 限流熔断配置

springcloud 微服务网关 zuul.strip-prefixtrue zuul.routes.postgres-client.path /ps01/** zuul.routes.postgres-client.service-idpostgres-client zuul.routes.postgres-client02.path/ps02/** zuul.routes.postgres-client02.service-idpostgres-client02 zuul.semaphor…

基于Python实现多功能翻译助手(下)

为了将上述步骤中的功能增强与扩展具体化为代码,我们将实现翻译历史记录功能、翻译选项配置以及UI的改进。 翻译历史记录功能 import json # 假设有一个用于存储历史记录的json文件 HISTORY_FILE translation_history.json # 初始化历史记录列表 translati…

React Native获取及监听网络状态

在React Native中,要获取和监听网络状态,你可以使用react-native-netinfo库(以前是核心库的一部分,但在React Native 0.60之后被移出并作为一个独立的库提供)。以下是使用这个库来获取和监听网络状态的基本步骤&#x…

论文翻译 - Multilingual Jailbreak Challenges in Large Language Models

论文链接:https://arxiv.org/pdf/2310.06474.pdf 项目代码:https://github.com/DAMO-NLP-SG/multilingual-safety-for-LLMs Multilingual Jailbreak Challenges in Large Language Models Abstract1 Introduction2 Preliminary Study2.1 Setup2.2 Result…

【技术概述】关于MQTT

MQTT(Message Queuing Telemetry Transport)是一种轻量级的、开放的、基于发布/订阅模式的通信协议。它被设计用于在低带宽和不稳定网络环境下,用于传输小型的消息。MQTT协议是为物联网设备之间的通信而设计的,具有低能耗、低带宽…

LeetCode-热题100:74. 搜索二维矩阵

题目描述 给你一个满足下述两条属性的 m x n 整数矩阵: 每行中的整数从左到右按非严格递增顺序排列。每行的第一个整数大于前一行的最后一个整数。 给你一个整数 target ,如果 target 在矩阵中,返回 true ;否则,返回…

简易TCP服务器通信、IO多路复用(select、poll、epoll)以及reactor模式。

网络编程学习 简单TCP服务器通信TCP三次握手和四次挥手三次握手(如下图)常见问题? 四次挥手 client和server通信写法server端client端 通信双方建立连接到断开连接的状态转换怎么应对多用户连接?缺点 IO多路复用select优缺点 poll…

【真题解析】题目 3151: 蓝桥杯2023年第十四届省赛真题-飞机降落【C++ DFS 超详解注释版本】

爆搜冥想 暴力枚举每一辆飞机对于每一个飞机都只存在两种情况,可以降落和不可以降落如果可以降落,计算降落后最早可以降落的时间pre,作为下一次递归的传参如果不可以降落,枚举下一辆飞机 注意这辆的降落有盘旋这种量子叠加态&…