Stable Video Diffusion(SVD)安装和测试

news/2024/7/10 20:09:02 标签: stable diffusion, SVD

SVD_0">Stable Video Diffusion(SVD)安装和测试

官网

  • github | https://github.com/Stability-AI/generative-models
  • Hugging Face | https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt
  • Paper | https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets

准备工作

我的系统环境

  • 内存 64G
  • 显存3090,24G显存

下载

git clone https://github.com/Stability-AI/generative-models
cd generative-models

下载模型

  • SVD | https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt
  • SVD-XT | https://huggingface.co/stabilityai/stable-video-diffusion-img2vid

模型有4个,任意一个都可以使用,存放目录:

generative-models/checkpoints/

在这里插入图片描述

python环境配置

conda create --name svd python=3.10 -y

source activate svd
pip3 install -r requirements/pt2.txt
pip3 install .

运行

cd generative-models
streamlit run scripts/demo/video_sampling.py  --server.address  0.0.0.0  --server.port 7862

启动时,还会下载两个模型,可以手动去下载,放到以下目录:

  • /root/.cache/huggingface/hub/models–laion–CLIP-ViT-H-14-laion2B-s32B-b79K
  • /root/.cache/clip/ViT-L-14.pt

如果报错

from scripts.demo.streamlit_helpers import *
ModuleNotFoundError: No module named 'scripts'

添加环境变量

RUN echo 'export PYTHONPATH=/generative-models:$PYTHONPATH' >>  /root/.bashrc
source /root/.bashrc

再次启动
在这里插入图片描述
Okay, 没有问题了

测试

访问: 0.0.0.0:7862, 页面可以正常打开了。
在这里插入图片描述

开始操作,选择模型版本,然后打钩,速度看机器配置,在我们的电脑需要2-3分钟。
在这里插入图片描述

查看一下后台的情况
在这里插入图片描述
报错

  File "/opt/miniconda3/envs/svd/lib/python3.10/site-packages/streamlit/runtime/scriptrunner/script_runner.py", line 534, in _run_script
    exec(code, module.__dict__)
  File "/root/workspace/generative-models/scripts/demo/video_sampling.py", line 142, in <module>
    value_dict["cond_frames"] = img + cond_aug * torch.randn_like(img)
TypeError: randn_like(): argument 'input' (position 1) must be Tensor, not NoneType

在这里插入图片描述

这是因为我们没有选择图片的缘故,上传图片
在这里插入图片描述
我们用官方提供的图片,先做测试
在这里插入图片描述
红色框的帧数改为 2,太大了,容易报显存错误,其他参数保持不变。点击 ‘Sample’,然后看一下后台
在这里插入图片描述
Okay,处理完之后,可以看一下视频,视频保存在:

generative-models/outputs/demo/vid/svd_image_decoder/samples

可以看到一个2秒的视频,已经生成了
在这里插入图片描述


AIGC群交流

在这里插入图片描述
在这里插入图片描述


http://www.niftyadmin.cn/n/5209956.html

相关文章

可以ping通IP但是无法远程连接-‘telnet‘ 不是内部或外部命令,也不是可运行的程序或批处理文件

起因 一开始远程连接IP&#xff0c;报错&#xff0c;怀疑是自己网络原因&#xff0c;但是同事依旧无法连接 怀疑是自己防火墙的原因&#xff0c;查看关闭依旧无法连接 问题 两个地址可以ping通排除防火墙缘故 怀疑端口&#xff0c;测试端口 然 解决方案 winR 输入control…

MySQL与Redis如何保证数据的一致性

文章目录 MySQL与Redis如何保证数据的一致性&#xff1f;不好的方案1. 先写 MySQL&#xff0c;再写 Redis2. 先写 Redis&#xff0c;再写 MySQL3. 先删除 Redis&#xff0c;再写 MySQL 好的方案4. 先删除 Redis&#xff0c;再写 MySQL&#xff0c;再删除 Redis5. 先写 MySQL&am…

Python大语言模型实战-记录一次用ChatDev框架实现爬虫任务的完整过程

1、模型选择&#xff1a;GPT4 2、需求&#xff1a;在win10操作系统环境下&#xff0c;基于python3.10解释器&#xff0c;爬取豆瓣电影Top250的相关信息&#xff0c;包括电影详情链接&#xff0c;图片链接&#xff0c;影片中文名&#xff0c;影片外国名&#xff0c;评分&#x…

浅谈C#在unity应用中的工厂模式

文章目录 前言简单工厂模式工厂方法模式抽象工厂模式Unity实战 前言 工厂模式是一种创建型设计模式&#xff0c;它提供了一种将对象的实例化过程封装起来的方法&#xff0c;使得客户端代码不必直接依赖于具体类。这有助于降低代码的耦合度&#xff0c;提高代码的可维护性和可扩…

HashMap,1.7与1.8的区别,HashMap的扩容方式有哪些

HashMap,1.7与1.8的区别 底层数据结构的区别 JDK 1.8之前&#xff1a; 1&#xff09;JDK1.8 之前HashMap 底层是数组和链表结合在一起使用也就是链表散列。 2&#xff09;HashMap 通过key 的hashCode 经过扰动函数处理过后得到hash 值&#xff0c;然后通过(n - 1&#xff09…

内网穿透的应用-如何在本地安装Flask,以及将其web界面发布到公网上并进行远程访问

轻量级web开发框架&#xff1a;Flask本地部署及实现公网访问界面 文章目录 轻量级web开发框架&#xff1a;Flask本地部署及实现公网访问界面前言1. 安装部署Flask2. 安装Cpolar内网穿透3. 配置Flask的web界面公网访问地址4. 公网远程访问Flask的web界面 前言 本篇文章讲解如何…

React Hooks函数之useRef

useRef 是 React 中常用的 Hook 之一&#xff0c;它返回一个可变的 ref 对象&#xff0c;其 .current 属性被初始化为传入的参数&#xff08;initialValue&#xff09;。返回的 ref 对象在组件的整个生命周期内保持不变。 以下是一些使用 useRef 的场景和示例&#xff1a; 1、…

electron 问题记录

23年11月24 electron项目npm install 卡在一个地方不动 原因&#xff1a;主要是 install electron 会卡住 解决方法&#xff1a; # 先解决install electron卡死 npm install -g cnpm --registryhttps://registry.npmmirror.com cnpm install electron# 然后下载其他依赖 np…