零基础

Ai图生视频第二章之DynamiCrafter篇

小智 AI视频教程 2025年02月10日

0 收藏 0 点赞 438 浏览 2288 个字

摘要 :

Ai图生视频第二章之DynamiCrafter篇： DynamiCrafter 是一个基于视频扩散先验技术的开源项目，能够将静态图像转换为动画视频。它支持多种主题和风格，并允许通过文本控……

哈喽！伙伴们，我是小智，你们的AI向导。欢迎来到每日的AI学习时间。今天，我们将一起深入AI的奇妙世界，探索“Ai图生视频第二章之DynamiCrafter篇”，并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知，只需唤醒你的潜能！”跟着小智的步伐，我们终将学有所成，学以致用，并发现自身的更多可能性。话不多说，现在就让我们开始这场激发潜能的AI学习之旅吧。

Ai图生视频第二章之DynamiCrafter篇：

DynamiCrafter 是一个基于视频扩散先验技术的开源项目，能够将静态图像转换为动画视频。它支持多种主题和风格，并允许通过文本控制动画运动，广泛应用于数字媒体、教育、艺术创作等领域。本文将为您详细介绍 DynamiCrafter 的功能特点、应用场景以及如何快速上手使用。

《Ai图生视频教程PDF》电子版下载

《Ai图生视频教程PDF》电子版下载：AI 图生视频系列教程：从静态到动态的奇妙转变在数字化时代，AI 技术的飞速发展为视频创作领域带来...

查看文章

一、前言介绍

1.1 DynamiCrafter 是什么？
DynamiCrafter 是由香港中文大学、腾讯 AI 实验室和北京大学联合开发的一款图像动画化工具。它利用视频扩散先验技术，将静态图像转化为动态视频，涵盖风景、人物、动物、交通工具等多种主题。此外，用户还可以通过文本指令控制动画运动，为创作提供更大的灵活性。

1.2 运行环境介绍
– Python 3.8 及以上版本。
– PyTorch 2.0 及以上版本。
– 建议使用 CUDA 12.1 及以上版本（适用于 GPU 用户）。

1.3 DynamiCrafter 的主要特点
1. 视频扩散先验技术：模拟真实世界的运动模式，生成高质量动画。
2. 开放域图像动画化：支持各种类型的静态图像，不限主题或风格。
3. 多种主题和风格：包括风景、人物、动物、交通工具等。
4. 文本控制运动：通过输入文本指令，灵活控制动画效果。
5. 广泛应用场景：从数字媒体到文化遗产保护，用途广泛。

1.4 DynamiCrafter 的应用场景
DynamiCrafter 在多个领域具有应用潜力：
– 数字媒体和娱乐：为电影、动画、游戏等创造动态背景和角色动画。
– 教育：制作教育视频，解释复杂概念。
– 社交媒体和营销：生成吸引人的短视频广告。
– 艺术创作：将静态作品转化为动态艺术。
– 文化遗产：将历史照片或艺术品动画化，提供互动体验。

二、环境搭建

2.1 下载代码
首先，克隆 DynamiCrafter 的代码仓库：
bash：

$ git clone https://github.com/Doubiiu/DynamiCrafter.git
$ cd DynamiCrafter

2.2 构建环境
创建并激活一个新的 Python 环境：
bash：

$ conda create -n py310 python=3.10 #创建新环境
$ source activate py310 #激活环境

2.3 安装依赖
安装必要的依赖包：
bash：

$ pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple –ignore-installed

2.4 下载模型
下载 DynamiCrafter_X 模型
例如，下载 DynamiCrafter_1024 模型：
bash：

$ git lfs install
$ git clone https://modelscope.cn/models/AI-ModelScope/DynamiCrafter_1024

下载 CLIP-ViT-H-14-laion2B-s32B-b79K 模型
bash：

$ git lfs install
$ git clone https://modelscope.cn/models/AI-ModelScope/CLIP-ViT-H-14-laion2B-s32B-b79K/

三、Image-to-Video 生成

3.1 修改配置文件
编辑脚本文件 scripts/run.sh，设置以下参数：
bash：

ckpt=checkpoints/dynamicrafter_$1_v1/model.ckpt #修改模型路径

3.2 运行
运行以下命令生成视频：
bash：

#单 GPU 推理
sh scripts/run.sh 1024

#多 GPU 并行推理
sh scripts/run_mp.sh 1024

生成效果示例：
– 风景动画：静止的山水画变为动态的河流与云彩。
– 人物动画：静态肖像中的人物开始眨眼或微笑。

四、帧插值与循环视频生成

4.1 修改配置文件
下载预训练模型 DynamiCrafter512_interp，并将 model.ckpt 放入 checkpoints/dynamicrafter_512_interp_v1/model.ckpt 目录中。

4.2 运行
运行以下命令生成帧插值或循环视频：
bash：

#帧插值
sh scripts/run_application.sh interp

#循环视频生成
sh scripts/run_application.sh loop

五、Local Gradio Demo

5.1 Image-to-Video 生成
1. 下载预训练模型，并将其放入相应的目录中。
2. 运行以下命令启动本地 Gradio 演示界面：
bash：

python gradio_app.py –res 1024

5.2 帧插值与循环视频生成
下载预训练模型，并运行以下命令：
bash：

python gradio_app_interp_and_loop.py

六、训练与微调

6.1 Image-to-Video 生成
1. 下载 WebVid 数据集，并确保 CSV 文件包含 page_dir、videoid 和 name 字段。
2. 下载预训练模型，并将其放入相应目录。
3. 修改 training_[1024|512]_v1.0/run.sh 文件中的保存路径。
4. 运行以下命令进行训练：
bash：

sh configs/training_1024_v1.0/run.sh #微调 DynamiCrafter1024

希望这篇教程能帮助您快速上手 DynamiCrafter！如果您有任何疑问或需要进一步的帮助。

Ai图生视频第三章之MOFA-Video让静态图片“活”起来

Ai图生视频第三章之MOFA-Video让静态图片“活”起来：MOFA-Video 是一项基于生成运动场适应技术的图像动画工具，能够让静态图片“活”起来。...

查看文章

嘿，伙伴们，今天我们的AI探索之旅已经圆满结束。关于“Ai图生视频第二章之DynamiCrafter篇”的内容已经分享给大家了。感谢你们的陪伴，希望这次旅程让你对AI能够更了解、更喜欢。谨记，精准提问是解锁AI潜能的钥匙哦！如果有小伙伴想要了解学习更多的AI知识，请关注我们的官网“AI智研社”，保证让你收获满满呦！

赏

微信打赏二维码微信扫一扫