小智头像图片
AI动态资讯 2025年02月27日
0 收藏 0 点赞 159 浏览 1430 个字
摘要 :

超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!: 2 月 25 日消息,阿里云旗下视觉生成基座模型万相 2.1(Wan)重磅开源,此次开源采用最宽松的 Apache2.0 协议……

哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。

超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!

超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!:

2 月 25 日消息,阿里云旗下视觉生成基座模型万相 2.1(Wan)重磅开源,此次开源采用最宽松的 Apache2.0 协议,14B 和 1.3B 两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在 Github、HuggingFace 和魔搭社区下载体验。

开源地址:

Github: https://github.com/Wan-Video

HuggingFace: https://huggingface.co/Wan-AI

魔搭社区:https://modelscope.cn/organization/Wan-AI

超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!

据介绍,14B 万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集 VBench 中,万相 2.1 以总分 86.22% 的成绩大幅超越 Sora、Luma、Pika 等国内外模型,稳居榜首位置。1.3B 版本测试结果不仅超过了更大尺寸的开源模型,甚至还接近部分闭源模型,同时能在消费级显卡运行,仅需 8.2GB 显存就可以生成高质量视频,适用于二次模型开发和学术研究。

超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!

(万相 2.1 以总分 86.22% 的成绩稳居 VBench 榜单第一)

在算法设计上,万相基于主流 DiT 架构和线性噪声轨迹 Flow Matching 范式,研发了高效的因果 3D VAE、可扩展的预训练策略等。以 3D VAE 为例,为了高效支持任意长度视频的编码和解码,万相在 3D VAE 的因果卷积模块中实现了特征缓存机制,从而代替直接对长视频端到端的编解码过程,实现了无限长 1080P 视频的高效编解码。此外,通过将空间降采样压缩提前,在不损失性能的情况下进一步减少了 29% 的推理时内存占用。

万相团队的实验结果显示,在运动质量、视觉质量、风格和多目标等 14 个主要维度和 26 个子维度测试中,万相均达到了业界领先表现,并且斩获 5 项第一。尤其在复杂运动和物理规律遵循上的表现上大幅提升,万相能够稳定展现各种复杂的人物肢体运动,如旋转、跳跃、转身、翻滚等;能够精准还原碰撞、反弹、切割等复杂真实物理场景。

超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!

(万相在 14 个主要维度测试中斩获 5 项第一及平均分第一)

从 2023 年开始,阿里云就坚定大模型开源路线,其千问(Qwen)衍生模型数量已超过 10 万个,是全球最大的 AI 模型家族。随着万相的开源,阿里云实现了全模态、全尺寸大模型的开源。

生成效果如何
下面我们可以看下万相 2.1 的实际生成效果。

输入 Prompt:

体育摄影风格,骑手在场地障碍赛中引导马匹快速通过障碍物。骑手身着专业比赛服,头戴安全帽,表情专注而坚定,双手紧握缰绳,双腿夹紧马腹,与马匹完美配合。马匹腾空跃起,动作连贯且准确,四蹄有力地踏过每一个障碍物,保持速度和平衡。背景是自然的草地和蓝天,画面充满动感和紧张感。4K, 高清画质, 动作完整。

生成图片:

超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!

输入 Prompt:

体育摄影风格,中国皮划艇运动员在激流回旋比赛中,于湍急的水流中用桨快速划水,灵活地绕过一个又一个障碍物。他身着专业运动服,肌肉线条明显,表情专注而坚定,展现出出色的操控技术和顽强的拼搏精神。背景是清澈的河流和翠绿的山峦,画面充满动感与活力。近景特写,运动员在空中翻转滑板,动作完整,4K, 高清画质。

生成图片:

超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!

输入 Prompt:

一段超速 POV 镜头,摄像机疾驰穿越一条阳光下的中国乡村小路,镜头紧跟着一个在空中飞行的穿着休闲服休闲鞋的中国女子的背后,她身体直立展开双臂,风吹动她的头发和衣服。

生成图片:

超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!

嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!

微信打赏二维码 微信扫一扫

支付宝打赏二维码 支付宝扫一扫

版权: 转载请注明出处:https://www.ai-blog.cn/5523.html

相关推荐

Vidu Q1视频大模型技术解析与行业影响: 一、技术突破:性能全面超越国际竞品 Vidu Q1在视频生成领…

小智头像图片
152

欧盟AI生成内容溯源法案深度解析: 一、法案核心要求与执行框架 欧盟《人工智能法案》(AI Act)作…

小智头像图片
112

寒武纪2025Q1业绩深度解析: 一、历史性盈利突破 寒武纪2025年第一季度实现营收11.11亿元,同比…

小智头像图片
46

腾讯混元3D引擎V2.5技术升级深度解析: 一、几何生成革命:速度与精度双突破 本次升级核心亮点在于…

小智头像图片
87

全球首款嗅觉机器人技术解析与应用前景: 一、核心技术突破 日本Ainos公司与ugo合作开发的AI Nos…

小智头像图片
133

Claude-3 IQ突破人类水平的技术突破与伦理争议: 一、门萨测试里程碑与认知跃升 Claude-3在挪威门…

小智头像图片
145

AI宠物市场爆发式增长深度解析: 一、市场规模与增长动力 全球AI宠物设备市场正经历指数级增长,预…

小智头像图片
158

华为昇腾910C芯片量产关键信息解析: 一、量产启动与技术参数 华为昇腾910C作为首款国产7nm AI训练…

小智头像图片
83
发表评论
暂无评论

还没有评论呢,快来抢沙发~

助力原创内容

快速提升站内名气成为大牛

扫描二维码

手机访问本站

二维码
vip弹窗图片