AI视频生成工具哪家强?
更新时间:2024-12-23 15:06 浏览量:46
视频生成工具越来越多,即梦/可灵/海螺/清影/Vidu等,哪个适合我?
(1)开路者Sora
今年春节期间炸出AIGC领域的一个关键事件:Sora
2024 年 2 月 16 日凌晨OpenAI 首次发布文生视频模型Sora,展示了 48 个惊艳的视频,包括行人在日本街头行走、狗在雪地中玩耍、中国龙年舞龙等丰富场景。但是,Sora仅允许极少数人体验,处于Demo状态,大部分只能干瞪眼。2024 年 12 月 10 日凌晨吃瓜群众等了足足10个月,OpenAI 将于2025年正式推出 Sora,ChatGPT 会员可直接使用 Sora Turbo,Plus 用户每月 50 次生成配额,支付每月 200 美元的 Pro 用户享无限慢速模式和 500 次快速通道。注:以上内容参考豆包桌面版,验证无误,豆包进步神速,看来搜索引擎的末日来了。
一个简单文本提示词:
A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage.就能生成电影画质的视频
当然,视频没有声音,默片。
2024年3月,音乐生成工具 Suna AI诞生,借助Suno AI V3,可直接输入文本生成配乐,拼接到视频上。
默片变有声电影。
详见往期文章《音乐生成:如果给Sora加上声音会怎么样》
而这次发布的Sora据说能以各种宽高比生成长达 20 秒的 1080p 视频,拭目以待。
(2)视频生成工具
Sora发布后,大家快速跟进,纷纷复现Sora技术方案,如:Latte、Open-Sora、Vidu等,并先于OpenAI发布自己的产品。
知名工具包括:
国内:即梦AI、智谱清影、可灵AI、海螺、Vidu等国外:Runway、Pika、Stable Video、Luma Dream Machine等一图对比Stable Video、Runway、Pika效果,与Sora相当。
这些工具效果怎么样?
有人对国内外主流工具做了简单评测。
(2.1)生成速度
生成速度方面
Pika:1min
Pika最快:1分钟快速生成视频。国外工具中,Luma Dream Machine 服务器拥堵导致生成速度大幅下降,其他工具均在2分钟内稳定生成视频。国内工具中,即梦AI和Vidu表现稳定,生成速度一般不超过5分钟,即使高峰期也未拥堵。相比之下,可灵AI和智谱清影在高峰期生成速度有所下降。(2.2)内容时长
各工具免费时,一次生成的视频内容时长不同。
即梦:12s>清影、Luma Dream Machine:6s>可灵5s>Vidu、Stable Video 、Runway:4s>Pika:3s
即梦AI以2分钟生成12秒视频内容的最长时长占据优势而Pika则最短,仅为3秒。国内工具中,可灵AI和智谱清影分别能生成5秒和6秒视频内容Vidu和国外部分工具则介于4-6秒之间。(2.3)视频内容呈现效果
从AI拟人化、物理定律、运镜、人物一致性、视频风格、多人场景等多个维度进行评定。
AI拟人化:即梦AI和可灵AI在模拟人类动作方面表现突出,如柴犬看报纸、女孩倒牛奶等场景均能较好呈现。而国外工具在此方面表现不一,部分工具出现动作不自然或指令理解错误的情况。物理定律:各工具在遵循物理定律方面表现均较为稳定,未出现明显违反物理定律的情况。运镜:即梦AI、可灵AI和智谱清影在运镜方面表现优秀,能准确控制运镜轨迹和画面缩放。而国外工具中,Stable Video因画质问题稍逊一筹,Pika则因只描绘了一只蝴蝶而未能完全满足指令要求。人物一致性:即梦AI、Vidu和可灵AI在保持人物一致性方面表现较好,未出现五官扭曲或动作不连贯,其他工具则在此方面存在不足。视频风格:各有千秋,即梦AI在卡通形象刻画方面表现突出,而智谱清影则在真实场景还原方面更具优势。多人场景:即梦AI、Runway和智谱清影在描绘多人场景时表现较好,准确呈现多个人物的动作和互动。而国外工具中,Stable Video因每天免费使用次数限制未能参与此维度测试。(2.4)总结
8款国内外免费工具评测总结
国内3款工具评分占据前三而国外4款工具中只有Runway超越了国产vidu即梦AI表现出色,视频内容效果评分最高。视频生成上,国内外技术代差并没有想象的那么大,反而领先国外(按下不表,待有机会实测),大家不要灰心。
详见:可信AI进展评测原文,https://blog.csdn.net/m0_56647251/article/details/141824350
(3)国产工具
由于国外产品访问不便,还是重点关注国内视频生成工具:即梦/可灵/海螺/清影/Vidu等(排名不分先后)。
视频生成上,各家基本都支持文生视频、图生视频,各家产品主页面如下。
① 字节跳动即梦AI
地址:https://jimeng.jianying.com/ai-tool/video/generate
② 快手可灵
地址:https://klingai.kuaishou.com/image-to-video/new
③ Minimax 海螺AI
地址:https://hailuoai.com/video/create
④ 智谱华章 清影
地址:https://chatglm.cn/video
⑤ 生数科技+清华 Vidu
地址:http://www.vidu.studio/
横向对比各家工具基本属性
总结
功能:文生视频、图生视频是必备项,即梦/可灵集成了文生图,即梦还有对口型(抖音特效),vidu有参考生视频,清影有音效(付费)收费:新用户都有一定免费体验额度,大多采用积分制,即梦、海螺每天登录有奖励,可灵、vidu是月度积分,清影没有积分制;付费一般每月58-100元范围,每次使用会消耗积分,整体上,vidu和清影对用户最为慷慨视频时长:4-6s为主,可灵、清影支持10s并发:免费用户一般只能一次生成1个视频,海螺可以生成3个视频其它:视频长宽比、运镜、清晰度等(4)视频生成哪家强?
说了一堆,大家最关心的还是视频质量。
国产工具真的有那么厉害吗?
那就自己动手实测下,拿一手资料。
(4.1)评测集
小规模评测
目标:测试文生视频、图生视频场景下的视频生成质量数据:文本提示语、条件图片,各4个随机样本,未特殊处理。方法:不同工具使用相同提示语、图片,测试各个功能文本提示语:
两只猫在打架两只凤凰在荷花池中飞过观音站起来,双手作揖,拿着宝瓶,笑着跟你打招呼先生牵着姑娘,有说有笑的向前走条件图片:(用于图生视频)
随机挑了4张测试图片,覆盖实拍/特效图,动物/植物/人/物体其中,古装人物+自在观影雕塑拍摄于国家博物馆。提示语基于图片设计,隐藏动作、虚拟物体、表情(4.2)文生视频
分别用4个提示语测试各工具文生视频效果
其中,可灵免费额度、请求速度受限,缺失1组结果
汇总分析:
免费工具文生视频效果总结:
整体效果:即梦>海螺>可灵>vidu>清影即梦:侧重现实场景海螺:电影风格,细腻可灵:特写镜头,生成速度太慢,缺失一组样本Vidu:卡通动画风格,使用便利清影:免费版效果就算了视频样例见附录
(4.3)图生视频
继续分别用4个提示语+条件图片,测试各工具图生视频效果
其中,可灵免费额度、请求速度受限,缺失两组结果
汇总分析:
免费工具图生视频效果总结:
整体效果:海螺>vidu>即梦>可灵>清影海螺是唯一全部合格的工具,其余工具不达标(可灵缺失两组数据)即梦:侧重现实场景可灵:动作理解欠缺,生成速度太慢,缺失两组样本Vidu:人物识别、动作理解较好清影:免费版还是算了视频样例见附录
(5)问题
尽管AI视频生成工具在生成速度、内容时长和呈现效果等方面进步显著,但离“一人搞定一部影视作品”还有一定距离
首先,自动生成视频内容,在创意构思、剧本编写、角色设定等方面仍需人类参与。其次,细节处理、情感表达等方面仍然不足,还难以替代人类创作者。最后,影视作品制作涉及多个环节和团队协作,仅凭一人使用AI工具难以完成整个制作过程。因此,虽然AI视频生成工具很强,但仍有局限,需理性看待。
AI工具还是要结合人类创作者的智慧和专业技能,才能完成更好的影视作品。
评测效果视频: 抖音地址