可灵AI视频‌ 可灵AI 2.0震撼发布:视频生成进入多模态时代,创作效率飙升25倍

默认分类4周前发布 admin
1,011 0
ChatGPT国内版

全球2200万用户翘首以盼的可灵AI 2.0今日正式上线!仅用10个月,月活用户激增25倍,累计生成超1.68亿个视频——这一数据背后,是AI视频创作领域的一次颠覆性革新。快手旗下可灵AI在“灵感成真”发布会上,推出可灵2.0视频生成模型和可图2.0图像生成模型,首次实现“文字+图片+视频”多模态融合创作,彻底打破传统单一文字驱动的生成逻辑。

创意配图:可灵AI

核心升级一:多模态交互,让创意“活”起来

过去的AI视频生成依赖文字描述,而可灵2.0的“多模态视觉语言(MVL)”功能,允许用户混合输入文字、图片、视频片段,甚至通过“@图片1+@视频2”的指令组合,精准传递复杂场景。例如,用户可上传一张婚纱照、一段动漫视频,并输入“替换主角为@图片1”,即可生成身着婚纱的动漫角色动态。

这一技术不仅支持元素的增、删、改,还能智能调整光线、色彩,确保新元素与原始视频无缝融合。实测中,用户甚至能将士兵替换为机器人,并动态添加攻击动作,全程无需专业剪辑技能。

可灵AI视频‌ 可灵AI 2.0震撼发布:视频生成进入多模态时代,创作效率飙升25倍

核心升级二:视频生成能力碾压级提升

可灵2.0在动态质量、语义响应、画面美学三大维度实现飞跃。例如,输入“男人从开心大笑到愤怒捶桌”的指令,模型能精准捕捉情绪转折与肢体动作;而10秒的“换弹反击”场景中,子弹轨迹、角色呼吸、拉栓声效等细节一气呵成,远超同类模型表现。

对比测试显示,可灵2.0在文生视频领域对Sora的胜负比高达367%,图生视频更以1000分的评测成绩登顶全球榜首。

可图2.0:艺术创作的天花板再突破

图像模型可图2.0同样亮眼,支持60多种艺术风格转绘,电影级质感与指令遵循能力显著增强。例如,普通照片可通过“吉卜力风格”一键转换,局部重绘功能可修复瑕疵或扩展画面背景,甚至通过“荷兰角构图+动感模糊”等专业术语生成悬疑大片。

其光线处理与氛围营造能力尤为突出——一张威士忌酒杯的静物图,通过低饱和度色彩与阴影对比,瞬间渲染出电影《教父》般的宿命感。

商业化与用户增长:AI创作的黄金时代已至

可灵AI视频‌ 可灵AI 2.0震撼发布:视频生成进入多模态时代,创作效率飙升25倍

自2024年6月上线以来,可灵AI已完成超20次迭代,累计营收突破1亿元,用户覆盖全球2200万创作者。10个月内月活增长25倍的爆发式数据,印证了市场对高效创作工具的迫切需求。

行业影响:AI工具如何重塑创作生态?

可灵2.0的发布,标志着AI从“辅助工具”向“创意伙伴”的转型。多模态交互降低了创作门槛,但如何平衡技术便利与人文表达,仍是创作者面临的挑战。正如快手高级副总裁盖坤所言:“AI应服务于人类想象力,而非取代创造力。”

可灵AI 2.0的横空出世,不仅重新定义了视频生成的技术边界,更开启了“人人皆可导演”的新纪元。当技术突破与用户需求同频共振,这场AI创作的革命,或许才刚刚开始。

(本文综合自发布会实录及多平台实测数据)

323AI导航网发布

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...