全球2200万用户翘首以盼的可灵AI 2.0今日正式上线!仅用10个月,月活用户激增25倍,累计生成超1.68亿个视频——这一数据背后,是AI视频创作领域的一次颠覆性革新。快手旗下可灵AI在“灵感成真”发布会上,推出可灵2.0视频生成模型和可图2.0图像生成模型,首次实现“文字+图片+视频”多模态融合创作,彻底打破传统单一文字驱动的生成逻辑。
创意配图:可灵AI
核心升级一:多模态交互,让创意“活”起来
过去的AI视频生成依赖文字描述,而可灵2.0的“多模态视觉语言(MVL)”功能,允许用户混合输入文字、图片、视频片段,甚至通过“@图片1+@视频2”的指令组合,精准传递复杂场景。例如,用户可上传一张婚纱照、一段动漫视频,并输入“替换主角为@图片1”,即可生成身着婚纱的动漫角色动态。
这一技术不仅支持元素的增、删、改,还能智能调整光线、色彩,确保新元素与原始视频无缝融合。实测中,用户甚至能将士兵替换为机器人,并动态添加攻击动作,全程无需专业剪辑技能。
核心升级二:视频生成能力碾压级提升
可灵2.0在动态质量、语义响应、画面美学三大维度实现飞跃。例如,输入“男人从开心大笑到愤怒捶桌”的指令,模型能精准捕捉情绪转折与肢体动作;而10秒的“换弹反击”场景中,子弹轨迹、角色呼吸、拉栓声效等细节一气呵成,远超同类模型表现。
对比测试显示,可灵2.0在文生视频领域对Sora的胜负比高达367%,图生视频更以1000分的评测成绩登顶全球榜首。
可图2.0:艺术创作的天花板再突破
图像模型可图2.0同样亮眼,支持60多种艺术风格转绘,电影级质感与指令遵循能力显著增强。例如,普通照片可通过“吉卜力风格”一键转换,局部重绘功能可修复瑕疵或扩展画面背景,甚至通过“荷兰角构图+动感模糊”等专业术语生成悬疑大片。
其光线处理与氛围营造能力尤为突出——一张威士忌酒杯的静物图,通过低饱和度色彩与阴影对比,瞬间渲染出电影《教父》般的宿命感。
商业化与用户增长:AI创作的黄金时代已至
自2024年6月上线以来,可灵AI已完成超20次迭代,累计营收突破1亿元,用户覆盖全球2200万创作者。10个月内月活增长25倍的爆发式数据,印证了市场对高效创作工具的迫切需求。
行业影响:AI工具如何重塑创作生态?
可灵2.0的发布,标志着AI从“辅助工具”向“创意伙伴”的转型。多模态交互降低了创作门槛,但如何平衡技术便利与人文表达,仍是创作者面临的挑战。正如快手高级副总裁盖坤所言:“AI应服务于人类想象力,而非取代创造力。”
可灵AI 2.0的横空出世,不仅重新定义了视频生成的技术边界,更开启了“人人皆可导演”的新纪元。当技术突破与用户需求同频共振,这场AI创作的革命,或许才刚刚开始。
(本文综合自发布会实录及多平台实测数据)
323AI导航网发布