7月26日,智谱AI宣布推出基于大模型技术的AI视频生成平台“清影(Ying)”。
智谱AI成立于致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司合作研发了中英双语千亿级超大规模预训练模型GLM-130B,并基于此推出对话模型,开源单卡版模型-6B。同时,团队还打造了AIGC模型及产品矩阵,包括AI提效助手智谱清言()、高效率代码模型、多模态理解模型和文生图模型等。公司践行Model as a (MaaS)的市场理念,推出大模型MaaS开放平台(),打造高效率、通用化的“模型即服务”AI开发新范式。通过认知大模型链接物理世界的亿级用户,智谱AI基于完整的模型生态和全流程技术支持,为千行百业带来持续创新与变革,加速迈向通用人工智能的时代。
今年2月16日,发布文字生成视频的大模型Sora。Sora根据用户简单几句提示,便能准确“理解”文本,生成长达60秒的视频,引发全球关注。一些业内人士将Sora的问世称为视频生成领域的“ 时刻”。
“清影”平台利用智谱AI自研的DiT模型架构,结合了文本、时间和空间三个维度,通过优化算法,实现了视频内容的高效生成。
与前代技术相比,“清影”的推理速度提升了6倍,理论上生成6秒视频仅需30秒。用户可以通过输入一段文字(),即可选择多种风格,如卡通3D、黑白、油画、电影感等,生成清晰度的高精度视频。
此外,平台还支持图片生成视频。“清影”现已在清言App全面上线,面向所有用户开放。“清影”API也同步上线至智谱AI大模型开放平台。
截至目前,国内的基于大模型技术的AI视频生成平台展现出了强大的潜力和创新能力,但仍存在一些局限。
首先,国内的大模型技术在算法、硬件和算力方面均实现了自主创新,如“紫东太初”大模型,它完全依赖国产软硬件,展现了高性能的运行效率。这表明国内在人工智能领域的技术研发方面取得了显著进步,尤其是在大模型的开发和应用上,已经达到了国际先进水平。
视频生成大模型如Sora的问世,不仅推动了AIGC技术在全球范围的进步,还引发了对中国在未来全球AI竞争中技术创新能力的关注。这表明国内在视频生成大模型领域已经取得了重要的技术突破,具有全球竞争力。
然而,尽管Sora等平台的出现引起了广泛关注,但它们的实际应用能力还有待提高。例如,Sora的文本到视频生成技术目前还难以进行精细的局部调整,如果用户希望修改视频中的某个具体细节,可能需要进行复杂的手工编辑,这不仅工作量大,而且要求用户具备一定的视频编辑技能。此外,Sora每次生成的视频内容有较大变化,难以保持一致的叙事风格或视觉风格,这对于需要高度一致性的影视作品来说是一个挑战。
整体来看,国内基于大模型技术的AI视频生成平台在技术创新和应用潜力方面表现出了强大的实力,尽管目前还存在一些技术和应用上的局限,但随着技术的不断进步和应用场景的拓展,这些平台有望在未来发挥更大的作用。
323AI导航网发布