精选全球实用AIGC工具箱
标签:多模态模型
智谱清言 智谱AI的“类GPT-4o”,让我看到了作业帮、小红书、下厨房的影子
卷出第一个国产版GPT-4o的,是智谱AI。智谱AI的2024年主题,一定是在多模态赛道上狂奔。先是2024年7月26日,智谱AI上线了类Sora的视频生成模型“智谱清影”。
智谱清言 智谱AI的“类GPT-4o”,让我看到了作业帮、小红书、下厨房的影子
卷出第一个国产版GPT-4o的,是智谱AI。智谱AI的2024年主题,一定是在多模态赛道上狂奔。先是2024年7月26日,智谱AI上线了类Sora的视频生成模型“智谱清影”。
多模态模型 多模态大模型如何改变我们的生活?
文章浏览阅读1.3k次,点赞18次,收藏12次。2022年,OpenAI 的ChatGPT 3.5 横空出世,搅动了整个AI 行业。
多模态模型 【文献阅读】MUTAN——多模态塔克融合VQA模型(Hedi Ben-younes等人,ArXiv,2017,有代码)
文章浏览阅读4.3k次,点赞5次,收藏25次。MUTAN模型,基于多模态塔克融合的VQA解决方案,有效解决双线性模型的维度爆炸问题,通过张量分解和结构化稀疏约束
多模态模型 【文献阅读】MUTAN——多模态塔克融合VQA模型(Hedi Ben-younes等人,ArXiv,2017,有代码)
文章浏览阅读4.3k次,点赞5次,收藏25次。MUTAN模型,基于多模态塔克融合的VQA解决方案,有效解决双线性模型的维度爆炸问题,通过张量分解和结构化稀疏约束
多模态模型 AI大一统:阿里达摩院发布多任务、多模态统一模型OFA
文章浏览阅读1.6k次。引言:我们正处于一个“多模多任务大统一”的AI时代。老铁们,上图是对动漫《海贼王》所选框的文字描述(Zero-shot测试)
多模态模型 多模态大模型暴露短板?EMMA基准深度揭秘多模态推理能力
「三个点电荷 + Q、-2Q 和 + 3Q 等距放置,哪个向量最能描述作用在 + Q 电荷上的净电力方向?这进一步证明视觉推理是主要的性能瓶颈。
多模态模型 多模态大模型暴露短板?EMMA基准深度揭秘多模态推理能力
「三个点电荷 + Q、-2Q 和 + 3Q 等距放置,哪个向量最能描述作用在 + Q 电荷上的净电力方向?这进一步证明视觉推理是主要的性能瓶颈。
多模态模型 多模态扩散模型开始爆发,这次是高速可控还能学习推理的LaViDa
近段时间,离散的扩散模型开始崛起,甚至被许多人认为是自回归 LLM 的一种有力替代
多模态模型 多模态扩散模型开始爆发,这次是高速可控还能学习推理的LaViDa
近段时间,离散的扩散模型开始崛起,甚至被许多人认为是自回归 LLM 的一种有力替代