标签:多模态模型

智谱清言‌ 智谱AI的“类GPT-4o”,让我看到了作业帮、小红书、下厨房的影子

卷出第一个国产版GPT-4o的,是智谱AI。智谱AI的2024年主题,一定是在多模态赛道上狂奔。先是2024年7月26日,智谱AI上线了类Sora的视频生成模型“智谱清影”。

智谱清言‌ 智谱AI的“类GPT-4o”,让我看到了作业帮、小红书、下厨房的影子

卷出第一个国产版GPT-4o的,是智谱AI。智谱AI的2024年主题,一定是在多模态赛道上狂奔。先是2024年7月26日,智谱AI上线了类Sora的视频生成模型“智谱清影”。

多模态模型‌ 多模态大模型如何改变我们的生活?

文章浏览阅读1.3k次,点赞18次,收藏12次。2022年,OpenAI 的ChatGPT 3.5 横空出世,搅动了整个AI 行业。

多模态模型‌ 【文献阅读】MUTAN——多模态塔克融合VQA模型(Hedi Ben-younes等人,ArXiv,2017,有代码)

文章浏览阅读4.3k次,点赞5次,收藏25次。MUTAN模型,基于多模态塔克融合的VQA解决方案,有效解决双线性模型的维度爆炸问题,通过张量分解和结构化稀疏约束

多模态模型‌ 【文献阅读】MUTAN——多模态塔克融合VQA模型(Hedi Ben-younes等人,ArXiv,2017,有代码)

文章浏览阅读4.3k次,点赞5次,收藏25次。MUTAN模型,基于多模态塔克融合的VQA解决方案,有效解决双线性模型的维度爆炸问题,通过张量分解和结构化稀疏约束

多模态模型‌ AI大一统:阿里达摩院发布多任务、多模态统一模型OFA

文章浏览阅读1.6k次。引言:我们正处于一个“多模多任务大统一”的AI时代。老铁们,上图是对动漫《海贼王》所选框的文字描述(Zero-shot测试)

多模态模型‌ 多模态大模型暴露短板?EMMA基准深度揭秘多模态推理能力

「三个点电荷 + Q、-2Q 和 + 3Q 等距放置,哪个向量最能描述作用在 + Q 电荷上的净电力方向?这进一步证明视觉推理是主要的性能瓶颈。

多模态模型‌ 多模态大模型暴露短板?EMMA基准深度揭秘多模态推理能力

「三个点电荷 + Q、-2Q 和 + 3Q 等距放置,哪个向量最能描述作用在 + Q 电荷上的净电力方向?这进一步证明视觉推理是主要的性能瓶颈。

多模态模型‌ 多模态扩散模型开始爆发,这次是高速可控还能学习推理的LaViDa

近段时间,离散的扩散模型开始崛起,甚至被许多人认为是自回归 LLM 的一种有力替代

多模态模型‌ 多模态扩散模型开始爆发,这次是高速可控还能学习推理的LaViDa

近段时间,离散的扩散模型开始崛起,甚至被许多人认为是自回归 LLM 的一种有力替代
1 2 3