精选全球实用AIGC工具箱
标签:多模态模型
多模态模型 群雄争霸多模态大模型
21世纪经济报道记者雷晨 北京报道 随着AI技术演进和应用场景的不断拓宽,多模态交互已经成为AI应用的重要趋势之一。海内外科技企业相继布局AI视频生成赛道。
大语言模型 多模态模型挑战北京杭州地铁图!o3成绩显著,但跟人类有差距
ReasonMap团队 投稿 量子位 | 公众号 QbitAI 近年来,大语言模型(LLMs)以及多模态大模型(MLLMs)在多种场景理解和复杂推理任务中取得突
多模态模型 让大模型看图比打字管用!NeurIPS 2023新研究提出多模态查询方法
转载自 沁园夏量子位 | 公众号 QbitAI大模型“识图”能力都这么强了,为啥还老找错东西?例如,把长得不太像的蝙蝠和拍子搞混,又或是认不出一些数据集中的稀有...
多模态模型 字节Seed开源统一多模态理解和生成模型BAGEL
IT之家 6 月 3 日消息,字节跳动 Seed 团队上周宣布开源统一多模态理解和生成模型 BAGEL,该模型支持文本、图像和视频的统一理解和生成。
多模态模型 多模态能力全球TOP3,来自中国从容大模型
白交 发自 凹非寺量子位 | 公众号 QbitAI国产多模态大模型的头号交椅,再次易主——来自云从科技的从容大模型,登上OpenCompass权威榜单,仅次于GPT-
多模态模型 ACL 2024 | 多模态大模型能揭示图像背后的深意吗?
来源:PaperWeekly本文约3000字,建议阅读5分钟本文介绍了多模态大模型能揭示图像背后的深意。
多模态模型 让模型像o3一样动手搜索,写代码!Visual ARFT实现多模态智能体能力
在大型推理模型(例如 OpenAI-o3)中,一个关键的发展趋势是让模型具备原生的智能体能力。具体来说,就是让模型能够调用外部工具(如网页浏览器)进行搜索
多模态模型 SmolVLM:资源受限环境下的高效多模态模型研究
来源:Deephub Imba本文共5000字,建议阅读5分钟本文介绍了SmolVLM模型在资源受限环境下的高效多模态模型研究。
多模态模型 多模态LLM多到看不过来?先看这26个SOTA模型吧
机器之心报道机器之心编辑部多模态大型语言模型进展如何?盘点 26 个当前最佳多模态大型语言模型。当前 AI 领域的关注重心正从大型语言模型(LLM)向多模态转...
多模态模型 坚持不做Sora,百度为何又开始重视多模态大模型?
界面新闻记者 | 肖芳界面新闻编辑 | 文姝琪百度正在强化文心大模型的多模态理解能力。在百度AI Day上,百度集团副总裁吴甜详细解释了其最新发布的两款模型文...