标签:开放世界感知

多模态模型‌ 让大模型看图比打字管用!NeurIPS 2023新研究提出多模态查询方法

转载自 沁园夏量子位 | 公众号 QbitAI大模型“识图”能力都这么强了,为啥还老找错东西?例如,把长得不太像的蝙蝠和拍子搞混,又或是认不出一些数据集中的稀有...