投资安全的配资平台 GPT-4o暴露傻瓜缺陷,大模型无一幸免!港中文等发布视觉听觉基准
2025-01-07编辑:LRST 【新智元导读】多模态大模型在听觉上,居然也出现了「9.119.8」的现象,音量大小这种简单问题都识别不了!港中文、斯坦福等大学联合发布的AV-Odyssey基准测试,包含26个视听任务,覆盖了7种声音属性,跨越了10个不同领域,确保测试的深度和广度。 在人工智能领域,我们一直以为顶尖的多模态大模型已经无所不能,GPT-4o在ASR(音频转文字)任务上已经达到了97%的正确率,更是凸显了强大的音频理解能力。 然而,最近一项来自香港中文大学、斯坦福大学、伯克利大学和耶鲁大学的研究成