首页 > 快讯 > 研究人员解锁大语言模型理解世界的新方法,与人类相当!

研究人员解锁大语言模型理解世界的新方法,与人类相当!

发布时间:2025-06-11 10:04:25 | 责任编辑:张毅 | 浏览量:10 次

据科技日报报道,中国科学院自动化研究所的科研人员近期取得了重要突破。他们首次证实,多模态大语言模型在训练过程中能够自发 “理解” 事物,其理解方式与人类的认知非常相似。这一发现不仅为我们探索人工智能的思维机制开辟了新路径,还为未来开发能够像人类一样理解世界的人工智能系统奠定了基础。这项研究成果已在《自然・机器智能》杂志上发表。
理解是人类智能的核心。当我们看到 “狗” 或 “苹果” 时,除了能够识别其外观特征,如大小、颜色和形状,我们还理解它们的用途、所带来的感受以及文化意义。这种全方位的理解能力是我们认识世界的基础。随着 ChatGPT 等大模型的迅速发展,科学家们开始思考这些模型是否能从大量文字和图片中学会像人类一样 “理解” 事物。
传统的人工智能研究多集中于物体识别的准确率,而鲜有探讨模型是否真正 “理解” 物体的内涵。中国科学院的研究员何晖光指出,尽管当前人工智能能够区分猫和狗的图片,但这种 “识别” 与人类对猫狗的 “理解” 之间的本质区别仍待深入研究。
在这项研究中,科研团队借鉴人类大脑的认知原理,设计了一个有趣的实验:让大模型与人类一起玩 “找不同” 游戏。他们从1854种常见物品中挑选出三个物品的概念,要求参与者找出最不搭的一个。通过分析470万次的判断数据,科研人员首次绘制出大模型的 “思维导图”,即 “概念地图”。
研究显示,科学家总结了66个代表人工智能 “理解” 事物的关键视角,这些视角不仅易于解释,且与人脑中负责物体加工的神经活动模式高度一致。更重要的是,能同时处理文字和图片的多模态模型在 “思考” 和选择方面与人类的方式更为接近。
有趣的是,当人类进行判断时,会同时考虑物体的外观特征和其意义或用途,而大模型则更依赖于它所获得的 “文字标签” 和抽象概念。这一发现表明,大模型的确发展出了一种与人类相似的理解世界的方式,开启了人工智能理解能力的新篇章。

研究人员解锁大语言模型理解世界的新方法,与人类相当!

科学家们对大语言模型(LLMs)“理解”世界的方式进行了广泛研究,目前的研究成果和观点呈现出一定的复杂性。以下是一些关键发现和观点:

多模态大语言模型的类人理解能力

  • 概念判断与人类高度一致:中国科学院的研究团队通过“找不同”实验,分析了多模态大语言模型对1854种物品的概念判断数据,发现其“理解”角度与人类神经活动高度一致,且多模态模型的决策过程更接近人类思维。

  • 视觉认知能力的局限性:尽管多模态大语言模型在某些任务上表现出色,但在视觉认知方面仍存在明显不足。例如,《Nature》杂志发表的一项研究显示,即使是先进的多模态大语言模型(如GPT-4V和Claude-3)在直觉物理学和因果推理等任务上的表现远逊于5岁儿童。

大语言模型在语言理解上的表现

  • 语言生成与推理能力:大语言模型通过自监督学习,能够生成自然语言文本,并在某些语言任务上表现出色。例如,OpenAI的GPT-3和Google的PaLM在通用语言理解评估(GLUE)和SuperGLUE等基准数据集上的表现甚至超越了人类。

  • 缺乏真实世界经验:尽管大语言模型能够生成流畅的文本,但一些学者认为它们缺乏真实世界的经验和感觉,因此无法真正理解语言的语义。例如,人类知道“挠痒痒”会让人笑是因为有身体经验,而大语言模型只是学会了语言的形式。

推理与规划能力的不足

  • 心智推理和规划的差距:通研院的研究发现,大语言模型在心智推理和规划任务上显著落后于人类。例如,在逆向推理任务中,GPT-4等模型的表现远低于人类水平。

  • 动态情境适应能力有限:在动态心智理论的研究中,大语言模型在追踪心理状态变化时表现不佳,尤其是在处理长期连续互动时存在“迷失在中间”的问题。

未来发展方向

  • 多模态融合:将语言、视觉、听觉等多种模态结合起来,可能会使大语言模型更接近人类的理解方式。

  • 结合真实世界经验:一些科学家认为,大语言模型需要结合真实世界的物理和心理模型,才能实现更接近人类水平的理解能力。

综上所述,大语言模型在某些方面展现出了类似人类的理解能力,但在真实世界经验、复杂推理和动态情境适应等方面仍存在明显差距。科学家们正在通过多模态融合和引入真实世界经验等方法,努力提升大语言模型的理解能力。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复