谷歌将多模态搜索功能引入AI模式,用户可询问图像内容
发布时间:2025-04-08 09:58:41 | 责任编辑:字母汇 | 浏览量:26 次
谷歌近日在其博客中宣布,将多模态搜索功能引入 AI 模式,这一新功能允许用户通过复杂的问题深入了解图像内容。此功能为有权使用 AI 模式的用户提供,用户现在可以直接对他们上传或用相机拍摄的照片进行提问。
AI 模式中的新图像分析功能是基于Google Lens 的多模式技术。谷歌表示,该模式能够理解图像中的整个场景,包括物体之间的关系、材质、颜色、形状及排列等。通过一种称为 “查询扇出” 的技术,用户可以对图像及其所显示的对象提出多个问题,获得比传统搜索更详细的信息。
例如,用户可以拍摄一张书架的照片,然后询问:“如果我喜欢这些书,还有哪些类似的、评价很高的书?”AI 模式将识别照片中的每本书,并生成一份推荐书籍列表,附带了解更多信息和购买链接。更为人性化的是,用户还可以继续提问,以进一步缩小搜索范围,比如 “我在寻找快速阅读材料,这些推荐中哪一个最短?” 这样的互动方式让搜索变得更加智能和个性化。
谷歌表示,AI 模式的新功能将在未来几周内向数百万加入实验室的用户推广,此前该模式仅限于 Google One AI Premium 订阅用户使用。此次推出的 AI 模式旨在与市面上流行的服务,如 Perplexity 和 OpenAI 的 ChatGPT Search 等进行竞争。
谷歌还表示,未来将持续改进用户体验,并扩展这一新功能,力求为用户带来更优质的服务体验。
划重点:
🌟 新功能:谷歌 AI 模式允许用户通过多模态搜索深入提问图像内容。
📚 智能推荐:用户可上传照片并获得相关书籍推荐及链接。
🚀 扩展计划:新功能将在数百万用户中推广,未来将持续改进。
谷歌于2025年4月8日宣布为其AI模式聊天机器人增加多模态功能。这一更新将定制版的Gemini AI与谷歌的Lens图像识别技术相结合,允许用户上传或拍摄图片,并通过AI模式获取关于图片的详细回答。谷歌的AI模式现已上线,用户可以通过安卓和iOS平台上的谷歌应用访问。
谷歌搜索产品副总裁罗比·斯坦表示,AI模式基于谷歌在视觉搜索领域的多年研究,并进一步拓展了其功能。借助Gemini的多模态能力,AI模式能够理解图像中的整体场景,包括对象之间的关联性及其独特的材质、颜色、形状和排列方式。此外,谷歌采用“发散式查询技术”(query fan-out),针对所识别图像及其中的对象发出多个查询,以提供“极具深度且符合上下文”的回复。
例如,用户可以上传一张书架的照片并询问推荐类似且高评分的书籍,AI模式会识别每本书,然后提供一个推荐书籍列表,并附上链接以便用户了解更多信息或进行购买。此外,用户还可以提出后续问题来进一步筛选推荐书籍。
此次更新进一步扩大了AI模式的使用范围,面向“数百万”新增用户开放。此前,AI模式仅面向谷歌One AI高级订阅用户(仅限实验室版本)推出,如今已开始向美国“数百万”实验室用户开放,不再局限于付费的高级订阅用户。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。