首页 > 快讯 > 谷歌发布新型Gemini API URL Context特性,用于详尽解析网页信息

谷歌发布新型Gemini API URL Context特性,用于详尽解析网页信息

发布时间:2025-09-02 14:52:00 | 责任编辑:吴昊 | 浏览量:28 次

近日,谷歌正式推出其全新的 Gemini API URL Context 功能,旨在让 AI 在浏览网页时有如人类一般的理解能力。这一功能于5月28日在 Google AI Studio 上线,标志着谷歌在 AI 技术领域的又一次重大突破。
与我们常用的链接分享不同,URL Context 功能的运作方式截然不同。通常情况下,当我们将链接丢给 AI 时,它往往只是通过简单的浏览器工具或搜索引擎插件来读取网页内容,而这种方式常常只能获取到网页的摘要或部分信息。然而,Gemini 的 URL Context 则是专为开发者设计的 API,可以精准解析和理解网页中的所有内容,甚至可以处理 PDF、图片等多种格式的信息。
具体来说,URL Context 功能能够处理高达34MB 的网页内容,支持多种文件格式,包括 HTML、JSON 和 CSV 等。谷歌产品负责人 Logan Kilpatrick 表示,这项功能极大地简化了开发者的工作流程,使其能够在几行代码中实现深度的信息提取与处理。与传统的 “检索 - 增强生成”(RAG)流程相比,URL Context 减少了繁琐的步骤,不再需要额外的内容提取、向量存储和检索机制。
这一功能的能力相当强大。通过一个简单的 URL,Gemini 可以提取特斯拉财报中的关键数据,如 “总资产” 和 “总负债”,而这些信息往往无法通过传统方式获取。此外,它还能够识别 PDF 中的复杂结构,包括表格和脚注等。这使得开发者能够更快速、准确地获得所需信息,极大提高了工作效率。
不过,URL Context 也有其局限性。它无法突破付费墙,对于需要登录才能访问的内容无能为力。此外,它对专用工具(如 YouTube 视频和 Google Docs 等)也不会进行处理。内容的处理费用是按照 Token 数量计费,因此开发者需要合理设计信息源,以控制成本。
URL Context 功能不仅展示了 AI 技术的前沿发展趋势,也让我们对未来的信息检索方式有了新的认识。
文章地址:https://towardsdatascience.com/googles-url-context-grounding-another-nail-in-rags-coffin/

谷歌发布新型Gemini API URL Context特性,用于详尽解析网页信息
谷歌近期对 Gemini API 进行了一次重大升级,推出了名为 URL Context 的全新功能,使开发者能够直接在 API 请求中嵌入网页链接,从而快速获取和分析网页内容,极大简化了以往复杂的网页抓取流程

功能详解

  • 运作模式
    URL Context 工具采用了两步检索流程:首先尝试从谷歌内部索引缓存中提取网页内容,若网页未在索引中(如网页为新发布),则自动实时抓取网页内容,确保数据的时效性

  • 支持内容类型

    • 文本:HTML 页面、JSON、TXT、XML、CSV 等

    • 图片:PNG、JPEG、WebP、BMP 等

    • 文档:PDF 文件

    • 限制:不支持 YouTube 视频、Google Workspace 文档(如 Google Docs)、付费墙内容等

  • 技术规格

    • 每次请求最多支持处理 20 个 URL

    • 单个 URL 内容大小上限为 34MB

    • 抓取的内容会计入输入令牌(tokens)并产生相应费用

使用示例

以 Python SDK 为例,开发者仅需几行代码即可实现网页内容抓取与分析:

Python

            
            from google import genai
            client = genai.Client(
            )
            response = client.models.generate_content(
            model=
            "gemini-2.5-flash"
            ,
            contents=
            "总结此网页内容:https://example.com"
            ,
            config=
            {
            "tools"
            : [
            {
            "urlContext"
            : {
            }
            }
            ]
            }
            )
            print
            (response.text)
            
            

此外,谷歌还提供了 JavaScript SDKREST API命令行工具(CLI) 等多种调用方式,满足不同开发场景的需求

应用场景与意义

  • 数据科学家:更便捷地获取网络数据进行研究和分析

  • 内容聚合平台:高效处理多源信息,提升内容更新效率

  • 自动化工具开发:显著降低开发门槛,专注于业务逻辑本身

官方文档与资源

综上所述,谷歌此次推出的 URL Context 功能,不仅大幅简化了网页数据获取的技术流程,也为开发者提供了更强大、更便捷的工具,推动了 AI 与网络数据处理的深度融合。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐