谷歌发布新型Gemini API URL Context特性,用于详尽解析网页信息
发布时间:2025-09-02 14:52:00 | 责任编辑:吴昊 | 浏览量:28 次
近日,谷歌正式推出其全新的 Gemini API URL Context 功能,旨在让 AI 在浏览网页时有如人类一般的理解能力。这一功能于5月28日在 Google AI Studio 上线,标志着谷歌在 AI 技术领域的又一次重大突破。
与我们常用的链接分享不同,URL Context 功能的运作方式截然不同。通常情况下,当我们将链接丢给 AI 时,它往往只是通过简单的浏览器工具或搜索引擎插件来读取网页内容,而这种方式常常只能获取到网页的摘要或部分信息。然而,Gemini 的 URL Context 则是专为开发者设计的 API,可以精准解析和理解网页中的所有内容,甚至可以处理 PDF、图片等多种格式的信息。
具体来说,URL Context 功能能够处理高达34MB 的网页内容,支持多种文件格式,包括 HTML、JSON 和 CSV 等。谷歌产品负责人 Logan Kilpatrick 表示,这项功能极大地简化了开发者的工作流程,使其能够在几行代码中实现深度的信息提取与处理。与传统的 “检索 - 增强生成”(RAG)流程相比,URL Context 减少了繁琐的步骤,不再需要额外的内容提取、向量存储和检索机制。
这一功能的能力相当强大。通过一个简单的 URL,Gemini 可以提取特斯拉财报中的关键数据,如 “总资产” 和 “总负债”,而这些信息往往无法通过传统方式获取。此外,它还能够识别 PDF 中的复杂结构,包括表格和脚注等。这使得开发者能够更快速、准确地获得所需信息,极大提高了工作效率。
不过,URL Context 也有其局限性。它无法突破付费墙,对于需要登录才能访问的内容无能为力。此外,它对专用工具(如 YouTube 视频和 Google Docs 等)也不会进行处理。内容的处理费用是按照 Token 数量计费,因此开发者需要合理设计信息源,以控制成本。
URL Context 功能不仅展示了 AI 技术的前沿发展趋势,也让我们对未来的信息检索方式有了新的认识。
文章地址:https://towardsdatascience.com/googles-url-context-grounding-another-nail-in-rags-coffin/
。
功能详解
-
运作模式:
URL Context 工具采用了两步检索流程:首先尝试从谷歌内部索引缓存中提取网页内容,若网页未在索引中(如网页为新发布),则自动实时抓取网页内容,确保数据的时效性。
-
支持内容类型
:
-
文本:HTML 页面、JSON、TXT、XML、CSV 等
-
图片:PNG、JPEG、WebP、BMP 等
-
文档:PDF 文件
-
限制:不支持 YouTube 视频、Google Workspace 文档(如 Google Docs)、付费墙内容等
-
-
技术规格
:
-
每次请求最多支持处理 20 个 URL
-
单个 URL 内容大小上限为 34MB
-
抓取的内容会计入输入令牌(tokens)并产生相应费用
-
使用示例
以 Python SDK 为例,开发者仅需几行代码即可实现网页内容抓取与分析:
Python
from google import genai
client = genai.Client(
)
response = client.models.generate_content(
model=
"gemini-2.5-flash"
,
contents=
"总结此网页内容:https://example.com"
,
config=
{
"tools"
: [
{
"urlContext"
: {
}
}
]
}
)
print
(response.text)
。
应用场景与意义
-
数据科学家:更便捷地获取网络数据进行研究和分析
-
内容聚合平台:高效处理多源信息,提升内容更新效率
-
自动化工具开发:显著降低开发门槛,专注于业务逻辑本身
官方文档与资源
综上所述,谷歌此次推出的 URL Context 功能,不仅大幅简化了网页数据获取的技术流程,也为开发者提供了更强大、更便捷的工具,推动了 AI 与网络数据处理的深度融合。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。