Skip to content

Gemini CLI 内置网络搜索和页面抓取工具,让你能把"昨天才发布的库文档"直接喂给 AI:用 Prompt 触发 google_web_search 搜索最新资料,用 web_fetch 精准抓取指定 URL 的详细内容,然后让 AI 结合你的代码库给出实施方案。本页是联网工具的完整使用教程。

网络搜索与页面抓取

Gemini CLI 让你的 AI 助手拥有访问互联网的能力——搜索最新文档、抓取特定页面内容,再将这些信息直接用于代码修改。再也不用担心 AI 因训练数据截止日期而"不知道"新版本 API。

前置条件

  • Gemini CLI 已安装并完成认证,参见 安装指南
  • 稳定的网络连接

搜索实时信息

场景:查找昨天才发布的库

假如你想使用一个新库,模型还不了解它:

Prompt:

搜索"Bun 1.0"的发布说明,总结关键变化。

AI 使用 google_web_search 工具查找相关页面,综合多个来源给出答案。这个"接地气"的过程确保 AI 不会凭空编造不存在的功能。

Prompt:

查找 React Router v7 的 loader API 文档。

抓取完整页面内容

搜索给你摘要,但有时你需要完整的技术细节。web_fetch 工具让你把指定 URL 的内容直接送进 AI 的上下文。

场景:阅读一篇博客文章

你找到了一篇文章,里面有解决你 Bug 的方法:

Prompt:

阅读 https://example.com/fixing-memory-leaks 并解释如何应用到我的代码里。

AI 会获取页面内容(自动去除广告和导航栏),用它来回答你的问题。

场景:对比多个来源

可以同时抓取多个页面进行横向比较:

Prompt:

比较 https://api.example.com/v1/docs 和 https://api.example.com/v2/docs 中的分页模式差异。

将网络知识应用到代码

真正的威力来自将联网工具与文件编辑结合使用:

工作流程示例:

  1. 搜索: "如何用 Supabase 实现身份验证?"
  2. 抓取: "读取这篇指南:https://supabase.com/docs/guides/auth"
  3. 实现: "好,现在用那个模式在我的项目里创建 auth.ts 文件。"

每一步都建立在前一步的基础上,最终产出符合最新官方文档的代码。

查找报错解决方案

遇到晦涩的报错时,直接把错误信息粘贴进去:

Prompt:

我在 Next.js 中遇到"Error: hydration mismatch"。搜索最近的解决方案。

AI 会搜索 GitHub Issues、StackOverflow、各种技术论坛,找到可能在训练数据截止日期之后才出现的最新修复方法。

下一步

  • 了解如何操作和修改文件:文件管理教程
  • 查看 Web Search 工具的完整参数(引用格式等)
  • 查看 Web Fetch 工具的技术限制(最大页面大小、超时等)

常见问题

Q: Gemini CLI 用的是哪个搜索引擎?

A: 默认使用 Google 搜索(google_web_search 工具)。你也可以通过 MCP 配置 接入 Brave Search 等其他搜索服务。

Q: web_fetch 能抓取需要登录的页面吗?

A: 不能。web_fetch 以匿名用户身份访问网页,无法处理需要身份验证的内容(如 Confluence 内网文档、需要登录的 GitHub 私有仓库等)。对于这类内容,建议用 MCP 服务器(如 GitHub MCP)提供认证访问。

Q: AI 抓取的网页内容准确吗?会不会因为广告或弹窗干扰结果?

A: web_fetch 会处理 HTML 并过滤掉广告、导航栏等页面噪音,只提取正文内容。但对于结构复杂的单页应用(SPA),有时内容提取不完整——这种情况下可以尝试直接引用文档页面的纯文本版本或 GitHub 上的 .md 源文件。