Amazon Bedrock AgentCore Web Search: 托管式网页搜索能力 GA¶

Ch04.385 Amazon Bedrock AgentCore Web Search: 托管式网页搜索能力 GA¶

📊 Level ⭐⭐ | 6.4KB | entities/amazon-bedrock-agentcore-web-search-ga.md

Amazon Bedrock AgentCore Web Search: 托管式网页搜索能力 GA¶

来源: AWS Machine Learning Blog · Veda Raman, Kalyan Garimella · 2026-06-19

摘要¶

Amazon Bedrock AgentCore Web Search 以全托管 MCP 兼容方式为 AI Agent 提供实时网页搜索能力。底层是 Amazon 自建的数百亿文档索引，持续分钟级刷新，查询流量不离开 AWS。定价 $7/1,000 次查询。

→ 原文存档

核心要点¶

解决 Agent 知识冻结问题：Agent 的知识停留在训练时间，无法获取实时信息（股价、比分、刚发布的版本）。Web Search on AgentCore 直接解决这一结构性限制
零基础设施开销：作为 AgentCore Gateway 的 managed target/connector，Agent 通过标准 tools/list 发现，像其他 MCP 工具一样调用
Amazon 自建搜索索引：非第三方搜索 API wrapper，覆盖数百亿文档，持续分钟级刷新
隐私保证：查询流量不离开 AWS 基础设施，满足数据驻留和第三方出口合规要求
知识图谱 + 语义片段提取：内置知识图谱提供高置信度事实答案；语义片段提取针对 LLM context window 优化

深度分析¶

技术架构¶

Web Search on AgentCore 的架构分三层：

接入层：Agent → AgentCore Gateway（IAM 或 JWT 入站认证）→ Web Search connector（AWS 服务账户）→ 查询流量保持在 AWS 内部。

索引层：Amazon 自建并维护的 purpose-built web index，覆盖数百亿文档。关键特性： - 持续刷新：新内容在分钟内被索引，确保「今天发生了什么」的回答基于今天的真实数据 - 知识图谱：对实体查询（如「谁担任某职位」「某公司何时成立」）提供结构化高置信度回答，减少模型从片段文本推断导致的细微事实漂移 - 语义片段提取：不返回原始 HTML 或全文，而是提取与查询语义相关的片段，针对 model context window 优化，减少 boilerplate 和导航噪声的 token 消耗

安全层： - 查询不离开 AWS（数据路径端到端在 AWS 内部） - 出站认证通过 Gateway 的 IAM service role（bedrock-agentcore:InvokeWebSearch on arn:aws:bedrock-agentcore:us-east-1:aws:tool/web-search.v1） - 入站认证与出站认证分离（通常用 OAuth/JWT 如 Cognito） - Gateway role 不包含 bedrock:InvokeModel——模型访问属于运行 Agent 的身份

接入方式¶

import boto3

gateway_client = boto3.client("bedrock-agentcore-control", region_name="us-east-1")

gateway_client.create_gateway_target(
    gatewayIdentifier=gateway_id,
    name="web-search-tool",
    targetConfiguration={
        "mcp": {
            "connector": {
                "source": {"connectorId": "web-search"},
                "configurations": [{"name": "WebSearch", "parameterValues": {}}],
            }
        }
    },
    credentialProviderConfigurations=[
        {"credentialProviderType": "GATEWAY_IAM_ROLE"}
    ],
)

MCP 兼容框架（Strands、LangChain、LangGraph、CrewAI）可直接发现和调用：

from strands import Agent
from strands.tools.mcp import MCPClient

with mcp_client:
    tools = mcp_client.list_tools_sync()  # WebSearch 工具自动发现
    agent = Agent(model=model, tools=tools, system_prompt=system_prompt)
    result = agent("What are the latest AI breakthroughs this week?")

Agent 自行判断何时需要实时信息，调用 WebSearchTool，返回带源引用的 grounded response。无需编写工具特定代码。

响应格式¶

返回标准 MCP tools/call 信封，内含 JSON 文档：

{
  "results": [
    {
      "title": "2026 NBA Finals",
      "url": "https://en.wikipedia.org/wiki/2026_NBA_Finals",
      "publishedDate": "04:43AM, Wednesday, June 17 2026, PDT",
      "text": "The 2026 NBA Finals was the championship..."
    }
  ]
}

知识图谱观测（实体查询时可选返回）的 title 和 url 为 null，text 字段包含结构化键值事实。

与自建方案和第三方工具的对比¶

维度	自建	Exa/Tavily/SerpAPI	AgentCore Web Search
基础设施	需自建	需管理 API key、配额、速率限制	全托管，零运维
索引质量	取决于投入	第三方索引	Amazon 自建数百亿文档
隐私	取决于实现	查询发送至第三方	查询不离 AWS
集成	自行 glue	自行解析结果格式	MCP 原生集成
定价	高固定成本	按 API 计费	$7/1,000 queries

与 Knowledge Bases 的互补关系¶

AgentCore Knowledge Bases 处理企业私有数据（文档、知识库），Web Search 处理公共互联网实时信息。生产级 Agent 通常两者兼用：KB 回答「我们的文档怎么说」，Web Search 回答「世界上现在的真实情况」。

实践启示¶

Agent 架构设计：将 Web Search 作为 Agent 的「外部记忆」层，与内部 RAG 知识库配合，形成完整的知识获取架构
成本优化：$7/1,000 queries 意味着每个问题不到 1 美分——对于需要实时信息的 Agent 场景（金融分析、新闻摘要、竞品监控），成本可控
合规考量：对数据驻留有严格要求的企业（金融、医疗、政府），AWS 内部查询路径消除了第三方数据出口的合规障碍
MCP 生态价值：作为 MCP 工具暴露意味着任何兼容 MCP 的 Agent 框架均可零代码接入——这是 MCP 协议生态的实际价值体现
当前限制：仅在 us-east-1 可用，多区域支持待扩展

Amazon Bedrock AgentCore Web Search: 托管式网页搜索能力 GA¶

Ch04.385 Amazon Bedrock AgentCore Web Search: 托管式网页搜索能力 GA¶

Amazon Bedrock AgentCore Web Search: 托管式网页搜索能力 GA¶

摘要¶

核心要点¶

深度分析¶

技术架构¶

接入方式¶

响应格式¶

与自建方案和第三方工具的对比¶

与 Knowledge Bases 的互补关系¶

实践启示¶

相关实体¶