字节笔记本
2026年6月21日
hermes教程-标题:AWS Bedrock
先决条件
- AWS 凭证 — 任何 boto3 凭证链 支持的来源:
- IAM 实例角色(EC2、ECS、Lambda — 零配置)
AWS_ACCESS_KEY_ID+AWS_SECRET_ACCESS_KEY环境变量AWS_PROFILE用于 SSO 或命名配置文件aws configure用于本地开发
- boto3 — 使用
pip install hermes-agent[bedrock]安装 - IAM 权限 — 至少需要:
bedrock:InvokeModel和bedrock:InvokeModelWithResponseStream(用于推理)bedrock:ListFoundationModels和bedrock:ListInferenceProfiles(用于模型发现)
提示 — EC2 / ECS / Lambda
在 AWS 计算资源上,附加一个具有
AmazonBedrockFullAccess的 IAM 角色即可。无需 API 密钥,无需.env配置 — Hermes 会自动检测实例角色。
快速开始
## 安装时包含 Bedrock 支持
pip install hermes-agent[bedrock]
## 选择 Bedrock 作为你的提供商
hermes model
## → 选择 "更多提供商..." → "AWS Bedrock"
## → 选择你的区域和模型
## 开始对话
hermes chat配置
运行 hermes model 后,你的 ~/.hermes/config.yaml 将包含:
model:
default: us.anthropic.claude-sonnet-4-6
provider: bedrock
base_url: https://bedrock-runtime.us-east-2.amazonaws.com
bedrock:
region: us-east-2区域
通过以下任一方式设置 AWS 区域(优先级从高到低):
config.yaml中的bedrock.regionAWS_REGION环境变量AWS_DEFAULT_REGION环境变量- 默认值:
us-east-1
护栏
要对所有模型调用应用 Amazon Bedrock 护栏:
bedrock:
region: us-east-2
guardrail:
guardrail_identifier: "abc123def456" # 来自 Bedrock 控制台
guardrail_version: "1" # 版本号或 "DRAFT"
stream_processing_mode: "async" # "sync" 或 "async"
trace: "disabled" # "enabled"、"disabled" 或 "enabled_full"模型发现
Hermes 通过 Bedrock 控制平面自动发现可用模型。你可以自定义发现设置:
bedrock:
discovery:
enabled: true
provider_filter: ["anthropic", "amazon"] # 仅显示这些提供商
refresh_interval: 3600 # 缓存 1 小时可用模型
Bedrock 模型使用推理配置文件 ID 进行按需调用。hermes model 选择器会自动显示这些模型,推荐模型位于顶部:
| 模型 | ID | 备注 |
|---|---|---|
| Claude Sonnet 4.6 | us.anthropic.claude-sonnet-4-6 | 推荐 — 速度与能力的最佳平衡 |
| Claude Opus 4.6 | us.anthropic.claude-opus-4-6-v1 | 能力最强 |
| Claude Haiku 4.5 | us.anthropic.claude-haiku-4-5-20251001-v1:0 | 最快的 Claude |
| Amazon Nova Pro | us.amazon.nova-pro-v1:0 | Amazon 旗舰模型 |
| Amazon Nova Micro | us.amazon.nova-micro-v1:0 | 最快、最便宜 |
| DeepSeek V3.2 | deepseek.v3.2 | 强大的开源模型 |
| Llama 4 Scout 17B | us.meta.llama4-scout-17b-instruct-v1:0 | Meta 最新模型 |
信息 — 跨区域推理
以
us.为前缀的模型使用跨区域推理配置文件,可提供更好的容量和跨 AWS 区域的自动故障转移。以global.为前缀的模型则路由到全球所有可用区域。
会话中切换模型
在对话中使用 /model 命令:
/model us.amazon.nova-pro-v1:0
/model deepseek.v3.2
/model us.anthropic.claude-opus-4-6-v1诊断
hermes doctor诊断检查项:
- AWS 凭证是否可用(环境变量、IAM 角色、SSO)
- 是否安装了
boto3 - Bedrock API 是否可达(ListFoundationModels)
- 你所在区域中可用模型的数量
网关(消息平台)
Bedrock 可与所有 Hermes 网关平台(Telegram、Discord、Slack、飞书等)配合使用。将 Bedrock 配置为提供商,然后正常启动网关:
hermes gateway setup
hermes gateway start网关会读取 config.yaml 并使用相同的 Bedrock 提供商配置。
故障排除
"未找到 API 密钥" / "未找到 AWS 凭证"
Hermes 按以下顺序检查凭证:
AWS_BEARER_TOKEN_BEDROCKAWS_ACCESS_KEY_ID+AWS_SECRET_ACCESS_KEYAWS_PROFILE- EC2 实例元数据(IMDS)
- ECS 容器凭证
- Lambda 执行角色
如果都未找到,请运行 aws configure 或为你的计算实例附加 IAM 角色。
"不支持使用按需吞吐量调用模型 ID ..."
请使用推理配置文件 ID(以 us. 或 global. 为前缀)而不是裸的基础模型 ID。例如:
- ❌
anthropic.claude-sonnet-4-6 - ✅
us.anthropic.claude-sonnet-4-6
"ThrottlingException"
你已达到 Bedrock 的每模型速率限制。Hermes 会自动重试并退避。要增加限制,请在 AWS Service Quotas 控制台 中请求配额增加。
一键 AWS 部署
如需在 EC2 上使用 CloudFormation 进行全自动部署:
sample-hermes-agent-on-aws-with-bedrock — 自动创建 VPC、IAM 角色、EC2 实例并配置 Bedrock。一键部署到任何区域。