配置百度千帆
百度千帆(Qianfan)是百度推出的大语言模型平台,基于文心大模型技术。提供强大的中文理解和生成能力,支持 ERNIE-4.0、ERNIE-3.5 等多个版本。自 2025 年 3 月起,个人用户可免费调用 API。
1. 获取百度千帆 API Key
1.1 访问百度智能云
访问百度智能云官网并登录:https://cloud.baidu.com/
如果没有账号,需要先注册一个百度账号。

1.2 进入百度智能云控制台
登录后,点击右上角的 控制台 按钮,进入百度智能云总控制台。
百度智能云是一个综合性云平台,提供计算、存储、AI 等多种服务。

1.3 找到千帆大模型平台
在百度智能云控制台中,找到 千帆大模型平台 或 文心大模型 服务入口:
- 方式一:在控制台首页搜索"千帆"或"文心"
- 方式二:在左侧菜单中找到 人工智能 → 千帆大模型平台
- 方式三:直接访问千帆平台控制台:https://console.bce.baidu.com/qianfan/overview
点击进入千帆大模型平台。

首次进入千帆大模型平台时,会弹出用户服务协议,需要同意后才能继续使用。请阅读并同意协议。

1.4 进入 API Key 管理页面
在千帆大模型平台左侧菜单中,点击系统管理下的 API Key 菜单项。
进入 API Key 管理页面后,可以看到页面提示:"API Key 是通用于大模型服务及工具的调用鉴权凭证。请务必妥善保管并定期更换,以避免不必要的安全风险或资金损失。"

1.5 创建 API Key
点击右上角的 创建 API Key 按钮(蓝色按钮)。

1.6 填写 API Key 信息
在弹出的对话框中填写:
- 名称:为这个 API Key 起个名字,例如"CueMate"(方便后续识别用途)
- 授予"全部权限"或"自定义权限"
- 点击 创建 按钮

1.7 复制 API Key
创建成功后,会显示您的 API Key。
重要提示:
- API Key 用于调用百度千帆大模型 API 的鉴权凭证
- 请妥善保管,不要泄露给他人
- 如果 API Key 泄露,请立即删除并重新创建
点击复制按钮,将 API Key 复制保存到记事本或其他安全的地方,后续配置中会用到。

2. 在 CueMate 中配置百度千帆模型
2.1 进入模型设置页面
登录 CueMate 系统后,点击右上角下拉菜单的 模型设置。

2.2 添加新模型
点击右上角的 添加模型 按钮。

2.3 选择百度千帆服务商
在弹出的对话框中:
- 服务商类型:选择 百度千帆
- 点击后 自动进入下一步

2.4 填写配置信息
在配置页面填写以下信息:
基础配置
- 模型名称:为这个模型配置起个名字(例如:ERNIE-4.5-Turbo)
- API URL:保持默认
https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat - API Key:粘贴刚才复制的百度 API Key
- 模型版本:选择要使用的模型 ID,常用模型包括:
ERNIE-4.5-Turbo:文心 4.5 Turbo 版本,16K+ 上下文,性能最强,适合复杂任务ERNIE-4.5:文心 4.5 版本,16K+ 上下文,个人用户免费ERNIE-Speed-AppBuilder:速度优化版本,响应快,适合高频调用

高级配置(可选)
展开 高级配置 面板,可以调整以下参数:
温度(temperature):控制输出随机性
- 范围:0-1(ERNIE 系列)、0-2(DeepSeek/Llama/Qwen 系列)
- 默认值:
- ERNIE 系列:0.95
- DeepSeek 系列:1.0
- 其他模型:0.7
- 作用:值越高输出越随机创新,值越低输出越稳定保守
- 使用建议:
- 创意写作/头脑风暴:0.8-1.0
- 常规对话/问答:0.7-0.9
- 代码生成/精确任务:0.3-0.5
- 逻辑推理/数学计算:0.1-0.3
输出最大 tokens(max_tokens):限制单次输出长度
- 范围:根据模型而定
- 推荐值:4096
- 作用:控制模型单次响应的最大字数
- 模型限制:
- ERNIE-4.5/ERNIE-4.5-Turbo:最大 8192 tokens
- ERNIE-Speed-AppBuilder:最大 4096 tokens
- DeepSeek-V3/V3.2:最大 8192 tokens
- DeepSeek-V3.1-Think/V3.2-Think:最大 8000 tokens
- Kimi-K2-Instruct:最大 4096 tokens
- Llama 系列:最大 4096 tokens
- Qwen 系列:最大 6144 tokens
- GLM-4 系列:最大 4095 tokens
- Yi-Lightning:最大 4096 tokens
- 使用建议:
- 简短问答:1024-2048
- 常规对话:2048-4096
- 长文生成:4096-8192
- 代码生成:2048-4096

百度千帆 API 支持的其他高级参数:
虽然 CueMate 界面只提供 temperature 和 max_tokens 调整,但如果你通过 API 直接调用百度千帆,部分模型还支持以下参数:
top_p(nucleus sampling)
- 范围:0-1
- 默认值:0.8
- 作用:从概率累积达到 p 的最小候选集中采样
- 与 temperature 的关系:通常只调整其中一个
- 使用建议:
- 保持多样性但避免离谱:0.9-0.95
- 更保守的输出:0.7-0.8
penalty_score(重复惩罚)
- 范围:1.0-2.0
- 默认值:1.0
- 作用:降低重复内容的概率
- 使用建议:
- 减少重复:1.2-1.5
- 允许适度重复:1.0-1.1(默认)
stream(流式输出)
- 类型:布尔值
- 默认值:false
- 作用:启用 SSE 流式返回,边生成边返回
- CueMate 中:自动处理,无需手动设置
参数调优技巧:
- 创意场景:高 temperature (0.8-1.0) + 低 penalty_score (1.0-1.1)
- 精确场景:低 temperature (0.1-0.3) + 中等 penalty_score (1.2-1.3)
- 平衡场景:中等 temperature (0.7) + 中等 penalty_score (1.1-1.2)
- 长文本生成:适当提高 max_tokens,降低 temperature 保证连贯性
2.5 测试连接
填写完配置后,点击 测试连接 按钮,验证配置是否正确。

如果配置正确,会显示测试成功的提示,并返回模型的响应示例。

2.6 保存配置
测试成功后,点击 保存 按钮,完成模型配置。

3. 使用模型
通过右上角下拉菜单,进入系统设置界面,在大模型供应商栏目选择想要使用的模型配置。
配置完成后,可以在面试训练、问题生成等功能中选择使用此模型,当然也可以在面试的选项中单次选择此次面试的模型配置。

4. 支持的模型列表
百度千帆平台支持 54+ 个大模型,包括百度自家的 ERNIE 系列和第三方模型。以下是常用模型列表:
4.1 ERNIE 系列(百度自家)
| 序号 | 模型名称 | 模型 ID | 上下文长度 | 适用场景 |
|---|---|---|---|---|
| 1 | ERNIE-4.5-Turbo | ERNIE-4.5-Turbo | 16K+ tokens | 复杂任务、深度理解、代码生成 |
| 2 | ERNIE-4.5 | ERNIE-4.5 | 16K+ tokens | 常规对话、日常使用(免费) |
| 3 | ERNIE-Speed-AppBuilder | ERNIE-Speed-AppBuilder | 8K tokens | 快速响应、高频调用 |
4.2 DeepSeek 系列(深度求索)
| 序号 | 模型名称 | 模型 ID | 上下文长度 | 适用场景 |
|---|---|---|---|---|
| 1 | DeepSeek-V3.2 | DeepSeek-V3.2 | 16K tokens | 高性能推理、代码生成 |
| 2 | DeepSeek-V3.2-Think | DeepSeek-V3.2-Think | 16K tokens | 深度推理、复杂问题 |
| 3 | DeepSeek-V3 | DeepSeek-V3 | 16K tokens | 通用对话 |
| 4 | DeepSeek-V3.1-Think | DeepSeek-V3.1-Think | 16K tokens | 深度推理 |
4.3 Kimi 系列(月之暗面)
| 序号 | 模型名称 | 模型 ID | 上下文长度 | 适用场景 |
|---|---|---|---|---|
| 1 | Kimi-K2-Instruct | Kimi-K2-Instruct | 16K tokens | 长文本理解、对话 |
4.4 Llama 系列(Meta)
| 序号 | 模型名称 | 模型 ID | 上下文长度 | 适用场景 |
|---|---|---|---|---|
| 1 | Llama-3.3-70B-Instruct | Llama-3.3-70B-Instruct | 16K tokens | 通用对话、代码生成 |
| 2 | Llama-3.1-405B-Instruct | Llama-3.1-405B-Instruct | 16K tokens | 高性能推理 |
4.5 Qwen 系列(通义实验室/阿里)
| 序号 | 模型名称 | 模型 ID | 上下文长度 | 适用场景 |
|---|---|---|---|---|
| 1 | Qwen2.5-72B-Instruct | Qwen2.5-72B-Instruct | 16K tokens | 通用对话、代码生成 |
| 2 | Qwen2.5-7B-Instruct | Qwen2.5-7B-Instruct | 8K tokens | 轻量级对话 |
4.6 GLM 系列(智谱 AI)
| 序号 | 模型名称 | 模型 ID | 上下文长度 | 适用场景 |
|---|---|---|---|---|
| 1 | GLM-4-Plus | GLM-4-Plus | 16K tokens | 复杂任务、代码生成 |
| 2 | GLM-4-Flash | GLM-4-Flash | 8K tokens | 快速响应 |
4.7 Yi 系列(零一万物)
| 序号 | 模型名称 | 模型 ID | 上下文长度 | 适用场景 |
|---|---|---|---|---|
| 1 | Yi-Lightning | Yi-Lightning | 16K tokens | 快速响应、高性价比 |
说明:
- 以上仅列出常用模型,完整模型列表请访问百度千帆平台查看
- 模型 ID 需要在配置时准确填写
- 不同模型的计费标准不同,请查看官方定价说明
5. 常见问题
5.1 API Key 无效
现象:测试连接时提示 API Key 错误
解决方案:
- 检查 API Key 和 Secret Key 是否正确
- 确认应用是否已激活
- 检查账户是否有可用额度
5.2 请求超时
现象:测试连接或使用时长时间无响应
解决方案:
- 检查网络连接是否正常
- 确认 API URL 地址正确
- 检查防火墙设置
5.3 配额不足
现象:提示配额已用完或余额不足
解决方案:
- 登录千帆平台查看账户余额
- 充值或申请更多配额
- 优化使用频率
