配置智谱 AI
智谱 AI 是中国领先的认知智能大模型公司,提供 GLM-4 系列大语言模型服务。GLM-4 支持超长上下文、多模态理解、高性能推理等功能,广泛应用于对话、文本生成、代码辅助等场景。
1. 获取智谱 AI API Key
1.1 访问 AI 开放平台
访问 AI 开放平台并登录:https://open.bigmodel.cn/

1.2 进入 API 管理页面
点击右上角的用户头像,选择 API 管理。

1.3 创建新的 API Key
点击 创建 API Key 按钮。

1.4 设置 API Key 信息
在弹出的对话框中:
- 输入 API Key 的名称(例如:CueMate)
- 选择适用的模型
- 点击 确定 按钮

1.5 复制 API Key
创建成功后,系统会显示 API Key。
重要:这是唯一一次可以看到完整 API Key 的机会,请立即复制并妥善保存。

点击复制按钮,API Key 已复制到剪贴板。
2. 在 CueMate 中配置智谱 AI 模型
2.1 进入模型设置页面
登录 CueMate 系统后,点击右上角下拉菜单的 模型设置。

2.2 添加新模型
点击右上角的 添加模型 按钮。

2.3 选择智谱 AI 服务商
在弹出的对话框中:
- 服务商类型:选择 智谱 AI
- 点击后 自动进入下一步

2.4 填写配置信息
在配置页面填写以下信息:
基础配置
- 模型名称:为这个模型配置起个名字(例如:智谱 GLM-4 Plus)
- API URL:保持默认
https://open.bigmodel.cn/api/paas/v4(OpenAI 兼容格式) - API Key:粘贴刚才复制的智谱 AI API Key
- 模型版本:选择要使用的模型 ID,常用模型包括:
glm-4-plus:最强大模型,适合复杂推理、深度分析(最大输出 8K)glm-4-long:超长文本处理,支持 1M 上下文(最大输出 8K)glm-4-air:轻量高效版,快速响应(最大输出 8K)glm-4-airx:极速版本,超低延迟(最大输出 8K)glm-4-flash:闪电响应,实时对话(最大输出 8K)glm-4:标准版本,平衡性能与成本(最大输出 8K)glm-4v:多模态模型,支持图像理解(最大输出 8K)glm-4v-plus:多模态增强版,支持 2 小时视频、4K 图像(最大输出 8K)glm-3-turbo:经济实惠版,日常对话(最大输出 4K)

高级配置(可选)
展开 高级配置 面板,可以调整以下参数:
CueMate 界面可调参数:
温度(temperature):控制输出随机性
- 范围:0-1
- 推荐值:0.7
- 作用:值越高输出越随机创新,值越低输出越稳定保守
- 使用建议:
- 创意写作/头脑风暴:0.8-0.95
- 常规对话/问答:0.6-0.8
- 代码生成/精确任务:0.3-0.5
- 注意:智谱 AI 的 temperature 范围是 0-1,与 OpenAI 的 0-2 不同
输出最大 tokens(max_tokens):限制单次输出长度
- 范围:256 - 8192(根据模型而定)
- 推荐值:4096
- 作用:控制模型单次响应的最大字数
- 模型限制:
- GLM-4 系列:最大 8K tokens
- GLM-3-turbo:最大 4K tokens
- 使用建议:
- 简短问答:1024-2048
- 常规对话:4096-8192
- 长文生成:8192(最大)

智谱 AI API 支持的其他高级参数:
虽然 CueMate 界面只提供 temperature 和 max_tokens 调整,但如果你通过 API 直接调用智谱 AI,还可以使用以下高级参数(智谱 AI 采用 OpenAI 兼容的 API 格式):
top_p(nucleus sampling)
- 范围:0-1
- 默认值:0.7
- 作用:从概率累积达到 p 的最小候选集中采样
- 与 temperature 的关系:可以同时使用
- 使用建议:
- 保持多样性:0.7-0.95
- 更保守的输出:0.5-0.7
do_sample
- 类型:布尔值
- 默认值:true
- 作用:启用随机采样(设为 false 则使用贪心解码)
- 使用场景:
- 创意任务:true(启用采样)
- 确定性任务:false(贪心解码)
stop(停止序列)
- 类型:字符串或数组
- 默认值:null
- 最大数量:4 个字符串
- 作用:当生成内容包含指定字符串时停止
- 示例:
["###", "用户:", "\n\n"] - 使用场景:
- 结构化输出:使用分隔符控制格式
- 对话系统:防止模型代替用户说话
stream(流式输出)
- 类型:布尔值
- 默认值:false
- 作用:启用 SSE 流式返回,边生成边返回
- CueMate 中:自动处理,无需手动设置
tools(工具调用)
- 类型:对象数组
- 作用:定义模型可以调用的工具/函数
- 使用场景:Function Calling、Agent 应用
- 示例:json
{ "tools": [ { "type": "function", "function": { "name": "get_weather", "description": "获取指定城市的天气", "parameters": { "type": "object", "properties": { "city": {"type": "string"} } } } } ] }
智谱 AI 特色参数:
- request_id
- 类型:字符串
- 作用:用户端提供的唯一 ID,用于追踪请求
- 使用建议:传入唯一标识以便追踪和调试
参数组合建议:
| 序号 | 场景 | temperature | max_tokens | top_p | do_sample | stop |
|---|---|---|---|---|---|---|
| 1 | 创意写作 | 0.8-0.95 | 4096-8192 | 0.9 | true | null |
| 2 | 代码生成 | 0.2-0.5 | 2048-4096 | 0.7 | true | null |
| 3 | 问答系统 | 0.6-0.8 | 1024-2048 | 0.7 | true | null |
| 4 | 摘要总结 | 0.3-0.5 | 512-1024 | 0.7 | true | null |
| 5 | 确定性任务 | 0 | 2048 | 1.0 | false | null |
2.5 测试连接
填写完配置后,点击 测试连接 按钮,验证配置是否正确。

如果配置正确,会显示测试成功的提示,并返回模型的响应示例。

如果配置错误,会显示测试错误的日志,并且可以通过日志管理,查看具体报错信息。
2.6 保存配置
测试成功后,点击 保存 按钮,完成模型配置。

3. 使用模型
通过右上角下拉菜单,进入系统设置界面,在大模型供应商栏目选择想要使用的模型配置。
配置完成后,可以在面试训练、问题生成等功能中选择使用此模型, 当然也可以在面试的选项中单此选择此次面试的模型配置。

4. 支持的模型列表
| 序号 | 模型名称 | 模型 ID | 最大输出 | 适用场景 |
|---|---|---|---|---|
| 1 | GLM-4 Plus | glm-4-plus | 8K tokens | 最强版本、复杂推理 |
| 2 | GLM-4 Long | glm-4-long | 8K tokens | 长文本处理、支持 1M 上下文 |
| 3 | GLM-4 Air | glm-4-air | 8K tokens | 轻量级、快速响应 |
| 4 | GLM-4 AirX | glm-4-airx | 8K tokens | 极速版本、超低延迟 |
| 5 | GLM-4 Flash | glm-4-flash | 8K tokens | 实时对话、闪电响应 |
| 6 | GLM-4 | glm-4 | 8K tokens | 标准版本、技术面试 |
| 7 | GLM-4V | glm-4v | 8K tokens | 多模态、支持图像理解 |
| 8 | GLM-4V Plus | glm-4v-plus | 8K tokens | 多模态增强版、支持 2 小时视频 |
| 9 | GLM-3 Turbo | glm-3-turbo | 4K tokens | 经济实惠、常规对话 |
5. 常见问题
5.1 API Key 无效
现象:测试连接时提示 API Key 错误
解决方案:
- 检查 API Key 是否完整复制
- 确认 API Key 未过期或被禁用
- 检查账户是否有可用额度
5.2 请求超时
现象:测试连接或使用时长时间无响应
解决方案:
- 检查网络连接是否正常
- 检查防火墙设置
- 确认智谱 AI 服务状态正常
5.3 配额不足
现象:提示配额已用完
解决方案:
- 登录智谱 AI 平台查看账户余额
- 充值或申请更多配额
- 优化使用频率
