Skip to content
智谱 AI

配置智谱 AI

智谱 AI 是中国领先的认知智能大模型公司,提供 GLM-4 系列大语言模型服务。GLM-4 支持超长上下文、多模态理解、高性能推理等功能,广泛应用于对话、文本生成、代码辅助等场景。

1. 获取智谱 AI API Key

1.1 访问 AI 开放平台

访问 AI 开放平台并登录:https://open.bigmodel.cn/

访问 AI 平台

1.2 进入 API 管理页面

点击右上角的用户头像,选择 API 管理

进入 API 管理页面

1.3 创建新的 API Key

点击 创建 API Key 按钮。

点击创建按钮

1.4 设置 API Key 信息

在弹出的对话框中:

  1. 输入 API Key 的名称(例如:CueMate)
  2. 选择适用的模型
  3. 点击 确定 按钮

设置 API Key 信息

1.5 复制 API Key

创建成功后,系统会显示 API Key。

重要:这是唯一一次可以看到完整 API Key 的机会,请立即复制并妥善保存。

复制 API Key

点击复制按钮,API Key 已复制到剪贴板。

2. 在 CueMate 中配置智谱 AI 模型

2.1 进入模型设置页面

登录 CueMate 系统后,点击右上角下拉菜单的 模型设置

进入模型设置

2.2 添加新模型

点击右上角的 添加模型 按钮。

点击添加模型

2.3 选择智谱 AI 服务商

在弹出的对话框中:

  1. 服务商类型:选择 智谱 AI
  2. 点击后 自动进入下一步

选择智谱 AI

2.4 填写配置信息

在配置页面填写以下信息:

基础配置

  1. 模型名称:为这个模型配置起个名字(例如:智谱 GLM-4 Plus)
  2. API URL:保持默认 https://open.bigmodel.cn/api/paas/v4(OpenAI 兼容格式)
  3. API Key:粘贴刚才复制的智谱 AI API Key
  4. 模型版本:选择要使用的模型 ID,常用模型包括:
    • glm-4-plus:最强大模型,适合复杂推理、深度分析(最大输出 8K)
    • glm-4-long:超长文本处理,支持 1M 上下文(最大输出 8K)
    • glm-4-air:轻量高效版,快速响应(最大输出 8K)
    • glm-4-airx:极速版本,超低延迟(最大输出 8K)
    • glm-4-flash:闪电响应,实时对话(最大输出 8K)
    • glm-4:标准版本,平衡性能与成本(最大输出 8K)
    • glm-4v:多模态模型,支持图像理解(最大输出 8K)
    • glm-4v-plus:多模态增强版,支持 2 小时视频、4K 图像(最大输出 8K)
    • glm-3-turbo:经济实惠版,日常对话(最大输出 4K)

填写基础配置

高级配置(可选)

展开 高级配置 面板,可以调整以下参数:

CueMate 界面可调参数:

  1. 温度(temperature):控制输出随机性

    • 范围:0-1
    • 推荐值:0.7
    • 作用:值越高输出越随机创新,值越低输出越稳定保守
    • 使用建议
      • 创意写作/头脑风暴:0.8-0.95
      • 常规对话/问答:0.6-0.8
      • 代码生成/精确任务:0.3-0.5
    • 注意:智谱 AI 的 temperature 范围是 0-1,与 OpenAI 的 0-2 不同
  2. 输出最大 tokens(max_tokens):限制单次输出长度

    • 范围:256 - 8192(根据模型而定)
    • 推荐值:4096
    • 作用:控制模型单次响应的最大字数
    • 模型限制
      • GLM-4 系列:最大 8K tokens
      • GLM-3-turbo:最大 4K tokens
    • 使用建议
      • 简短问答:1024-2048
      • 常规对话:4096-8192
      • 长文生成:8192(最大)

高级配置

智谱 AI API 支持的其他高级参数:

虽然 CueMate 界面只提供 temperature 和 max_tokens 调整,但如果你通过 API 直接调用智谱 AI,还可以使用以下高级参数(智谱 AI 采用 OpenAI 兼容的 API 格式):

  1. top_p(nucleus sampling)

    • 范围:0-1
    • 默认值:0.7
    • 作用:从概率累积达到 p 的最小候选集中采样
    • 与 temperature 的关系:可以同时使用
    • 使用建议
      • 保持多样性:0.7-0.95
      • 更保守的输出:0.5-0.7
  2. do_sample

    • 类型:布尔值
    • 默认值:true
    • 作用:启用随机采样(设为 false 则使用贪心解码)
    • 使用场景
      • 创意任务:true(启用采样)
      • 确定性任务:false(贪心解码)
  3. stop(停止序列)

    • 类型:字符串或数组
    • 默认值:null
    • 最大数量:4 个字符串
    • 作用:当生成内容包含指定字符串时停止
    • 示例["###", "用户:", "\n\n"]
    • 使用场景
      • 结构化输出:使用分隔符控制格式
      • 对话系统:防止模型代替用户说话
  4. stream(流式输出)

    • 类型:布尔值
    • 默认值:false
    • 作用:启用 SSE 流式返回,边生成边返回
    • CueMate 中:自动处理,无需手动设置
  5. tools(工具调用)

    • 类型:对象数组
    • 作用:定义模型可以调用的工具/函数
    • 使用场景:Function Calling、Agent 应用
    • 示例
      json
      {
        "tools": [
          {
            "type": "function",
            "function": {
              "name": "get_weather",
              "description": "获取指定城市的天气",
              "parameters": {
                "type": "object",
                "properties": {
                  "city": {"type": "string"}
                }
              }
            }
          }
        ]
      }

智谱 AI 特色参数:

  1. request_id
    • 类型:字符串
    • 作用:用户端提供的唯一 ID,用于追踪请求
    • 使用建议:传入唯一标识以便追踪和调试

参数组合建议:

序号场景temperaturemax_tokenstop_pdo_samplestop
1创意写作0.8-0.954096-81920.9truenull
2代码生成0.2-0.52048-40960.7truenull
3问答系统0.6-0.81024-20480.7truenull
4摘要总结0.3-0.5512-10240.7truenull
5确定性任务020481.0falsenull

2.5 测试连接

填写完配置后,点击 测试连接 按钮,验证配置是否正确。

测试连接

如果配置正确,会显示测试成功的提示,并返回模型的响应示例。

测试成功

如果配置错误,会显示测试错误的日志,并且可以通过日志管理,查看具体报错信息。

2.6 保存配置

测试成功后,点击 保存 按钮,完成模型配置。

保存配置

3. 使用模型

通过右上角下拉菜单,进入系统设置界面,在大模型供应商栏目选择想要使用的模型配置。

配置完成后,可以在面试训练、问题生成等功能中选择使用此模型, 当然也可以在面试的选项中单此选择此次面试的模型配置。

选择模型

4. 支持的模型列表

序号模型名称模型 ID最大输出适用场景
1GLM-4 Plusglm-4-plus8K tokens最强版本、复杂推理
2GLM-4 Longglm-4-long8K tokens长文本处理、支持 1M 上下文
3GLM-4 Airglm-4-air8K tokens轻量级、快速响应
4GLM-4 AirXglm-4-airx8K tokens极速版本、超低延迟
5GLM-4 Flashglm-4-flash8K tokens实时对话、闪电响应
6GLM-4glm-48K tokens标准版本、技术面试
7GLM-4Vglm-4v8K tokens多模态、支持图像理解
8GLM-4V Plusglm-4v-plus8K tokens多模态增强版、支持 2 小时视频
9GLM-3 Turboglm-3-turbo4K tokens经济实惠、常规对话

5. 常见问题

5.1 API Key 无效

现象:测试连接时提示 API Key 错误

解决方案

  1. 检查 API Key 是否完整复制
  2. 确认 API Key 未过期或被禁用
  3. 检查账户是否有可用额度

5.2 请求超时

现象:测试连接或使用时长时间无响应

解决方案

  1. 检查网络连接是否正常
  2. 检查防火墙设置
  3. 确认智谱 AI 服务状态正常

5.3 配额不足

现象:提示配额已用完

解决方案

  1. 登录智谱 AI 平台查看账户余额
  2. 充值或申请更多配额
  3. 优化使用频率

相关链接

Released under the GPL-3.0 License.