Skip to content
阿里云百炼

配置阿里云百炼

阿里云百炼是阿里云推出的企业级大模型服务平台,提供通义千问 Qwen 系列模型。支持多语言、多模态、超长上下文等功能,适用于智能客服、内容创作、代码辅助等场景。

1. 获取阿里云百炼 API Key

1.1 访问阿里云百炼平台

访问阿里云百炼(通义千问)平台并登录:https://dashscope.aliyun.com/

访问阿里云百炼平台

1.2 进入 API-KEY 管理页面

登录后,点击右上角的用户头像,选择 API-KEY 管理

进入 API-KEY 管理

1.3 创建新的 API Key

点击 创建新的 API-KEY 按钮。

点击创建按钮

1.4 设置 API Key 信息

在弹出的对话框中:

  1. 输入 API Key 的名称(例如:CueMate)
  2. 点击 Create Key 按钮

设置 API Key 信息

1.5 复制 API Key

创建成功后,系统会显示 API Key。

重要:请立即复制并妥善保存,API Key 以 sk- 开头,长度为 32 位字符。

复制 API Key

点击复制按钮,API Key 已复制到剪贴板。

2. 在 CueMate 中配置阿里云百炼模型

2.1 进入模型设置页面

登录 CueMate 系统后,点击右上角下拉菜单的 模型设置

进入模型设置

2.2 添加新模型

点击右上角的 添加模型 按钮。

点击添加模型

2.3 选择阿里云百炼服务商

在弹出的对话框中:

  1. 服务商类型:选择 阿里云百炼
  2. 点击后 自动进入下一步

选择阿里云百炼

2.4 填写配置信息

在配置页面填写以下信息:

基础配置

  1. 模型名称:为这个模型配置起个名字(例如:通义千问 3-Max)
  2. API URL:保持默认 https://dashscope.aliyuncs.com/compatible-mode/v1(OpenAI 兼容格式)
  3. API Key:粘贴刚才复制的阿里云百炼 API Key
  4. 模型版本:选择或输入要使用的模型 ID,常用模型包括:
    • qwen3-max:最新最强模型,最大输出 65K
    • qwen-plus:高性价比版本,最大输出 32K
    • qwen-flash:快速响应版本,最大输出 16K
    • qwen-max:经典旗舰版本,最大输出 8K
    • qwen-turbo:快速版本,最大输出 8K
    • qwen3-235b-a22b:超大参数版本,最大输出 8K
    • 其他 Qwen3 系列模型(0.6b/1.7b/4b/8b/14b/32b/30b-a3b)

填写基础配置

高级配置(可选)

展开 高级配置 面板,可以调整以下参数:

CueMate 界面可调参数:

  1. 温度(temperature):控制输出随机性

    • 范围:0-2
    • 推荐值:0.7
    • 作用:值越高输出越随机创新,值越低输出越稳定保守
    • 使用建议
      • 创意写作/头脑风暴:1.0-1.5
      • 常规对话/问答:0.7-0.9
      • 代码生成/精确任务:0.3-0.5
  2. 输出最大 tokens(max_tokens):限制单次输出长度

    • 范围:256 - 65536(根据模型而定)
    • 推荐值:8192
    • 作用:控制模型单次响应的最大字数
    • 模型限制
      • qwen3-max:最大 65K tokens
      • qwen-plus:最大 32K tokens
      • qwen-flash:最大 16K tokens
      • qwen-max/qwen-turbo/qwen3 系列:最大 8K tokens
    • 使用建议
      • 简短问答:1024-2048
      • 常规对话:4096-8192
      • 长文生成:16384-32768
      • 超长文档:65536(仅 qwen3-max)

高级配置

阿里云百炼 API 支持的其他高级参数:

虽然 CueMate 界面只提供 temperature 和 max_tokens 调整,但如果你通过 API 直接调用阿里云百炼,还可以使用以下高级参数(阿里云百炼采用 OpenAI 兼容的 API 格式):

  1. top_p(nucleus sampling)

    • 范围:0-1
    • 默认值:1
    • 作用:从概率累积达到 p 的最小候选集中采样
    • 与 temperature 的关系:通常只调整其中一个
    • 使用建议
      • 保持多样性但避免离谱:0.9-0.95
      • 更保守的输出:0.7-0.8
  2. frequency_penalty(频率惩罚)

    • 范围:-2.0 到 2.0
    • 默认值:0
    • 作用:降低重复相同词汇的概率(基于词频)
    • 使用建议
      • 减少重复:0.3-0.8
      • 允许重复:0(默认)
  3. presence_penalty(存在惩罚)

    • 范围:-2.0 到 2.0
    • 默认值:0
    • 作用:降低已出现过的词汇再次出现的概率(基于是否出现)
    • 使用建议
      • 鼓励新话题:0.3-0.8
      • 允许重复话题:0(默认)
  4. stop(停止序列)

    • 类型:字符串或数组
    • 默认值:null
    • 作用:当生成内容包含指定字符串时停止
    • 示例["###", "用户:", "\n\n"]
    • 使用场景
      • 结构化输出:使用分隔符控制格式
      • 对话系统:防止模型代替用户说话
  5. stream(流式输出)

    • 类型:布尔值
    • 默认值:false
    • 作用:启用 SSE 流式返回,边生成边返回
    • CueMate 中:自动处理,无需手动设置
  6. tools(工具调用)

    • 类型:对象数组
    • 作用:定义模型可以调用的工具/函数
    • 使用场景:Function Calling、Agent 应用
    • 示例
      json
      {
        "tools": [
          {
            "type": "function",
            "function": {
              "name": "get_weather",
              "description": "获取指定城市的天气信息",
              "parameters": {
                "type": "object",
                "properties": {
                  "city": {"type": "string", "description": "城市名称"}
                }
              }
            }
          }
        ]
      }

阿里云百炼特色参数:

  1. enable_search(联网搜索)
    • 类型:布尔值
    • 默认值:false
    • 作用:启用实时联网搜索功能,增强答案时效性
    • 使用场景:需要最新信息的问答任务
    • 注意:仅部分模型支持(如 qwen-max、qwen-plus)

参数组合建议:

序号场景temperaturemax_tokenstop_pfrequency_penaltypresence_penaltyenable_search
1创意写作1.0-1.24096-81920.950.50.5false
2代码生成0.2-0.52048-40960.90.00.0false
3问答系统0.71024-20480.90.00.0false
4摘要总结0.3-0.5512-10240.90.00.0false
5实时资讯0.72048-40960.90.00.0true

2.5 测试连接

填写完配置后,点击 测试连接 按钮,验证配置是否正确。

测试连接

如果配置正确,会显示测试成功的提示,并返回模型的响应示例。

测试成功

如果配置错误,会显示测试错误的日志,并且可以通过日志管理,查看具体报错信息。

2.6 保存配置

测试成功后,点击 保存 按钮,完成模型配置。

保存配置

3. 使用模型

通过右上角下拉菜单,进入系统设置界面,在大模型供应商栏目选择想要使用的模型配置。

配置完成后,可以在面试训练、问题生成等功能中选择使用此模型, 当然也可以在面试的选项中单此选择此次面试的模型配置。

选择模型

4. 支持的模型列表

4.1 Qwen3 系列(最新)

序号模型名称模型 ID最大输出适用场景
1Qwen3-Maxqwen3-max65K tokens最新最强模型、复杂推理
2Qwen3-235B-A22Bqwen3-235b-a22b8K tokens超大规模任务
3Qwen3-32Bqwen3-32b8K tokens大规模任务
4Qwen3-30B-A3Bqwen3-30b-a3b8K tokens专业领域
5Qwen3-14Bqwen3-14b8K tokens中等规模任务
6Qwen3-8Bqwen3-8b8K tokens中等规模任务
7Qwen3-4Bqwen3-4b8K tokens小规模任务
8Qwen3-1.7Bqwen3-1.7b8K tokens轻量级应用
9Qwen3-0.6Bqwen3-0.6b8K tokens轻量级应用

4.2 通义千问系列

序号模型名称模型 ID最大输出适用场景
1通义千问-Plusqwen-plus32K tokens通用场景、高性价比
2通义千问-Flashqwen-flash16K tokens快速响应、实时对话
3通义千问-Maxqwen-max8K tokens技术面试、复杂推理
4通义千问-Turboqwen-turbo8K tokens快速响应、简单对话

5. 常见问题

5.1 API Key 无效

现象:测试连接时提示 API Key 错误

解决方案

  1. 检查 API Key 是否以 sk- 开头
  2. 确认 API Key 长度为 32 位字符
  3. 检查是否有多余的空格
  4. 确认 API Key 未过期或被禁用

5.2 请求超时

现象:测试连接或使用时长时间无响应

解决方案

  1. 检查网络连接是否正常
  2. 确认 API URL 地址正确
  3. 检查防火墙设置

5.3 配额不足

现象:提示配额已用完或余额不足

解决方案

  1. 登录阿里云百炼平台查看账户余额
  2. 充值或申请更多配额
  3. 检查 API 调用频率限制

相关链接

Released under the GPL-3.0 License.