Skip to content
阿里雲百鍊

配置阿里雲百鍊

阿里雲百鍊是阿里雲推出的企業級大模型服務平臺,提供通義千問 Qwen 系列模型。支援多語言、多模態、超長上下文等功能,適用於智慧客服、內容創作、程式碼輔助等場景。

1. 獲取阿里雲百鍊 API Key

1.1 訪問阿里雲百鍊平臺

訪問阿里雲百鍊(通義千問)平臺並登入:https://dashscope.aliyun.com/

訪問阿里雲百鍊平臺

1.2 進入 API-KEY 管理頁面

登入後,點選右上角的使用者頭像,選擇 API-KEY 管理

進入 API-KEY 管理

1.3 建立新的 API Key

點選 建立新的 API-KEY 按鈕。

點選建立按鈕

1.4 設定 API Key 資訊

在彈出的對話方塊中:

  1. 輸入 API Key 的名稱(例如:CueMate)
  2. 點選 Create Key 按鈕

設定 API Key 資訊

1.5 複製 API Key

建立成功後,系統會顯示 API Key。

重要:請立即複製並妥善儲存,API Key 以 sk- 開頭,長度為 32 位字元。

複製 API Key

點選複製按鈕,API Key 已複製到剪貼簿。

2. 在 CueMate 中配置阿里雲百鍊模型

2.1 進入模型設定頁面

登入 CueMate 系統後,點選右上角下拉選單的 模型設定

進入模型設定

2.2 新增新模型

點選右上角的 新增模型 按鈕。

點選新增模型

2.3 選擇阿里雲百鍊服務商

在彈出的對話方塊中:

  1. 服務商型別:選擇 阿里雲百鍊
  2. 點選後 自動進入下一步

選擇阿里雲百鍊

2.4 填寫配置資訊

在配置頁面填寫以下資訊:

基礎配置

  1. 模型名稱:為這個模型配置起個名字(例如:通義千問 3-Max)
  2. API URL:保持預設 https://dashscope.aliyuncs.com/compatible-mode/v1(OpenAI 相容格式)
  3. API Key:貼上剛才複製的阿里雲百鍊 API Key
  4. 模型版本:選擇或輸入要使用的模型 ID,常用模型包括:
    • qwen3-max:最新最強模型,最大輸出 65K
    • qwen-plus:高價效比版本,最大輸出 32K
    • qwen-flash:快速響應版本,最大輸出 16K
    • qwen-max:經典旗艦版本,最大輸出 8K
    • qwen-turbo:快速版本,最大輸出 8K
    • qwen3-235b-a22b:超大引數版本,最大輸出 8K
    • 其他 Qwen3 系列模型(0.6b/1.7b/4b/8b/14b/32b/30b-a3b)

填寫基礎配置

高階配置(可選)

展開 高階配置 面板,可以調整以下引數:

CueMate 介面可調引數:

  1. 溫度(temperature):控制輸出隨機性

    • 範圍:0-2
    • 推薦值:0.7
    • 作用:值越高輸出越隨機創新,值越低輸出越穩定保守
    • 使用建議
      • 創意寫作/頭腦風暴:1.0-1.5
      • 常規對話/問答:0.7-0.9
      • 程式碼生成/精確任務:0.3-0.5
  2. 輸出最大 tokens(max_tokens):限制單次輸出長度

    • 範圍:256 - 65536(根據模型而定)
    • 推薦值:8192
    • 作用:控制模型單次響應的最大字數
    • 模型限制
      • qwen3-max:最大 65K tokens
      • qwen-plus:最大 32K tokens
      • qwen-flash:最大 16K tokens
      • qwen-max/qwen-turbo/qwen3 系列:最大 8K tokens
    • 使用建議
      • 簡短問答:1024-2048
      • 常規對話:4096-8192
      • 長文生成:16384-32768
      • 超長文件:65536(僅 qwen3-max)

高階配置

阿里雲百鍊 API 支援的其他高階引數:

雖然 CueMate 介面只提供 temperature 和 max_tokens 調整,但如果你透過 API 直接呼叫阿里雲百鍊,還可以使用以下高階引數(阿里雲百鍊採用 OpenAI 相容的 API 格式):

  1. top_p(nucleus sampling)

    • 範圍:0-1
    • 預設值:1
    • 作用:從機率累積達到 p 的最小候選集中取樣
    • 與 temperature 的關係:通常只調整其中一個
    • 使用建議
      • 保持多樣性但避免離譜:0.9-0.95
      • 更保守的輸出:0.7-0.8
  2. frequency_penalty(頻率懲罰)

    • 範圍:-2.0 到 2.0
    • 預設值:0
    • 作用:降低重複相同詞彙的機率(基於詞頻)
    • 使用建議
      • 減少重複:0.3-0.8
      • 允許重複:0(預設)
  3. presence_penalty(存在懲罰)

    • 範圍:-2.0 到 2.0
    • 預設值:0
    • 作用:降低已出現過的詞彙再次出現的機率(基於是否出現)
    • 使用建議
      • 鼓勵新話題:0.3-0.8
      • 允許重複話題:0(預設)
  4. stop(停止序列)

    • 型別:字串或陣列
    • 預設值:null
    • 作用:當生成內容包含指定字串時停止
    • 示例["###", "使用者:", "\n\n"]
    • 使用場景
      • 結構化輸出:使用分隔符控制格式
      • 對話系統:防止模型代替使用者說話
  5. stream(流式輸出)

    • 型別:布林值
    • 預設值:false
    • 作用:啟用 SSE 流式返回,邊生成邊返回
    • CueMate 中:自動處理,無需手動設定
  6. tools(工具呼叫)

    • 型別:物件陣列
    • 作用:定義模型可以呼叫的工具/函式
    • 使用場景:Function Calling、Agent 應用
    • 示例
      json
      {
        "tools": [
          {
            "type": "function",
            "function": {
              "name": "get_weather",
              "description": "獲取指定城市的天氣資訊",
              "parameters": {
                "type": "object",
                "properties": {
                  "city": {"type": "string", "description": "城市名稱"}
                }
              }
            }
          }
        ]
      }

阿里雲百鍊特色引數:

  1. enable_search(聯網搜尋)
    • 型別:布林值
    • 預設值:false
    • 作用:啟用實時聯網搜尋功能,增強答案時效性
    • 使用場景:需要最新資訊的問答任務
    • 注意:僅部分模型支援(如 qwen-max、qwen-plus)

引數組合建議:

序號場景temperaturemax_tokenstop_pfrequency_penaltypresence_penaltyenable_search
1創意寫作1.0-1.24096-81920.950.50.5false
2程式碼生成0.2-0.52048-40960.90.00.0false
3問答系統0.71024-20480.90.00.0false
4摘要總結0.3-0.5512-10240.90.00.0false
5實時資訊0.72048-40960.90.00.0true

2.5 測試連線

填寫完配置後,點選 測試連線 按鈕,驗證配置是否正確。

測試連線

如果配置正確,會顯示測試成功的提示,並返回模型的響應示例。

測試成功

如果配置錯誤,會顯示測試錯誤的日誌,並且可以透過日誌管理,檢視具體報錯資訊。

2.6 儲存配置

測試成功後,點選 儲存 按鈕,完成模型配置。

儲存配置

3. 使用模型

透過右上角下拉選單,進入系統設定介面,在大模型服務商欄目選擇想要使用的模型配置。

配置完成後,可以在面試訓練、問題生成等功能中選擇使用此模型, 當然也可以在面試的選項中單此選擇此次面試的模型配置。

選擇模型

4. 支援的模型列表

4.1 Qwen3 系列(最新)

序號模型名稱模型 ID最大輸出適用場景
1Qwen3-Maxqwen3-max65K tokens最新最強模型、複雜推理
2Qwen3-235B-A22Bqwen3-235b-a22b8K tokens超大規模任務
3Qwen3-32Bqwen3-32b8K tokens大規模任務
4Qwen3-30B-A3Bqwen3-30b-a3b8K tokens專業領域
5Qwen3-14Bqwen3-14b8K tokens中等規模任務
6Qwen3-8Bqwen3-8b8K tokens中等規模任務
7Qwen3-4Bqwen3-4b8K tokens小規模任務
8Qwen3-1.7Bqwen3-1.7b8K tokens輕量級應用
9Qwen3-0.6Bqwen3-0.6b8K tokens輕量級應用

4.2 通義千問系列

序號模型名稱模型 ID最大輸出適用場景
1通義千問-Plusqwen-plus32K tokens通用場景、高價效比
2通義千問-Flashqwen-flash16K tokens快速響應、實時對話
3通義千問-Maxqwen-max8K tokens技術面試、複雜推理
4通義千問-Turboqwen-turbo8K tokens快速響應、簡單對話

5. 常見問題

5.1 API Key 無效

現象:測試連線時提示 API Key 錯誤

解決方案

  1. 檢查 API Key 是否以 sk- 開頭
  2. 確認 API Key 長度為 32 位字元
  3. 檢查是否有多餘的空格
  4. 確認 API Key 未過期或被禁用

5.2 請求超時

現象:測試連線或使用時長時間無響應

解決方案

  1. 檢查網路連線是否正常
  2. 確認 API URL 地址正確
  3. 檢查防火牆設定

5.3 配額不足

現象:提示配額已用完或餘額不足

解決方案

  1. 登入阿里雲百鍊平臺檢視賬戶餘額
  2. 充值或申請更多配額
  3. 檢查 API 呼叫頻率限制

相關連結

Released under the GPL-3.0 License.