Skip to content
智譜 AI

配置智譜 AI

智譜 AI 是中國領先的認知智慧大模型公司,提供 GLM-4 系列大語言模型服務。GLM-4 支援超長上下文、多模態理解、高效能推理等功能,廣泛應用於對話、文字生成、程式碼輔助等場景。

1. 獲取智譜 AI API Key

1.1 訪問 AI 開放平臺

訪問 AI 開放平臺並登入:https://open.bigmodel.cn/

訪問 AI 平臺

1.2 進入 API 管理頁面

點選右上角的使用者頭像,選擇 API 管理

進入 API 管理頁面

1.3 建立新的 API Key

點選 建立 API Key 按鈕。

點選建立按鈕

1.4 設定 API Key 資訊

在彈出的對話方塊中:

  1. 輸入 API Key 的名稱(例如:CueMate)
  2. 選擇適用的模型
  3. 點選 確定 按鈕

設定 API Key 資訊

1.5 複製 API Key

建立成功後,系統會顯示 API Key。

重要:這是唯一一次可以看到完整 API Key 的機會,請立即複製並妥善儲存。

複製 API Key

點選複製按鈕,API Key 已複製到剪貼簿。

2. 在 CueMate 中配置智譜 AI 模型

2.1 進入模型設定頁面

登入 CueMate 系統後,點選右上角下拉選單的 模型設定

進入模型設定

2.2 新增新模型

點選右上角的 新增模型 按鈕。

點選新增模型

2.3 選擇智譜 AI 服務商

在彈出的對話方塊中:

  1. 服務商型別:選擇 智譜 AI
  2. 點選後 自動進入下一步

選擇智譜 AI

2.4 填寫配置資訊

在配置頁面填寫以下資訊:

基礎配置

  1. 模型名稱:為這個模型配置起個名字(例如:智譜 GLM-4 Plus)
  2. API URL:保持預設 https://open.bigmodel.cn/api/paas/v4(OpenAI 相容格式)
  3. API Key:貼上剛才複製的智譜 AI API Key
  4. 模型版本:選擇要使用的模型 ID,常用模型包括:
    • glm-4-plus:最強大模型,適合複雜推理、深度分析(最大輸出 8K)
    • glm-4-long:超長文字處理,支援 1M 上下文(最大輸出 8K)
    • glm-4-air:輕量高效版,快速響應(最大輸出 8K)
    • glm-4-airx:極速版本,超低延遲(最大輸出 8K)
    • glm-4-flash:閃電響應,實時對話(最大輸出 8K)
    • glm-4:標準版本,平衡效能與成本(最大輸出 8K)
    • glm-4v:多模態模型,支援影象理解(最大輸出 8K)
    • glm-4v-plus:多模態增強版,支援 2 小時影片、4K 影象(最大輸出 8K)
    • glm-3-turbo:經濟實惠版,日常對話(最大輸出 4K)

填寫基礎配置

高階配置(可選)

展開 高階配置 面板,可以調整以下引數:

CueMate 介面可調引數:

  1. 溫度(temperature):控制輸出隨機性

    • 範圍:0-1
    • 推薦值:0.7
    • 作用:值越高輸出越隨機創新,值越低輸出越穩定保守
    • 使用建議
      • 創意寫作/頭腦風暴:0.8-0.95
      • 常規對話/問答:0.6-0.8
      • 程式碼生成/精確任務:0.3-0.5
    • 注意:智譜 AI 的 temperature 範圍是 0-1,與 OpenAI 的 0-2 不同
  2. 輸出最大 tokens(max_tokens):限制單次輸出長度

    • 範圍:256 - 8192(根據模型而定)
    • 推薦值:4096
    • 作用:控制模型單次響應的最大字數
    • 模型限制
      • GLM-4 系列:最大 8K tokens
      • GLM-3-turbo:最大 4K tokens
    • 使用建議
      • 簡短問答:1024-2048
      • 常規對話:4096-8192
      • 長文生成:8192(最大)

高階配置

智譜 AI API 支援的其他高階引數:

雖然 CueMate 介面只提供 temperature 和 max_tokens 調整,但如果你透過 API 直接呼叫智譜 AI,還可以使用以下高階引數(智譜 AI 採用 OpenAI 相容的 API 格式):

  1. top_p(nucleus sampling)

    • 範圍:0-1
    • 預設值:0.7
    • 作用:從機率累積達到 p 的最小候選集中取樣
    • 與 temperature 的關係:可以同時使用
    • 使用建議
      • 保持多樣性:0.7-0.95
      • 更保守的輸出:0.5-0.7
  2. do_sample

    • 型別:布林值
    • 預設值:true
    • 作用:啟用隨機取樣(設為 false 則使用貪心解碼)
    • 使用場景
      • 創意任務:true(啟用取樣)
      • 確定性任務:false(貪心解碼)
  3. stop(停止序列)

    • 型別:字串或陣列
    • 預設值:null
    • 最大數量:4 個字串
    • 作用:當生成內容包含指定字串時停止
    • 示例["###", "使用者:", "\n\n"]
    • 使用場景
      • 結構化輸出:使用分隔符控制格式
      • 對話系統:防止模型代替使用者說話
  4. stream(流式輸出)

    • 型別:布林值
    • 預設值:false
    • 作用:啟用 SSE 流式返回,邊生成邊返回
    • CueMate 中:自動處理,無需手動設定
  5. tools(工具呼叫)

    • 型別:物件陣列
    • 作用:定義模型可以呼叫的工具/函式
    • 使用場景:Function Calling、Agent 應用
    • 示例
      json
      {
        "tools": [
          {
            "type": "function",
            "function": {
              "name": "get_weather",
              "description": "獲取指定城市的天氣",
              "parameters": {
                "type": "object",
                "properties": {
                  "city": {"type": "string"}
                }
              }
            }
          }
        ]
      }

智譜 AI 特色引數:

  1. request_id
    • 型別:字串
    • 作用:使用者端提供的唯一 ID,用於追蹤請求
    • 使用建議:傳入唯一標識以便追蹤和除錯
序號場景temperaturemax_tokenstop_pdo_samplestop
1創意寫作0.8-0.954096-81920.9truenull
2程式碼生成0.2-0.52048-40960.7truenull
3問答系統0.6-0.81024-20480.7truenull
4摘要總結0.3-0.5512-10240.7truenull
5確定性任務020481.0falsenull

2.5 測試連線

填寫完配置後,點選 測試連線 按鈕,驗證配置是否正確。

測試連線

如果配置正確,會顯示測試成功的提示,並返回模型的響應示例。

測試成功

如果配置錯誤,會顯示測試錯誤的日誌,並且可以透過日誌管理,檢視具體報錯資訊。

2.6 儲存配置

測試成功後,點選 儲存 按鈕,完成模型配置。

儲存配置

3. 使用模型

透過右上角下拉選單,進入系統設定介面,在大模型服務商欄目選擇想要使用的模型配置。

配置完成後,可以在面試訓練、問題生成等功能中選擇使用此模型, 當然也可以在面試的選項中單此選擇此次面試的模型配置。

選擇模型

4. 支援的模型列表

序號模型名稱模型 ID最大輸出適用場景
1GLM-4 Plusglm-4-plus8K tokens最強版本、複雜推理
2GLM-4 Longglm-4-long8K tokens長文字處理、支援 1M 上下文
3GLM-4 Airglm-4-air8K tokens輕量級、快速響應
4GLM-4 AirXglm-4-airx8K tokens極速版本、超低延遲
5GLM-4 Flashglm-4-flash8K tokens實時對話、閃電響應
6GLM-4glm-48K tokens標準版本、技術面試
7GLM-4Vglm-4v8K tokens多模態、支援影象理解
8GLM-4V Plusglm-4v-plus8K tokens多模態增強版、支援 2 小時影片
9GLM-3 Turboglm-3-turbo4K tokens經濟實惠、常規對話

5. 常見問題

5.1 API Key 無效

現象:測試連線時提示 API Key 錯誤

解決方案

  1. 檢查 API Key 是否完整複製
  2. 確認 API Key 未過期或被禁用
  3. 檢查賬戶是否有可用額度

5.2 請求超時

現象:測試連線或使用時長時間無響應

解決方案

  1. 檢查網路連線是否正常
  2. 檢查防火牆設定
  3. 確認智譜 AI 服務狀態正常

5.3 配額不足

現象:提示配額已用完

解決方案

  1. 登入智譜 AI 平臺檢視賬戶餘額
  2. 充值或申請更多配額
  3. 最佳化使用頻率

相關連結

Released under the GPL-3.0 License.