配置百度千帆
百度千帆(Qianfan)是百度推出的大語言模型平臺,基於文心大模型技術。提供強大的中文理解和生成能力,支援 ERNIE-4.0、ERNIE-3.5 等多個版本。自 2025 年 3 月起,個人使用者可免費呼叫 API。
1. 獲取百度千帆 API Key
1.1 訪問百度智慧雲
訪問百度智慧雲官網並登入:https://cloud.baidu.com/
如果沒有賬號,需要先註冊一個百度賬號。

1.2 進入百度智慧雲控制檯
登入後,點選右上角的 控制檯 按鈕,進入百度智慧雲總控制檯。
百度智慧雲是一個綜合性雲平臺,提供計算、儲存、AI 等多種服務。

1.3 找到千帆大模型平臺
在百度智慧雲控制檯中,找到 千帆大模型平臺 或 文心大模型 服務入口:
- 方式一:在控制檯首頁搜尋"千帆"或"文心"
- 方式二:在左側選單中找到 人工智慧 → 千帆大模型平臺
- 方式三:直接訪問千帆平臺控制檯:https://console.bce.baidu.com/qianfan/overview
點選進入千帆大模型平臺。

首次進入千帆大模型平臺時,會彈出使用者服務協議,需要同意後才能繼續使用。請閱讀並同意協議。

1.4 進入 API Key 管理頁面
在千帆大模型平臺左側選單中,點選系統管理下的 API Key 選單項。
進入 API Key 管理頁面後,可以看到頁面提示:"API Key 是通用於大模型服務及工具的呼叫鑑權憑證。請務必妥善保管並定期更換,以避免不必要的安全風險或資金損失。"

1.5 建立 API Key
點選右上角的 建立 API Key 按鈕(藍色按鈕)。

1.6 填寫 API Key 資訊
在彈出的對話方塊中填寫:
- 名稱:為這個 API Key 起個名字,例如"CueMate"(方便後續識別用途)
- 授予"全部許可權"或"自定義許可權"
- 點選 建立 按鈕

1.7 複製 API Key
建立成功後,會顯示您的 API Key。
重要提示:
- API Key 用於呼叫百度千帆大模型 API 的鑑權憑證
- 請妥善保管,不要洩露給他人
- 如果 API Key 洩露,請立即刪除並重新建立
點選複製按鈕,將 API Key 複製儲存到記事本或其他安全的地方,後續配置中會用到。

2. 在 CueMate 中配置百度千帆模型
2.1 進入模型設定頁面
登入 CueMate 系統後,點選右上角下拉選單的 模型設定。

2.2 新增新模型
點選右上角的 新增模型 按鈕。

2.3 選擇百度千帆服務商
在彈出的對話方塊中:
- 服務商型別:選擇 百度千帆
- 點選後 自動進入下一步

2.4 填寫配置資訊
在配置頁面填寫以下資訊:
基礎配置
- 模型名稱:為這個模型配置起個名字(例如:ERNIE-4.5-Turbo)
- API URL:保持預設
https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat - API Key:貼上剛才複製的百度 API Key
- 模型版本:選擇要使用的模型 ID,常用模型包括:
ERNIE-4.5-Turbo:文心 4.5 Turbo 版本,16K+ 上下文,效能最強,適合複雜任務ERNIE-4.5:文心 4.5 版本,16K+ 上下文,個人使用者免費ERNIE-Speed-AppBuilder:速度最佳化版本,響應快,適合高頻呼叫

高階配置(可選)
展開 高階配置 面板,可以調整以下引數:
溫度(temperature):控制輸出隨機性
- 範圍:0-1(ERNIE 系列)、0-2(DeepSeek/Llama/Qwen 系列)
- 預設值:
- ERNIE 系列:0.95
- DeepSeek 系列:1.0
- 其他模型:0.7
- 作用:值越高輸出越隨機創新,值越低輸出越穩定保守
- 使用建議:
- 創意寫作/頭腦風暴:0.8-1.0
- 常規對話/問答:0.7-0.9
- 程式碼生成/精確任務:0.3-0.5
- 邏輯推理/數學計算:0.1-0.3
輸出最大 tokens(max_tokens):限制單次輸出長度
- 範圍:根據模型而定
- 推薦值:4096
- 作用:控制模型單次響應的最大字數
- 模型限制:
- ERNIE-4.5/ERNIE-4.5-Turbo:最大 8192 tokens
- ERNIE-Speed-AppBuilder:最大 4096 tokens
- DeepSeek-V3/V3.2:最大 8192 tokens
- DeepSeek-V3.1-Think/V3.2-Think:最大 8000 tokens
- Kimi-K2-Instruct:最大 4096 tokens
- Llama 系列:最大 4096 tokens
- Qwen 系列:最大 6144 tokens
- GLM-4 系列:最大 4095 tokens
- Yi-Lightning:最大 4096 tokens
- 使用建議:
- 簡短問答:1024-2048
- 常規對話:2048-4096
- 長文生成:4096-8192
- 程式碼生成:2048-4096

百度千帆 API 支援的其他高階引數:
雖然 CueMate 介面只提供 temperature 和 max_tokens 調整,但如果你透過 API 直接呼叫百度千帆,部分模型還支援以下引數:
top_p(nucleus sampling)
- 範圍:0-1
- 預設值:0.8
- 作用:從機率累積達到 p 的最小候選集中取樣
- 與 temperature 的關係:通常只調整其中一個
- 使用建議:
- 保持多樣性但避免離譜:0.9-0.95
- 更保守的輸出:0.7-0.8
penalty_score(重複懲罰)
- 範圍:1.0-2.0
- 預設值:1.0
- 作用:降低重複內容的機率
- 使用建議:
- 減少重複:1.2-1.5
- 允許適度重複:1.0-1.1(預設)
stream(流式輸出)
- 型別:布林值
- 預設值:false
- 作用:啟用 SSE 流式返回,邊生成邊返回
- CueMate 中:自動處理,無需手動設定
引數調優技巧:
- 創意場景:高 temperature (0.8-1.0) + 低 penalty_score (1.0-1.1)
- 精確場景:低 temperature (0.1-0.3) + 中等 penalty_score (1.2-1.3)
- 平衡場景:中等 temperature (0.7) + 中等 penalty_score (1.1-1.2)
- 長文字生成:適當提高 max_tokens,降低 temperature 保證連貫性
2.5 測試連線
填寫完配置後,點選 測試連線 按鈕,驗證配置是否正確。

如果配置正確,會顯示測試成功的提示,並返回模型的響應示例。

2.6 儲存配置
測試成功後,點選 儲存 按鈕,完成模型配置。

3. 使用模型
透過右上角下拉選單,進入系統設定介面,在大模型服務商欄目選擇想要使用的模型配置。
配置完成後,可以在面試訓練、問題生成等功能中選擇使用此模型,當然也可以在面試的選項中單次選擇此次面試的模型配置。

4. 支援的模型列表
百度千帆平臺支援 54+ 個大模型,包括百度自家的 ERNIE 系列和第三方模型。以下是常用模型列表:
4.1 ERNIE 系列(百度自家)
| 序號 | 模型名稱 | 模型 ID | 上下文長度 | 適用場景 |
|---|---|---|---|---|
| 1 | ERNIE-4.5-Turbo | ERNIE-4.5-Turbo | 16K+ tokens | 複雜任務、深度理解、程式碼生成 |
| 2 | ERNIE-4.5 | ERNIE-4.5 | 16K+ tokens | 常規對話、日常使用(免費) |
| 3 | ERNIE-Speed-AppBuilder | ERNIE-Speed-AppBuilder | 8K tokens | 快速響應、高頻呼叫 |
4.2 DeepSeek 系列(深度求索)
| 序號 | 模型名稱 | 模型 ID | 上下文長度 | 適用場景 |
|---|---|---|---|---|
| 1 | DeepSeek-V3.2 | DeepSeek-V3.2 | 16K tokens | 高效能推理、程式碼生成 |
| 2 | DeepSeek-V3.2-Think | DeepSeek-V3.2-Think | 16K tokens | 深度推理、複雜問題 |
| 3 | DeepSeek-V3 | DeepSeek-V3 | 16K tokens | 通用對話 |
| 4 | DeepSeek-V3.1-Think | DeepSeek-V3.1-Think | 16K tokens | 深度推理 |
4.3 Kimi 系列(月之暗面)
| 序號 | 模型名稱 | 模型 ID | 上下文長度 | 適用場景 |
|---|---|---|---|---|
| 1 | Kimi-K2-Instruct | Kimi-K2-Instruct | 16K tokens | 長文字理解、對話 |
4.4 Llama 系列(Meta)
| 序號 | 模型名稱 | 模型 ID | 上下文長度 | 適用場景 |
|---|---|---|---|---|
| 1 | Llama-3.3-70B-Instruct | Llama-3.3-70B-Instruct | 16K tokens | 通用對話、程式碼生成 |
| 2 | Llama-3.1-405B-Instruct | Llama-3.1-405B-Instruct | 16K tokens | 高效能推理 |
4.5 Qwen 系列(通義實驗室/阿里)
| 序號 | 模型名稱 | 模型 ID | 上下文長度 | 適用場景 |
|---|---|---|---|---|
| 1 | Qwen2.5-72B-Instruct | Qwen2.5-72B-Instruct | 16K tokens | 通用對話、程式碼生成 |
| 2 | Qwen2.5-7B-Instruct | Qwen2.5-7B-Instruct | 8K tokens | 輕量級對話 |
4.6 GLM 系列(智譜 AI)
| 序號 | 模型名稱 | 模型 ID | 上下文長度 | 適用場景 |
|---|---|---|---|---|
| 1 | GLM-4-Plus | GLM-4-Plus | 16K tokens | 複雜任務、程式碼生成 |
| 2 | GLM-4-Flash | GLM-4-Flash | 8K tokens | 快速響應 |
4.7 Yi 系列(零一萬物)
| 序號 | 模型名稱 | 模型 ID | 上下文長度 | 適用場景 |
|---|---|---|---|---|
| 1 | Yi-Lightning | Yi-Lightning | 16K tokens | 快速響應、高價效比 |
說明:
- 以上僅列出常用模型,完整模型列表請訪問百度千帆平臺檢視
- 模型 ID 需要在配置時準確填寫
- 不同模型的計費標準不同,請檢視官方定價說明
5. 常見問題
5.1 API Key 無效
現象:測試連線時提示 API Key 錯誤
解決方案:
- 檢查 API Key 和 Secret Key 是否正確
- 確認應用是否已啟用
- 檢查賬戶是否有可用額度
5.2 請求超時
現象:測試連線或使用時長時間無響應
解決方案:
- 檢查網路連線是否正常
- 確認 API URL 地址正確
- 檢查防火牆設定
5.3 配額不足
現象:提示配額已用完或餘額不足
解決方案:
- 登入千帆平臺檢視賬戶餘額
- 充值或申請更多配額
- 最佳化使用頻率
