Skip to content

模型設定

模型設定用於配置和管理所有大語言模型(LLM),支援公有云模型(OpenAI、Claude、DeepSeek)和私有部署模型(Ollama、vLLM、Xinference)。透過統一的配置介面,您可以新增多個模型、管理憑證、測試連線狀態、配置模型引數。

1. 頁面佈局

1.1 進入模型設定頁面

點選頂部下拉選單選單中的"模型設定",進入模型管理頁面。

頂部下拉選單選單

1.2 佈局結構

頁面採用左右分欄設計:

左側導航區域

  • 樹形結構展示服務商分類
  • 全部模型、公有模型、私有模型三級分類
  • 每個服務商帶有品牌圖示
  • 支援摺疊/展開側邊欄

右側內容區域

  • 頂部:標題、搜尋框、重新整理和新增按鈕
  • 主體:卡片式模型列表,桌面端 2 列布局
  • 底部:分頁導航

模型卡片資訊

  • 左上角序號、服務商圖示和模型名稱
  • 公有/私有標籤、連通狀態標籤(已連通/不可用)
  • 服務商、模型型別、基礎模型、版本號、建立者、建立時間
  • 懸停顯示操作按鈕:測試連線、編輯、刪除

頁面佈局

2. 瀏覽模型

2.1 使用導航樹篩選

左側導航樹以樹形結構組織模型:

全部模型
├── 公有模型
│   ├── OpenAI
│   ├── Claude
│   ├── DeepSeek
│   └── ...
└── 私有模型
    ├── Ollama
    ├── vLLM
    └── ...

操作方式

  • 點選"全部模型"顯示所有模型
  • 點選"公有模型"或"私有模型"顯示該類別模型
  • 點選具體服務商只顯示該服務商的模型
  • 選中節點高亮顯示

公有 vs 私有

  • 公有模型:雲端服務,資料在服務商雲端處理(如 OpenAI、Claude)
  • 私有模型:本地部署,資料在您的裝置內處理(如 Ollama、vLLM)

2.2 檢視模型列表

右側以卡片形式展示模型,每個卡片包含:

  • 序號和服務商圖示
  • 模型名稱和型別標籤
  • 連通狀態(綠色"已連通"/紅色"不可用")
  • 詳細資訊(服務商、基礎模型、版本、建立者、時間)

響應式佈局

  • 大螢幕:2 列卡片
  • 小螢幕:1 列卡片

模型列表

2.3 搜尋和篩選

搜尋功能

  • 位置:右上角搜尋框
  • 搜尋範圍:模型名稱
  • 支援實時搜尋和清除

篩選組合

  • 搜尋和導航篩選可同時使用
  • 例如:選中"公有模型"後搜尋"GPT",只顯示公有模型中包含"GPT"的模型

重新整理列表

  • 點選"重新整理"按鈕獲取最新模型狀態
  • 自動重新整理:新增、編輯、刪除模型後自動重新整理

模型卡片

3. 新增模型

3.1 選擇服務商

點選右上角"新增模型"按鈕,彈出服務商選擇抽屜。

服務商選擇抽屜

  • 寬度:頁面的 65%
  • 卡片網格:2 列布局
  • 每個卡片顯示:序號、圖示、服務商名稱
  • 篩選邏輯:
    • 選中"公有模型"只顯示公有服務商
    • 選中"私有模型"只顯示私有服務商
    • 選中"全部模型"顯示所有服務商

服務商列表示例

公有云模型(16 個)

  • 國際主流:OpenAI、Anthropic (Claude)、Google Gemini、DeepSeek
  • 國產大廠:Moonshot (Kimi)、智譜 AI、通義千問(阿里雲百鍊)、騰訊混元、訊飛星火、火山引擎(豆包)、百度千帆、商湯日日新
  • 新興平臺:百川智慧、MiniMax、階躍星辰、SiliconFlow

雲平臺模型服務(3 個)

  • Azure OpenAI、Amazon Bedrock、騰訊雲

私有部署模型(5 個)

  • Ollama、vLLM、Xinference、本地模型、Regolo

選擇服務商

3.2 配置基礎資訊

選擇服務商後,進入配置介面(二級抽屜)。

基礎資訊

  1. 模型名稱(必填)
    • 最多 64 個字元
    • 示例:GPT-4 Turbo、Claude 3 Sonnet、DeepSeek Chat
    • 右上角提供"檢視配置文件"連結,點選可跳轉到對應服務商的配置說明文件

檢視配置文件

在模型名稱輸入框右上角,提供了"檢視配置文件"連結。點選後會彈出確認對話方塊,確認跳轉後將在外部瀏覽器(客戶端)或新標籤頁(網頁端)開啟對應服務商的配置說明文件。

檢視配置文件

  1. 模型情況(自動選中)

    • 根據服務商型別自動選擇
    • 私有模型:本地部署,資料在您的裝置或環境內處理
    • 公有模型:雲端服務,資料在服務商雲端處理
  2. 模型型別(必填)

    • 當前選項:大語言模型(llm)
  3. 基礎模型(必填)

    • 下拉選擇該服務商支援的模型
    • 支援搜尋和自定義輸入
    • 直接輸入模型名稱後按回車新增
    • 示例:
      • OpenAI:gpt-5、gpt-5-mini、gpt-4.1、gpt-4o
      • Claude:claude-sonnet-4-5、claude-haiku-4-5、claude-opus-4-1
      • DeepSeek:deepseek-chat、deepseek-coder

配置基礎資訊

3.3 配置憑證

選擇基礎模型後,自動顯示憑證配置區域。

常見憑證欄位

  1. API Key(密碼型別)

    • 輸入框預設隱藏顯示(• • • •)
    • 點選眼睛圖示切換顯示/隱藏
    • 佔位符:提示格式如 "sk-xxx"
    • 必填欄位,未填寫顯示紅色邊框
  2. Base URL(文字型別,會帶出預設值,正常情況下不需要修改)

  3. 其他欄位

    • 根據服務商不同,可能包含:Organization ID、Project ID、Access Token、Secret Key
    • 每個欄位帶有清晰標籤和佔位符提示

憑證配置

3.4 配置高階引數

點選"高階設定"標籤頁,配置模型執行引數(正常帶出對應模型的預設值,自定義模型沒有預設值,需要自己填寫)。

參數列格

  • 表格列:顯示名稱、引數、元件型別、預設值、必填、操作
  • 右上角"+ 新增"按鈕新增新引數
  • 每行右側"刪除"按鈕刪除該引數

引數配置項

  1. 顯示名稱(label)

    • 引數在介面上顯示的名稱
    • 示例:溫度、最大 Token 數、Top P
  2. 引數(param_key)

    • 實際傳遞給模型的引數鍵名
    • 示例:temperature、max_tokens、top_p、frequency_penalty
    • 必須與模型 API 文件一致
  3. 元件型別(ui_type)

    • 選項:輸入框(input)、滑塊(slider)、開關(switch)、下拉選擇(select)
    • 決定該引數在對話設定中的展示形式
  4. 預設值(value)

    • 引數的預設值
    • 示例:temperature:0.7,max_tokens:2048
  5. 必填(required)

    • 開關控制元件,開啟表示必填項

常用引數示例

顯示名稱:溫度
引數:temperature
元件型別:滑塊
預設值:0.7
必填:是

顯示名稱:最大 Token 數
引數:max_tokens
元件型別:輸入框
預設值:2048
必填:否

高階引數

4. 測試連線

4.1 測試未儲存的配置

配置完模型後,建議先測試連線再儲存。

測試按鈕

  • 位於抽屜底部,"取消"和"儲存"按鈕之間
  • 按鈕文字:"測試連線" / "測試中..."

測試前驗證

  • 檢查服務商、基礎模型是否已選擇
  • 檢查必填憑證欄位是否已填寫
  • 未透過驗證顯示警告提示

測試過程

  1. 點選"測試連線"按鈕
  2. 顯示全屏遮罩層:"正在測試連通性"
  3. 後臺傳送測試請求驗證配置
  4. 測試成功:顯示綠色成功提示
  5. 測試失敗:顯示紅色錯誤提示和具體原因

測試意義

  • 驗證 API Key 是否有效
  • 驗證 Base URL 是否可訪問
  • 驗證模型名稱是否正確
  • 避免儲存錯誤配置

測試連線

4.2 測試已儲存的模型

對於已儲存的模型,可以快速測試連通狀態。

觸發方式

  • 滑鼠懸停在模型卡片上
  • 點選天藍色的"連結"圖示

測試結果

  • 成功:顯示綠色提示"連通正常",狀態標籤更新為"已連通"
  • 失敗:顯示紅色提示"連通失敗",狀態標籤更新為"不可用"
  • 測試完成後自動重新整理列表

最佳實踐

  • 定期測試模型連通性
  • 發現"不可用"狀態及時檢查配置
  • API Key 更換後重新測試

測試連線

5. 儲存模型配置

測試連線成功後,點選"儲存"按鈕儲存配置。

儲存前驗證

  • 模型名稱:必填,不能為空
  • 服務商:必填,必須選擇有效服務商
  • 基礎模型:必填,必須選擇或輸入模型名稱
  • 憑證欄位:檢查所有必填欄位是否已填寫

儲存過程

  1. 點選"儲存"按鈕
  2. 按鈕變為"儲存中..."並顯示載入動畫
  3. 顯示全屏遮罩層:"正在處理,請稍候..."
  4. 儲存成功:顯示綠色提示"已儲存"
  5. 關閉抽屜,自動重新整理模型列表

特殊處理

  • 首次新增模型時,自動設定為使用者的預設模型
  • 編輯已選中的模型時,同步更新記憶體中的模型資訊

儲存配置

6. 編輯模型

6.1 開啟編輯介面

滑鼠懸停在模型卡片上,點選藍色的"編輯"圖示(鉛筆圖示)。

6.2 修改配置

預填充邏輯

  • 所有欄位預填充當前模型的配置值
  • 憑證欄位展開顯示
  • 高階引數載入到表格

可修改項

  • 模型名稱:可重新命名
  • 基礎模型:可切換到同服務商下的其他模型
  • 憑證欄位:可更新 API Key、Base URL 等
  • 高階引數:可新增、修改、刪除引數

不可修改項

  • 服務商:不能更改,如需更改請刪除後重新新增
  • 模型情況(公有/私有):根據服務商自動確定

編輯流程

  1. 點選編輯圖示
  2. 抽屜滑出並載入模型詳情
  3. 修改需要更改的欄位
  4. (可選)點選"測試連線"驗證修改
  5. 點選"儲存"按鈕儲存修改
  6. 關閉抽屜,列表自動重新整理

編輯模型

7. 刪除模型

7.1 觸發刪除

滑鼠懸停在模型卡片上,點選紅色的"刪除"圖示(垃圾桶圖示)。

7.2 確認刪除

確認對話方塊

  • 標題:"確認刪除模型"
  • 內容:"確定要刪除該模型嗎?刪除後無法恢復。"
  • 操作按鈕:
    • "取消"按鈕:灰色,關閉對話方塊
    • "刪除"按鈕:紅色危險按鈕,執行刪除

刪除過程

  1. 點選確認對話方塊中的"刪除"按鈕
  2. 顯示全屏遮罩層:"正在處理,請稍候..."
  3. 刪除成功顯示綠色提示:"已刪除"
  4. 自動重新整理模型列表
  5. 如果刪除後當前頁沒有資料,自動跳轉到上一頁

注意事項

  • 刪除操作無法撤銷,請謹慎操作
  • 刪除模型不會影響歷史對話記錄
  • 如果刪除的是當前正在使用的模型,需要重新選擇其他模型

刪除模型

刪除模型

8. 支援的模型服務商

CueMate 支援多個主流大語言模型服務商,您可以根據需求選擇合適的模型:

8.1 公有云模型

  1. OpenAI - 全球領先的 AI 公司,提供 GPT-5、GPT-4.1、GPT-4o 等先進模型,支援複雜推理和多模態理解
  2. Anthropic - Claude 系列模型,最新 Claude Sonnet 4.5 為世界最強程式設計模型,擅長長文字理解和安全對話
  3. Google Gemini - Google 最新多模態模型,支援文字、影象、影片理解
  4. DeepSeek - 國產優秀模型,價效比高,程式碼能力強,支援數學推理
  5. Moonshot (Kimi) - 月之暗面,支援 200K 超長上下文,適合文件分析
  6. 智譜 AI - 清華系,GLM-4 系列模型,中文理解能力突出
  7. 通義千問 - 阿里雲百鍊平臺,Qwen 系列模型,生態完善
  8. 騰訊混元 - 騰訊自研大模型,中文能力強,接入便捷
  9. 訊飛星火 - 科大訊飛,語音場景最佳化,中文對話流暢
  10. 火山引擎 - 位元組跳動,豆包系列模型,多場景適配
  11. SiliconFlow - 開源模型推理平臺,支援 Llama、Qwen 等多個開源模型
  12. 百度千帆 - 百度推出的大語言模型平臺,支援 ERNIE-4.0、ERNIE-3.5 等模型
  13. 百川智慧 - 百川智慧推出的 Baichuan 系列模型,支援 Baichuan4、Baichuan3-Turbo、Baichuan3-Turbo-128k 等模型
  14. MiniMax - MiniMax 推出的超長文字大模型,支援 abab6.5-chat、abab6.5s-chat 等模型,最高支援 245K tokens 上下文
  15. 階躍星辰 - 主打長上下文的 Step 系列模型,支援 step-1-8k、step-1-32k、step-1-256k 等模型,最高支援 256K tokens 超長上下文
  16. 商湯日日新 - 商湯科技推出的 SenseNova 系列模型,支援 SenseChat-5、SenseChat-Turbo 等 22 個模型,包含自研和第三方模型

8.2 雲平臺模型服務

  1. Azure OpenAI - 微軟 Azure 雲平臺,提供企業級 OpenAI 模型服務,支援私有網路
  2. Amazon Bedrock - AWS 託管服務,整合 Claude、Llama 等多個模型,安全合規
  3. 騰訊雲 - 騰訊雲 AI 平臺,提供混元等模型服務

8.3 私有部署模型

  1. Ollama - 本地執行開源模型,支援 Llama、Qwen、Gemma 等,資料完全本地化
  2. vLLM - 高效能推理引擎,支援大規模模型部署,吞吐量高
  3. Xinference - Xorbits 開源推理框架,支援多種模型格式,易於擴充套件
  4. 本地模型 - 自定義本地模型服務,完全離線執行,資料安全性最高
  5. Regolo - 企業級私有化部署方案,高可用性保障,專業技術支援

選擇建議:

  • 追求效能:OpenAI GPT-5、Claude Sonnet 4.5
  • 程式設計場景:Claude Sonnet 4.5(世界最強)、OpenAI GPT-5
  • 高價效比:Claude Haiku 4.5、GPT-5 Mini、DeepSeek
  • 注重成本:DeepSeek、SiliconFlow、Ollama
  • 中文場景:智譜 GLM-4、通義千問、騰訊混元
  • 資料安全:Ollama、vLLM、本地模型
  • 企業應用:Azure OpenAI、Amazon Bedrock、私有部署

9. 最佳實踐

模型配置建議

命名規範

  • 使用清晰描述性的名稱,如"GPT-4 Turbo(生產環境)"
  • 區分不同用途的相同模型,如"Claude 3 Sonnet(翻譯)"、"Claude 3 Sonnet(程式碼)"
  • 避免使用過長的名稱,建議不超過 30 個字元

憑證安全

  • API Key 輸入後使用密碼模式隱藏
  • 不要在截圖或錄屏中暴露 API Key
  • 定期更換 API Key,更換後重新測試連線
  • 不同環境(開發/生產)使用不同的 API Key

引數最佳化

  • 根據使用場景調整 temperature 引數:
    • 創意寫作:0.7-0.9(更隨機)
    • 程式碼生成:0.2-0.4(更確定)
    • 翻譯任務:0.3-0.5(平衡)
  • max_tokens 根據需求設定,避免過大導致費用增加
  • 開啟 stream 引數可以實現打字機效果

連通性管理

  • 新新增模型務必先測試連線
  • 定期測試已有模型的連通性
  • 發現"不可用"狀態及時排查原因
  • 保留備用模型以應對主模型故障

效率提升技巧

快速新增模型

  • 在左側導航樹選中具體服務商節點
  • 點選"新增模型"直接進入配置介面,跳過服務商選擇步驟

搜尋篩選

  • 模型較多時使用搜尋功能快速定位
  • 結合左側導航和搜尋框實現精確篩選

頁面佈局最佳化

  • 模型數量少時可以摺疊左側導航
  • 調整每頁顯示數量,大螢幕建議設定為 12 或 18

常見問題排查

連通測試失敗

  • 檢查 API Key 是否正確
  • 檢查 Base URL 是否可訪問(私有部署模型)
  • 檢查網路連線是否正常
  • 檢查模型名稱是否正確

儲存失敗

  • 確認所有必填欄位已填寫
  • 檢查模型名稱是否重複
  • 檢查憑證格式是否正確

模型無法使用

  • 確認模型狀態為"已連通"
  • 重新測試連線
  • 檢查 API Key 是否過期
  • 檢查餘額是否充足(公有模型)

相關頁面

Released under the GPL-3.0 License.