模型概述

CueMate 支援配置多種主流大語言模型服務商，為使用者提供靈活的 AI 能力選擇。

1. 支援的模型服務商

CueMate 目前支援以下模型服務商：

國內服務商

阿里雲百鍊 - 阿里雲推出的企業級大模型服務平臺
騰訊混元 - 騰訊自研的大語言模型
騰訊雲 - 騰訊雲提供的大模型服務
智譜 AI - 智譜 AI 提供的 GLM 系列模型
DeepSeek - DeepSeek 推出的高效能大模型
Kimi - 月之暗面推出的 Kimi 智慧助手
訊飛星火 - 科大訊飛推出的星火認知大模型
火山引擎 - 位元組跳動旗下的豆包大模型服務
SiliconFlow - 專注於 AI 推理加速的服務平臺
百度千帆 - 百度推出的大語言模型平臺
MiniMax - MiniMax 推出的超長文字大模型
階躍星辰 - 主打長上下文的 Step 系列模型
商湯日日新 - 商湯科技推出的 SenseNova 系列模型
百川智慧 - 百川智慧推出的 Baichuan 系列模型

國際服務商

OpenAI - GPT 系列模型的服務商
Anthropic - Claude 系列模型的服務商
Google Gemini - Google 推出的多模態大模型
Azure OpenAI - 微軟 Azure 平臺上的 OpenAI 服務
Amazon Bedrock - AWS 提供的大模型服務平臺

本地/私有化部署

本地大模型 - 支援本地部署的大模型服務
Ollama - 本地執行大模型的開源工具
vLLM - 高效能的大模型推理引擎
Xorbits Inference - 支援多種模型的推理框架
Regolo - 企業級私有化部署方案

2. 模型配置說明

配置步驟

獲取 API 金鑰 - 從對應的服務商處獲取 API 金鑰
新增模型配置 - 在 CueMate 系統中新增模型配置
測試連線 - 驗證模型配置是否正確
應用模型 - 在系統中使用配置好的模型

配置引數說明

不同的模型服務商需要配置的引數可能不同，常見的配置引數包括：

API 金鑰（API Key） - 用於身份驗證的金鑰
API 端點（API Endpoint） - 模型服務的訪問地址
模型名稱（Model Name） - 具體使用的模型版本
溫度（Temperature） - 控制輸出的隨機性，範圍 0-1
最大令牌數（Max Tokens） - 限制模型輸出的最大長度
超時時間（Timeout） - API 請求的超時設定

3. 模型選擇建議

根據場景選擇

技術面試場景（2026 年推薦）

推薦：Claude Sonnet 4.5、DeepSeek Reasoner、OpenAI GPT-5、百川智慧 Baichuan4
特點：頂級推理能力，深度程式碼理解，技術問答準確
備選：Claude Opus 4.1、GPT-4.1、阿里雲 Qwen Max

行為面試場景

推薦：DeepSeek Chat、智譜 GLM-4 Flash、Gemini 2.0 Flash、百度千帆 ERNIE-4.5、MiniMax abab6.5s
特點：理解能力強，響應迅速，成本極低
備選：Claude 3.7 Sonnet、GPT-4o Mini、商湯日日新 SenseChat-Turbo

多模態/多語言場景

推薦：Claude Sonnet 4.5、Gemini 2.0 Flash、智譜 GLM-4V Plus、商湯日日新 SenseChat-5
特點：影象理解、多語言支援、實時翻譯
備選：GPT-4o、Claude 3.7 Sonnet、百度千帆 ERNIE-4.5-Turbo

成本敏感場景

推薦：DeepSeek Chat（0.07 元/百萬 tokens）、智譜 GLM-4 Air、本地 Ollama、百度千帆（免費）、阿里雲 Qwen Turbo
特點：成本極低，價效比無敵，基本滿足日常需求
備選：阿里雲 Qwen3 系列、騰訊混元 Lite、MiniMax abab6.5s

長文字處理場景

推薦：MiniMax abab6.5-chat（245K）、百川智慧 Baichuan3-Turbo-128k（128K）、階躍星辰 Step-1-32k（32K）
特點：超長上下文支援，適合長文件分析、多輪深度對話
備選：Kimi（200K）、Claude Sonnet 4.5（200K）

根據模型部署位置選擇

CueMate 是安裝在您本地電腦（Mac/Windows）的桌面軟體，可以連線不同部署位置的大語言模型：

雲端 API 服務（模型在服務商雲端）

使用方式：CueMate 透過網際網路呼叫服務商的雲端 API
優點：
- 即配即用，無需自己部署
- 模型能力強，持續更新
- 無需購買伺服器和 GPU
缺點：
- 需要付費（按使用量計費）
- 需要網路連線
- 資料經過服務商伺服器
適合：對模型能力要求高，希望快速上手的使用者

私有化部署（模型在您自己的伺服器上）

使用方式：在伺服器上部署模型（Ollama、vLLM、Xinference 等），CueMate 透過內網或公網訪問
優點：
- 資料完全私有，不經過第三方
- 無 API 呼叫費用（僅伺服器成本）
- 可根據需求定製模型
缺點：
- 需要購買或租用伺服器（推薦 32GB+ 記憶體，GPU 更佳）
- 需要技術能力進行部署和維護
- 需要下載模型檔案（幾 GB 到幾十 GB）
- 模型能力通常不如頂級雲端模型
適合：注重資料隱私、有技術能力、有伺服器資源的使用者或企業

根據成本預算選擇

以下是主流服務商的參考價格（100 萬 tokens 約等於 75 萬漢字）：

高階模型（強大但昂貴）

OpenAI GPT-5：約 ¥280-560（輸入/輸出）
Anthropic Claude Sonnet 4.5：約 ¥210-420（輸入/輸出）
Anthropic Claude Opus 4.1：約 ¥140-420
Google Gemini 1.5 Pro：約 ¥70-210
適合：對準確性要求極高的場景

中端模型（價效比高）

Anthropic Claude Haiku 4.5：約 ¥7-14
OpenAI GPT-5 Mini：約 ¥7-14
OpenAI GPT-4o Mini：約 ¥3.5-7
智譜 GLM-4：約 ¥7-14
DeepSeek Chat：約 ¥0.7-1.4
阿里雲 Qwen Plus：約 ¥2.8-14
騰訊混元 Pro：約 ¥21-70
百川智慧 Baichuan3-Turbo：約 ¥2-4
適合：日常使用，成本可控

經濟型模型（低成本）

DeepSeek Chat：約 ¥0.7-1.4
阿里雲 Qwen Turbo：約 ¥1.4-4.2
訊飛星火 Lite：約 ¥1.4-4.2
騰訊混元 Lite：約 ¥2.8-7
百度千帆（個人使用者免費）：¥0
MiniMax abab6.5s：約 ¥1-2
階躍星辰 Step-1-8k：約 ¥1-2
商湯日日新 SenseChat-Turbo：約 ¥1.5-3
適合：高頻使用，預算有限

本地模型（零成本）

Ollama + DeepSeek-R1、Llama、Qwen：¥0
僅需一次性硬體投入（電腦記憶體/顯示卡）
適合：長期使用，注重隱私，有足夠硬體配置

價格說明：

以上價格為 100 萬 tokens 的大致費用（人民幣）
實際價格以各服務商官網為準
多數服務商按"輸入 tokens + 輸出 tokens"分別計費
本地模型無 API 費用，但需電費和硬體成本

模型體驗等級（個人使用感受）

根據實際使用體驗，將主流模型分為 5 個等級：

等級	模型列表	體驗特點	理由
夯	OpenAI、Anthropic、Google Gemini、阿里雲百鍊、DeepSeek、百川智慧	頂級推理能力，深度理解，響應質量極高，多模態能力強	代表當前大模型的最高水平，推理鏈路清晰，程式碼生成準確度極高，多輪對話上下文理解出色，複雜任務處理能力一流
頂級	Azure OpenAI、Amazon Bedrock、騰訊混元、Kimi、MiniMax、階躍星辰	優秀效能，快速響應，價效比高，適合大多數場景	效能接近頂級但成本更低，響應速度快，綜合能力均衡，日常使用體驗流暢，價格相對友好，適合高頻使用
人上人	智譜 AI、火山引擎、SiliconFlow、vLLM、百度千帆、商湯日日新	效能良好，企業級穩定性，成本適中，功能全面	企業級服務有 SLA 保障，功能完整度高，中文支援好，穩定性可靠，API 文件完善，適合生產環境
NPC	騰訊雲、本地大模型、Ollama	基本可用，成本低廉，適合簡單任務，響應質量一般	能完成基本任務但偶有錯誤，響應質量不穩定，推理能力一般，適合非核心業務或測試環境，勝在便宜
拉	訊飛星火、Xorbits Inference、Regolo	體驗欠佳，配置複雜或效能不足，僅適合特殊場景或測試	配置繁瑣易出錯，響應速度慢，理解能力弱，文件不完善，本地模型受硬體限制嚴重，僅適合特定場景或學習測試

說明：

此評級基於個人實際使用體驗，僅供參考
模型體驗受網路環境、API 配置、提示詞質量等多種因素影響
建議根據自己的實際需求和場景進行測試選擇
高等級模型通常意味著更高的成本，需權衡價效比

4. 注意事項

API 金鑰安全 - 請妥善保管 API 金鑰，不要洩露給他人
使用限制 - 注意各服務商的 API 呼叫限制和計費規則
資料合規 - 確保使用模型時符合相關法律法規
效能監控 - 建議定期檢查模型響應時間和準確率
成本控制 - 合理設定請求引數，避免不必要的費用

下一步

模型設定功能使用：

模型設定使用指南 - 詳細介紹如何新增、配置、測試和管理模型

選擇您需要配置的模型服務商，檢視詳細的配置指南：

模型概述 ​

1. 支援的模型服務商 ​

國內服務商 ​

國際服務商 ​

本地/私有化部署 ​

2. 模型配置說明 ​

配置步驟 ​

配置引數說明 ​

3. 模型選擇建議 ​

根據場景選擇 ​

根據模型部署位置選擇 ​

根據成本預算選擇 ​

模型體驗等級（個人使用感受） ​

4. 注意事項 ​

下一步 ​