模型概述
CueMate 支援配置多種主流大語言模型服務商,為使用者提供靈活的 AI 能力選擇。
1. 支援的模型服務商
CueMate 目前支援以下模型服務商:
國內服務商
- 阿里雲百鍊 - 阿里雲推出的企業級大模型服務平臺
- 騰訊混元 - 騰訊自研的大語言模型
- 騰訊雲 - 騰訊雲提供的大模型服務
- 智譜 AI - 智譜 AI 提供的 GLM 系列模型
- DeepSeek - DeepSeek 推出的高效能大模型
- Kimi - 月之暗面推出的 Kimi 智慧助手
- 訊飛星火 - 科大訊飛推出的星火認知大模型
- 火山引擎 - 位元組跳動旗下的豆包大模型服務
- SiliconFlow - 專注於 AI 推理加速的服務平臺
- 百度千帆 - 百度推出的大語言模型平臺
- MiniMax - MiniMax 推出的超長文字大模型
- 階躍星辰 - 主打長上下文的 Step 系列模型
- 商湯日日新 - 商湯科技推出的 SenseNova 系列模型
- 百川智慧 - 百川智慧推出的 Baichuan 系列模型
國際服務商
- OpenAI - GPT 系列模型的服務商
- Anthropic - Claude 系列模型的服務商
- Google Gemini - Google 推出的多模態大模型
- Azure OpenAI - 微軟 Azure 平臺上的 OpenAI 服務
- Amazon Bedrock - AWS 提供的大模型服務平臺
本地/私有化部署
- 本地大模型 - 支援本地部署的大模型服務
- Ollama - 本地執行大模型的開源工具
- vLLM - 高效能的大模型推理引擎
- Xorbits Inference - 支援多種模型的推理框架
- Regolo - 企業級私有化部署方案
2. 模型配置說明
配置步驟
- 獲取 API 金鑰 - 從對應的服務商處獲取 API 金鑰
- 新增模型配置 - 在 CueMate 系統中新增模型配置
- 測試連線 - 驗證模型配置是否正確
- 應用模型 - 在系統中使用配置好的模型
配置引數說明
不同的模型服務商需要配置的引數可能不同,常見的配置引數包括:
- API 金鑰(API Key) - 用於身份驗證的金鑰
- API 端點(API Endpoint) - 模型服務的訪問地址
- 模型名稱(Model Name) - 具體使用的模型版本
- 溫度(Temperature) - 控制輸出的隨機性,範圍 0-1
- 最大令牌數(Max Tokens) - 限制模型輸出的最大長度
- 超時時間(Timeout) - API 請求的超時設定
3. 模型選擇建議
根據場景選擇
技術面試場景(2025 年推薦)
- 推薦:Claude Sonnet 4.5、DeepSeek Reasoner、OpenAI GPT-5、百川智慧 Baichuan4
- 特點:頂級推理能力,深度程式碼理解,技術問答準確
- 備選:Claude Opus 4.1、GPT-4.1、阿里雲 Qwen Max
行為面試場景
- 推薦:DeepSeek Chat、智譜 GLM-4 Flash、Gemini 2.0 Flash、百度千帆 ERNIE-4.5、MiniMax abab6.5s
- 特點:理解能力強,響應迅速,成本極低
- 備選:Claude 3.7 Sonnet、GPT-4o Mini、商湯日日新 SenseChat-Turbo
多模態/多語言場景
- 推薦:Claude Sonnet 4.5、Gemini 2.0 Flash、智譜 GLM-4V Plus、商湯日日新 SenseChat-5
- 特點:影象理解、多語言支援、實時翻譯
- 備選:GPT-4o、Claude 3.7 Sonnet、百度千帆 ERNIE-4.5-Turbo
成本敏感場景
- 推薦:DeepSeek Chat(0.07 元/百萬 tokens)、智譜 GLM-4 Air、本地 Ollama、百度千帆(免費)、阿里雲 Qwen Turbo
- 特點:成本極低,價效比無敵,基本滿足日常需求
- 備選:阿里雲 Qwen3 系列、騰訊混元 Lite、MiniMax abab6.5s
長文字處理場景
- 推薦:MiniMax abab6.5-chat(245K)、百川智慧 Baichuan3-Turbo-128k(128K)、階躍星辰 Step-1-32k(32K)
- 特點:超長上下文支援,適合長文件分析、多輪深度對話
- 備選:Kimi(200K)、Claude Sonnet 4.5(200K)
根據模型部署位置選擇
CueMate 是安裝在您本地電腦(Mac/Windows)的桌面軟體,可以連線不同部署位置的大語言模型:
雲端 API 服務(模型在服務商雲端)
- 使用方式:CueMate 透過網際網路呼叫服務商的雲端 API
- 優點:
- 即配即用,無需自己部署
- 模型能力強,持續更新
- 無需購買伺服器和 GPU
- 缺點:
- 需要付費(按使用量計費)
- 需要網路連線
- 資料經過服務商伺服器
- 適合:對模型能力要求高,希望快速上手的使用者
私有化部署(模型在您自己的伺服器上)
- 使用方式:在伺服器上部署模型(Ollama、vLLM、Xinference 等),CueMate 透過內網或公網訪問
- 優點:
- 資料完全私有,不經過第三方
- 無 API 呼叫費用(僅伺服器成本)
- 可根據需求定製模型
- 缺點:
- 需要購買或租用伺服器(推薦 32GB+ 記憶體,GPU 更佳)
- 需要技術能力進行部署和維護
- 需要下載模型檔案(幾 GB 到幾十 GB)
- 模型能力通常不如頂級雲端模型
- 適合:注重資料隱私、有技術能力、有伺服器資源的使用者或企業
根據成本預算選擇
以下是主流服務商的參考價格(100 萬 tokens 約等於 75 萬漢字):
高階模型(強大但昂貴)
- OpenAI GPT-5:約 ¥280-560(輸入/輸出)
- Anthropic Claude Sonnet 4.5:約 ¥210-420(輸入/輸出)
- Anthropic Claude Opus 4.1:約 ¥140-420
- Google Gemini 1.5 Pro:約 ¥70-210
- 適合:對準確性要求極高的場景
中端模型(價效比高)
- Anthropic Claude Haiku 4.5:約 ¥7-14
- OpenAI GPT-5 Mini:約 ¥7-14
- OpenAI GPT-4o Mini:約 ¥3.5-7
- 智譜 GLM-4:約 ¥7-14
- DeepSeek Chat:約 ¥0.7-1.4
- 阿里雲 Qwen Plus:約 ¥2.8-14
- 騰訊混元 Pro:約 ¥21-70
- 百川智慧 Baichuan3-Turbo:約 ¥2-4
- 適合:日常使用,成本可控
經濟型模型(低成本)
- DeepSeek Chat:約 ¥0.7-1.4
- 阿里雲 Qwen Turbo:約 ¥1.4-4.2
- 訊飛星火 Lite:約 ¥1.4-4.2
- 騰訊混元 Lite:約 ¥2.8-7
- 百度千帆(個人使用者免費):¥0
- MiniMax abab6.5s:約 ¥1-2
- 階躍星辰 Step-1-8k:約 ¥1-2
- 商湯日日新 SenseChat-Turbo:約 ¥1.5-3
- 適合:高頻使用,預算有限
本地模型(零成本)
- Ollama + DeepSeek-R1、Llama、Qwen:¥0
- 僅需一次性硬體投入(電腦記憶體/顯示卡)
- 適合:長期使用,注重隱私,有足夠硬體配置
價格說明:
- 以上價格為 100 萬 tokens 的大致費用(人民幣)
- 實際價格以各服務商官網為準
- 多數服務商按"輸入 tokens + 輸出 tokens"分別計費
- 本地模型無 API 費用,但需電費和硬體成本
模型體驗等級(個人使用感受)
根據實際使用體驗,將主流模型分為 5 個等級:
| 等級 | 模型列表 | 體驗特點 | 理由 |
|---|---|---|---|
| 夯 | OpenAI、Anthropic、Google Gemini、阿里雲百鍊、DeepSeek、百川智慧 | 頂級推理能力,深度理解,響應質量極高,多模態能力強 | 代表當前大模型的最高水平,推理鏈路清晰,程式碼生成準確度極高,多輪對話上下文理解出色,複雜任務處理能力一流 |
| 頂級 | Azure OpenAI、Amazon Bedrock、騰訊混元、Kimi、MiniMax、階躍星辰 | 優秀效能,快速響應,價效比高,適合大多數場景 | 效能接近頂級但成本更低,響應速度快,綜合能力均衡,日常使用體驗流暢,價格相對友好,適合高頻使用 |
| 人上人 | 智譜 AI、火山引擎、SiliconFlow、vLLM、百度千帆、商湯日日新 | 效能良好,企業級穩定性,成本適中,功能全面 | 企業級服務有 SLA 保障,功能完整度高,中文支援好,穩定性可靠,API 文件完善,適合生產環境 |
| NPC | 騰訊雲、本地大模型、Ollama | 基本可用,成本低廉,適合簡單任務,響應質量一般 | 能完成基本任務但偶有錯誤,響應質量不穩定,推理能力一般,適合非核心業務或測試環境,勝在便宜 |
| 拉 | 訊飛星火、Xorbits Inference、Regolo | 體驗欠佳,配置複雜或效能不足,僅適合特殊場景或測試 | 配置繁瑣易出錯,響應速度慢,理解能力弱,文件不完善,本地模型受硬體限制嚴重,僅適合特定場景或學習測試 |
說明:
- 此評級基於個人實際使用體驗,僅供參考
- 模型體驗受網路環境、API 配置、提示詞質量等多種因素影響
- 建議根據自己的實際需求和場景進行測試選擇
- 高等級模型通常意味著更高的成本,需權衡價效比
4. 注意事項
- API 金鑰安全 - 請妥善保管 API 金鑰,不要洩露給他人
- 使用限制 - 注意各服務商的 API 呼叫限制和計費規則
- 資料合規 - 確保使用模型時符合相關法律法規
- 效能監控 - 建議定期檢查模型響應時間和準確率
- 成本控制 - 合理設定請求引數,避免不必要的費用
下一步
模型設定功能使用:
- 模型設定使用指南 - 詳細介紹如何新增、配置、測試和管理模型
選擇您需要配置的模型服務商,檢視詳細的配置指南:
