Skip to content

模型概述

CueMate 支援配置多種主流大語言模型服務商,為使用者提供靈活的 AI 能力選擇。

1. 支援的模型服務商

CueMate 目前支援以下模型服務商:

國內服務商

  • 阿里雲百鍊 - 阿里雲推出的企業級大模型服務平臺
  • 騰訊混元 - 騰訊自研的大語言模型
  • 騰訊雲 - 騰訊雲提供的大模型服務
  • 智譜 AI - 智譜 AI 提供的 GLM 系列模型
  • DeepSeek - DeepSeek 推出的高效能大模型
  • Kimi - 月之暗面推出的 Kimi 智慧助手
  • 訊飛星火 - 科大訊飛推出的星火認知大模型
  • 火山引擎 - 位元組跳動旗下的豆包大模型服務
  • SiliconFlow - 專注於 AI 推理加速的服務平臺
  • 百度千帆 - 百度推出的大語言模型平臺
  • MiniMax - MiniMax 推出的超長文字大模型
  • 階躍星辰 - 主打長上下文的 Step 系列模型
  • 商湯日日新 - 商湯科技推出的 SenseNova 系列模型
  • 百川智慧 - 百川智慧推出的 Baichuan 系列模型

國際服務商

  • OpenAI - GPT 系列模型的服務商
  • Anthropic - Claude 系列模型的服務商
  • Google Gemini - Google 推出的多模態大模型
  • Azure OpenAI - 微軟 Azure 平臺上的 OpenAI 服務
  • Amazon Bedrock - AWS 提供的大模型服務平臺

本地/私有化部署

  • 本地大模型 - 支援本地部署的大模型服務
  • Ollama - 本地執行大模型的開源工具
  • vLLM - 高效能的大模型推理引擎
  • Xorbits Inference - 支援多種模型的推理框架
  • Regolo - 企業級私有化部署方案

2. 模型配置說明

配置步驟

  1. 獲取 API 金鑰 - 從對應的服務商處獲取 API 金鑰
  2. 新增模型配置 - 在 CueMate 系統中新增模型配置
  3. 測試連線 - 驗證模型配置是否正確
  4. 應用模型 - 在系統中使用配置好的模型

配置引數說明

不同的模型服務商需要配置的引數可能不同,常見的配置引數包括:

  • API 金鑰(API Key) - 用於身份驗證的金鑰
  • API 端點(API Endpoint) - 模型服務的訪問地址
  • 模型名稱(Model Name) - 具體使用的模型版本
  • 溫度(Temperature) - 控制輸出的隨機性,範圍 0-1
  • 最大令牌數(Max Tokens) - 限制模型輸出的最大長度
  • 超時時間(Timeout) - API 請求的超時設定

3. 模型選擇建議

根據場景選擇

技術面試場景(2025 年推薦)

  • 推薦:Claude Sonnet 4.5、DeepSeek Reasoner、OpenAI GPT-5、百川智慧 Baichuan4
  • 特點:頂級推理能力,深度程式碼理解,技術問答準確
  • 備選:Claude Opus 4.1、GPT-4.1、阿里雲 Qwen Max

行為面試場景

  • 推薦:DeepSeek Chat、智譜 GLM-4 Flash、Gemini 2.0 Flash、百度千帆 ERNIE-4.5、MiniMax abab6.5s
  • 特點:理解能力強,響應迅速,成本極低
  • 備選:Claude 3.7 Sonnet、GPT-4o Mini、商湯日日新 SenseChat-Turbo

多模態/多語言場景

  • 推薦:Claude Sonnet 4.5、Gemini 2.0 Flash、智譜 GLM-4V Plus、商湯日日新 SenseChat-5
  • 特點:影象理解、多語言支援、實時翻譯
  • 備選:GPT-4o、Claude 3.7 Sonnet、百度千帆 ERNIE-4.5-Turbo

成本敏感場景

  • 推薦:DeepSeek Chat(0.07 元/百萬 tokens)、智譜 GLM-4 Air、本地 Ollama、百度千帆(免費)、阿里雲 Qwen Turbo
  • 特點:成本極低,價效比無敵,基本滿足日常需求
  • 備選:阿里雲 Qwen3 系列、騰訊混元 Lite、MiniMax abab6.5s

長文字處理場景

  • 推薦:MiniMax abab6.5-chat(245K)、百川智慧 Baichuan3-Turbo-128k(128K)、階躍星辰 Step-1-32k(32K)
  • 特點:超長上下文支援,適合長文件分析、多輪深度對話
  • 備選:Kimi(200K)、Claude Sonnet 4.5(200K)

根據模型部署位置選擇

CueMate 是安裝在您本地電腦(Mac/Windows)的桌面軟體,可以連線不同部署位置的大語言模型:

雲端 API 服務(模型在服務商雲端)

  • 使用方式:CueMate 透過網際網路呼叫服務商的雲端 API
  • 優點:
    • 即配即用,無需自己部署
    • 模型能力強,持續更新
    • 無需購買伺服器和 GPU
  • 缺點:
    • 需要付費(按使用量計費)
    • 需要網路連線
    • 資料經過服務商伺服器
  • 適合:對模型能力要求高,希望快速上手的使用者

私有化部署(模型在您自己的伺服器上)

  • 使用方式:在伺服器上部署模型(Ollama、vLLM、Xinference 等),CueMate 透過內網或公網訪問
  • 優點:
    • 資料完全私有,不經過第三方
    • 無 API 呼叫費用(僅伺服器成本)
    • 可根據需求定製模型
  • 缺點:
    • 需要購買或租用伺服器(推薦 32GB+ 記憶體,GPU 更佳)
    • 需要技術能力進行部署和維護
    • 需要下載模型檔案(幾 GB 到幾十 GB)
    • 模型能力通常不如頂級雲端模型
  • 適合:注重資料隱私、有技術能力、有伺服器資源的使用者或企業

根據成本預算選擇

以下是主流服務商的參考價格(100 萬 tokens 約等於 75 萬漢字):

高階模型(強大但昂貴)

  • OpenAI GPT-5:約 ¥280-560(輸入/輸出)
  • Anthropic Claude Sonnet 4.5:約 ¥210-420(輸入/輸出)
  • Anthropic Claude Opus 4.1:約 ¥140-420
  • Google Gemini 1.5 Pro:約 ¥70-210
  • 適合:對準確性要求極高的場景

中端模型(價效比高)

  • Anthropic Claude Haiku 4.5:約 ¥7-14
  • OpenAI GPT-5 Mini:約 ¥7-14
  • OpenAI GPT-4o Mini:約 ¥3.5-7
  • 智譜 GLM-4:約 ¥7-14
  • DeepSeek Chat:約 ¥0.7-1.4
  • 阿里雲 Qwen Plus:約 ¥2.8-14
  • 騰訊混元 Pro:約 ¥21-70
  • 百川智慧 Baichuan3-Turbo:約 ¥2-4
  • 適合:日常使用,成本可控

經濟型模型(低成本)

  • DeepSeek Chat:約 ¥0.7-1.4
  • 阿里雲 Qwen Turbo:約 ¥1.4-4.2
  • 訊飛星火 Lite:約 ¥1.4-4.2
  • 騰訊混元 Lite:約 ¥2.8-7
  • 百度千帆(個人使用者免費):¥0
  • MiniMax abab6.5s:約 ¥1-2
  • 階躍星辰 Step-1-8k:約 ¥1-2
  • 商湯日日新 SenseChat-Turbo:約 ¥1.5-3
  • 適合:高頻使用,預算有限

本地模型(零成本)

  • Ollama + DeepSeek-R1、Llama、Qwen:¥0
  • 僅需一次性硬體投入(電腦記憶體/顯示卡)
  • 適合:長期使用,注重隱私,有足夠硬體配置

價格說明:

  • 以上價格為 100 萬 tokens 的大致費用(人民幣)
  • 實際價格以各服務商官網為準
  • 多數服務商按"輸入 tokens + 輸出 tokens"分別計費
  • 本地模型無 API 費用,但需電費和硬體成本

模型體驗等級(個人使用感受)

根據實際使用體驗,將主流模型分為 5 個等級:

等級模型列表體驗特點理由
OpenAI、Anthropic、Google Gemini、阿里雲百鍊、DeepSeek、百川智慧頂級推理能力,深度理解,響應質量極高,多模態能力強代表當前大模型的最高水平,推理鏈路清晰,程式碼生成準確度極高,多輪對話上下文理解出色,複雜任務處理能力一流
頂級Azure OpenAI、Amazon Bedrock、騰訊混元、Kimi、MiniMax、階躍星辰優秀效能,快速響應,價效比高,適合大多數場景效能接近頂級但成本更低,響應速度快,綜合能力均衡,日常使用體驗流暢,價格相對友好,適合高頻使用
人上人智譜 AI、火山引擎、SiliconFlow、vLLM、百度千帆、商湯日日新效能良好,企業級穩定性,成本適中,功能全面企業級服務有 SLA 保障,功能完整度高,中文支援好,穩定性可靠,API 文件完善,適合生產環境
NPC騰訊雲、本地大模型、Ollama基本可用,成本低廉,適合簡單任務,響應質量一般能完成基本任務但偶有錯誤,響應質量不穩定,推理能力一般,適合非核心業務或測試環境,勝在便宜
訊飛星火、Xorbits Inference、Regolo體驗欠佳,配置複雜或效能不足,僅適合特殊場景或測試配置繁瑣易出錯,響應速度慢,理解能力弱,文件不完善,本地模型受硬體限制嚴重,僅適合特定場景或學習測試

說明:

  • 此評級基於個人實際使用體驗,僅供參考
  • 模型體驗受網路環境、API 配置、提示詞質量等多種因素影響
  • 建議根據自己的實際需求和場景進行測試選擇
  • 高等級模型通常意味著更高的成本,需權衡價效比

4. 注意事項

  1. API 金鑰安全 - 請妥善保管 API 金鑰,不要洩露給他人
  2. 使用限制 - 注意各服務商的 API 呼叫限制和計費規則
  3. 資料合規 - 確保使用模型時符合相關法律法規
  4. 效能監控 - 建議定期檢查模型響應時間和準確率
  5. 成本控制 - 合理設定請求引數,避免不必要的費用

下一步

模型設定功能使用:

選擇您需要配置的模型服務商,檢視詳細的配置指南:

Released under the GPL-3.0 License.