模型服務商列表
CueMate 支援配置多種主流大語言模型服務商,選擇適合您的模型服務商開始配置。
國際服務商
02
Anthropic
Claude 系列模型的服務商,注重安全和長上下文。提供 Claude Sonnet 4.5(世界最強程式設計模型)、Claude Haiku 4.5、Claude Opus 4.1 等模型。
檢視配置指南 →國內服務商
本地/私有化部署
1. 選擇建議
1.1 根據使用場景選擇
1.1.1 技術面試場景(演算法、程式設計、架構)
頂級推理能力:
- OpenAI GPT-5: 最新旗艦模型,綜合能力最強,技術理解深度最佳
- Anthropic Claude Sonnet 4.5: 世界最強程式設計模型,推理能力卓越
- Google Gemini 2.0: 多模態能力強,最新技術支援好
- 智譜 GLM-4: 國內最強技術模型之一,中文理解優秀
- DeepSeek-R1: 推理鏈路清晰,特別適合演算法問題
- 商湯日日新 SenseNova-V6-5-Pro: 最新旗艦模型,能力強大
價效比優選:
- DeepSeek-V3: 高價效比,技術能力不輸旗艦模型
- 百川智慧 Baichuan4: 技術理解準確,響應速度快
- 騰訊雲 DeepSeek-V3: 穩定性好,企業級支援
1.1.2 程式碼生成與程式設計輔助
專業程式碼模型:
- Anthropic Claude Sonnet 4.5: 世界最強程式設計模型,程式碼理解和生成能力頂尖
- 商湯日日新 Qwen3-Coder: 通義千問最新程式碼模型,程式設計能力卓越
- 商湯日日新 Qwen2-5-Coder: 程式碼生成準確率高,支援多種程式語言
- OpenAI GPT-5: 最新旗艦模型,程式碼能力強大
- MiniMax MiniMax-M2: 專為編碼任務和 Agent 工作流最佳化
快速響應:
- 百川智慧 Baichuan3-Turbo: 程式碼生成速度快,質量高
- 階躍星辰 step-2-mini: 輕量級模型,快速響應
1.1.3 長文件處理場景
超長上下文專家:
- 階躍星辰 step-1-256k: 支援 256K tokens 超長上下文,最適合超長文件處理
- MiniMax abab6.5s-chat: 支援 245K tokens 上下文,長文字理解深度優秀
- 商湯日日新 SenseChat-128K: 128K 超長上下文,適合複雜文件分析
- Kimi: 超長上下文理解,長文字處理專家
長上下文價效比:
- 階躍星辰 step-1-32k: 32K 上下文,價效比高
- 百川智慧 Baichuan3-Turbo-128k: 128K 上下文,成本適中
- 商湯日日新 SenseChat-32K: 32K 上下文,穩定可靠
- MiniMax abab6.5t-chat: 快速響應,適合常規長文字
1.1.4 行為面試場景(HR、溝通、軟技能)
對話理解優秀:
- OpenAI GPT-4o Mini: 輕量級多模態模型,對話理解準確
- Kimi: 上下文理解能力強,多輪對話流暢
- DeepSeek-Chat: 對話自然,成本低
- 商湯日日新 SenseChat-5: 中文對話能力出色,理解準確
- MiniMax abab6.5g-chat: 通用對話模型,日常使用體驗好
快速響應優選:
- 騰訊混元 Hunyuan-Standard: 響應快,穩定性高
- 百度千帆 ERNIE-3.5: 中文理解好,速度快
- 階躍星辰 step-1-8k: 快速響應,價效比高
- 商湯日日新 SenseChat-Turbo: 快速模型,適合高頻對話
1.1.5 多模態場景(圖文理解、視覺分析)
多模態能力:
- Google Gemini 2.0: 多模態能力最強,支援文字、影象、影片
- Google Gemini 1.5 Pro: 長上下文多模態支援
- 商湯日日新 SenseNova-V6-5-Omni: 全模態互動,實時對話能力強
- 商湯日日新 SenseChat-Vision: 視覺理解能力出色,圖文對話流暢
1.1.6 特殊場景
粵語對話:
- 商湯日日新 SenseChat-5-Cantonese: 粵語對話專家,方言理解準確
角色扮演:
- 商湯日日新 SenseChat-Character-Pro: 高階角色扮演能力
- 商湯日日新 SenseChat-Character: 基礎角色扮演
推理鏈路:
- 商湯日日新 SenseNova-V6-Reasoner: 推理任務專家,邏輯分析深度
- DeepSeek-R1: 推理鏈路清晰,思考過程可見
Agent 工作流:
- MiniMax MiniMax-M2: 專為 Agent 工作流設計,編碼任務優秀
1.1.7 資料安全與隱私場景
完全私有化部署:
- 本地大模型: 資料完全不出網,絕對可控
- Ollama: 開源本地執行,支援 DeepSeek-R1、Llama、Qwen 等多種模型
- vLLM: 高效能推理引擎,吞吐量提升高達 24 倍
- Xorbits Inference: 一鍵部署,支援 100+ 開源模型
- Regolo: 企業級私有化方案,專業技術支援
企業級雲服務:
- Azure OpenAI: 微軟雲平臺,企業級合規性強
- Amazon Bedrock: AWS 平臺,多模型選擇
- 阿里雲百鍊: 國內企業級平臺,Qwen 系列模型
- 騰訊雲: 企業級支援,穩定性高
1.2 根據預算選擇
1.2.1 高預算(追求極致效果)
國際頂級模型:
- OpenAI GPT-5: 最新旗艦模型,綜合能力最強,適合高價值場景
- Anthropic Claude Sonnet 4.5: 世界最強程式設計模型
- Anthropic Claude Opus 4.1: 頂級推理能力,深度分析
- Google Gemini 2.0: 多模態能力最強
國內旗艦模型:
- 智譜 GLM-4: 國內最強技術模型之一
- 商湯日日新 SenseNova-V6-5-Pro: 最新旗艦,能力強大
- MiniMax MiniMax-M2: 編碼和 Agent 任務頂尖
1.2.2 中等預算(價效比優選)
高價效比國際模型:
- Anthropic Claude Haiku 4.5: 高價效比,速度快成本低
- OpenAI GPT-5 Mini: 輕量級 GPT-5,價效比高
- Google Gemini 1.5 Pro: 長上下文,價格適中
高價效比國內模型:
- DeepSeek-V3: 能力接近頂級,價格極低
- 騰訊雲 DeepSeek-V3: 穩定性好,成本低
- 智譜 GLM-3: 效果不錯,價格合理
- Kimi: 超長上下文,價效比高
- 百川智慧 Baichuan4: 技術能力強,價格適中
- 商湯日日新 SenseNova-V6-5-Turbo: 高效能快速模型
- MiniMax abab6.5s-chat: 超長上下文,價格合理
1.2.3 低預算(免費額度/低成本)
有免費額度:
- DeepSeek: 提供免費額度,成本極低
- SiliconFlow: 專注 AI 推理加速,多種開源模型
- 訊飛星火: 提供免費試用額度
- 百度千帆: 新使用者有免費額度
- 騰訊混元: 提供免費試用
- 商湯日日新: 個人使用者實名認證後有免費額度
- MiniMax: 2025 年推出新使用者禮包
快速輕量模型:
- OpenAI GPT-4o Mini: 輕量級多模態模型,價效比高
- 階躍星辰 step-1-8k: 快速響應,成本低
- 階躍星辰 step-2-mini: 最新輕量級,價效比極高
- MiniMax abab6.5t-chat: 快速模型,成本低
- 商湯日日新 SenseChat-Turbo: 快速響應,價效比高
- 百川智慧 Baichuan3-Turbo: 快速穩定,價格友好
完全免費(本地部署):
- Ollama: 完全免費,支援多種開源模型
- vLLM: 開源推理引擎,高效能
- Xorbits Inference: 開源框架,支援 100+ 模型
1.3 根據地域與網路選擇
1.3.1 國際使用者或需要訪問國際服務
首選國際服務商:
- OpenAI: 全球最強 AI 服務商
- Anthropic: Claude 系列,安全性高
- Google Gemini: 多模態能力強
- Azure OpenAI: 企業級,全球部署
- Amazon Bedrock: AWS 平臺,全球可用
1.3.2 國內使用者或網路限制
國內服務商優選:
- 智譜 AI: 清華系,技術能力強
- DeepSeek: 價效比最高,能力強
- 阿里雲百鍊: 企業級,Qwen 系列
- 騰訊雲: 穩定性好,多模型選擇
- 百度千帆: ERNIE 系列,中文優秀
- 訊飛星火: 語音技術強,多版本選擇
- 火山引擎: 位元組跳動,豆包大模型
- Kimi: 月之暗面,超長上下文
- 騰訊混元: 騰訊自研,穩定可靠
新興服務商(2025 年推薦):
- 商湯日日新: 22 個模型可選,包含 SenseNova、SenseChat 系列及第三方模型(Qwen、DeepSeek、Kimi)
- 百川智慧: Baichuan4 技術能力強,Baichuan3-Turbo-128k 長上下文支援好
- MiniMax: 超長文字專家,abab6.5s-chat 支援 245K tokens
- 階躍星辰: step-1-256k 支援 256K tokens 超長上下文,API 完全相容 OpenAI
1.4 快速選擇指南
| 場景 | 首選模型 | 備選方案 | 預算考慮 |
|---|---|---|---|
| 技術面試 | OpenAI GPT-5 | Claude Sonnet 4.5、智譜 GLM-4 | DeepSeek-V3 |
| 程式碼生成 | Claude Sonnet 4.5 | 商湯日日新 Qwen3-Coder、OpenAI GPT-5 | 百川智慧 Baichuan3-Turbo |
| 長文件處理 | 階躍星辰 step-1-256k | MiniMax abab6.5s-chat、商湯日日新 SenseChat-128K | Kimi |
| 行為面試 | GPT-4o Mini | Kimi、商湯日日新 SenseChat-5 | DeepSeek-Chat |
| 多模態 | Google Gemini 2.0 | 商湯日日新 SenseNova-V6-5-Omni | 商湯日日新 SenseChat-Vision |
| 資料安全 | Ollama | vLLM、Regolo | 本地大模型 |
| 超長上下文 | 階躍星辰 step-1-256k | MiniMax abab6.5s-chat | 百川智慧 Baichuan3-Turbo-128k |
| 快速響應 | 階躍星辰 step-2-mini | 商湯日日新 SenseChat-Turbo | MiniMax abab6.5t-chat |
| Agent 工作流 | MiniMax MiniMax-M2 | Claude Sonnet 4.5、OpenAI GPT-5 | DeepSeek-V3 |
| 推理任務 | DeepSeek-R1 | Claude Opus 4.1、商湯日日新 SenseNova-V6-Reasoner | 智譜 GLM-4 |
