模型服務商列表

CueMate 支援配置多種主流大語言模型服務商，選擇適合您的模型服務商開始配置。

國際服務商

OpenAI

GPT 系列模型的服務商，提供強大的 AI 能力。支援 GPT-5、GPT-4.1、GPT-4o 等最新模型。

檢視配置指南 →

Anthropic

Claude 系列模型的服務商，注重安全和長上下文。提供 Claude Sonnet 4.5（世界最強程式設計模型）、Claude Haiku 4.5、Claude Opus 4.1 等模型。

檢視配置指南 →

Google Gemini

Google 推出的多模態大模型。支援 Gemini 2.0、Gemini 1.5 Pro 等模型。

檢視配置指南 →

Azure OpenAI

微軟 Azure 平臺上的 OpenAI 服務。企業級部署，合規性強。

檢視配置指南 →

Amazon Bedrock

AWS 提供的大模型服務平臺。支援 Claude、Llama、Mistral 等多種模型。

檢視配置指南 →

國內服務商

智譜 AI

清華系 AI 公司，提供 GLM 系列模型。支援 GLM-4、GLM-3 等模型。

檢視配置指南 →

阿里雲百鍊

阿里雲推出的企業級大模型服務平臺。提供 Qwen 系列模型。

檢視配置指南 →

DeepSeek

DeepSeek 推出的高效能大模型。支援 DeepSeek-R1、DeepSeek-Chat 等模型。

檢視配置指南 →

Kimi

月之暗面推出的 Kimi 智慧助手。支援超長上下文理解。

檢視配置指南 →

騰訊混元

騰訊自研的大語言模型。支援 Hunyuan-Pro、Hunyuan-Standard 等模型。

檢視配置指南 →

騰訊雲

騰訊雲提供的大模型服務。支援 DeepSeek-V3、Hunyuan-Pro 等模型。

檢視配置指南 →

訊飛星火

科大訊飛推出的星火認知大模型。支援 4.0 Ultra、3.5 等多個版本。

檢視配置指南 →

火山引擎

位元組跳動旗下的豆包大模型服務。提供高效能的 AI 推理能力。

檢視配置指南 →

SiliconFlow

專注於 AI 推理加速的服務平臺。支援多種開源模型。

檢視配置指南 →

百度千帆

百度推出的大語言模型平臺。支援 ERNIE-4.0、ERNIE-3.5 等模型。

檢視配置指南 →

MiniMax

MiniMax 推出的超長文字大模型。支援 abab6.5-chat、abab6.5s-chat 等模型。

檢視配置指南 →

階躍星辰

主打長上下文的 Step 系列模型。支援 step-1-8k、step-1-32k 等模型。

檢視配置指南 →

商湯日日新

商湯科技推出的 SenseNova 系列模型。支援 SenseChat-5、SenseChat-Turbo 等模型。

檢視配置指南 →

百川智慧

百川智慧推出的 Baichuan 系列模型。支援 Baichuan4、Baichuan3-Turbo、Baichuan3-Turbo-128k 等模型。

檢視配置指南 →

本地/私有化部署

本地大模型

支援本地部署的大模型服務。完全私有化，資料安全可控。

檢視配置指南 →

Ollama

本地執行大模型的開源工具。支援 DeepSeek-R1、Llama、Qwen 等多種模型。

檢視配置指南 →

vLLM

高效能的大模型推理引擎。支援 PagedAttention 技術，吞吐量提升高達 24 倍。

檢視配置指南 →

Xorbits Inference

支援多種模型的推理框架。一鍵部署，支援 100+ 開源模型。

檢視配置指南 →

Regolo

企業級私有化部署方案。高可用性保障，專業技術支援。

檢視配置指南 →

1. 選擇建議

1.1 根據使用場景選擇

1.1.1 技術面試場景（演算法、程式設計、架構）

頂級推理能力：

OpenAI GPT-5: 最新旗艦模型，綜合能力最強，技術理解深度最佳
Anthropic Claude Sonnet 4.5: 世界最強程式設計模型，推理能力卓越
Google Gemini 2.0: 多模態能力強，最新技術支援好
智譜 GLM-4: 國內最強技術模型之一，中文理解優秀
DeepSeek-R1: 推理鏈路清晰，特別適合演算法問題
商湯日日新 SenseNova-V6-5-Pro: 最新旗艦模型，能力強大

價效比優選：

DeepSeek-V3: 高價效比，技術能力不輸旗艦模型
百川智慧 Baichuan4: 技術理解準確，響應速度快
騰訊雲 DeepSeek-V3: 穩定性好，企業級支援

1.1.2 程式碼生成與程式設計輔助

專業程式碼模型：

Anthropic Claude Sonnet 4.5: 世界最強程式設計模型，程式碼理解和生成能力頂尖
商湯日日新 Qwen3-Coder: 通義千問最新程式碼模型，程式設計能力卓越
商湯日日新 Qwen2-5-Coder: 程式碼生成準確率高，支援多種程式語言
OpenAI GPT-5: 最新旗艦模型，程式碼能力強大
MiniMax MiniMax-M2: 專為編碼任務和 Agent 工作流最佳化

快速響應：

百川智慧 Baichuan3-Turbo: 程式碼生成速度快，質量高
階躍星辰 step-2-mini: 輕量級模型，快速響應

1.1.3 長文件處理場景

超長上下文專家：

階躍星辰 step-1-256k: 支援 256K tokens 超長上下文，最適合超長文件處理
MiniMax abab6.5s-chat: 支援 245K tokens 上下文，長文字理解深度優秀
商湯日日新 SenseChat-128K: 128K 超長上下文，適合複雜文件分析
Kimi: 超長上下文理解，長文字處理專家

長上下文價效比：

階躍星辰 step-1-32k: 32K 上下文，價效比高
百川智慧 Baichuan3-Turbo-128k: 128K 上下文，成本適中
商湯日日新 SenseChat-32K: 32K 上下文，穩定可靠
MiniMax abab6.5t-chat: 快速響應，適合常規長文字

1.1.4 行為面試場景（HR、溝通、軟技能）

對話理解優秀：

OpenAI GPT-4o Mini: 輕量級多模態模型，對話理解準確
Kimi: 上下文理解能力強，多輪對話流暢
DeepSeek-Chat: 對話自然，成本低
商湯日日新 SenseChat-5: 中文對話能力出色，理解準確
MiniMax abab6.5g-chat: 通用對話模型，日常使用體驗好

快速響應優選：

騰訊混元 Hunyuan-Standard: 響應快，穩定性高
百度千帆 ERNIE-3.5: 中文理解好，速度快
階躍星辰 step-1-8k: 快速響應，價效比高
商湯日日新 SenseChat-Turbo: 快速模型，適合高頻對話

1.1.5 多模態場景（圖文理解、視覺分析）

多模態能力：

Google Gemini 2.0: 多模態能力最強，支援文字、影象、影片
Google Gemini 1.5 Pro: 長上下文多模態支援
商湯日日新 SenseNova-V6-5-Omni: 全模態互動，實時對話能力強
商湯日日新 SenseChat-Vision: 視覺理解能力出色，圖文對話流暢

1.1.6 特殊場景

粵語對話：

商湯日日新 SenseChat-5-Cantonese: 粵語對話專家，方言理解準確

角色扮演：

商湯日日新 SenseChat-Character-Pro: 高階角色扮演能力
商湯日日新 SenseChat-Character: 基礎角色扮演

推理鏈路：

商湯日日新 SenseNova-V6-Reasoner: 推理任務專家，邏輯分析深度
DeepSeek-R1: 推理鏈路清晰，思考過程可見

Agent 工作流：

MiniMax MiniMax-M2: 專為 Agent 工作流設計，編碼任務優秀

1.1.7 資料安全與隱私場景

完全私有化部署：

本地大模型: 資料完全不出網，絕對可控
Ollama: 開源本地執行，支援 DeepSeek-R1、Llama、Qwen 等多種模型
vLLM: 高效能推理引擎，吞吐量提升高達 24 倍
Xorbits Inference: 一鍵部署，支援 100+ 開源模型
Regolo: 企業級私有化方案，專業技術支援

企業級雲服務：

Azure OpenAI: 微軟雲平臺，企業級合規性強
Amazon Bedrock: AWS 平臺，多模型選擇
阿里雲百鍊: 國內企業級平臺，Qwen 系列模型
騰訊雲: 企業級支援，穩定性高

1.2 根據預算選擇

1.2.1 高預算（追求極致效果）

國際頂級模型：

OpenAI GPT-5: 最新旗艦模型，綜合能力最強，適合高價值場景
Anthropic Claude Sonnet 4.5: 世界最強程式設計模型
Anthropic Claude Opus 4.1: 頂級推理能力，深度分析
Google Gemini 2.0: 多模態能力最強

國內旗艦模型：

智譜 GLM-4: 國內最強技術模型之一
商湯日日新 SenseNova-V6-5-Pro: 最新旗艦，能力強大
MiniMax MiniMax-M2: 編碼和 Agent 任務頂尖

1.2.2 中等預算（價效比優選）

高價效比國際模型：

Anthropic Claude Haiku 4.5: 高價效比，速度快成本低
OpenAI GPT-5 Mini: 輕量級 GPT-5，價效比高
Google Gemini 1.5 Pro: 長上下文，價格適中

高價效比國內模型：

DeepSeek-V3: 能力接近頂級，價格極低
騰訊雲 DeepSeek-V3: 穩定性好，成本低
智譜 GLM-3: 效果不錯，價格合理
Kimi: 超長上下文，價效比高
百川智慧 Baichuan4: 技術能力強，價格適中
商湯日日新 SenseNova-V6-5-Turbo: 高效能快速模型
MiniMax abab6.5s-chat: 超長上下文，價格合理

1.2.3 低預算（免費額度/低成本）

有免費額度：

DeepSeek: 提供免費額度，成本極低
SiliconFlow: 專注 AI 推理加速，多種開源模型
訊飛星火: 提供免費試用額度
百度千帆: 新使用者有免費額度
騰訊混元: 提供免費試用
商湯日日新: 個人使用者實名認證後有免費額度
MiniMax: 2026 年推出新使用者禮包

快速輕量模型：

OpenAI GPT-4o Mini: 輕量級多模態模型，價效比高
階躍星辰 step-1-8k: 快速響應，成本低
階躍星辰 step-2-mini: 最新輕量級，價效比極高
MiniMax abab6.5t-chat: 快速模型，成本低
商湯日日新 SenseChat-Turbo: 快速響應，價效比高
百川智慧 Baichuan3-Turbo: 快速穩定，價格友好

完全免費（本地部署）：

Ollama: 完全免費，支援多種開源模型
vLLM: 開源推理引擎，高效能
Xorbits Inference: 開源框架，支援 100+ 模型

1.3 根據地域與網路選擇

1.3.1 國際使用者或需要訪問國際服務

首選國際服務商：

OpenAI: 全球最強 AI 服務商
Anthropic: Claude 系列，安全性高
Google Gemini: 多模態能力強
Azure OpenAI: 企業級，全球部署
Amazon Bedrock: AWS 平臺，全球可用

1.3.2 國內使用者或網路限制

國內服務商優選：

智譜 AI: 清華系，技術能力強
DeepSeek: 價效比最高，能力強
阿里雲百鍊: 企業級，Qwen 系列
騰訊雲: 穩定性好，多模型選擇
百度千帆: ERNIE 系列，中文優秀
訊飛星火: 語音技術強，多版本選擇
火山引擎: 位元組跳動，豆包大模型
Kimi: 月之暗面，超長上下文
騰訊混元: 騰訊自研，穩定可靠

新興服務商（2026 年推薦）：

商湯日日新: 22 個模型可選，包含 SenseNova、SenseChat 系列及第三方模型（Qwen、DeepSeek、Kimi）
百川智慧: Baichuan4 技術能力強，Baichuan3-Turbo-128k 長上下文支援好
MiniMax: 超長文字專家，abab6.5s-chat 支援 245K tokens
階躍星辰: step-1-256k 支援 256K tokens 超長上下文，API 完全相容 OpenAI

1.4 快速選擇指南

場景	首選模型	備選方案	預算考慮
技術面試	OpenAI GPT-5	Claude Sonnet 4.5、智譜 GLM-4	DeepSeek-V3
程式碼生成	Claude Sonnet 4.5	商湯日日新 Qwen3-Coder、OpenAI GPT-5	百川智慧 Baichuan3-Turbo
長文件處理	階躍星辰 step-1-256k	MiniMax abab6.5s-chat、商湯日日新 SenseChat-128K	Kimi
行為面試	GPT-4o Mini	Kimi、商湯日日新 SenseChat-5	DeepSeek-Chat
多模態	Google Gemini 2.0	商湯日日新 SenseNova-V6-5-Omni	商湯日日新 SenseChat-Vision
資料安全	Ollama	vLLM、Regolo	本地大模型
超長上下文	階躍星辰 step-1-256k	MiniMax abab6.5s-chat	百川智慧 Baichuan3-Turbo-128k
快速響應	階躍星辰 step-2-mini	商湯日日新 SenseChat-Turbo	MiniMax abab6.5t-chat
Agent 工作流	MiniMax MiniMax-M2	Claude Sonnet 4.5、OpenAI GPT-5	DeepSeek-V3
推理任務	DeepSeek-R1	Claude Opus 4.1、商湯日日新 SenseNova-V6-Reasoner	智譜 GLM-4

模型服務商列表 ​

國際服務商

OpenAI

Anthropic

Google Gemini

Azure OpenAI

Amazon Bedrock

國內服務商

智譜 AI

阿里雲百鍊

DeepSeek

Kimi

騰訊混元

騰訊雲

訊飛星火

火山引擎

SiliconFlow

百度千帆

MiniMax

階躍星辰

商湯日日新

百川智慧

本地/私有化部署

本地大模型

Ollama

vLLM

Xorbits Inference

Regolo

1. 選擇建議 ​

1.1 根據使用場景選擇 ​

1.1.1 技術面試場景（演算法、程式設計、架構） ​

1.1.2 程式碼生成與程式設計輔助 ​

1.1.3 長文件處理場景 ​

1.1.4 行為面試場景（HR、溝通、軟技能） ​

1.1.5 多模態場景（圖文理解、視覺分析） ​

1.1.6 特殊場景 ​

1.1.7 資料安全與隱私場景 ​

1.2 根據預算選擇 ​

1.2.1 高預算（追求極致效果） ​

1.2.2 中等預算（價效比優選） ​

1.2.3 低預算（免費額度/低成本） ​

1.3 根據地域與網路選擇 ​

1.3.1 國際使用者或需要訪問國際服務 ​

1.3.2 國內使用者或網路限制 ​

1.4 快速選擇指南 ​

模型服務商列表

1. 選擇建議

1.1 根據使用場景選擇

1.1.1 技術面試場景（演算法、程式設計、架構）

1.1.2 程式碼生成與程式設計輔助

1.1.3 長文件處理場景

1.1.4 行為面試場景（HR、溝通、軟技能）

1.1.5 多模態場景（圖文理解、視覺分析）

1.1.6 特殊場景

1.1.7 資料安全與隱私場景

1.2 根據預算選擇

1.2.1 高預算（追求極致效果）

1.2.2 中等預算（價效比優選）

1.2.3 低預算（免費額度/低成本）

1.3 根據地域與網路選擇

1.3.1 國際使用者或需要訪問國際服務

1.3.2 國內使用者或網路限制

1.4 快速選擇指南