模型服务商列表

CueMate 支持配置多种主流大语言模型服务商，选择适合您的模型服务商开始配置。

国际服务商

OpenAI

GPT 系列模型的服务商，提供强大的 AI 能力。支持 GPT-5、GPT-4.1、GPT-4o 等最新模型。

查看配置指南 →

Anthropic

Claude 系列模型的服务商，注重安全和长上下文。提供 Claude Sonnet 4.5（世界最强编程模型）、Claude Haiku 4.5、Claude Opus 4.1 等模型。

查看配置指南 →

Google Gemini

Google 推出的多模态大模型。支持 Gemini 2.0、Gemini 1.5 Pro 等模型。

查看配置指南 →

Azure OpenAI

微软 Azure 平台上的 OpenAI 服务。企业级部署，合规性强。

查看配置指南 →

Amazon Bedrock

AWS 提供的大模型服务平台。支持 Claude、Llama、Mistral 等多种模型。

查看配置指南 →

国内服务商

智谱 AI

清华系 AI 公司，提供 GLM 系列模型。支持 GLM-4、GLM-3 等模型。

查看配置指南 →

阿里云百炼

阿里云推出的企业级大模型服务平台。提供 Qwen 系列模型。

查看配置指南 →

DeepSeek

DeepSeek 推出的高性能大模型。支持 DeepSeek-R1、DeepSeek-Chat 等模型。

查看配置指南 →

Kimi

月之暗面推出的 Kimi 智能助手。支持超长上下文理解。

查看配置指南 →

腾讯混元

腾讯自研的大语言模型。支持 Hunyuan-Pro、Hunyuan-Standard 等模型。

查看配置指南 →

腾讯云

腾讯云提供的大模型服务。支持 DeepSeek-V3、Hunyuan-Pro 等模型。

查看配置指南 →

讯飞星火

科大讯飞推出的星火认知大模型。支持 4.0 Ultra、3.5 等多个版本。

查看配置指南 →

火山引擎

字节跳动旗下的豆包大模型服务。提供高性能的 AI 推理能力。

查看配置指南 →

SiliconFlow

专注于 AI 推理加速的服务平台。支持多种开源模型。

查看配置指南 →

百度千帆

百度推出的大语言模型平台。支持 ERNIE-4.0、ERNIE-3.5 等模型。

查看配置指南 →

MiniMax

MiniMax 推出的超长文本大模型。支持 abab6.5-chat、abab6.5s-chat 等模型。

查看配置指南 →

阶跃星辰

主打长上下文的 Step 系列模型。支持 step-1-8k、step-1-32k 等模型。

查看配置指南 →

商汤日日新

商汤科技推出的 SenseNova 系列模型。支持 SenseChat-5、SenseChat-Turbo 等模型。

查看配置指南 →

百川智能

百川智能推出的 Baichuan 系列模型。支持 Baichuan4、Baichuan3-Turbo、Baichuan3-Turbo-128k 等模型。

查看配置指南 →

本地/私有化部署

本地大模型

支持本地部署的大模型服务。完全私有化，数据安全可控。

查看配置指南 →

Ollama

本地运行大模型的开源工具。支持 DeepSeek-R1、Llama、Qwen 等多种模型。

查看配置指南 →

vLLM

高性能的大模型推理引擎。支持 PagedAttention 技术，吞吐量提升高达 24 倍。

查看配置指南 →

Xorbits Inference

支持多种模型的推理框架。一键部署，支持 100+ 开源模型。

查看配置指南 →

Regolo

企业级私有化部署方案。高可用性保障，专业技术支持。

查看配置指南 →

1. 选择建议

1.1 根据使用场景选择

1.1.1 技术面试场景（算法、编程、架构）

顶级推理能力：

OpenAI GPT-5: 最新旗舰模型，综合能力最强，技术理解深度最佳
Anthropic Claude Sonnet 4.5: 世界最强编程模型，推理能力卓越
Google Gemini 2.0: 多模态能力强，最新技术支持好
智谱 GLM-4: 国内最强技术模型之一，中文理解优秀
DeepSeek-R1: 推理链路清晰，特别适合算法问题
商汤日日新 SenseNova-V6-5-Pro: 最新旗舰模型，能力强大

性价比优选：

DeepSeek-V3: 高性价比，技术能力不输旗舰模型
百川智能 Baichuan4: 技术理解准确，响应速度快
腾讯云 DeepSeek-V3: 稳定性好，企业级支持

1.1.2 代码生成与编程辅助

专业代码模型：

Anthropic Claude Sonnet 4.5: 世界最强编程模型，代码理解和生成能力顶尖
商汤日日新 Qwen3-Coder: 通义千问最新代码模型，编程能力卓越
商汤日日新 Qwen2-5-Coder: 代码生成准确率高，支持多种编程语言
OpenAI GPT-5: 最新旗舰模型，代码能力强大
MiniMax MiniMax-M2: 专为编码任务和 Agent 工作流优化

快速响应：

百川智能 Baichuan3-Turbo: 代码生成速度快，质量高
阶跃星辰 step-2-mini: 轻量级模型，快速响应

1.1.3 长文档处理场景

超长上下文专家：

阶跃星辰 step-1-256k: 支持 256K tokens 超长上下文，最适合超长文档处理
MiniMax abab6.5s-chat: 支持 245K tokens 上下文，长文本理解深度优秀
商汤日日新 SenseChat-128K: 128K 超长上下文，适合复杂文档分析
Kimi: 超长上下文理解，长文本处理专家

长上下文性价比：

阶跃星辰 step-1-32k: 32K 上下文，性价比高
百川智能 Baichuan3-Turbo-128k: 128K 上下文，成本适中
商汤日日新 SenseChat-32K: 32K 上下文，稳定可靠
MiniMax abab6.5t-chat: 快速响应，适合常规长文本

1.1.4 行为面试场景（HR、沟通、软技能）

对话理解优秀：

OpenAI GPT-4o Mini: 轻量级多模态模型，对话理解准确
Kimi: 上下文理解能力强，多轮对话流畅
DeepSeek-Chat: 对话自然，成本低
商汤日日新 SenseChat-5: 中文对话能力出色，理解准确
MiniMax abab6.5g-chat: 通用对话模型，日常使用体验好

快速响应优选：

腾讯混元 Hunyuan-Standard: 响应快，稳定性高
百度千帆 ERNIE-3.5: 中文理解好，速度快
阶跃星辰 step-1-8k: 快速响应，性价比高
商汤日日新 SenseChat-Turbo: 快速模型，适合高频对话

1.1.5 多模态场景（图文理解、视觉分析）

多模态能力：

Google Gemini 2.0: 多模态能力最强，支持文本、图像、视频
Google Gemini 1.5 Pro: 长上下文多模态支持
商汤日日新 SenseNova-V6-5-Omni: 全模态交互，实时对话能力强
商汤日日新 SenseChat-Vision: 视觉理解能力出色，图文对话流畅

1.1.6 特殊场景

粤语对话：

商汤日日新 SenseChat-5-Cantonese: 粤语对话专家，方言理解准确

角色扮演：

商汤日日新 SenseChat-Character-Pro: 高级角色扮演能力
商汤日日新 SenseChat-Character: 基础角色扮演

推理链路：

商汤日日新 SenseNova-V6-Reasoner: 推理任务专家，逻辑分析深度
DeepSeek-R1: 推理链路清晰，思考过程可见

Agent 工作流：

MiniMax MiniMax-M2: 专为 Agent 工作流设计，编码任务优秀

1.1.7 数据安全与隐私场景

完全私有化部署：

本地大模型: 数据完全不出网，绝对可控
Ollama: 开源本地运行，支持 DeepSeek-R1、Llama、Qwen 等多种模型
vLLM: 高性能推理引擎，吞吐量提升高达 24 倍
Xorbits Inference: 一键部署，支持 100+ 开源模型
Regolo: 企业级私有化方案，专业技术支持

企业级云服务：

Azure OpenAI: 微软云平台，企业级合规性强
Amazon Bedrock: AWS 平台，多模型选择
阿里云百炼: 国内企业级平台，Qwen 系列模型
腾讯云: 企业级支持，稳定性高

1.2 根据预算选择

1.2.1 高预算（追求极致效果）

国际顶级模型：

OpenAI GPT-5: 最新旗舰模型，综合能力最强，适合高价值场景
Anthropic Claude Sonnet 4.5: 世界最强编程模型
Anthropic Claude Opus 4.1: 顶级推理能力，深度分析
Google Gemini 2.0: 多模态能力最强

国内旗舰模型：

智谱 GLM-4: 国内最强技术模型之一
商汤日日新 SenseNova-V6-5-Pro: 最新旗舰，能力强大
MiniMax MiniMax-M2: 编码和 Agent 任务顶尖

1.2.2 中等预算（性价比优选）

高性价比国际模型：

Anthropic Claude Haiku 4.5: 高性价比，速度快成本低
OpenAI GPT-5 Mini: 轻量级 GPT-5，性价比高
Google Gemini 1.5 Pro: 长上下文，价格适中

高性价比国内模型：

DeepSeek-V3: 能力接近顶级，价格极低
腾讯云 DeepSeek-V3: 稳定性好，成本低
智谱 GLM-3: 效果不错，价格合理
Kimi: 超长上下文，性价比高
百川智能 Baichuan4: 技术能力强，价格适中
商汤日日新 SenseNova-V6-5-Turbo: 高性能快速模型
MiniMax abab6.5s-chat: 超长上下文，价格合理

1.2.3 低预算（免费额度/低成本）

有免费额度：

DeepSeek: 提供免费额度，成本极低
SiliconFlow: 专注 AI 推理加速，多种开源模型
讯飞星火: 提供免费试用额度
百度千帆: 新用户有免费额度
腾讯混元: 提供免费试用
商汤日日新: 个人用户实名认证后有免费额度
MiniMax: 2025 年推出新用户礼包

快速轻量模型：

OpenAI GPT-4o Mini: 轻量级多模态模型，性价比高
阶跃星辰 step-1-8k: 快速响应，成本低
阶跃星辰 step-2-mini: 最新轻量级，性价比极高
MiniMax abab6.5t-chat: 快速模型，成本低
商汤日日新 SenseChat-Turbo: 快速响应，性价比高
百川智能 Baichuan3-Turbo: 快速稳定，价格友好

完全免费（本地部署）：

Ollama: 完全免费，支持多种开源模型
vLLM: 开源推理引擎，高性能
Xorbits Inference: 开源框架，支持 100+ 模型

1.3 根据地域与网络选择

1.3.1 国际用户或需要访问国际服务

首选国际服务商：

OpenAI: 全球最强 AI 服务商
Anthropic: Claude 系列，安全性高
Google Gemini: 多模态能力强
Azure OpenAI: 企业级，全球部署
Amazon Bedrock: AWS 平台，全球可用

1.3.2 国内用户或网络限制

国内服务商优选：

智谱 AI: 清华系，技术能力强
DeepSeek: 性价比最高，能力强
阿里云百炼: 企业级，Qwen 系列
腾讯云: 稳定性好，多模型选择
百度千帆: ERNIE 系列，中文优秀
讯飞星火: 语音技术强，多版本选择
火山引擎: 字节跳动，豆包大模型
Kimi: 月之暗面，超长上下文
腾讯混元: 腾讯自研，稳定可靠

新兴服务商（2025 年推荐）：

商汤日日新: 22 个模型可选，包含 SenseNova、SenseChat 系列及第三方模型（Qwen、DeepSeek、Kimi）
百川智能: Baichuan4 技术能力强，Baichuan3-Turbo-128k 长上下文支持好
MiniMax: 超长文本专家，abab6.5s-chat 支持 245K tokens
阶跃星辰: step-1-256k 支持 256K tokens 超长上下文，API 完全兼容 OpenAI

1.4 快速选择指南

场景	首选模型	备选方案	预算考虑
技术面试	OpenAI GPT-5	Claude Sonnet 4.5、智谱 GLM-4	DeepSeek-V3
代码生成	Claude Sonnet 4.5	商汤日日新 Qwen3-Coder、OpenAI GPT-5	百川智能 Baichuan3-Turbo
长文档处理	阶跃星辰 step-1-256k	MiniMax abab6.5s-chat、商汤日日新 SenseChat-128K	Kimi
行为面试	GPT-4o Mini	Kimi、商汤日日新 SenseChat-5	DeepSeek-Chat
多模态	Google Gemini 2.0	商汤日日新 SenseNova-V6-5-Omni	商汤日日新 SenseChat-Vision
数据安全	Ollama	vLLM、Regolo	本地大模型
超长上下文	阶跃星辰 step-1-256k	MiniMax abab6.5s-chat	百川智能 Baichuan3-Turbo-128k
快速响应	阶跃星辰 step-2-mini	商汤日日新 SenseChat-Turbo	MiniMax abab6.5t-chat
Agent 工作流	MiniMax MiniMax-M2	Claude Sonnet 4.5、OpenAI GPT-5	DeepSeek-V3
推理任务	DeepSeek-R1	Claude Opus 4.1、商汤日日新 SenseNova-V6-Reasoner	智谱 GLM-4

模型服务商列表 ​

国际服务商

OpenAI

Anthropic

Google Gemini

Azure OpenAI

Amazon Bedrock

国内服务商

智谱 AI

阿里云百炼

DeepSeek

Kimi

腾讯混元

腾讯云

讯飞星火

火山引擎

SiliconFlow

百度千帆

MiniMax

阶跃星辰

商汤日日新

百川智能

本地/私有化部署

本地大模型

Ollama

vLLM

Xorbits Inference

Regolo

1. 选择建议 ​

1.1 根据使用场景选择 ​

1.1.1 技术面试场景（算法、编程、架构） ​

1.1.2 代码生成与编程辅助 ​

1.1.3 长文档处理场景 ​

1.1.4 行为面试场景（HR、沟通、软技能） ​

1.1.5 多模态场景（图文理解、视觉分析） ​

1.1.6 特殊场景 ​

1.1.7 数据安全与隐私场景 ​

1.2 根据预算选择 ​

1.2.1 高预算（追求极致效果） ​

1.2.2 中等预算（性价比优选） ​

1.2.3 低预算（免费额度/低成本） ​

1.3 根据地域与网络选择 ​

1.3.1 国际用户或需要访问国际服务 ​

1.3.2 国内用户或网络限制 ​

1.4 快速选择指南 ​

模型服务商列表

1. 选择建议

1.1 根据使用场景选择

1.1.1 技术面试场景（算法、编程、架构）

1.1.2 代码生成与编程辅助

1.1.3 长文档处理场景

1.1.4 行为面试场景（HR、沟通、软技能）

1.1.5 多模态场景（图文理解、视觉分析）

1.1.6 特殊场景

1.1.7 数据安全与隐私场景

1.2 根据预算选择

1.2.1 高预算（追求极致效果）

1.2.2 中等预算（性价比优选）

1.2.3 低预算（免费额度/低成本）

1.3 根据地域与网络选择

1.3.1 国际用户或需要访问国际服务

1.3.2 国内用户或网络限制

1.4 快速选择指南