Skip to content

模型服务商列表

CueMate 支持配置多种主流大语言模型服务商,选择适合您的模型服务商开始配置。

国际服务商

01

OpenAI

GPT 系列模型的服务商,提供强大的 AI 能力。支持 GPT-4、GPT-3.5 等主流模型。

查看配置指南 →
02

Anthropic

Claude 系列模型的服务商,注重安全和长上下文。提供 Claude 3.5 Sonnet、Claude 3 Opus 等模型。

查看配置指南 →
03

Google Gemini

Google 推出的多模态大模型。支持 Gemini 2.0、Gemini 1.5 Pro 等模型。

查看配置指南 →
04

Azure OpenAI

微软 Azure 平台上的 OpenAI 服务。企业级部署,合规性强。

查看配置指南 →
05

Amazon Bedrock

AWS 提供的大模型服务平台。支持 Claude、Llama、Mistral 等多种模型。

查看配置指南 →

国内服务商

06

智谱 AI

清华系 AI 公司,提供 GLM 系列模型。支持 GLM-4、GLM-3 等模型。

查看配置指南 →
07

阿里云百炼

阿里云推出的企业级大模型服务平台。提供 Qwen 系列模型。

查看配置指南 →
08

DeepSeek

DeepSeek 推出的高性能大模型。支持 DeepSeek-R1、DeepSeek-Chat 等模型。

查看配置指南 →
09

Kimi

月之暗面推出的 Kimi 智能助手。支持超长上下文理解。

查看配置指南 →
10

腾讯混元

腾讯自研的大语言模型。支持 Hunyuan-Pro、Hunyuan-Standard 等模型。

查看配置指南 →
11

腾讯云

腾讯云提供的大模型服务。支持 DeepSeek-V3、Hunyuan-Pro 等模型。

查看配置指南 →
12

讯飞星火

科大讯飞推出的星火认知大模型。支持 4.0 Ultra、3.5 等多个版本。

查看配置指南 →
13

火山引擎

字节跳动旗下的豆包大模型服务。提供高性能的 AI 推理能力。

查看配置指南 →
14

SiliconFlow

专注于 AI 推理加速的服务平台。支持多种开源模型。

查看配置指南 →
15

百度千帆

百度推出的大语言模型平台。支持 ERNIE-4.0、ERNIE-3.5 等模型。

查看配置指南 →
16

MiniMax

MiniMax 推出的超长文本大模型。支持 abab6.5-chat、abab6.5s-chat 等模型。

查看配置指南 →
17

阶跃星辰

主打长上下文的 Step 系列模型。支持 step-1-8k、step-1-32k 等模型。

查看配置指南 →
18

商汤日日新

商汤科技推出的 SenseNova 系列模型。支持 SenseChat-5、SenseChat-Turbo 等模型。

查看配置指南 →
19

百川智能

百川智能推出的 Baichuan 系列模型。支持 Baichuan4、Baichuan3-Turbo、Baichuan3-Turbo-128k 等模型。

查看配置指南 →

本地/私有化部署

21

本地大模型

支持本地部署的大模型服务。完全私有化,数据安全可控。

查看配置指南 →
22

Ollama

本地运行大模型的开源工具。支持 DeepSeek-R1、Llama、Qwen 等多种模型。

查看配置指南 →
23

vLLM

高性能的大模型推理引擎。支持 PagedAttention 技术,吞吐量提升高达 24 倍。

查看配置指南 →
24

Xorbits Inference

支持多种模型的推理框架。一键部署,支持 100+ 开源模型。

查看配置指南 →
25

Regolo

企业级私有化部署方案。高可用性保障,专业技术支持。

查看配置指南 →

1. 选择建议

1.1 根据使用场景选择

1.1.1 技术面试场景(算法、编程、架构)

顶级推理能力:

  • OpenAI GPT-4: 综合能力最强,技术理解深度最佳
  • Anthropic Claude 3.5 Sonnet: 推理能力卓越,长上下文支持出色
  • Google Gemini 2.0: 多模态能力强,最新技术支持好
  • 智谱 GLM-4: 国内最强技术模型之一,中文理解优秀
  • DeepSeek-R1: 推理链路清晰,特别适合算法问题
  • 商汤日日新 SenseNova-V6-5-Pro: 最新旗舰模型,能力强大

性价比优选:

  • DeepSeek-V3: 高性价比,技术能力不输旗舰模型
  • 百川智能 Baichuan4: 技术理解准确,响应速度快
  • 腾讯云 DeepSeek-V3: 稳定性好,企业级支持

1.1.2 代码生成与编程辅助

专业代码模型:

  • 商汤日日新 Qwen3-Coder: 通义千问最新代码模型,编程能力卓越
  • 商汤日日新 Qwen2-5-Coder: 代码生成准确率高,支持多种编程语言
  • OpenAI GPT-4: 代码理解和生成能力顶尖
  • MiniMax MiniMax-M2: 专为编码任务和 Agent 工作流优化

快速响应:

  • 百川智能 Baichuan3-Turbo: 代码生成速度快,质量高
  • 阶跃星辰 step-2-mini: 轻量级模型,快速响应

1.1.3 长文档处理场景

超长上下文专家:

  • 阶跃星辰 step-1-256k: 支持 256K tokens 超长上下文,最适合超长文档处理
  • MiniMax abab6.5s-chat: 支持 245K tokens 上下文,长文本理解深度优秀
  • 商汤日日新 SenseChat-128K: 128K 超长上下文,适合复杂文档分析
  • Kimi: 超长上下文理解,长文本处理专家

长上下文性价比:

  • 阶跃星辰 step-1-32k: 32K 上下文,性价比高
  • 百川智能 Baichuan3-Turbo-128k: 128K 上下文,成本适中
  • 商汤日日新 SenseChat-32K: 32K 上下文,稳定可靠
  • MiniMax abab6.5t-chat: 快速响应,适合常规长文本

1.1.4 行为面试场景(HR、沟通、软技能)

对话理解优秀:

  • OpenAI GPT-3.5: 经典对话模型,理解准确
  • Kimi: 上下文理解能力强,多轮对话流畅
  • DeepSeek-Chat: 对话自然,成本低
  • 商汤日日新 SenseChat-5: 中文对话能力出色,理解准确
  • MiniMax abab6.5g-chat: 通用对话模型,日常使用体验好

快速响应优选:

  • 腾讯混元 Hunyuan-Standard: 响应快,稳定性高
  • 百度千帆 ERNIE-3.5: 中文理解好,速度快
  • 阶跃星辰 step-1-8k: 快速响应,性价比高
  • 商汤日日新 SenseChat-Turbo: 快速模型,适合高频对话

1.1.5 多模态场景(图文理解、视觉分析)

多模态能力:

  • Google Gemini 2.0: 多模态能力最强,支持文本、图像、视频
  • Google Gemini 1.5 Pro: 长上下文多模态支持
  • 商汤日日新 SenseNova-V6-5-Omni: 全模态交互,实时对话能力强
  • 商汤日日新 SenseChat-Vision: 视觉理解能力出色,图文对话流畅

1.1.6 特殊场景

粤语对话:

  • 商汤日日新 SenseChat-5-Cantonese: 粤语对话专家,方言理解准确

角色扮演:

  • 商汤日日新 SenseChat-Character-Pro: 高级角色扮演能力
  • 商汤日日新 SenseChat-Character: 基础角色扮演

推理链路:

  • 商汤日日新 SenseNova-V6-Reasoner: 推理任务专家,逻辑分析深度
  • DeepSeek-R1: 推理链路清晰,思考过程可见

Agent 工作流:

  • MiniMax MiniMax-M2: 专为 Agent 工作流设计,编码任务优秀

1.1.7 数据安全与隐私场景

完全私有化部署:

  • 本地大模型: 数据完全不出网,绝对可控
  • Ollama: 开源本地运行,支持 DeepSeek-R1、Llama、Qwen 等多种模型
  • vLLM: 高性能推理引擎,吞吐量提升高达 24 倍
  • Xorbits Inference: 一键部署,支持 100+ 开源模型
  • Regolo: 企业级私有化方案,专业技术支持

企业级云服务:

  • Azure OpenAI: 微软云平台,企业级合规性强
  • Amazon Bedrock: AWS 平台,多模型选择
  • 阿里云百炼: 国内企业级平台,Qwen 系列模型
  • 腾讯云: 企业级支持,稳定性高

1.2 根据预算选择

1.2.1 高预算(追求极致效果)

国际顶级模型:

  • OpenAI GPT-4: 综合能力最强,适合高价值场景
  • Anthropic Claude 3 Opus: 长上下文专家,深度推理
  • Google Gemini 2.0: 多模态能力最强

国内旗舰模型:

  • 智谱 GLM-4: 国内最强技术模型之一
  • 商汤日日新 SenseNova-V6-5-Pro: 最新旗舰,能力强大
  • MiniMax MiniMax-M2: 编码和 Agent 任务顶尖

1.2.2 中等预算(性价比优选)

高性价比国际模型:

  • Anthropic Claude 3.5 Sonnet: 性价比超越 GPT-4
  • Google Gemini 1.5 Pro: 长上下文,价格适中

高性价比国内模型:

  • DeepSeek-V3: 能力接近顶级,价格极低
  • 腾讯云 DeepSeek-V3: 稳定性好,成本低
  • 智谱 GLM-3: 效果不错,价格合理
  • Kimi: 超长上下文,性价比高
  • 百川智能 Baichuan4: 技术能力强,价格适中
  • 商汤日日新 SenseNova-V6-5-Turbo: 高性能快速模型
  • MiniMax abab6.5s-chat: 超长上下文,价格合理

1.2.3 低预算(免费额度/低成本)

有免费额度:

  • DeepSeek: 提供免费额度,成本极低
  • SiliconFlow: 专注 AI 推理加速,多种开源模型
  • 讯飞星火: 提供免费试用额度
  • 百度千帆: 新用户有免费额度
  • 腾讯混元: 提供免费试用
  • 商汤日日新: 个人用户实名认证后有免费额度
  • MiniMax: 2025 年推出新用户礼包

快速轻量模型:

  • OpenAI GPT-3.5: 经典模型,价格最低
  • 阶跃星辰 step-1-8k: 快速响应,成本低
  • 阶跃星辰 step-2-mini: 最新轻量级,性价比极高
  • MiniMax abab6.5t-chat: 快速模型,成本低
  • 商汤日日新 SenseChat-Turbo: 快速响应,性价比高
  • 百川智能 Baichuan3-Turbo: 快速稳定,价格友好

完全免费(本地部署):

  • Ollama: 完全免费,支持多种开源模型
  • vLLM: 开源推理引擎,高性能
  • Xorbits Inference: 开源框架,支持 100+ 模型

1.3 根据地域与网络选择

1.3.1 国际用户或需要访问国际服务

首选国际服务商:

  • OpenAI: 全球最强 AI 服务商
  • Anthropic: Claude 系列,安全性高
  • Google Gemini: 多模态能力强
  • Azure OpenAI: 企业级,全球部署
  • Amazon Bedrock: AWS 平台,全球可用

1.3.2 国内用户或网络限制

国内服务商优选:

  • 智谱 AI: 清华系,技术能力强
  • DeepSeek: 性价比最高,能力强
  • 阿里云百炼: 企业级,Qwen 系列
  • 腾讯云: 稳定性好,多模型选择
  • 百度千帆: ERNIE 系列,中文优秀
  • 讯飞星火: 语音技术强,多版本选择
  • 火山引擎: 字节跳动,豆包大模型
  • Kimi: 月之暗面,超长上下文
  • 腾讯混元: 腾讯自研,稳定可靠

新兴服务商(2025 年推荐):

  • 商汤日日新: 22 个模型可选,包含 SenseNova、SenseChat 系列及第三方模型(Qwen、DeepSeek、Kimi)
  • 百川智能: Baichuan4 技术能力强,Baichuan3-Turbo-128k 长上下文支持好
  • MiniMax: 超长文本专家,abab6.5s-chat 支持 245K tokens
  • 阶跃星辰: step-1-256k 支持 256K tokens 超长上下文,API 完全兼容 OpenAI

1.4 快速选择指南

场景首选模型备选方案预算考虑
技术面试OpenAI GPT-4智谱 GLM-4、商汤日日新 SenseNova-V6-5-ProDeepSeek-V3
代码生成商汤日日新 Qwen3-CoderMiniMax MiniMax-M2、OpenAI GPT-4百川智能 Baichuan3-Turbo
长文档处理阶跃星辰 step-1-256kMiniMax abab6.5s-chat、商汤日日新 SenseChat-128KKimi
行为面试OpenAI GPT-3.5Kimi、商汤日日新 SenseChat-5DeepSeek-Chat
多模态Google Gemini 2.0商汤日日新 SenseNova-V6-5-Omni商汤日日新 SenseChat-Vision
数据安全OllamavLLM、Regolo本地大模型
超长上下文阶跃星辰 step-1-256kMiniMax abab6.5s-chat百川智能 Baichuan3-Turbo-128k
快速响应阶跃星辰 step-2-mini商汤日日新 SenseChat-TurboMiniMax abab6.5t-chat
Agent 工作流MiniMax MiniMax-M2OpenAI GPT-4DeepSeek-V3
推理任务DeepSeek-R1商汤日日新 SenseNova-V6-Reasoner智谱 GLM-4

Released under the GPL-3.0 License.