模型服务商列表
CueMate 支持配置多种主流大语言模型服务商,选择适合您的模型服务商开始配置。
国际服务商
国内服务商
本地/私有化部署
1. 选择建议
1.1 根据使用场景选择
1.1.1 技术面试场景(算法、编程、架构)
顶级推理能力:
- OpenAI GPT-4: 综合能力最强,技术理解深度最佳
- Anthropic Claude 3.5 Sonnet: 推理能力卓越,长上下文支持出色
- Google Gemini 2.0: 多模态能力强,最新技术支持好
- 智谱 GLM-4: 国内最强技术模型之一,中文理解优秀
- DeepSeek-R1: 推理链路清晰,特别适合算法问题
- 商汤日日新 SenseNova-V6-5-Pro: 最新旗舰模型,能力强大
性价比优选:
- DeepSeek-V3: 高性价比,技术能力不输旗舰模型
- 百川智能 Baichuan4: 技术理解准确,响应速度快
- 腾讯云 DeepSeek-V3: 稳定性好,企业级支持
1.1.2 代码生成与编程辅助
专业代码模型:
- 商汤日日新 Qwen3-Coder: 通义千问最新代码模型,编程能力卓越
- 商汤日日新 Qwen2-5-Coder: 代码生成准确率高,支持多种编程语言
- OpenAI GPT-4: 代码理解和生成能力顶尖
- MiniMax MiniMax-M2: 专为编码任务和 Agent 工作流优化
快速响应:
- 百川智能 Baichuan3-Turbo: 代码生成速度快,质量高
- 阶跃星辰 step-2-mini: 轻量级模型,快速响应
1.1.3 长文档处理场景
超长上下文专家:
- 阶跃星辰 step-1-256k: 支持 256K tokens 超长上下文,最适合超长文档处理
- MiniMax abab6.5s-chat: 支持 245K tokens 上下文,长文本理解深度优秀
- 商汤日日新 SenseChat-128K: 128K 超长上下文,适合复杂文档分析
- Kimi: 超长上下文理解,长文本处理专家
长上下文性价比:
- 阶跃星辰 step-1-32k: 32K 上下文,性价比高
- 百川智能 Baichuan3-Turbo-128k: 128K 上下文,成本适中
- 商汤日日新 SenseChat-32K: 32K 上下文,稳定可靠
- MiniMax abab6.5t-chat: 快速响应,适合常规长文本
1.1.4 行为面试场景(HR、沟通、软技能)
对话理解优秀:
- OpenAI GPT-3.5: 经典对话模型,理解准确
- Kimi: 上下文理解能力强,多轮对话流畅
- DeepSeek-Chat: 对话自然,成本低
- 商汤日日新 SenseChat-5: 中文对话能力出色,理解准确
- MiniMax abab6.5g-chat: 通用对话模型,日常使用体验好
快速响应优选:
- 腾讯混元 Hunyuan-Standard: 响应快,稳定性高
- 百度千帆 ERNIE-3.5: 中文理解好,速度快
- 阶跃星辰 step-1-8k: 快速响应,性价比高
- 商汤日日新 SenseChat-Turbo: 快速模型,适合高频对话
1.1.5 多模态场景(图文理解、视觉分析)
多模态能力:
- Google Gemini 2.0: 多模态能力最强,支持文本、图像、视频
- Google Gemini 1.5 Pro: 长上下文多模态支持
- 商汤日日新 SenseNova-V6-5-Omni: 全模态交互,实时对话能力强
- 商汤日日新 SenseChat-Vision: 视觉理解能力出色,图文对话流畅
1.1.6 特殊场景
粤语对话:
- 商汤日日新 SenseChat-5-Cantonese: 粤语对话专家,方言理解准确
角色扮演:
- 商汤日日新 SenseChat-Character-Pro: 高级角色扮演能力
- 商汤日日新 SenseChat-Character: 基础角色扮演
推理链路:
- 商汤日日新 SenseNova-V6-Reasoner: 推理任务专家,逻辑分析深度
- DeepSeek-R1: 推理链路清晰,思考过程可见
Agent 工作流:
- MiniMax MiniMax-M2: 专为 Agent 工作流设计,编码任务优秀
1.1.7 数据安全与隐私场景
完全私有化部署:
- 本地大模型: 数据完全不出网,绝对可控
- Ollama: 开源本地运行,支持 DeepSeek-R1、Llama、Qwen 等多种模型
- vLLM: 高性能推理引擎,吞吐量提升高达 24 倍
- Xorbits Inference: 一键部署,支持 100+ 开源模型
- Regolo: 企业级私有化方案,专业技术支持
企业级云服务:
- Azure OpenAI: 微软云平台,企业级合规性强
- Amazon Bedrock: AWS 平台,多模型选择
- 阿里云百炼: 国内企业级平台,Qwen 系列模型
- 腾讯云: 企业级支持,稳定性高
1.2 根据预算选择
1.2.1 高预算(追求极致效果)
国际顶级模型:
- OpenAI GPT-4: 综合能力最强,适合高价值场景
- Anthropic Claude 3 Opus: 长上下文专家,深度推理
- Google Gemini 2.0: 多模态能力最强
国内旗舰模型:
- 智谱 GLM-4: 国内最强技术模型之一
- 商汤日日新 SenseNova-V6-5-Pro: 最新旗舰,能力强大
- MiniMax MiniMax-M2: 编码和 Agent 任务顶尖
1.2.2 中等预算(性价比优选)
高性价比国际模型:
- Anthropic Claude 3.5 Sonnet: 性价比超越 GPT-4
- Google Gemini 1.5 Pro: 长上下文,价格适中
高性价比国内模型:
- DeepSeek-V3: 能力接近顶级,价格极低
- 腾讯云 DeepSeek-V3: 稳定性好,成本低
- 智谱 GLM-3: 效果不错,价格合理
- Kimi: 超长上下文,性价比高
- 百川智能 Baichuan4: 技术能力强,价格适中
- 商汤日日新 SenseNova-V6-5-Turbo: 高性能快速模型
- MiniMax abab6.5s-chat: 超长上下文,价格合理
1.2.3 低预算(免费额度/低成本)
有免费额度:
- DeepSeek: 提供免费额度,成本极低
- SiliconFlow: 专注 AI 推理加速,多种开源模型
- 讯飞星火: 提供免费试用额度
- 百度千帆: 新用户有免费额度
- 腾讯混元: 提供免费试用
- 商汤日日新: 个人用户实名认证后有免费额度
- MiniMax: 2025 年推出新用户礼包
快速轻量模型:
- OpenAI GPT-3.5: 经典模型,价格最低
- 阶跃星辰 step-1-8k: 快速响应,成本低
- 阶跃星辰 step-2-mini: 最新轻量级,性价比极高
- MiniMax abab6.5t-chat: 快速模型,成本低
- 商汤日日新 SenseChat-Turbo: 快速响应,性价比高
- 百川智能 Baichuan3-Turbo: 快速稳定,价格友好
完全免费(本地部署):
- Ollama: 完全免费,支持多种开源模型
- vLLM: 开源推理引擎,高性能
- Xorbits Inference: 开源框架,支持 100+ 模型
1.3 根据地域与网络选择
1.3.1 国际用户或需要访问国际服务
首选国际服务商:
- OpenAI: 全球最强 AI 服务商
- Anthropic: Claude 系列,安全性高
- Google Gemini: 多模态能力强
- Azure OpenAI: 企业级,全球部署
- Amazon Bedrock: AWS 平台,全球可用
1.3.2 国内用户或网络限制
国内服务商优选:
- 智谱 AI: 清华系,技术能力强
- DeepSeek: 性价比最高,能力强
- 阿里云百炼: 企业级,Qwen 系列
- 腾讯云: 稳定性好,多模型选择
- 百度千帆: ERNIE 系列,中文优秀
- 讯飞星火: 语音技术强,多版本选择
- 火山引擎: 字节跳动,豆包大模型
- Kimi: 月之暗面,超长上下文
- 腾讯混元: 腾讯自研,稳定可靠
新兴服务商(2025 年推荐):
- 商汤日日新: 22 个模型可选,包含 SenseNova、SenseChat 系列及第三方模型(Qwen、DeepSeek、Kimi)
- 百川智能: Baichuan4 技术能力强,Baichuan3-Turbo-128k 长上下文支持好
- MiniMax: 超长文本专家,abab6.5s-chat 支持 245K tokens
- 阶跃星辰: step-1-256k 支持 256K tokens 超长上下文,API 完全兼容 OpenAI
1.4 快速选择指南
| 场景 | 首选模型 | 备选方案 | 预算考虑 |
|---|---|---|---|
| 技术面试 | OpenAI GPT-4 | 智谱 GLM-4、商汤日日新 SenseNova-V6-5-Pro | DeepSeek-V3 |
| 代码生成 | 商汤日日新 Qwen3-Coder | MiniMax MiniMax-M2、OpenAI GPT-4 | 百川智能 Baichuan3-Turbo |
| 长文档处理 | 阶跃星辰 step-1-256k | MiniMax abab6.5s-chat、商汤日日新 SenseChat-128K | Kimi |
| 行为面试 | OpenAI GPT-3.5 | Kimi、商汤日日新 SenseChat-5 | DeepSeek-Chat |
| 多模态 | Google Gemini 2.0 | 商汤日日新 SenseNova-V6-5-Omni | 商汤日日新 SenseChat-Vision |
| 数据安全 | Ollama | vLLM、Regolo | 本地大模型 |
| 超长上下文 | 阶跃星辰 step-1-256k | MiniMax abab6.5s-chat | 百川智能 Baichuan3-Turbo-128k |
| 快速响应 | 阶跃星辰 step-2-mini | 商汤日日新 SenseChat-Turbo | MiniMax abab6.5t-chat |
| Agent 工作流 | MiniMax MiniMax-M2 | OpenAI GPT-4 | DeepSeek-V3 |
| 推理任务 | DeepSeek-R1 | 商汤日日新 SenseNova-V6-Reasoner | 智谱 GLM-4 |
