Skip to content

模型服務商列表

CueMate 支援配置多種主流大語言模型服務商,選擇適合您的模型服務商開始配置。

國際服務商

01

OpenAI

GPT 系列模型的服務商,提供強大的 AI 能力。支援 GPT-5、GPT-4.1、GPT-4o 等最新模型。

檢視配置指南 →
02

Anthropic

Claude 系列模型的服務商,注重安全和長上下文。提供 Claude Sonnet 4.5(世界最強程式設計模型)、Claude Haiku 4.5、Claude Opus 4.1 等模型。

檢視配置指南 →
03

Google Gemini

Google 推出的多模態大模型。支援 Gemini 2.0、Gemini 1.5 Pro 等模型。

檢視配置指南 →
04

Azure OpenAI

微軟 Azure 平臺上的 OpenAI 服務。企業級部署,合規性強。

檢視配置指南 →
05

Amazon Bedrock

AWS 提供的大模型服務平臺。支援 Claude、Llama、Mistral 等多種模型。

檢視配置指南 →

國內服務商

06

智譜 AI

清華系 AI 公司,提供 GLM 系列模型。支援 GLM-4、GLM-3 等模型。

檢視配置指南 →
07

阿里雲百鍊

阿里雲推出的企業級大模型服務平臺。提供 Qwen 系列模型。

檢視配置指南 →
08

DeepSeek

DeepSeek 推出的高效能大模型。支援 DeepSeek-R1、DeepSeek-Chat 等模型。

檢視配置指南 →
09

Kimi

月之暗面推出的 Kimi 智慧助手。支援超長上下文理解。

檢視配置指南 →
10

騰訊混元

騰訊自研的大語言模型。支援 Hunyuan-Pro、Hunyuan-Standard 等模型。

檢視配置指南 →
11

騰訊雲

騰訊雲提供的大模型服務。支援 DeepSeek-V3、Hunyuan-Pro 等模型。

檢視配置指南 →
12

訊飛星火

科大訊飛推出的星火認知大模型。支援 4.0 Ultra、3.5 等多個版本。

檢視配置指南 →
13

火山引擎

位元組跳動旗下的豆包大模型服務。提供高效能的 AI 推理能力。

檢視配置指南 →
14

SiliconFlow

專注於 AI 推理加速的服務平臺。支援多種開源模型。

檢視配置指南 →
15

百度千帆

百度推出的大語言模型平臺。支援 ERNIE-4.0、ERNIE-3.5 等模型。

檢視配置指南 →
16

MiniMax

MiniMax 推出的超長文字大模型。支援 abab6.5-chat、abab6.5s-chat 等模型。

檢視配置指南 →
17

階躍星辰

主打長上下文的 Step 系列模型。支援 step-1-8k、step-1-32k 等模型。

檢視配置指南 →
18

商湯日日新

商湯科技推出的 SenseNova 系列模型。支援 SenseChat-5、SenseChat-Turbo 等模型。

檢視配置指南 →
19

百川智慧

百川智慧推出的 Baichuan 系列模型。支援 Baichuan4、Baichuan3-Turbo、Baichuan3-Turbo-128k 等模型。

檢視配置指南 →

本地/私有化部署

21

本地大模型

支援本地部署的大模型服務。完全私有化,資料安全可控。

檢視配置指南 →
22

Ollama

本地執行大模型的開源工具。支援 DeepSeek-R1、Llama、Qwen 等多種模型。

檢視配置指南 →
23

vLLM

高效能的大模型推理引擎。支援 PagedAttention 技術,吞吐量提升高達 24 倍。

檢視配置指南 →
24

Xorbits Inference

支援多種模型的推理框架。一鍵部署,支援 100+ 開源模型。

檢視配置指南 →
25

Regolo

企業級私有化部署方案。高可用性保障,專業技術支援。

檢視配置指南 →

1. 選擇建議

1.1 根據使用場景選擇

1.1.1 技術面試場景(演算法、程式設計、架構)

頂級推理能力:

  • OpenAI GPT-5: 最新旗艦模型,綜合能力最強,技術理解深度最佳
  • Anthropic Claude Sonnet 4.5: 世界最強程式設計模型,推理能力卓越
  • Google Gemini 2.0: 多模態能力強,最新技術支援好
  • 智譜 GLM-4: 國內最強技術模型之一,中文理解優秀
  • DeepSeek-R1: 推理鏈路清晰,特別適合演算法問題
  • 商湯日日新 SenseNova-V6-5-Pro: 最新旗艦模型,能力強大

價效比優選:

  • DeepSeek-V3: 高價效比,技術能力不輸旗艦模型
  • 百川智慧 Baichuan4: 技術理解準確,響應速度快
  • 騰訊雲 DeepSeek-V3: 穩定性好,企業級支援

1.1.2 程式碼生成與程式設計輔助

專業程式碼模型:

  • Anthropic Claude Sonnet 4.5: 世界最強程式設計模型,程式碼理解和生成能力頂尖
  • 商湯日日新 Qwen3-Coder: 通義千問最新程式碼模型,程式設計能力卓越
  • 商湯日日新 Qwen2-5-Coder: 程式碼生成準確率高,支援多種程式語言
  • OpenAI GPT-5: 最新旗艦模型,程式碼能力強大
  • MiniMax MiniMax-M2: 專為編碼任務和 Agent 工作流最佳化

快速響應:

  • 百川智慧 Baichuan3-Turbo: 程式碼生成速度快,質量高
  • 階躍星辰 step-2-mini: 輕量級模型,快速響應

1.1.3 長文件處理場景

超長上下文專家:

  • 階躍星辰 step-1-256k: 支援 256K tokens 超長上下文,最適合超長文件處理
  • MiniMax abab6.5s-chat: 支援 245K tokens 上下文,長文字理解深度優秀
  • 商湯日日新 SenseChat-128K: 128K 超長上下文,適合複雜文件分析
  • Kimi: 超長上下文理解,長文字處理專家

長上下文價效比:

  • 階躍星辰 step-1-32k: 32K 上下文,價效比高
  • 百川智慧 Baichuan3-Turbo-128k: 128K 上下文,成本適中
  • 商湯日日新 SenseChat-32K: 32K 上下文,穩定可靠
  • MiniMax abab6.5t-chat: 快速響應,適合常規長文字

1.1.4 行為面試場景(HR、溝通、軟技能)

對話理解優秀:

  • OpenAI GPT-4o Mini: 輕量級多模態模型,對話理解準確
  • Kimi: 上下文理解能力強,多輪對話流暢
  • DeepSeek-Chat: 對話自然,成本低
  • 商湯日日新 SenseChat-5: 中文對話能力出色,理解準確
  • MiniMax abab6.5g-chat: 通用對話模型,日常使用體驗好

快速響應優選:

  • 騰訊混元 Hunyuan-Standard: 響應快,穩定性高
  • 百度千帆 ERNIE-3.5: 中文理解好,速度快
  • 階躍星辰 step-1-8k: 快速響應,價效比高
  • 商湯日日新 SenseChat-Turbo: 快速模型,適合高頻對話

1.1.5 多模態場景(圖文理解、視覺分析)

多模態能力:

  • Google Gemini 2.0: 多模態能力最強,支援文字、影象、影片
  • Google Gemini 1.5 Pro: 長上下文多模態支援
  • 商湯日日新 SenseNova-V6-5-Omni: 全模態互動,實時對話能力強
  • 商湯日日新 SenseChat-Vision: 視覺理解能力出色,圖文對話流暢

1.1.6 特殊場景

粵語對話:

  • 商湯日日新 SenseChat-5-Cantonese: 粵語對話專家,方言理解準確

角色扮演:

  • 商湯日日新 SenseChat-Character-Pro: 高階角色扮演能力
  • 商湯日日新 SenseChat-Character: 基礎角色扮演

推理鏈路:

  • 商湯日日新 SenseNova-V6-Reasoner: 推理任務專家,邏輯分析深度
  • DeepSeek-R1: 推理鏈路清晰,思考過程可見

Agent 工作流:

  • MiniMax MiniMax-M2: 專為 Agent 工作流設計,編碼任務優秀

1.1.7 資料安全與隱私場景

完全私有化部署:

  • 本地大模型: 資料完全不出網,絕對可控
  • Ollama: 開源本地執行,支援 DeepSeek-R1、Llama、Qwen 等多種模型
  • vLLM: 高效能推理引擎,吞吐量提升高達 24 倍
  • Xorbits Inference: 一鍵部署,支援 100+ 開源模型
  • Regolo: 企業級私有化方案,專業技術支援

企業級雲服務:

  • Azure OpenAI: 微軟雲平臺,企業級合規性強
  • Amazon Bedrock: AWS 平臺,多模型選擇
  • 阿里雲百鍊: 國內企業級平臺,Qwen 系列模型
  • 騰訊雲: 企業級支援,穩定性高

1.2 根據預算選擇

1.2.1 高預算(追求極致效果)

國際頂級模型:

  • OpenAI GPT-5: 最新旗艦模型,綜合能力最強,適合高價值場景
  • Anthropic Claude Sonnet 4.5: 世界最強程式設計模型
  • Anthropic Claude Opus 4.1: 頂級推理能力,深度分析
  • Google Gemini 2.0: 多模態能力最強

國內旗艦模型:

  • 智譜 GLM-4: 國內最強技術模型之一
  • 商湯日日新 SenseNova-V6-5-Pro: 最新旗艦,能力強大
  • MiniMax MiniMax-M2: 編碼和 Agent 任務頂尖

1.2.2 中等預算(價效比優選)

高價效比國際模型:

  • Anthropic Claude Haiku 4.5: 高價效比,速度快成本低
  • OpenAI GPT-5 Mini: 輕量級 GPT-5,價效比高
  • Google Gemini 1.5 Pro: 長上下文,價格適中

高價效比國內模型:

  • DeepSeek-V3: 能力接近頂級,價格極低
  • 騰訊雲 DeepSeek-V3: 穩定性好,成本低
  • 智譜 GLM-3: 效果不錯,價格合理
  • Kimi: 超長上下文,價效比高
  • 百川智慧 Baichuan4: 技術能力強,價格適中
  • 商湯日日新 SenseNova-V6-5-Turbo: 高效能快速模型
  • MiniMax abab6.5s-chat: 超長上下文,價格合理

1.2.3 低預算(免費額度/低成本)

有免費額度:

  • DeepSeek: 提供免費額度,成本極低
  • SiliconFlow: 專注 AI 推理加速,多種開源模型
  • 訊飛星火: 提供免費試用額度
  • 百度千帆: 新使用者有免費額度
  • 騰訊混元: 提供免費試用
  • 商湯日日新: 個人使用者實名認證後有免費額度
  • MiniMax: 2025 年推出新使用者禮包

快速輕量模型:

  • OpenAI GPT-4o Mini: 輕量級多模態模型,價效比高
  • 階躍星辰 step-1-8k: 快速響應,成本低
  • 階躍星辰 step-2-mini: 最新輕量級,價效比極高
  • MiniMax abab6.5t-chat: 快速模型,成本低
  • 商湯日日新 SenseChat-Turbo: 快速響應,價效比高
  • 百川智慧 Baichuan3-Turbo: 快速穩定,價格友好

完全免費(本地部署):

  • Ollama: 完全免費,支援多種開源模型
  • vLLM: 開源推理引擎,高效能
  • Xorbits Inference: 開源框架,支援 100+ 模型

1.3 根據地域與網路選擇

1.3.1 國際使用者或需要訪問國際服務

首選國際服務商:

  • OpenAI: 全球最強 AI 服務商
  • Anthropic: Claude 系列,安全性高
  • Google Gemini: 多模態能力強
  • Azure OpenAI: 企業級,全球部署
  • Amazon Bedrock: AWS 平臺,全球可用

1.3.2 國內使用者或網路限制

國內服務商優選:

  • 智譜 AI: 清華系,技術能力強
  • DeepSeek: 價效比最高,能力強
  • 阿里雲百鍊: 企業級,Qwen 系列
  • 騰訊雲: 穩定性好,多模型選擇
  • 百度千帆: ERNIE 系列,中文優秀
  • 訊飛星火: 語音技術強,多版本選擇
  • 火山引擎: 位元組跳動,豆包大模型
  • Kimi: 月之暗面,超長上下文
  • 騰訊混元: 騰訊自研,穩定可靠

新興服務商(2025 年推薦):

  • 商湯日日新: 22 個模型可選,包含 SenseNova、SenseChat 系列及第三方模型(Qwen、DeepSeek、Kimi)
  • 百川智慧: Baichuan4 技術能力強,Baichuan3-Turbo-128k 長上下文支援好
  • MiniMax: 超長文字專家,abab6.5s-chat 支援 245K tokens
  • 階躍星辰: step-1-256k 支援 256K tokens 超長上下文,API 完全相容 OpenAI

1.4 快速選擇指南

場景首選模型備選方案預算考慮
技術面試OpenAI GPT-5Claude Sonnet 4.5、智譜 GLM-4DeepSeek-V3
程式碼生成Claude Sonnet 4.5商湯日日新 Qwen3-Coder、OpenAI GPT-5百川智慧 Baichuan3-Turbo
長文件處理階躍星辰 step-1-256kMiniMax abab6.5s-chat、商湯日日新 SenseChat-128KKimi
行為面試GPT-4o MiniKimi、商湯日日新 SenseChat-5DeepSeek-Chat
多模態Google Gemini 2.0商湯日日新 SenseNova-V6-5-Omni商湯日日新 SenseChat-Vision
資料安全OllamavLLM、Regolo本地大模型
超長上下文階躍星辰 step-1-256kMiniMax abab6.5s-chat百川智慧 Baichuan3-Turbo-128k
快速響應階躍星辰 step-2-mini商湯日日新 SenseChat-TurboMiniMax abab6.5t-chat
Agent 工作流MiniMax MiniMax-M2Claude Sonnet 4.5、OpenAI GPT-5DeepSeek-V3
推理任務DeepSeek-R1Claude Opus 4.1、商湯日日新 SenseNova-V6-Reasoner智譜 GLM-4

Released under the GPL-3.0 License.