模型概述

CueMate 支持配置多种主流大语言模型服务商，为用户提供灵活的 AI 能力选择。

1. 支持的模型服务商

CueMate 目前支持以下模型服务商：

国内服务商

阿里云百炼 - 阿里云推出的企业级大模型服务平台
腾讯混元 - 腾讯自研的大语言模型
腾讯云 - 腾讯云提供的大模型服务
智谱 AI - 智谱 AI 提供的 GLM 系列模型
DeepSeek - DeepSeek 推出的高性能大模型
Kimi - 月之暗面推出的 Kimi 智能助手
讯飞星火 - 科大讯飞推出的星火认知大模型
火山引擎 - 字节跳动旗下的豆包大模型服务
SiliconFlow - 专注于 AI 推理加速的服务平台
百度千帆 - 百度推出的大语言模型平台
MiniMax - MiniMax 推出的超长文本大模型
阶跃星辰 - 主打长上下文的 Step 系列模型
商汤日日新 - 商汤科技推出的 SenseNova 系列模型
百川智能 - 百川智能推出的 Baichuan 系列模型

国际服务商

OpenAI - GPT 系列模型的服务商
Anthropic - Claude 系列模型的服务商
Google Gemini - Google 推出的多模态大模型
Azure OpenAI - 微软 Azure 平台上的 OpenAI 服务
Amazon Bedrock - AWS 提供的大模型服务平台

本地/私有化部署

本地大模型 - 支持本地部署的大模型服务
Ollama - 本地运行大模型的开源工具
vLLM - 高性能的大模型推理引擎
Xorbits Inference - 支持多种模型的推理框架
Regolo - 企业级私有化部署方案

2. 模型配置说明

配置步骤

获取 API 密钥 - 从对应的服务商处获取 API 密钥
添加模型配置 - 在 CueMate 系统中添加模型配置
测试连接 - 验证模型配置是否正确
应用模型 - 在系统中使用配置好的模型

配置参数说明

不同的模型服务商需要配置的参数可能不同，常见的配置参数包括：

API 密钥（API Key） - 用于身份验证的密钥
API 端点（API Endpoint） - 模型服务的访问地址
模型名称（Model Name） - 具体使用的模型版本
温度（Temperature） - 控制输出的随机性，范围 0-1
最大令牌数（Max Tokens） - 限制模型输出的最大长度
超时时间（Timeout） - API 请求的超时设置

3. 模型选择建议

根据场景选择

技术面试场景（2025 年推荐）

推荐：Claude Sonnet 4.5、DeepSeek Reasoner、OpenAI GPT-5、百川智能 Baichuan4
特点：顶级推理能力，深度代码理解，技术问答准确
备选：Claude Opus 4.1、GPT-4.1、阿里云 Qwen Max

行为面试场景

推荐：DeepSeek Chat、智谱 GLM-4 Flash、Gemini 2.0 Flash、百度千帆 ERNIE-4.5、MiniMax abab6.5s
特点：理解能力强，响应迅速，成本极低
备选：Claude 3.7 Sonnet、GPT-4o Mini、商汤日日新 SenseChat-Turbo

多模态/多语言场景

推荐：Claude Sonnet 4.5、Gemini 2.0 Flash、智谱 GLM-4V Plus、商汤日日新 SenseChat-5
特点：图像理解、多语言支持、实时翻译
备选：GPT-4o、Claude 3.7 Sonnet、百度千帆 ERNIE-4.5-Turbo

成本敏感场景

推荐：DeepSeek Chat（0.07 元/百万 tokens）、智谱 GLM-4 Air、本地 Ollama、百度千帆（免费）、阿里云 Qwen Turbo
特点：成本极低，性价比无敌，基本满足日常需求
备选：阿里云 Qwen3 系列、腾讯混元 Lite、MiniMax abab6.5s

长文本处理场景

推荐：MiniMax abab6.5-chat（245K）、百川智能 Baichuan3-Turbo-128k（128K）、阶跃星辰 Step-1-32k（32K）
特点：超长上下文支持，适合长文档分析、多轮深度对话
备选：Kimi（200K）、Claude Sonnet 4.5（200K）

根据模型部署位置选择

CueMate 是安装在您本地电脑（Mac/Windows）的桌面软件，可以连接不同部署位置的大语言模型：

云端 API 服务（模型在服务商云端）

使用方式：CueMate 通过互联网调用服务商的云端 API
优点：
- 即配即用，无需自己部署
- 模型能力强，持续更新
- 无需购买服务器和 GPU
缺点：
- 需要付费（按使用量计费）
- 需要网络连接
- 数据经过服务商服务器
适合：对模型能力要求高，希望快速上手的用户

私有化部署（模型在您自己的服务器上）

使用方式：在服务器上部署模型（Ollama、vLLM、Xinference 等），CueMate 通过内网或公网访问
优点：
- 数据完全私有，不经过第三方
- 无 API 调用费用（仅服务器成本）
- 可根据需求定制模型
缺点：
- 需要购买或租用服务器（推荐 32GB+ 内存，GPU 更佳）
- 需要技术能力进行部署和维护
- 需要下载模型文件（几 GB 到几十 GB）
- 模型能力通常不如顶级云端模型
适合：注重数据隐私、有技术能力、有服务器资源的用户或企业

根据成本预算选择

以下是主流服务商的参考价格（100 万 tokens 约等于 75 万汉字）：

高端模型（强大但昂贵）

OpenAI GPT-5：约 ¥280-560（输入/输出）
Anthropic Claude Sonnet 4.5：约 ¥210-420（输入/输出）
Anthropic Claude Opus 4.1：约 ¥140-420
Google Gemini 1.5 Pro：约 ¥70-210
适合：对准确性要求极高的场景

中端模型（性价比高）

Anthropic Claude Haiku 4.5：约 ¥7-14
OpenAI GPT-5 Mini：约 ¥7-14
OpenAI GPT-4o Mini：约 ¥3.5-7
智谱 GLM-4：约 ¥7-14
DeepSeek Chat：约 ¥0.7-1.4
阿里云 Qwen Plus：约 ¥2.8-14
腾讯混元 Pro：约 ¥21-70
百川智能 Baichuan3-Turbo：约 ¥2-4
适合：日常使用，成本可控

经济型模型（低成本）

DeepSeek Chat：约 ¥0.7-1.4
阿里云 Qwen Turbo：约 ¥1.4-4.2
讯飞星火 Lite：约 ¥1.4-4.2
腾讯混元 Lite：约 ¥2.8-7
百度千帆（个人用户免费）：¥0
MiniMax abab6.5s：约 ¥1-2
阶跃星辰 Step-1-8k：约 ¥1-2
商汤日日新 SenseChat-Turbo：约 ¥1.5-3
适合：高频使用，预算有限

本地模型（零成本）

Ollama + DeepSeek-R1、Llama、Qwen：¥0
仅需一次性硬件投入（电脑内存/显卡）
适合：长期使用，注重隐私，有足够硬件配置

价格说明：

以上价格为 100 万 tokens 的大致费用（人民币）
实际价格以各服务商官网为准
多数服务商按"输入 tokens + 输出 tokens"分别计费
本地模型无 API 费用，但需电费和硬件成本

模型体验等级（个人使用感受）

根据实际使用体验，将主流模型分为 5 个等级：

等级	模型列表	体验特点	理由
夯	OpenAI、Anthropic、Google Gemini、阿里云百炼、DeepSeek、百川智能	顶级推理能力，深度理解，响应质量极高，多模态能力强	代表当前大模型的最高水平，推理链路清晰，代码生成准确度极高，多轮对话上下文理解出色，复杂任务处理能力一流
顶级	Azure OpenAI、Amazon Bedrock、腾讯混元、Kimi、MiniMax、阶跃星辰	优秀性能，快速响应，性价比高，适合大多数场景	性能接近顶级但成本更低，响应速度快，综合能力均衡，日常使用体验流畅，价格相对友好，适合高频使用
人上人	智谱 AI、火山引擎、SiliconFlow、vLLM、百度千帆、商汤日日新	性能良好，企业级稳定性，成本适中，功能全面	企业级服务有 SLA 保障，功能完整度高，中文支持好，稳定性可靠，API 文档完善，适合生产环境
NPC	腾讯云、本地大模型、Ollama	基本可用，成本低廉，适合简单任务，响应质量一般	能完成基本任务但偶有错误，响应质量不稳定，推理能力一般，适合非核心业务或测试环境，胜在便宜
拉	讯飞星火、Xorbits Inference、Regolo	体验欠佳，配置复杂或性能不足，仅适合特殊场景或测试	配置繁琐易出错，响应速度慢，理解能力弱，文档不完善，本地模型受硬件限制严重，仅适合特定场景或学习测试

说明：

此评级基于个人实际使用体验，仅供参考
模型体验受网络环境、API 配置、提示词质量等多种因素影响
建议根据自己的实际需求和场景进行测试选择
高等级模型通常意味着更高的成本，需权衡性价比

4. 注意事项

API 密钥安全 - 请妥善保管 API 密钥，不要泄露给他人
使用限制 - 注意各服务商的 API 调用限制和计费规则
数据合规 - 确保使用模型时符合相关法律法规
性能监控 - 建议定期检查模型响应时间和准确率
成本控制 - 合理设置请求参数，避免不必要的费用

下一步

模型设置功能使用：

模型设置使用指南 - 详细介绍如何添加、配置、测试和管理模型

选择您需要配置的模型服务商，查看详细的配置指南：

模型概述 ​

1. 支持的模型服务商 ​

国内服务商 ​

国际服务商 ​

本地/私有化部署 ​

2. 模型配置说明 ​

配置步骤 ​

配置参数说明 ​

3. 模型选择建议 ​

根据场景选择 ​

根据模型部署位置选择 ​

根据成本预算选择 ​

模型体验等级（个人使用感受） ​

4. 注意事项 ​

下一步 ​