模型概述
CueMate 支持配置多种主流大语言模型服务商,为用户提供灵活的 AI 能力选择。
1. 支持的模型服务商
CueMate 目前支持以下模型服务商:
国内服务商
- 阿里云百炼 - 阿里云推出的企业级大模型服务平台
- 腾讯混元 - 腾讯自研的大语言模型
- 腾讯云 - 腾讯云提供的大模型服务
- 智谱 AI - 智谱 AI 提供的 GLM 系列模型
- DeepSeek - DeepSeek 推出的高性能大模型
- Kimi - 月之暗面推出的 Kimi 智能助手
- 讯飞星火 - 科大讯飞推出的星火认知大模型
- 火山引擎 - 字节跳动旗下的豆包大模型服务
- SiliconFlow - 专注于 AI 推理加速的服务平台
- 百度千帆 - 百度推出的大语言模型平台
- MiniMax - MiniMax 推出的超长文本大模型
- 阶跃星辰 - 主打长上下文的 Step 系列模型
- 商汤日日新 - 商汤科技推出的 SenseNova 系列模型
- 百川智能 - 百川智能推出的 Baichuan 系列模型
国际服务商
- OpenAI - GPT 系列模型的服务商
- Anthropic - Claude 系列模型的服务商
- Google Gemini - Google 推出的多模态大模型
- Azure OpenAI - 微软 Azure 平台上的 OpenAI 服务
- Amazon Bedrock - AWS 提供的大模型服务平台
本地/私有化部署
- 本地大模型 - 支持本地部署的大模型服务
- Ollama - 本地运行大模型的开源工具
- vLLM - 高性能的大模型推理引擎
- Xorbits Inference - 支持多种模型的推理框架
- Regolo - 企业级私有化部署方案
2. 模型配置说明
配置步骤
- 获取 API 密钥 - 从对应的服务商处获取 API 密钥
- 添加模型配置 - 在 CueMate 系统中添加模型配置
- 测试连接 - 验证模型配置是否正确
- 应用模型 - 在系统中使用配置好的模型
配置参数说明
不同的模型服务商需要配置的参数可能不同,常见的配置参数包括:
- API 密钥(API Key) - 用于身份验证的密钥
- API 端点(API Endpoint) - 模型服务的访问地址
- 模型名称(Model Name) - 具体使用的模型版本
- 温度(Temperature) - 控制输出的随机性,范围 0-1
- 最大令牌数(Max Tokens) - 限制模型输出的最大长度
- 超时时间(Timeout) - API 请求的超时设置
3. 模型选择建议
根据场景选择
技术面试场景(2025 年推荐)
- 推荐:DeepSeek Reasoner、Claude Sonnet 4、OpenAI GPT-5、百川智能 Baichuan4
- 特点:顶级推理能力,深度代码理解,技术问答准确
- 备选:Claude Opus 4、GPT-4.1、阿里云 Qwen Max
行为面试场景
- 推荐:DeepSeek Chat、智谱 GLM-4 Flash、Gemini 2.0 Flash、百度千帆 ERNIE-4.5、MiniMax abab6.5s
- 特点:理解能力强,响应迅速,成本极低
- 备选:Claude 3.7 Sonnet、GPT-4o Mini、商汤日日新 SenseChat-Turbo
多模态/多语言场景
- 推荐:Claude Sonnet 4、Gemini 2.0 Flash、智谱 GLM-4V Plus、商汤日日新 SenseChat-5
- 特点:图像理解、多语言支持、实时翻译
- 备选:GPT-4o、Claude 3.7 Sonnet、百度千帆 ERNIE-4.5-Turbo
成本敏感场景
- 推荐:DeepSeek Chat(0.07 元/百万 tokens)、智谱 GLM-4 Air、本地 Ollama、百度千帆(免费)、阿里云 Qwen Turbo
- 特点:成本极低,性价比无敌,基本满足日常需求
- 备选:阿里云 Qwen3 系列、腾讯混元 Lite、MiniMax abab6.5s
长文本处理场景
- 推荐:MiniMax abab6.5-chat(245K)、百川智能 Baichuan3-Turbo-128k(128K)、阶跃星辰 Step-1-32k(32K)
- 特点:超长上下文支持,适合长文档分析、多轮深度对话
- 备选:Kimi(200K)、Claude Sonnet 4(200K)
根据模型部署位置选择
CueMate 是安装在您本地电脑(Mac/Windows)的桌面软件,可以连接不同部署位置的大语言模型:
云端 API 服务(模型在服务商云端)
- 使用方式:CueMate 通过互联网调用服务商的云端 API
- 优点:
- 即配即用,无需自己部署
- 模型能力强,持续更新
- 无需购买服务器和 GPU
- 缺点:
- 需要付费(按使用量计费)
- 需要网络连接
- 数据经过服务商服务器
- 适合:对模型能力要求高,希望快速上手的用户
私有化部署(模型在您自己的服务器上)
- 使用方式:在服务器上部署模型(Ollama、vLLM、Xinference 等),CueMate 通过内网或公网访问
- 优点:
- 数据完全私有,不经过第三方
- 无 API 调用费用(仅服务器成本)
- 可根据需求定制模型
- 缺点:
- 需要购买或租用服务器(推荐 32GB+ 内存,GPU 更佳)
- 需要技术能力进行部署和维护
- 需要下载模型文件(几 GB 到几十 GB)
- 模型能力通常不如顶级云端模型
- 适合:注重数据隐私、有技术能力、有服务器资源的用户或企业
根据成本预算选择
以下是主流服务商的参考价格(100 万 tokens 约等于 75 万汉字):
高端模型(强大但昂贵)
- OpenAI GPT-4:约 ¥210-420(输入/输出)
- Anthropic Claude 3 Opus:约 ¥105-315
- Google Gemini 1.5 Pro:约 ¥70-210
- 适合:对准确性要求极高的场景
中端模型(性价比高)
- OpenAI GPT-3.5 Turbo:约 ¥3.5-7
- 智谱 GLM-4:约 ¥7-14
- DeepSeek Chat:约 ¥0.7-1.4
- 阿里云 Qwen Plus:约 ¥2.8-14
- 腾讯混元 Pro:约 ¥21-70
- 百川智能 Baichuan3-Turbo:约 ¥2-4
- 适合:日常使用,成本可控
经济型模型(低成本)
- DeepSeek Chat:约 ¥0.7-1.4
- 阿里云 Qwen Turbo:约 ¥1.4-4.2
- 讯飞星火 Lite:约 ¥1.4-4.2
- 腾讯混元 Lite:约 ¥2.8-7
- 百度千帆(个人用户免费):¥0
- MiniMax abab6.5s:约 ¥1-2
- 阶跃星辰 Step-1-8k:约 ¥1-2
- 商汤日日新 SenseChat-Turbo:约 ¥1.5-3
- 适合:高频使用,预算有限
本地模型(零成本)
- Ollama + DeepSeek-R1、Llama、Qwen:¥0
- 仅需一次性硬件投入(电脑内存/显卡)
- 适合:长期使用,注重隐私,有足够硬件配置
价格说明:
- 以上价格为 100 万 tokens 的大致费用(人民币)
- 实际价格以各服务商官网为准
- 多数服务商按"输入 tokens + 输出 tokens"分别计费
- 本地模型无 API 费用,但需电费和硬件成本
模型体验等级(个人使用感受)
根据实际使用体验,将主流模型分为 5 个等级:
| 等级 | 模型列表 | 体验特点 | 理由 |
|---|---|---|---|
| 夯 | OpenAI、Anthropic、Google Gemini、阿里云百炼、DeepSeek、百川智能 | 顶级推理能力,深度理解,响应质量极高,多模态能力强 | 代表当前大模型的最高水平,推理链路清晰,代码生成准确度极高,多轮对话上下文理解出色,复杂任务处理能力一流 |
| 顶级 | Azure OpenAI、Amazon Bedrock、腾讯混元、Kimi、MiniMax、阶跃星辰 | 优秀性能,快速响应,性价比高,适合大多数场景 | 性能接近顶级但成本更低,响应速度快,综合能力均衡,日常使用体验流畅,价格相对友好,适合高频使用 |
| 人上人 | 智谱 AI、火山引擎、SiliconFlow、vLLM、百度千帆、商汤日日新 | 性能良好,企业级稳定性,成本适中,功能全面 | 企业级服务有 SLA 保障,功能完整度高,中文支持好,稳定性可靠,API 文档完善,适合生产环境 |
| NPC | 腾讯云、本地大模型、Ollama | 基本可用,成本低廉,适合简单任务,响应质量一般 | 能完成基本任务但偶有错误,响应质量不稳定,推理能力一般,适合非核心业务或测试环境,胜在便宜 |
| 拉 | 讯飞星火、Xorbits Inference、Regolo | 体验欠佳,配置复杂或性能不足,仅适合特殊场景或测试 | 配置繁琐易出错,响应速度慢,理解能力弱,文档不完善,本地模型受硬件限制严重,仅适合特定场景或学习测试 |
说明:
- 此评级基于个人实际使用体验,仅供参考
- 模型体验受网络环境、API 配置、提示词质量等多种因素影响
- 建议根据自己的实际需求和场景进行测试选择
- 高等级模型通常意味着更高的成本,需权衡性价比
4. 注意事项
- API 密钥安全 - 请妥善保管 API 密钥,不要泄露给他人
- 使用限制 - 注意各服务商的 API 调用限制和计费规则
- 数据合规 - 确保使用模型时符合相关法律法规
- 性能监控 - 建议定期检查模型响应时间和准确率
- 成本控制 - 合理设置请求参数,避免不必要的费用
下一步
模型设置功能使用:
- 模型设置使用指南 - 详细介绍如何添加、配置、测试和管理模型
选择您需要配置的模型服务商,查看详细的配置指南:
