通用对话 / Agent
gpt-4.1-mini
OpenAI
Live

Agent 编排 / 结构化输出 / 工具调用

上下文
128K
平均延迟
0.8s
输入售价
$0.80 / 1M
输出售价
$2.40 / 1M
请求趋势
高性价比工具调用
多模态 / 通用
gpt-4o
OpenAI
Live

多模态理解 / 通用问答 / 图文场景

上下文
128K
平均延迟
0.9s
输入售价
$2.50 / 1M
输出售价
$10.00 / 1M
请求趋势
多模态通用场景
轻量 / 低成本
gpt-4o-mini
OpenAI
Live

低成本批量调用 / 轻量助手 / 高并发接口

上下文
128K
平均延迟
0.4s
输入售价
$0.15 / 1M
输出售价
$0.60 / 1M
请求趋势
低成本轻量
代码 / 长文本
claude-3-7-sonnet
Anthropic
Live

代码生成 / 长文分析 / 复杂文本任务

上下文
200K+
平均延迟
1.2s
输入售价
$4.50 / 1M
输出售价
$18.00 / 1M
请求趋势
代码生成长上下文
稳定文本 / 代码
claude-3-5-sonnet
Anthropic
Live

代码审查 / 文本重写 / 复杂知识问答

上下文
200K
平均延迟
1.0s
输入售价
$3.00 / 1M
输出售价
$15.00 / 1M
请求趋势
稳定输出代码审查
轻量文本 / 快速响应
claude-3-5-haiku
Anthropic
Live

快速摘要 / 轻量对话 / 中低成本接口

上下文
200K
平均延迟
0.6s
输入售价
$0.80 / 1M
输出售价
$4.00 / 1M
请求趋势
快速响应轻量文本
低延迟 / 高吞吐
gemini-2.0-flash
Google
Live

实时交互 / 高吞吐接口 / 轻量多模态

上下文
1M+
平均延迟
0.5s
输入售价
$0.30 / 1M
输出售价
$1.20 / 1M
请求趋势
低延迟高吞吐
长上下文 / 多模态
gemini-1.5-pro
Google
Live

长文档分析 / 多模态理解 / 知识任务

上下文
1M+
平均延迟
1.1s
输入售价
$1.25 / 1M
输出售价
$5.00 / 1M
请求趋势
长上下文多模态
低延迟 / 轻量多模态
gemini-1.5-flash
Google
Live

实时接口 / 轻量多模态 / 快速提取

上下文
1M
平均延迟
0.5s
输入售价
$0.35 / 1M
输出售价
$1.40 / 1M
请求趋势
实时低延迟
推理 / 数学
o3-mini
OpenAI
Live

数学推理 / 复杂分析 / 推理链任务

上下文
200K
平均延迟
1.4s
输入售价
$1.10 / 1M
输出售价
$4.40 / 1M
请求趋势
推理数学
通用文本 / 成本友好
deepseek-chat
DeepSeek
Live

成本优化 / 通用对话 / 内容生成

上下文
64K
平均延迟
0.7s
输入售价
$0.27 / 1M
输出售价
$1.10 / 1M
请求趋势
成本友好通用文本
推理 / 成本控制
deepseek-reasoner
DeepSeek
Live

推理任务 / 技术分析 / 成本可控

上下文
64K
平均延迟
1.1s
输入售价
$0.55 / 1M
输出售价
$2.20 / 1M
请求趋势
推理任务技术分析
中文 / 通用助手
qwen-max
Alibaba
Live

中文对话 / 中文生成 / 业务问答

上下文
128K
平均延迟
0.9s
输入售价
$0.90 / 1M
输出售价
$3.60 / 1M
请求趋势
中文强项业务问答
中文 / 轻量高频
qwen-plus
Alibaba
Live

中文客服 / 高频接口 / 轻量任务

上下文
128K
平均延迟
0.6s
输入售价
$0.35 / 1M
输出售价
$1.40 / 1M
请求趋势
中文高频低延迟
开源 / 通用推理
llama-3.1-70b
Meta
Live

开源路线 / 私有化延展 / 通用推理

上下文
128K
平均延迟
1.3s
输入售价
$0.80 / 1M
输出售价
$2.80 / 1M
请求趋势
开源生态通用推理
文本 / 欧洲生态
mistral-large
Mistral
Live

文本生成 / 多供应商补位 / 知识任务

上下文
128K
平均延迟
1.0s
输入售价
$2.00 / 1M
输出售价
$6.00 / 1M
请求趋势
知识任务文本生成