模型名称 | model(调用参数) | 能力支持 | 上下文窗口 (Token) | 最大输入 (Token) | 最大输出 (Token) |
DeepSeek-V4-Flash | deepseek-v4-flash | 深度思考 结构化输出 Function Calling Cache 缓存 | 1M | 1M | 384k |
DeepSeek-V4-Pro | deepseek-v4-pro | 深度思考 结构化输出 Function Calling Cache 缓存 | 1M | 1M | 384k |
Deepseek-v3.2 | deepseek-v3.2 | 深度思考 结构化输出 Function Calling | 128k | 96k | 32k |
GLM-5 | glm-5 | 深度思考 Function Calling Cache 缓存 | 200k | 200k | 128k |
GLM-5-Turbo | glm-5-turbo | 深度思考 结构化输出 Function Calling Cache 缓存 | 200k | 200k | 128k |
GLM-5V-Turbo | glm-5v-turbo | 深度思考 结构化输出 Function Calling Cache 缓存 | 200k | 200k | 128k |
GLM-5.1 | glm-5.1 | 深度思考 结构化输出 Function Calling Cache 缓存 | 200k | 200k | 128k |
Kimi-K2.6 | kimi-k2.6 | 深度思考 结构化输出 Function Calling Cache 缓存 | 256k | 256k | 256k |
Kimi-K2.5 | kimi-k2.5 | 深度思考 结构化输出 Function Calling Cache 缓存 | 256k | 224k | 16k |
MiniMax-M2.5 | minimax-m2.5 | 深度思考 Function Calling Cache 缓存 | 200k | 200k | 128k |
MiniMax-M2.7 | minimax-m2.7 | 深度思考 Function Calling Cache 缓存 | 200k | 200k | 128k |
文档反馈