Model List

다운로드

포커스 모드

폰트 크기

마지막 업데이트 시간: 2026-06-03 20:20:38

Language Models
Model Name
Model (API Parameter)
Supported Capabilities
Context Window
(Tokens)
Maximum Input
(Tokens)
Maximum Output
(Tokens)
DeepSeek-V4-Flash (Original Vendor Direct)
deepseek-v4-flash-202605
Deep Reasoning
Structured Output
Function Calling
Caching
1M
1M
384k
DeepSeek-V4-Pro Original Vendor Direct)
deepseek-v4-pro-202606
Deep Reasoning
Structured Output
Function Calling
Caching
1M
1M
384k
DeepSeek-V4-Flash
deepseek-v4-flash
Deep Reasoning
Structured Output
Function Calling
Caching
1M
1M
384k
DeepSeek-V4-Pro
deepseek-v4-pro
Deep Reasoning
Structured Output
Function Calling
Caching
1M
1M
384k
Deepseek-v3.2
deepseek-v3.2
Deep Reasoning
Structured Output
Function Calling
128k
96k
32k
GLM-5
glm-5
Deep Reasoning
Function Calling
Caching
200k
200k
128k
GLM-5-Turbo
glm-5-turbo
Deep Reasoning
Structured Output
Function Calling
Caching
200k
200k
128k
GLM-5V-Turbo
glm-5v-turbo
Deep Reasoning
Structured Output
Function Calling
Caching
200k
200k
128k
GLM-5.1
glm-5.1
Deep Reasoning
Structured Output
Function Calling
Caching
200k
200k
128k
Kimi-K2.6
kimi-k2.6
Deep Reasoning
Structured Output
Function Calling
Caching
256k
256k
256k
Kimi-K2.5
kimi-k2.5
Deep Reasoning
Structured Output
Function Calling
Caching
256k
224k
16k
MiniMax-M3
minimax-m3
Deep Reasoning
Function Calling
Caching
1M
1M
-
MiniMax-M2.5
minimax-m2.5
Deep Reasoning
Function Calling
Caching
200k
200k
128k
MiniMax-M2.7
minimax-m2.7
Deep Reasoning
Function Calling
Caching
200k
200k
128k
Capability Description
Deep Reasoning
The model, before generating the final response, first performs internal (Chain-of-Thought) reasoning by step-by-step analyzing and decomposing problems, thereby improving the accuracy of responses to complex tasks (such as mathematics, logical reasoning, code generation, and so on).
Structured Output
The model supports outputting structured data in specified formats (such as JSON Schema), facilitating direct parsing and utilization by downstream programs. This capability is suitable for scenarios like information extraction, data population, and API response construction.
Function Calling
The model supports function calling capabilities, which can automatically identify and trigger predefined external tools or APIs during the inference process based on user intent, enabling extended operations such as querying databases and invoking third-party services.
Caching
The model's caching capability can reuse context computation results from historical requests, reducing the overhead of redundant computations, thereby improving response speed and reducing invocation costs.
﻿

도움말 및 지원

문제 해결에 도움이 되었나요?

더 자세한 내용은 문의하기 또는 티겟 제출 을 통해 문의할 수 있습니다.

피드백

tencent cloud

LLM Service TokenHub

Model List

Language Models

Capability Description

Deep Reasoning

Structured Output

Function Calling

Caching

도움말 및 지원

Model Name	Model (API Parameter)	Supported Capabilities	Context Window (Tokens)	Maximum Input (Tokens)	Maximum Output (Tokens)
DeepSeek-V4-Flash (Original Vendor Direct)	deepseek-v4-flash-202605	Deep Reasoning Structured Output Function Calling Caching	1M	1M	384k
DeepSeek-V4-Pro Original Vendor Direct)	deepseek-v4-pro-202606	Deep Reasoning Structured Output Function Calling Caching	1M	1M	384k
DeepSeek-V4-Flash	deepseek-v4-flash	Deep Reasoning Structured Output Function Calling Caching	1M	1M	384k
DeepSeek-V4-Pro	deepseek-v4-pro	Deep Reasoning Structured Output Function Calling Caching	1M	1M	384k
Deepseek-v3.2	deepseek-v3.2	Deep Reasoning Structured Output Function Calling	128k	96k	32k
GLM-5	glm-5	Deep Reasoning Function Calling Caching	200k	200k	128k
GLM-5-Turbo	glm-5-turbo	Deep Reasoning Structured Output Function Calling Caching	200k	200k	128k
GLM-5V-Turbo	glm-5v-turbo	Deep Reasoning Structured Output Function Calling Caching	200k	200k	128k
GLM-5.1	glm-5.1	Deep Reasoning Structured Output Function Calling Caching	200k	200k	128k
Kimi-K2.6	kimi-k2.6	Deep Reasoning Structured Output Function Calling Caching	256k	256k	256k
Kimi-K2.5	kimi-k2.5	Deep Reasoning Structured Output Function Calling Caching	256k	224k	16k
MiniMax-M3	minimax-m3	Deep Reasoning Function Calling Caching	1M	1M	-
MiniMax-M2.5	minimax-m2.5	Deep Reasoning Function Calling Caching	200k	200k	128k
MiniMax-M2.7	minimax-m2.7	Deep Reasoning Function Calling Caching	200k	200k	128k