接口请求域名: lkeap.intl.tencentcloudapi.com 。
用于创建一个文档拆分任务,支持多种文件类型,具备mllm能力,能够解析并深入理解图表中的信息。
默认接口请求频率限制:20次/秒。
以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数。
| 参数名称 | 必选 | 类型 | 描述 |
|---|---|---|---|
| Action | 是 | String | 公共参数,本接口取值:CreateSplitDocumentFlow。 |
| Version | 是 | String | 公共参数,本接口取值:2024-05-22。 |
| Region | 是 | String | 公共参数,详见产品支持的 地域列表,本接口仅支持其中的: ap-jakarta 。 |
| FileType | 是 | String | 文件类型。支持的文件类型:- WPS、PDF、DOC、DOCX、XLS、XLSX、PPT、PPTX、MD、TXT、PNG、JPG、JPEG、CSV、HTML、EPUB支持的文件大小: - PDF 最大300M - WPS、DOCX、DOC、PPT、PPTX 最大 200M - TXT、MD 最大10M - 其他 最大20M |
| FileUrl | 是 | String | 文件的 URL 地址。 文件存储于腾讯云的 URL 可保障更高的下载速度和稳定性,建议文件存储于腾讯云。 非腾讯云存储的 URL 速度和稳定性可能受一定影响。 参考:腾讯云COS文档 |
| FileName | 否 | String | 文件名,可选。 需带文件类型后缀,当文件名无法从传入的 FileUrl获取时需要通过该字段来明确。 |
| FileStartPageNumber | 否 | Integer | 文档的起始页码。 当传入文件是PDF、PDF、PPT、PPTX、DOC类型时,用来指定识别的起始页码,识别的页码包含当前值。 |
| FileEndPageNumber | 否 | Integer | 文档的结束页码。 当传入文件是PDF、PDF、PPT、PPTX、DOC类型时,用来指定识别的结束页码,识别的页码包含当前值。 |
| Config | 否 | CreateSplitDocumentFlowConfig | 文档拆分任务的配置信息。 |
| 参数名称 | 类型 | 描述 |
|---|---|---|
| TaskId | String | 拆分任务唯一ID。 30天内可以通过 GetSplitDocumentResult接口查询TaskId对应的拆分结果。 |
| RequestId | String | 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。 |
对外部在线文档进行拆分
POST / HTTP/1.1
Host: lkeap.intl.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: CreateSplitDocumentFlow
<公共请求参数>
{
"FileType": "PDF",
"FileName": "example.pdf",
"FileUrl": "https://qidian-qbot-1251316161.cos.ap-guangzhou.myqcloud.com/public/example/example.pdf",
"FileStartPageNumber": 1,
"FileEndPageNumber": 2,
"Config": {
"EnableMllm": true
}
}
{
"Response": {
"RequestId": "5e148c27-9c21-43cd-992c-799117bb4216",
"TaskId": "236e51fd-827b-41cb-b303-56003a817ce5"
}
}
云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。
以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码。
| 错误码 | 描述 |
|---|---|
| FailedOperation | 操作失败。 |
| InternalError | 内部错误。 |
| InvalidParameter.FileURLInvalid | 文件url链接不正确。 |
| InvalidParameter.InvalidFileFormat | 无效的文件格式。 |
| InvalidParameter.InvalidFileType | 无效的文件类型。 |
| LimitExceeded.ExceededMaxPagesError | 超过最大文件页数限制 |
| LimitExceeded.TooLargeFileError | 文件太大 |
| RequestLimitExceeded | 请求的次数超过了频率限制。 |
| ResourceUnavailable.ResourcePackageRunOut | 账号资源包耗尽。 |
文档反馈