tencent cloud

APIs

创建文档解析任务

下载
聚焦模式
字号
最后更新时间: 2026-06-04 20:17:36

1. 接口描述

接口请求域名: lkeap.intl.tencentcloudapi.com 。

本接口为异步接口的发起请求接口,用于发起文档解析任务。
文档解析支持将图片或PDF、DOCX、PPTX、EXCEL等文件转换成Markdown格式文件,可解析包括表格、公式、图片、标题、段落、页眉、页脚等内容元素,并将内容智能转换成阅读顺序。具体支持文件类型请查看下方输入参数列表。

体验期间单账号限制qps仅为1,若有正式接入需要请与产研团队沟通开放。

默认接口请求频率限制:20次/秒。

推荐使用 API Explorer
点击调试
API Explorer 提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力。您可查看每次调用的请求内容和返回结果以及自动生成 SDK 调用示例。

2. 输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数

参数名称 必选 类型 描述
Action String 公共参数,本接口取值:CreateReconstructDocumentFlow。
Version String 公共参数,本接口取值:2024-05-22。
Region String 公共参数,详见产品支持的 地域列表,本接口仅支持其中的: ap-jakarta 。
FileType String 文件类型。支持的文件类型:- WPS、PDFDOCDOCXXLSXLSXPPTPPTXMDTXTPNGJPGJPEGCSVHTMLEPUBBMPGIFWEBPHEICEPSICNSIMPCXPPMTIFFXBMHEIFJP2支持的文件大小: - PDF 最大300M - WPSDOCXDOCPPTPPTX 最大 200M - TXTMD 最大10M - 其他 最大20M
FileUrl String 说明:文件的 URL 地址。
备注:文件存储于腾讯云的 URL 可保障更高的下载速度和稳定性,建议文件存储于腾讯云。 非腾讯云存储的 URL 速度和稳定性可能受一定影响。
参考:腾讯云COS文档
FileBase64 String 文件的 Base64 值。
支持的文件类型: PNG、JPG、JPEG、PDF、GIF、BMP、TIFF
支持的文件大小:所下载文件经Base64编码后不超过 8M。文件下载时间不超过 3 秒。
支持的图片像素:单边介于20-10000px之间。
文件的 FileUrl、FileBase64 必须提供一个,如果都提供,只使用 FileUrl。
FileStartPageNumber Integer 说明:文档的起始页码。
备注:当传入文件是PDF、PDF、PPT、PPTX、DOC类型时,用来指定识别的起始页码,识别的页码包含当前值。
默认值:无
FileEndPageNumber Integer 说明:文档的结束页码。
备注:当传入文件是PDF、PDF、PPT、PPTX、DOC类型时,用来指定识别的结束页码,识别的页码包含当前值。
默认值:无
Config CreateReconstructDocumentFlowConfig 说明:创建文档解析任务配置信息。
备注:可设置结果的返回格式
默认值:无

3. 输出参数

参数名称 类型 描述
TaskId String 任务唯一id。30天内可以通过GetReconstructDocumentResult接口查询TaskId对应的处理结果。
RequestId String 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。

4. 示例

示例1 接口请求成功示例

输入示例

POST / HTTP/1.1
Host: lkeap.intl.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: CreateReconstructDocumentFlow
<公共请求参数>

{
    "FileType": "PDF",
    "FileUrl": "http://example.com/example.pdf"
}

输出示例

{
    "Response": {
        "RequestId": "1d569fb4-4c9d-4141-bbd7-e1d8735bd1a9",
        "TaskId": "123123123"
    }
}

5. 开发者资源

SDK

云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。

命令行工具

6. 错误码

以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码

错误码 描述
FailedOperation 操作失败。
FailedOperation.InternalError 内部错误。
InvalidParameter.FileURLInvalid 文件url链接不正确。
InvalidParameter.InvalidFileFormat 无效的文件格式。
InvalidParameter.InvalidFileType 无效的文件类型。
LimitExceeded.ExceededMaxPagesError 超过最大文件页数限制
LimitExceeded.TooLargeFileError 文件太大
ResourceUnavailable.ResourcePackageRunOut 账号资源包耗尽。
ResourcesSoldOut.ChargeStatusException 计费状态异常。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈