基于腾讯云 ES 引擎和生态优势,帮助客户通过更轻量的研发和运维投入,轻松构建 RAG、AI 搜索等应用。本文档将详细说明各原子服务的计费方式和单价策略,遵循按需付费原则,提供预付费资源包与按量计费两种方式,帮助客户根据实际业务场景精细化成本管理。
|
按量计费 | 按照实际调用接口消耗的资源量进行计费,每小时对腾讯云账户进行结算和扣费,正式使用前请保证账户处于非欠费状态。 |
预付费资源包 | 一次性预付有效期内费用,用于抵扣使用对应原子服务产生的费用,有效期为自购买日后的一年。 |
免费额度
通过实名认证的主账号开通智能搜索开发原子服务后,将拥有所有原子服务总共 100 次免费测试额度,超过 100 次后将自动转为计费。如您有更多的测试需求,请 联系我们。 购买方式
在账单结算时,系统将按照“免费体验次数 > 资源包 > 后付费”的顺序进行结算。
计费内容包含直接调用 API 和在控制台使用相关原子服务在线体验,调用失败不计费。
开通后付费
当开通智能搜索开发原子服务后,默认情况下会自动打开后付费,免费体验次数使用完后,若未购买预付费资源包,将会自动转入后付费。如需开启或关闭后付费模式结算,请前往控制台 > 资源管理 > 后付费设置 开通或关闭后付费。 说明:
后付费设置每月仅能变更 5 次,变更后约 10秒 后生效,请不要频繁变更。
购买资源包
在控制台的资源管理菜单栏,点击购买资源包,选择所需的资源类型: 按量计费定价
文档解析(Document Parsing)
文档解析服务按原始文档成功解析的页数计费,单价如下:
说明:
doc-llm 文档解析服务是按页收费,对不同文档计费规则如下:
doc、docx、ppt、pptx、pdf 按页计量。
jpeg、png 等图片格式以一张图为一页。
xlsx、txt、md、csv 以 1 份为一页。
文本切片(Text Chunking)
文本切片服务按千 token 计费,单价如下:
|
doc-tree-chunk | 0.0125 |
doc-chunk | 0.000009 |
说明:
doc-tree-chunk 服务是基于 doc-llm 文档解析服务实现的文档切片,默认会分为解析和分片的两种费用,具体如下:
输入文件为 pdf/docx/doc/ppt/pptx 文档格式和 jpg/png 等图片格式时,需要计算文档解析费用(按页计费)。
输入文件为 txt/md/xlsx/xls 格式时,仅需工程解析,不需要付费。
两种方式输入的文件都需要计算拆分消耗的费用,按 token 消耗数量计费。
doc-chunk 服务是基于分隔符、文本长度进行切片,适用于规则性较强的文本,这里统计的 token 为原始文本的字符长度。
向量化(Embedding)
纯文本 Embedding 服务按千 token 计费,单价如下:
|
KaLM-embedding-multilingual-mini-v1 | 896 | 131072 | 多语言 | 0.0001 |
bge-m3 | 1024 | 8194 | 多语言 | 0.0001 |
图文 Embedding 服务支持文本和图片两种模态输入,分别以 token 和图片数量计费,单价如下:
|
WeCLIPv2-Large | 768 | 72 | 多语言,中文最优 | 文本:0.0001 美元/千 tokens 图片:0.1 美元/千张 |
重排序(Rerank)
重排序服务按千 token 计费,单价如下:
|
bge-reranker-v2-m3 | 8194 | 多语言 | 0.0002 |
资源包定价
智能搜索开发服务提供预付费资源包的购买形式,用于各类原子服务消耗。相较于按量计费模式,资源包性价比更高,可前往购买页购买预付费资源包。 资源类型维度的定价
|
文档解析 | 1千页 | 83 |
| 1万页 | 708 |
| 10万页 | 4083 |
| 100万页 | 31250 |
文本切片 | 1千万 tokens | 125 |
| 1亿 tokens | 1188 |
| 10亿 tokens | 11250 |
文本向量化 | 10亿 tokens | 100 |
| 100亿 tokens | 950 |
| 1000亿 tokens | 9000 |
图片向量化 | 100万张 | 100 |
| 1000万张 | 950 |
| 1亿张 | 9000 |
重排序 | 10亿 tokens | 200 |
| 100亿 tokens | 1900 |
| 1000亿 tokens | 18000 |
抵扣系数
各个模型的抵扣系数不同,实际资源包的消耗根据抵扣系数进行换算,换算公式:资源包用量 = 实际用量 * 抵扣系数。
计费计算示例:
客户甲用了文本切片 doc-chunk 10亿 token,用了 doc-tree-chunk 1百万 token,那么换算下来抵扣的资源包:10亿 * 0.00066667 + 1百万 * 1 = 1.66667 百万 token。
以下是各个资源类型的抵扣系数:
|
文档解析 | doc-llm | 1 |
文本切片 | doc-tree-chunk | 1 |
| doc-chunk | 0.00066667 |
文本向量化 | KaLM-embedding-multilingual-mini-v1 | 1 |
| bge-m3 | 1 |
图片向量化 | WeCLIPv2-Large | 1 |
重排序 | bge-reranker-v2-m3 | 1 |
抵扣系数说明:
抵扣系数是一种用于统一不同模型服务计费标准的换算比率。以向量化服务为例:当您不确定哪个 Embedding 模型最适合业务需求时,可以直接购买通用的"向量化资源包"。该资源包支持所有 Embedding 模型,系统会根据实际调用模型的抵扣系数(例如:模型 A 的1次调用 = 1.2 个资源单位,模型 B 的 1 次调用 = 0.8 个资源单位)自动折算消耗的资源量。这种设计既避免了前期选型困难,又能确保资源的高效利用。