tencent cloud

腾讯云智能数智人

产品简介
产品概述
产品功能
产品优势
购买指南
价格指南
购买指引
使用代金券购买流程
退费说明
数智人形象介绍
形象类别介绍
基础形象库
形象和声音复刻指引
数智人平台操作指引
访问平台
形象生产与资产管理
数智人会话互动应用与管理
播报数智人视频生成与管理
运营管理与分析
服务端 API 接入
数智人 API 接入模式概述
数智人 aPaas 接口调用方式
2D真人小样本形象、声音定制 API 文档
视频生成服务 API 文档
交互数智人服务 API 文档
个人资产管理 API 文档
客户端 SDK 接入
整体介绍
3D 端渲染 SDK 接入
2D 端渲染 SDK 接入
数智人 SSML 标记语言规范
相关协议
隐私协议
DSA(Data Sharing Agreement)
常见问题

定制资产管理

PDF
聚焦模式
字号
最后更新时间: 2024-10-29 11:23:44
说明:
当前平台定制资产管理模块仅支持2D小样本通用口型形象定制和声音复刻极速版。
其余定制资产在完成定制、推送上架到您的账户前,暂无法在平台上查看。

一、新增定制任务

购买了形象定制和声音复刻额度的客户,可通过数智人平台提交素材进行定制。访问路径:首页 > 形象设定 > 定制资产管理




1.1. 配额余量检查

需要确保已购买小样本定制服务,若尚未购买,可至产品购买页中购买形象定制生产服务。
若页面顶部出现无配额的提示,请先联系客户经理,确认小样本形象及声音的定制配额开通情况。

若页面顶部提示余额正常,可进行后续定制内容录入。


1.2. 填写及上传信息指引

按照表单提示,填写和上传定制形象和声音所需要的信息。
根据定制内容不同,上传的材料有差异;需要填写和上传的主要内容有:
1)基础信息
数智人名称:将直接使用页面输入的数智人名称命名定制的角色和声音。
角色性别:必选项,将影响声音上架后的分类。
定制类型:必选项,可多选;选择“定制形象”、“声音复刻”后出现相应的形象素材、声音素材上传表单。
备注:方便后续区分各个定制工单。
2)授权信息
需下载并签署页面右侧的《形象授权书》,文件大小小于10M,支持 PDF 格式。



3)形象素材
视频背景:必选项
需我方抠像:(抠除拍摄背景-绿幕视频/白幕视频,支持更换背景)
无需我方抠像:(保留拍摄背景,使用原始拍摄背景,不支持更换背景。非绿幕、非白墙背景视频请选择此项)
训练素材:请参考 2D小样本形象定制指引,确认您已经充分了解了形象定制的注意事项及常见问题。
为保障口型训练素材充分,请参考页面右侧的《小样本口播参考文稿》录制。
每个素材独立训练,将结合输入的数智人名称+上传素材文件名,定义数智人的各形象名称,如“张三_白衬衫”、“张三_蓝西装”,请分别按服装特征严格命名加以区分。
支持上传 1-9 个视频素材;但实际可上传个数取决于当前账号定制余额,不可超额提交。




4)声音素材
训练素材
为保障口型训练素材充分,请参考页面右侧的《小样本口播参考文稿》录制。
单个zip包⽤于定制1个⾳⾊。



5)Demo脚本



demo驱动方式:
文本驱动:根据您输入的文本,以及选定的音色,合成文本驱动 demo 视频。
默认音色:我们会默认选择一个公共音色来合成视频;
指定音色:支持客户指定音色和语速来合成视频;
文本驱动内容:您可以根据需求修改文本内容。
语音驱动:根据您上传的音频生成语音驱动 demo 视频。
声音快速复刻
尝试提取视频里的声音快速复刻,额外生成文本驱动demo;
由于视频里的音质质量不能保证,可能会存在声音快速复刻失败的情况;
如果声音复刻失败,也会尝试使用视频里的声音直接生成语音驱动demo。
该demo不影响其他demo的正常合成。

1.3. 素材提交

确认提交成功后,将扣减您的定制配额,并由交付团队跟进定制。

二、定制进度查看及管理

提交素材进行训练后,可进入定制资产管理页面查看提交审核进度。访问路径:首页 > 形象设定 > 定制资产管理。




按照定制资产的类型,可分类查看您已提交的定制任务列表。各类资产定制过程中,具体的操作指引如下:

2.1. 2D小样本-通用口型

1)定制进度总览
2D小样本(通用口型)的定制主要包含以下环节,其中素材提交、授权审核、效果确认环节可能需要您参与操作,其余环节均为自动流程无需您处理。您可以通过定制进度数智人名称等快速筛选特定的定制任务。

您可以通过进度条,确认定制任务当前的定制进度。

注意:
2D小样本(通用口型)相比2D小样本(专属口型)定制时效性强,因此我们不会审核您的形象素材尺寸、画面、光线、动作等,仅进行模特身份授权审核,请您自行把关定制素材质量。

2)素材提交环节
若出现素材提交失败,可将鼠标放在红点处查看失败原因。并单击重新提交,单击后进入素材上传页。
如果您在提交形象定制素材时批量提交了多个素材,仅其中部分失败了,那么单击重新提交后,只需要重新提交当前的失败素材即可。


3)授权审核环节
若出现“审核未通过”,可将鼠标放在红点处查看未通过原因,单击重新提交上传修改后素材。
授权审核一般会在3个工作日内完成,审核完成后会自动推送给您,无需催办。


4)效果确认环节
单击去确认,即可进入形象定制效果确认页,查看定制 demo 效果。

若效果满意,单击认可训练效果,即可触发自动上架流程,一般几分钟后形象将出现在您的形象资产内,可进行后续的应用。

若不满意定制效果,请单击不认可效果,返还配额放弃定制,直接终止定制流程,当前定制任务对应的定制配额将自动原路返还至账号内。
注意:
通用口型非专属训练模型,在不改变形象训练素材的情况下,无法通过打回重新训练来获取更好的训练效果。
2D小样本(通用口型)的定制引擎会为您的视频素材自动适配通用口型数据,因此生成的数智人可能与模特发音口型习惯、口型外观存在差异,若您希望获得与模特更高吻合度的口型特征,请选择定制2D小样本(专属口型)。

2.2. 2D小样本-照片数字人

1)定制进度总览
2D小样本(照片数字人)的定制主要包含素材提交环节、审核环节、智能训练环节,这些环节均为自动流程。
您可以通过进度条,确认定制任务当前的定制进度。



2)素材提交失败
在该环节,可能由于素材格式不符合要求导致失败的情况,可将鼠标放在红点处查看失败原因。并单击重新提交,单击后进入素材上传页。
3)授权审核环节
在该环节,可能由于素材涉及敏感信息、人脸检测不到等审核未通过的情况,可将鼠标放在红点处查看未通过原因,单击重新提交上传修改后素材。



4)智能训练完成
训练完成后,该照片数字人即会自动下发到您的形象资产内,可进行后续的应用。
注意:照片数字人主打低价快速,从素材提交后,一般情况下在10分钟后即可使用;
形象智能训练完成后,会自动下发资产到客户账号,不支持返回额度。


2.3. 声音复刻-极速版

1)定制进度总览
小样本声音复刻的定制主要包含以下环节,该环节均为自动流程无需您处理。您可以通过定制进度数智人名称等快速筛选特定的定制任务。



您可以通过进度条,确认定制任务当前的定制进度。提交素材后,10分钟内就可以完成定制。




2)定制完成后,您即可在数智人平台→场景应用→音视频播报模块,使用您的声音合成音频,或者合成数智人播报视频。




2.4. 关于待确认 demo 的详细说明

关于2D小样本-通用口型,在“效果确认”阶段,我们提供如下 demo 供客户确认效果,包含:
1. 文本驱动 Demo:通过指定的文案,指定的音色生成的文本驱动视频;
2. 语音驱动 Demo:通过指定的音频生成的语音驱动视频;
3. 声音快速复刻 Demo:提取视频里的声音,进行声音快速复刻,从而生成的文本驱动视频;
4. 静默预览视频:该视频即该数智人的全部选用视频片段,也可通过“个人资产管理API > 小样本形象列表接口里”的 ReferenceVideoSegmentUrl 来查询。

2.8. 关于收到形象或声音已完成制作的通知

待自动上架流程结束,形象或声音将出现在您的个人资产内。腾讯云会以站内信、邮件、手机短信的形式向您发送通知。以2D小样本为例。
1)站内信通知:
在腾讯云账号的主页中点击“小铃铛”的图标,会展开站内信列表,在列表中,您会看到数智人产品定制已完成的通知,如图:




2)邮件通知:
在您绑定的邮箱中,会收到如下邮件,如图:



若您没有收到邮件,可在腾讯云账号的主页中找到订阅管理,在接收人管理中的修改联系方式中,绑定邮箱,如图:







3)短信通知:
在您绑定的手机号下,会收到如下短信,如图:



若您没有收到手机短信,可根据“邮件通知”中绑定邮箱的指引中,检查接收短信的手机号是否正确,如图:






三、定制方案介绍

您可在此页面快速浏览了解我们的数智人定制形象服务,包含定制方案的制作方案、交付物标准及后续可应用的技术场景。若您已挑选到符合自己需求的形象类型,可直接与商务沟通形象定制需求。








帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈