tencent cloud

游戏多媒体引擎

产品动态
产品介绍
产品概述
优势特性
产品功能
应用场景
安全合规认证
新手指引
产品计费
免费额度
购买指南
SDK 下载指引
产品功能体验
基本功能演示
场景化 Demo 体验
控制台指南
用量查看
服务开通
快速入门
快速接入 SDK
快速接入 Sample Project
基础功能开发指南
鉴权密钥
实时语音角色设置
音质选择
进阶功能开发指南
服务端录制
万人范围语音
3D 音效
音效与伴奏
网络音频流转发路由
自定义消息通道
如何应对公司防火墙限制
语言参数参考列表
房间管理功能
客户端 API
Unity SDK
Unreal Engine SDK
Cocos2D SDK
Windows SDK
iOS SDK
Android SDK
macOS SDK
H5SDK
Electron SDK
Flutter SDK
SDK 版本升级指引
错误码
编译工具链文档
服务端 API
History
Introduction
API Category
Usage APIs
Recording APIs
Making API Requests
Voice Chat APIs
Application APIs
Data Types
Error Codes
常见问题
产品功能问题
问题解决指南
计费相关问题
Sample Project 使用问题
一般性问题
鉴权相关问题
实时语音进房失败问题
实时语音无声及音频问题
网络问题
语音转文本问题
工程导出问题
服务协议
服务等级协议
联系我们
词汇表
GME 政策
数据处理和安全协议
隐私协议

语音转文本

PDF
聚焦模式
字号
最后更新时间: 2024-12-18 15:00:18
GME 语音转文本服务 可将录音文件、流式语音消息、实时语音流转成文本,最多支持 125 种语言即说即转。

功能概述

功能
描述
录音文件转文本
可将录制好的语音文件转文本。
流式语音消息转文本
玩家发送语音消息时,一边说话一边返回转文本结果。
实时语音流转文本
将玩家的实时语音流转成文本。

应用场景

聊天频道内按住说话,实时获取文本结果。
聊天频道内将音频消息进行文本转换。
“歌会”、 “你说我猜”等猜词场景,对玩家的音频文件或实时音频流转换成文本,用于策略命中。
游戏内人机交互、游戏AI机器人交互场景下,实现玩家与机器人角色的语音互动。

产品特性

支持 125 种语言即说即转。
音频流识别结果即时回调给客户端及服务端,帮助游戏便捷实现业务逻辑。
通过自定义热词词库能力,提高关键词识别准确率。

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈