tencent cloud

スマート認識テンプレート

PDF
フォーカスモード
フォントサイズ
最終更新日: 2025-11-05 14:18:57

利用シナリオ

MPSのスマート認識テンプレートは、顔認識、テキスト全文認識、音声完全認識、音声翻訳、物体認識など、動画に対してスマート認識が必要なシナリオに適しています。サービスオーケストレーション管理でプリセットテンプレートを直接使用するか、業務ニーズに応じてカスタムテンプレートを作成することが可能です。作成したテンプレートはテンプレート一覧に表示され、フィルターによる表示、編集、削除などの管理操作を行うことができます。

前提条件

1. Tencent Cloudアカウントを登録し、実名認証を完了していること。
2. Tencent CloudのMPSサービスを購入し、MPSコンソールにログインしていること。

操作説明

テンプレート管理スマート認識テンプレートに進み、スマート認識テンプレートを作成をクリックすると、テンプレートのカスタム設定画面が表示され、テンプレート名とコンテンツ認識項目を設定できます。
設定項目
説明
テンプレート名
中国語、英語、数字、アンダースコア(_)、ハイフン(-)、ピリオド(.)のみ使用できます。長さは64文字以内にする必要があります。
コンテンツ認識項目の設定
設定項目には、顔認識、テキスト全文認識、音声完全認識、音声翻訳、物体認識が含まれています。

注意:
MPSコンソール>スマート認識テンプレートページでシステムプリセットのスマート認識テンプレートを確認できます。

顔認識

顔認識では、フィルタリングスコアとフィルタリングタグを設定できます。
フィルタリングスコアは認識結果の信頼度を制限するために用いられます。範囲は0~100、デフォルト値は95です。認識結果が設定したスコアを上回った場合、認識結果が返されます。
フィルタリングタグには「芸能人」、「スポーツ選手」、「政治家」から選択可能です。選択した場合、対応するタグの結果のみが返され、選択しない場合はすべての結果が返されます。


音声完全認識

音声完全認識を有効化するには、動画のソース言語を選択する必要があります。音声認識後に字幕ファイルの同時生成を希望する場合は、字幕ファイル形式を選択する必要があります。
注意:
現在、字幕ファイル機能はオンデマンドタスクおよびオンデマンドファイルのみ対象としており、ライブストリームからのASRタスクには適用されません。

現在対応している言語は以下の通りです。
動画ソース言語
中国語(簡体字)
英語
日本語
韓国語
中国語・英語・広東語
中国語(医療分野向け)
広東語
ベトナム語
マレー語
インドネシア語
フィリピン語
タイ語
ポルトガル語
トルコ語
アラビア語
スペイン語
ヒンディー語
フランス語
ドイツ語
イタリア語
ロシア語
中国語方言
-
-

音声翻訳

音声翻訳機能を有効化するには、動画のソース言語と翻訳先言語を選択する必要があります。翻訳後に字幕ファイルの同時生成を希望する場合は、字幕ファイル形式を選択する必要があります。

注意:
現在、字幕ファイル機能はオンデマンドタスクおよびオンデマンドファイルのみ対象としており、ライブストリームからのASRタスクには適用されません。
現在対応している言語は以下の通りです。
動画ソース言語
中国語(簡体字)
英語
日本語
韓国語
ベトナム語
マレー語
タイ語
ポルトガル語
トルコ語
アラビア語
スペイン語
ヒンディー語
フランス語
-
-

テキスト全文認識

テキスト全文認識を有効化すると、コールバックにより動画内の文字認識結果が返されます。現在、中国語と英語の認識に対応しており、その他の言語はまだ対応していません。

物体認識

物体認識を有効化すると、コールバックにより動画内の物体認識結果が返されます。デフォルトでは一般的な物体を認識できます。特定の認識対象が必要な場合は、サポートチケットを作成するか、プロダクト開発チームまでお問い合わせください。

ヘルプとサポート

この記事はお役に立ちましたか?

フィードバック