Optical Character Recognition

印刷体、筆記体、及びカスタムシーンにおける画像・文字認識サービスをサポートすることにより、情報入力効率を有効的に高める

概要

Optical Character Recognitionは、Tencent YouTuラボの世界先端のディープラーニング技術に基づき、画像にある文字内容を、編集可能なテキストに認識することです。身分証明書、名刺等証明書や帳票類の印刷体の認識、送り状等の筆記体の認識、及びカスタムサービスの提供をサポートしており、人工による情報入力を有効的に代替することが可能です。

特徴

高い正確性

Tencent Cloud Optical Character Recognition(OCR)は、自動的に画像からフィールドを特定し認識することができます。活字の平均認識精度は95%以上、手書き文字の平均認識精度は90%以上に達し、高い堅牢性を備えています。

幅広い適用範囲

Tencent Youtu Labが独自開発したもので、証明書の検出、認識フレームワークのすべてのコアアルゴリズムをカバーしています。水平・垂直方向の撮影をサポートし、遠近法の歪み、不均一な照明、部分的なオクルージョンといった状況に対応し、複雑な環境下でも非常に高い可用性を備えています。

使いやすくシンプル

OCRは、直接呼び出すことのできる包括的なAPIインターフェースに加えて、開発者向けにさまざまなSDKも数多く提供しています。サービスはシンプルで使いやすく、強力な互換性を備えています。

機能

汎用的な活字の認識

高い汎用性を備えた、画像と文字全体の検出および認識をサポートしています。

· 中国語、英語、日本語、韓国語、スペイン語、フランス語、ドイツ語、ポルトガル語など19言語を含む多言語認識をサポートし、さらにそれぞれの言語で英語混在の文字認識をサポートしています。

· 言語タイプを自動的に検出し、テキストボックスの座標情報と認識した内容を返すことができます。

· 傾いた文書の自動回転補正をサポートしています。

ユースケース

ユーザーの身分認証

金融業界における身分認識

ID証明書の認識は、銀行、保険、証券業界などユーザーの身元を検証する必要のあるシーンで幅広く応用されています。ユーザーによる情報入力の手間を省き、効率を高め、ユーザーエクスペリエンスの向上に役立ちます。

インターネット業界における身分認識

ライブブロードキャストやオンラインでのカーブッキングといったシーンでは、身分認識によりホストや乗客の身分認証を行い、違法行為や犯罪のリスクを低減することができます。

パスポート認証

出入国時のパスポート認識

パスポート認識は、ホテル、国境検問所、通関港湾、税関、空港、旅行代理店などのシーンで幅広く応用されています。OCR技術は、ユーザーが通行証明書を速やかに取得するのに役立ち、ユーザーエクスペリエンスを向上させることができます。

教育業界におけるパスポート認識

パスポート認識は、留学申請機関や学校などのシーンで応用されています。OCR技術は、教育機関が学生の身元情報をすばやく取得できるように助け、手作業による情報入力を減らして効率アップに役立ちます。

違法文字の認識

Eコマース広告の画像認識

Eコマース業界においては、OCR技術によって、広告画像における文字情報をインテリジェントに認識し、広告の違法文字をフィルタリングして、違法リスクを低減することができます。

動画字幕の認識

OCR技術は、さまざまな動画シーンにおいて、動画の字幕情報をすばやく識別して、文字のコンテンツが準拠しているかどうかを効果的に判断することができます。

出版物画像のテキスト変換

従来のニュースメディア

OCR技術は、大量の紙文書を編集可能なテキストに変換することができ、文字のレイアウトや情報検索に大きな利便性を提供します。

出版物画像

OCR技術は、出版物の画像を編集可能なテキストに変換することができ、出版物の分類や検索などの面で、人的コストを大幅に削減することができます。

料金

Tencent Cloud Optical Character Recognitionは、後払い(月次決済)課金方式を採用しています。 API呼び出しの月間合計がある段階に達すると、すべての呼び出しはその段階の単価で課金されます。段階が高くなるほど、単価は下がります。各月の計算書は翌月の1~3日に決済されます。定価の詳細については、課金の概要をご覧ください