音声を文字起こししてくれる「Amazon Transcribe」、言語の種類を自動識別する新機能。人間によるタグ付けが不要に

2020年9月17日

Amazon Web Services(AWS)が提供する「Amazon Transcribe」は、音声をテキストに変換する、いわゆる文字起こしを機械が行ってくれるサービスです。

例えば、ボイスメールをテキストに変換して送信するサービスの構築や、電話での問い合わせなどを受け付けるコールセンターなどで顧客とのやり取りの記録をテキストで残すサービスの開発などに役立ちます。

AWSはこのAmazon Transcribeに、話されている言語が英語なのか日本語なのか中国語なのか、などの言語の種類を自動的に識別する機能を追加したと発表しました

これまでAmazon Transcribeを利用するには、その音声の言語が何語なのかを示すタグを付けた上で処理をする必要がありました。

日本ではボイスメールやコールセンターへの通話が多様な言語で行われることはあまり想定されませんが、海外では国内で複数の言語が使われている地域や、国境をまたいで複数の言語が日常的に使われるサービスなどもあり、そうした地域やサービスで音声に対してAmazon Transcribeを利用するには、複数の言語に通じた人間のチームにより音声ファイルのタグ付けによる言語種別の指定が行われていました。

今回の機能追加により、最短30秒の音声があれば人間が言語の種類を指定することなく、Amazon Transcribeが自動識別をしてテキストへ変換してくれるようになりました。

この機能は追加料金なしで利用でき、Amazon Transcribeで現在サポートされている31種類の言語すべてに対応しているとのことです。

あわせて読みたい

AWS クラウド




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本