[速報]Google、動画になにが映っているかを自動的に判断する「Video Intelligence API」発表。Google Cloud Next'17
Googleは米サンフランシスコでイベント「Google Cloud Next'17」を開催。1日目の基調講演で、動画を分析して、いつ、なにが映っているかを判断する「Video Intelligence API」を発表しました。
動画になにが映っているかをコンピュータが自動的に判断する
Googleのチーフサイエンティスト Fei-Fei Li博士によると、動画をコンピュータに理解させることはこれまで何年ものあいだ大きな課題で、実際、画像研究者にとって動画はデジタルな世界のダークマター(暗黒物質)だとされてきた、と。
そうしたなかで、Googleは機械学習による新しいAPI「Video Intelligence API」を発表しました。
Video Intelligence APIのライブデモでは、家の部屋、街角、犬、車庫などさまざまなシーンが収められた1本の動画をVideo Intelligence APIで分析。動画のどのシーンに何が映っているのかが示されました。
この画面では、動画の下に並ぶ青地のバーに「DOG」「BIRTHDAY CAKE」「CAR」など、動画に映っているエンティティの名称が並び、その横の赤い印は、動画のなかのどの部分にそのエンティティが映っているかを示しています。
赤い部分をクリックすると、動画の該当部分が再生され、そのエンティティが映っているかどうかが確認できます。
次は、複数の動画を分析する例。大量の動画を保存している企業があると想定します。
ここで検索窓に「baseball」と入力すると、野球のシーンが含まれている動画だけがリストアップされます。リストアップされるだけでなく、どの部分に野球のシーンがあるかも示してくれます。
3本目に示された動画のように、全体のほんの一部にだけ野球のシーンがある動画もリストアップされます。いままで動画を何時間も見て人間が判断してきたことが、このAPIでわずか数秒でできるようになるのです。
Video Intelligence APIは今日から利用可能とのこと。
あわせて読みたい
[速報]Google、データサイエンティストのコミュニティ「Kaggle」買収を発表。Google Cloud Next'17
≪前の記事
[速報]GoogleとSAPがクラウドで協業。SAP Cloud PlatformをGoogle Cloud上で展開可能に