JP2024076103A

JP2024076103A - 情報処理装置、情報処理方法、及びプログラム

Info

Publication number: JP2024076103A
Application number: JP2022187500A
Authority: JP
Inventors: 剛生二宮
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2022-11-24
Filing date: 2022-11-24
Publication date: 2024-06-05

Abstract

【課題】視聴者の嗜好により適合する映像効果を映像データに付与する。【解決手段】情報処理装置１００は、動画像データを少なくとも含む編集対象映像データの特徴を示す対象特徴情報を取得し、前記対象特徴情報が示す特徴に類似する特徴を含む参照用映像データであって、人気度が所定の条件を満たす前記参照用映像データに含まれる映像効果を示す参照効果情報を取得し、前記参照効果情報が示す映像効果と同一又は類似の映像効果を前記編集対象映像データに付与する。【選択図】図１

Description

本開示は、映像データに映像効果を付与する技術に関する。

動画像データを含む映像データに、自動で映像効果を付与する技術がある。特許文献１には、配信用の映像において、配信者等のユーザが、所定の動作若しくは表情をとったこと、又は所定のフレーズを発話したことを特定し、当該映像のデータに、動作若しくは表情、又はフレーズに対応する映像効果を付与する技術が開示されている。

特開２０１９－９２１８６号公報

しかしながら、特許文献１に開示された技術では、動作若しくは表情、又はフレーズごとに予め用意された映像効果を、単に、ユーザの動作若しくは表情、又はフレーズに対応させて映像のデータに付与するものである。そのため、特許文献１に開示された技術では、付与された映像効果が視聴者の嗜好に合っていない可能性があった。

本開示に係る情報処理装置は、動画像データを少なくとも含む編集対象映像データの特徴を示す対象特徴情報を取得する対象取得手段と、前記対象特徴情報が示す特徴に類似する特徴を含む参照用映像データであって、人気度が所定の条件を満たす前記参照用映像データに含まれる映像効果を示す参照効果情報を取得する効果取得手段と、前記参照効果情報が示す映像効果と同一又は類似の映像効果を前記編集対象映像データに付与する付与手段と、を有する。

視聴者の嗜好により適合する映像効果を映像データに付与することができる。

情報処理システムの構成の一例を示すブロック図である。情報処理装置のハードウェア構成の一例を示すブロック図である。対象映像データの映像の一例を示す図である。第１サーバの処理フローの一例を示すフローチャートである。再生情報及びタグ情報の一例を示す図である。映像ジャンル特定用データの一例を示す図である。参照用映像データに付与された映像効果の一例を示す図である。参照用映像データの映像の特徴の一例を示す図である。映像効果特定用データの一例を示す図である。情報処理装置の処理フローの一例を示すフローチャートである。対象映像データの映像の一例を示す図である。参照用映像データに付与された映像効果の一例を示す図である。参照用映像データの映像の特徴の一例を示す図である。映像効果特定用データの一例を示す図である。対象映像データの映像の一例を示す図である。参照用映像データに付与された映像効果の一例を示す図である。参照用映像データの映像の特徴の一例を示す図である。映像効果特定用データの一例を示す図である。

以下、添付図面を参照して本開示の技術の実施形態を詳しく説明する。尚、以下の実施形態は、本開示の技術を限定するものでなく、また本実施形態で説明されている特徴の組み合わせの全てが本開示の技術の解決手段に必須のものとは限らない。なお、同一の構成要素には同一の符号を付して、説明を省略する。

［実施形態１］
＜情報処理システムの構成＞
図１乃至１０を参照して、実施形態１に係る情報処理システム１について説明する。図１は、実施形態１に係る情報処理システム１の構成の一例を示すブロック図である。情報処理システム１は、情報処理装置１００、第１サーバ１１０、及び第２サーバ１２０を備える。情報処理装置１００、第１サーバ１１０、及び第２サーバ１２０は、ＬＡＮ（local area network）、無線ＬＡＮ、又はインターネット回線等を介して、互いに通信可能に互いに接続されている。情報処理装置１００は、パーソナルコンピュータ（ＰＣ）、タブレット端末、又はスマートフォン等のコンピュータにより構成される、ユーザにより操作される装置である。情報処理装置１００の詳細については後述する。

第２サーバ１２０は、ＰＣ等のコンピュータ、又はクラウドサーバ等により構成される装置であって、動画像のデータ（以下「動画像データ」とも呼ぶ。）を少なくとも含む映像のデータ（以下「映像データ」とも呼ぶ。）の配信サービスを提供する。以下、映像データは、動画像データ及び音声データを含むものとして説明する。第２サーバ１２０は、情報処理装置１００等の外部装置からの、映像データの登録要求、登録されている映像データの検索要求、又は、登録されている映像データの取得要求等のコマンドを受信して、受信したコマンドに対応する動作を行う。

例えば、ユーザは、情報処理装置１００を用いて、第２サーバ１２０に登録された複数の映像データのうち、再生を所望する映像データを選択する。情報処理装置１００は、ユーザが選択した映像データを取得するための取得要求のコマンドを第２サーバ１２０に対して送信する。具体的には、情報処理装置１００は、ユーザが選択した映像データを一意に特定可能な映像ＩＤ（identifier）等を付した取得要求のコマンドを第２サーバ１２０に対して送信する。第２サーバ１２０は、取得要求のコマンドを受信して、受信した取得要求のコマンドに対応する映像データを情報処理装置１００に対して送信する。映像の再生の際に、映像データに含まれる動画像データ及び音声データがレンダリングされて、動画像と音声とが同期して再生される。

また、例えば、ユーザは、情報処理装置１００を用いて、所望の映像データを第２サーバ１２０に登録する。具体的には、例えば、ユーザは、情報処理装置１００を用いて、図１には不図示の記憶装置に記憶されている１以上の映像データから所望の映像データを選択する。情報処理装置１００は、第２サーバ１２０に対して、登録要求のコマンドと選択した映像データとを送信する。第２サーバ１２０は、登録要求のコマンドと映像データとを受信して、受信した当該映像データを図１には不図示の記憶装置に記憶させて、当該映像データを登録する。

ユーザは、第２サーバ１２０に映像データを登録する際に、映像データの検索等に用いられる、映像のジャンルを特定するためのタグ情報（以下「タグ情報」と呼ぶ。）を付与してもよい。例えば、この場合、情報処理装置１００は、第２サーバ１２０に対して、登録要求のコマンド、映像データ、及びタグ情報を送信する。第２サーバ１２０は、これらを受信して、受信した映像データとタグ情報とを対応付けて上述の記憶装置に記憶させて、当該映像データを登録する。以下、第２サーバ１２０に登録されている映像データは、１つ以上のタグ情報が対応付けられているものとして説明する。また、第２サーバ１２０は、タグ情報の他に、映像データごとの再生回数、お気に入りへの登録数、又は、良い若しくは悪い等の評価値等の、映像データの再生の状態を示す情報を管理して、当該情報を当該映像データに対応付けて、上述の記憶装置に記憶させる。映像データの再生の状態を示す情報（以下「再生情報」と呼ぶ。）は、上述のものに限定されるものではなく、映像データに対する視聴者からのコメント、映像データの視聴時に視聴者から投じられた投げ銭の額等の情報であってもよい。

第１サーバ１１０は、第２サーバ１２０から複数の映像データを取得する。以下、第１サーバ１１０が第２サーバ１２０から取得する映像データを「参照用映像データ」と呼び、参照用映像データに含まれる動画像データを「参照用動画像データ」、及び参照用映像データに含まれる音声データを「参照用音声データ」と呼ぶ。第１サーバ１１０は、参照用映像データを解析することにより、参照用映像データの特徴を示す情報（以下「映像特徴情報」と呼ぶ。）、及び、参照用映像データに付与されている映像効果を示す情報（以下「映像効果情報」と呼ぶ。）を取得する。第１サーバ１１０は、取得した映像特徴情報と映像効果情報とを対応付けて、図１には不図示の記憶装置に映像特徴情報及び映像効果情報を記憶させる。第１サーバ１１０は、映像特徴情報及び映像効果情報を記憶させる際に、参照用映像データに対応するタグ情報又は再生情報等の参照用映像データに関連する情報を対応付けてもよい。

情報処理装置１００は、処理対象の映像データ（以下「対象映像データ」と呼ぶ。）を解析することにより、対象映像データの特徴を特定する。また、情報処理装置１００は、第１サーバ１１０から、参照用映像データに対応する映像特徴情報及び映像効果情報を取得して、映像特徴情報及び映像効果情報、並びに、特定した対象映像データの特徴に基づいて、対象映像データに対して映像効果を付与する。

＜情報処理装置の構成＞
情報処理装置１００は、機能構成として、映像取得部１０１、映像解析部１０２、効果取得部１０３、効果付与部１０４、及び映像出力部１０５を備える。情報処理装置１００が機能構成として備える各部の処理は、情報処理装置１００に内蔵されたＡＳＩＣ（Application Specific Integrated Circuit）等のハードウェアによってなされる。当該処理は、ＦＰＧＡ（Field Programmable Gate Array）等のハードウェアによってなされるものであってもよい。また、当該処理は、ＲＡＭ（Random Access Memory）等のメモリと、ＣＰＵ（Central Processor Unit）等のプロセッサとを用いたソフトウェアによってなされるものであってもよい。情報処理装置１００が機能構成として備える各部の処理の詳細については後述する。

図２を参照して、情報処理装置１００が機能構成として備える各部がソフトウェアとして動作する場合の情報処理装置１００のハードウェア構成について説明する。図２は、実施形態１に係る情報処理装置１００のハードウェア構成の一例を示すブロック図である。情報処理装置１００は、コンピュータにより構成されており、当該コンピュータは、図２に一例として示すようにＣＰＵ２０１、ＲＯＭ２０２、ＲＡＭ２０３、補助記憶装置２０４、表示部２０５、操作部２０６、通信部２０７、及びバス２０８を有している。

ＣＰＵ２０１は、ＲＯＭ２０２又はＲＡＭ２０３等に格納されているプログラム又はデータを用いて当該コンピュータを制御することにより、当該コンピュータを、情報処理装置１００が機能構成として備える各部として機能させるプロセッサである。なお、情報処理装置１００は、ＣＰＵ２０１とは異なる１又は複数の専用のハードウェアを有し、ＣＰＵ２０１による処理の少なくとも一部を専用のハードウェアが実行してもよい。専用のハードウェアの例としては、ＡＳＩＣ、ＦＰＧＡ、及びＤＳＰ（デジタルシグナルプロセッサ）等がある。ＲＯＭ２０２は、変更を必要としないプログラム等を格納するメモリである。ＲＡＭ２０３は、補助記憶装置２０４から供給されるプログラム若しくはデータ、又は通信部２０７を介して外部から供給されるデータ等を一時記憶するメモリである。補助記憶装置２０４は、例えばハードディスクドライブにより構成され、プログラム、又は画像データ若しくは音声データ等の種々のデータを記憶する。

表示部２０５は、例えば液晶ディスプレイ又はＬＥＤ等により構成され、ユーザが情報処理装置１００を操作、又は情報処理装置１００における処理の状態を閲覧するためのＧＵＩ（Graphical User Interface）等を表示する。操作部２０６は、例えばキーボード、マウス、ジョイスティック、又はタッチパネル等により構成され、ユーザによる操作を受けて各種の指示をＣＰＵ２０１に入力する。ＣＰＵ２０１は、表示部２０５を制御する表示制御部、及び操作部２０６を制御する操作制御部としても動作する。

通信部２０７は、情報処理装置１００と外部の装置との間の、データ等の送受信等の通信に用いられる。例えば、情報処理装置１００が外部の装置と有線接続される場合には、通信用のケーブルが通信部２０７に接続される。情報処理装置１００が外部の装置と無線通信する機能を有する場合には、通信部２０７はアンテナを備える。バス２０８は、情報処理装置１００がハードウェア構成として備える各部同士をつないで情報を伝達する。実施形態１では、表示部２０５及び操作部２０６は、情報処理装置１００の内部に存在するものとして説明するが、表示部２０５及び操作部２０６の少なくとも一方は、情報処理装置１００の外部に別の装置として存在していてもよい。

＜第１サーバの構成＞
第１サーバ１１０は、機能構成として、映像取得部１１１、人気度取得部１１２、映像解析部１１３、及び効果出力部１１４を備える。第１サーバ１１０が機能構成として備える各部の処理は、情報処理装置１００に内蔵されたＡＳＩＣ又はＦＰＧＡ等のハードウェアによってなされる。当該処理は、ＲＡＭ等のメモリとＣＰＵ等のプロセッサとを用いたソフトウェアによってなされるものであってもよい。具体的には、第１サーバ１１０が機能構成として備える各部がソフトウェアとして動作する場合、例えば、第１サーバ１１０は、図２に示すハードウェアと同様のハードウェア構成を備える。

＜機能構成として備える各部の処理＞
まず、第１サーバ１１０が機能構成として備える各部の処理について説明する。映像取得部１１１は、参照用映像データを取得する。具体的には、例えば、映像取得部１１１は、参照用映像データを、第２サーバ１２０から取得する。映像取得部１１１は、参照用映像データに加えて、当該参照用映像データの再生情報についても取得する。また、映像取得部１１１は、参照用映像データ及び再生情報に加えて、映像データのジャンルを特定するためのタグ情報等についても取得してもよい。以下、映像取得部１１１は、参照用映像データ、並びに、参照用映像データに対応する再生情報及びタグ情報を取得するものとして説明する。人気度取得部１１２は、再生情報に基づいて人気度を算出することにより再生情報に対応する参照用映像データの人気度を取得する。人気度の算出方法については後述する。

映像解析部１１３は、人気度取得部１１２により取得された人気度が所定の条件を満たす参照用映像データについて、映像に付与されている映像効果、及び映像の特徴を特定するための解析を行う。映像解析部１１３は、映像効果の特定、及び映像の特徴の特定の解析に加えて、映像のジャンル等を特定するための解析を行ってもよい。映像効果、映像の特徴、及び映像のジャンルのそれぞれを特定するための解析は、例えば、予め用意された、映像効果解析用データ、映像特徴解析用データ、又は映像ジャンル特定用データに基づいて行われる。映像効果解析用データ、映像特徴解析用データ、及び映像ジャンル特定用データのそれぞれは、第１サーバ１１０の補助記憶装置２０４等に予め記憶されている。映像解析部１１３は、解析結果に基づいて、参照用映像データに対応する映像効果情報及び映像特徴情報を生成する。更に、映像解析部１１３は、これらの情報及び人気度取得部１１２により取得された人気度を互いに対応付けて、映像効果特定用データとして第１サーバ１１０の補助記憶装置２０４等に記憶させる。

映像解析部１１３は、映像効果情報及び映像特徴情報に加えて、参照用映像データの映像のジャンルを示す情報（以下「映像ジャンル情報」と呼ぶ。）についても生成する。映像解析部１１３は、生成した映像ジャンル情報を映像効果特定用データに含めて第１サーバ１１０の補助記憶装置２０４等に記憶させる。なお、映像解析部１１３は、解析による映像のジャンルの特定に替えて、映像取得部１１１により取得されるタグ情報に基づいて映像のジャンルの特定し、映像ジャンル情報を生成してもよい。映像効果特定用データは、映像取得部１１１が取得する複数の参照用映像データのうちの、人気度取得部１１２により取得された人気度が所定の条件を満たす複数の参照用映像データについて、参照用映像データごとに生成される。効果出力部１１４は、情報処理装置１００からの要求に応じて、映像効果特定用データを情報処理装置１００に出力する。

次に、情報処理装置１００が機能構成として備える各部の処理について説明する。映像取得部１０１は、対象映像データを取得する。対象映像データは、例えば、情報処理装置１００の補助記憶装置２０４に予め記憶されており、映像取得部１０１は、ユーザ操作により指定された対象映像データを補助記憶装置２０４から読み出すことにより、対象映像データを取得する。映像取得部１０１は、通信部２０７を介して、図１には不図示の外部装置等から対象映像データを取得してもよい。タグ情報が、取得する対象映像データに予め対応付けられている場合、映像取得部１０１は、対象映像データに加えて、対応するタグ情報を取得してもよい。

映像解析部１０２は、映像取得部１０１により取得された対象映像データについて、映像の特徴、及び映像のジャンルを特定するための解析を行う。映像解析部１０２は、映像の特徴、及び映像のジャンルのそれぞれを特定するための解析は、例えば、予め用意された、映像特徴解析用データ又は映像ジャンル特定用データに基づいて行われる。映像特徴解析用データ及び映像ジャンル特定用データのそれぞれは、情報処理装置１００の補助記憶装置２０４等に予め記憶されている。映像解析部１０２は、特定した、対象映像データの映像の特徴を示す情報（映像特徴情報）、及び映像のジャンルを示す情報（映像ジャンル情報）を生成する。なお、映像解析部１０２は、解析による映像のジャンルの特定に替えて、映像取得部１０１により取得される、対象映像データに対応するタグ情報に基づいて対象映像データの映像のジャンルを特定し、映像ジャンル情報を生成してもよい。

効果取得部１０３は、第１サーバ１１０から映像効果特定用データを取得する。具体的には、効果取得部１０３は、複数の参照用映像データのそれぞれに対応する映像効果特定用データのうちから、対象映像データの映像の特徴に類似する特徴を含む参照用映像データに対応する映像効果特定用データを第１サーバ１１０から取得する。効果取得部１０３は、以下のようにして、対象映像データの映像の特徴に類似する特徴を含む参照用映像データに対応する映像効果特定用データを取得してもよい。例えば、まず、効果取得部１０３は、複数の参照用映像データのそれぞれに対応する映像効果特定用データを第１サーバ１１０から取得する。続いて、効果取得部１０３は、取得した複数の映像効果特定用データのうちから、対象映像データの映像の特徴に類似する特徴を含む参照用映像データに対応する映像効果特定用データを取得する。

また、例えば、まず、効果取得部１０３は、対象映像データ及び参照用映像データのそれぞれに対応する映像ジャンル情報に基づいて、対象映像データのジャンルと一致するジャンルの参照用映像データを検索する。続いて、効果取得部１０３は、当該検索により得られた複数の参照用映像データのそれぞれに対応する映像効果特定用データのうちから、対象映像データの映像の特徴に類似する特徴を含む参照用映像データに対応する映像効果特定用データを取得する。また、例えば、まず、効果取得部１０３は、対象映像データ及び参照用映像データのそれぞれに対応する映像ジャンル情報に基づいて、対象映像データのジャンルと一致するジャンルの参照用映像データを検索する。続いて、効果取得部１０３は、当該検索により得られた複数の参照用映像データのそれぞれに対応する映像効果特定用データを第１サーバ１１０から取得する。続いて、取得した複数の映像効果特定用データのうちから、対象映像データの映像の特徴に類似する特徴を含む参照用映像データに対応する映像効果特定用データを取得する。

効果付与部１０４は、対象映像データに映像効果を付与する。具体的には、効果付与部１０４は、効果取得部１０３により取得された映像効果特定用データに含まれる映像効果を示す情報に基づいて、当該映像効果と同様の映像効果を対象映像データに付与する。ここで、同様の映像効果とは、映像効果特定用データに含まれる映像効果を示す情報が示す映像効果と同一のものに限定されるものではなく、当該映像効果に類似するものも含む。映像出力部１０５は、効果付与部１０４により映像効果が付与された後の対象映像データ（以下「付与後映像データ」と呼ぶ。）を出力する。具体的には、例えば、映像出力部１０５は、第２サーバ１２０に付与後映像データを出力して、付与後映像データを第２サーバ１２０に登録させる。映像出力部１０５は、情報処理装置１００の補助記憶装置２０４等に付与後映像データを出力して、補助記憶装置２０４等に付与後映像データを記憶させてもよい。

以下、対象映像データは、ビデオゲームの実況を行う映像（以下「ゲーム実況映像」と呼ぶ。）のデータであるものとして説明する。図３は、実施形態１に係る対象映像データの映像３００の一例を示す図である。具体的には、図３（ａ）は、対象映像データの映像３００であって、ゲーム実況映像の一例を示す図であり、図３（ｂ）は、図３（ａ）に示す対象映像データに対応する付与後映像データの映像３１０の一例を示す図である。

図３（ａ）に示す映像３００の画像領域は、ビデオゲームの実況を行う者（以下「実況者」と呼ぶ。）３０１が映る画像領域３０２、及びビデオゲームの画面３０３が映る画像領域３０４の２つの画像領域に分かれている。情報処理装置１００は、対象映像データの映像の特徴を解析し、解析した映像の特徴に適した映像効果を付与して付与後映像データを生成する。図３（ｂ）に示す映像３１０では、対象映像データの映像の特徴に合わせた映像効果として、実況者３０１の背景３１２の色が、図３（ａ）に示す画像領域３０２における実況者３０１の背景の色に対して変化している。また、図３（ｂ）に示す映像３１０では、対象映像データの映像の特徴に合わせた映像効果として、テロップ３１５が、図３（ａ）に示す映像３００に対して追加されている。また、図３（ｂ）に示す映像３１０では、対象映像データの映像の特徴に合わせた映像効果として、効果音３１６が、図３（ａ）に示す映像３００に対応する音声に対して追加されている。

＜第１サーバの動作＞
図４を参照して、第１サーバ１１０の動作について説明する。図４は、実施形態１に係る第１サーバ１１０の処理フローの一例を示すフローチャートである。具体的には、図４は、第１サーバ１１０における映像効果特定用データの生成処理の処理フローを示している。第１サーバ１１０は、当該フローチャートの処理を繰り返すことにより、複数の参照用映像データのそれぞれに対応する映像効果特定用データを生成する。なお、以下の説明において記号「Ｓ」はステップを意味する。まず、Ｓ４０１にて、映像取得部１１１は、参照用映像データを取得する。次に、Ｓ４０２にて、映像取得部１１１は、Ｓ４０１にて取得した参照用映像データに対応する再生情報及びタグ情報を取得する。

図５を参照して、再生情報及びタグ情報について説明する。図５は、再生情報及びタグ情報の一例を示す図である。映像ＩＤ５０１は、参照用映像データを識別するための情報である。再生回数５０２は、再生情報の一例であって、参照用映像データがこれまでに再生された回数を示す情報である。肯定的なコメント数５０３は、再生情報の一例であって、これまでに参照用映像データの映像を視聴した視聴者のコメントのうちの、肯定的なコメントの数を示す情報である。否定的なコメント数５０４は、再生情報の一例であって、これまでに参照用映像データの映像を視聴した視聴者のコメントのうち、否定的なコメントの数を示す情報である。タグ５０５は、参照用映像データの映像のジャンルを特定するための情報であって、参照用映像データの登録者が予め設定したタグ情報に対応する情報である。再生回数５０２、肯定的なコメント数５０３、及び否定的なコメント数５０４は、人気度取得部１１２による参照用映像データの人気度の取得の際に用いられる。また、タグ５０５は、参照用映像データのジャンルを特定する際に用いられる。

Ｓ４０２の後、Ｓ４０３にて、人気度取得部１１２は、Ｓ４０２にて取得した再生情報を用いて、Ｓ４０１にて取得した参照用映像データの人気度３０７を算出する。人気度取得部１１２は、例えば、単純に、再生回数を人気度としてもよい。また、例えば、他の参照用映像データとの相対的な再生回数を人気度としてもよい。具体的には、参照用映像データの再生回数をＹ，他の参照用映像データの再生回数のうちの最大の再生回数をＸｍａｘ、最小の再生回数をＸｍｉｎ、人気度をＺとして、例えば、人気度取得部１１２は、次式（１）のように再生回数を正規化して人気度を求める。
Ｚ＝（Ｙ―Ｘｍｉｎ）／（Ｘｍａｘ―Ｘｍｉｎ）・・・式（１）

式（１）の場合、Ｚの値が大きいほど人気度が高く、Ｚの値が小さいほど人気度が低いことを表している。人気度の算出方法は、上述のものに限定されるものではない。例えば、再生回数をＸ、肯定的なコメント数をＹ、重みの係数をｗとして、及び人気度をＺとして、次式（２）のように人気度を求めてもよい。
Ｚ＝Ｘ＋ｗＹ・・・式（２）

また、例えば、否定的なコメント数についても考慮して、式（２）におけるＹを（肯定的なコメント数－否定的なコメント数）として人気度を求めてもよい。

Ｓ４０３の後、Ｓ４０４にて、映像解析部１１３は、Ｓ４０３にて取得した人気度が所定の条件を満たすか否かを判定する。具体的には、映像解析部１１３は、参照用映像データの人気度が所定の閾値以上であるか否かを判定する。Ｓ４０４にて人気度が所定の条件を満たすと判定された場合、映像解析部１１３は、Ｓ４０５にて、映像解析部１１３は、Ｓ４０１にて取得した参照用映像データを解析する。映像解析部１１３は、当該解析により、参照用映像データの映像の特徴、及び参照用映像データに付与されている映像効果を特定し、当該参照用映像データに対応する映像特徴情報及び映像効果情報を生成する。映像解析部１１３は、生成した映像特徴情報及び映像効果情報を参照用映像データの映像ＩＤ及び人気度に対応付けて、映像効果特定用データとして第１サーバ１１０の補助記憶装置２０４に記憶させる。

続いてＳ４０５にて、映像解析部１１３は、参照用映像データを解析することにより、参照用映像データの映像のジャンルの特定を行い、映像ジャンル情報を生成する。映像解析部１１３は、生成した映像ジャンル情報を映像効果特定用データに含めて第１サーバ１１０の補助記憶装置２０４等に記憶させる。なお、映像解析部１１３は、解析による映像のジャンルの特定に替えて、Ｓ４０２にて取得したタグ情報に基づいて映像のジャンルの特定し、映像ジャンル情報を生成してもよい。

図６を参照して、映像のジャンルの特定方法について説明する。図６は、映像のジャンルを特定するための映像ジャンル特定用データ６００及び６１０の一例を示す図である。具体的には、図６（ａ）は、タグ情報に基づいて映像のジャンルを特定するための映像ジャンル特定用データ６００の一例を示す図である。また、図６（ｂ）は、映像データの解析結果に基づいて映像のジャンルを特定するための映像ジャンル特定用データ６００の一例を示す図である。

図６（ａ）において、映像ジャンル６０１は、映像解析部１１３により特定される映像のジャンルであり、タグ６０２は、参照用映像データに予め設定されているタグ情報である。映像解析部１１３は、参照用映像データに設定されているタグ情報に一致するタグ６０２を映像ジャンル特定用データ６００から検索し、検索結果に基づいてタグ６０２に対応する映像ジャンル６０１を特定する。図６（ｂ）において、映像ジャンル６１１は、映像解析部１１３により特定される映像のジャンルである。また、映像態様６１２は、参照用映像データの解析結果であって、参照用映像データの映像の態様を示す情報である。まず、映像解析部１１３は、参照用映像データの解析結果である映像の態様に一致する映像態様６１２を映像ジャンル特定用データ６１０から検索する。続いて、映像解析部１１３は、検索結果に基づいて映像態様６１２に対応する映像ジャンル６１１を特定する。

図７を参照して、映像解析部１１３により特定される、参照用映像データに付与された映像効果について説明する。図７は、映像解析部１１３により特定される、参照用映像データに付与された映像効果の一例を示す図である。具体的には、図７（ａ）に示す背景色７０１は、参照用映像データに動画像の映像効果として付与されている、動画像の背景領域における色の変化の情報である。図７（ｂ）に示すテロップ表現７０２は、参照用映像データに動画像の映像効果として付与されている、挿入されたテロップの位置、並びに、当該テロップ内の文字の大きさ、色、及び形状等の情報である。図７（ｃ）に示すテロップ内容７０３は、参照用映像データに動画像の映像効果として付与されている、挿入されたテロップに含まれる文字列の情報である。図７（ｄ）に示す効果音７０４は、参照用映像データの音声データに映像効果として付与されている音（以下「効果音」と呼ぶ。）の種類を示す情報である。

映像効果は、例えば、動画の背景色、テロップ表現、テロップ内容、及び効果音等の映像効果の種類ごとの、機械学習等の学習により得られた学習モデル等の映像効果解析用データを用いて特定される。映像解析部１１３が特定する映像効果は、図７に示す映像効果に限定されるものではない。例えば、映像における動画像に対する色調変化、フェードイン若しくはフェードアウト、又はフィルタ等のエフェクト等であってもよい。また、映像の音声におけるＢＧＭ（Back Ground Music）、声色、又は抑揚等であってもよい。

図８を参照して、映像解析部１１３により特定される、参照用映像データの映像の特徴について説明する。図８は、映像解析部１１３により特定される、参照用映像データの映像の特徴の一例を示す図である。具体的には、図８（ａ）は、映像解析部１１３により特定される映像の特徴の一例を示す図であって、映像内の発話内容８０１の一例を示す図である。映像解析部１１３は、参照用映像データの映像において、映像効果が付与されている期間、又は当該期間の前若しくは後の期間の発話の内容を特定する。当該特定は、例えば、周知の音声の言語認識技術を用いることにより行うことができる。発話の内容を特定する期間は、映像効果が付与されている期間の一部又は全部を含んでいてもよく、映像効果が付与されている期間を含んでいなくてもよい。具体的には、発話の内容を特定する期間は、映像効果が付与されている期間における、始期の５秒前から終期の５秒後まで等のように、例えば、予めその期間を設定しておく。以下、映像解析部１１３が発話の内容を特定する、映像効果が付与されている期間、又は当該期間の前若しくは後の期間を「映像効果に対応する期間」と表記する。

映像解析部１１３は、映像効果に対応する期間における発話の全てを特定してもよいし、取得された映像のジャンルごとに特定する語句を予め設定して、設定した語句のみを映像効果に対応する期間において特定してもよい。例えば、映像のジャンルが「ゲーム実況」である場合、映像解析部１１３は、発話内容８０１に示す「負けた」又は「勝った」等の、ゲームの勝敗等に関連する語句だけを特定してもよい。

図８（ｂ）は、映像解析部１１３により特定される映像の特徴の一例を示す図であって、映像内で発話する者（実況者）の感情の起伏の推移を示す感情曲線８０２の一例を示す図である。感情曲線８０２の横軸は時間であり、感情曲線８０２は、映像全体の期間におけるものであってもよく、映像効果に対応する期間におけるものであってもよい。感情曲線８０２の縦軸は、実況者の感情におけるポジティブな感情を正方向、ネガティブな感情を負方向として、実況者の感情を数値化したもの（以下「ポジティブ度」と呼ぶ。）で表現したものである。人物の感情の数値化は、例えば、ＢＥＲＴ（Bidirectional Encoder Representations from Transformers）等を用いた自然言語処理モデル等の周知の音声による感情分析技術を用いて行うことができる。ポジティブな発言の回数とネガティブな発言の回数とに基づいて、ポジティブな発言の回数からネガティブな発言の回数を減じた値をポジティブ度としてもよい。

また、人物の感情の数値化は、実況者の発話だけでなく、映像の動画像に映る実況者の表情に基づいて、周知の表情認識（ＦＥＲ：Facial Expression Recognition）技術を用いて行ってもよい。具体的には、例えば、ポジティブな表情をした回数とネガティブな表情をした回数とに基づいて、ポジティブな表情をした回数からネガティブな表情をした回数を減じた値をポジティブ度とする。また、声の抑揚の大きさ、又は声の大きさ等を数値化し、この数値が、予め定められた基準値より、大きい場合はポジティブな感情であり、小さい場合はネガティブな感情であるものとして、当該数値と基準値との差分をポジティブ度の変化量としてもよい。

図８（ｃ）は、感情曲線８０２の生成方法の一例を説明するための図である。図８（ｃ）に示す時系列図８０３は、映像の再生時刻に応じた映像の移り変わりの一例を示している。時系列図８０３には、一例として、再生時刻が５秒、１０秒、及び１５秒の時点におけるフレーム８０５と、各再生時刻の周辺の期間における、実況者の発話の内容８０４とが示されている。具体的には、時系列図８０３には、実況者の発話の内容８０４として、「良い感じ」、「やったー！」、及び「ダメだな」という語句が示されている。図８（ｄ）は、各再生時刻におけるポジティブ度の一例を示す図である。具体的には、図８（ｄ）には、「良い感じ」、「やったー！」、及び「ダメだな」という各語句に対応するポジティブ度の算出結果を、それぞれ２、４、及び－２とした対応表８０６が示されている。こうして得られた再生時刻とポジティブ度との対応関係に基づいて、感情曲線８０２が生成される。

Ｓ４０５の後、Ｓ４０６にて、映像解析部１１３は、Ｓ４０３にて算出した人気度、並びに、Ｓ４０５にて生成した映像効果情報及び映像特徴情報に基づいて、例えば、Ｓ４０５にて特定した映像のジャンルごとに、映像効果特定用データを生成（更新）する。図９は、映像効果特定用データ９００の一例を示す図である。映像特徴９０１、及び、映像効果９０２のそれぞれは、映像解析部１１３により生成された映像効果情報及び映像特徴情報が示す映像の特徴及び映像効果である。また、人気度９０３は、人気度取得部１１２が取得した人気度である。Ｓ４０６の後、又はＳ４０４にて人気度が所定の条件を満たさないと判定された場合、第１サーバ１１０は、図４に示すフローチャートを終了し、終了後にＳ４０１に戻って、当該フローチャートの処理を繰り返して実行する。

本実施形態では、人気度が参照用映像データに対する人気度であるものとして説明したが、参照用映像データの人気度は、これに限定されるものではない。例えば、人気度取得部１１２は、映像効果に対応する期間における参照用映像データの人気度を取得してもよい。具体的には、例えば、人気度取得部１１２は、生配信されている参照用映像データの映像に付与されている映像効果を解析し、映像効果に対応する期間における投げ銭の総額等を参照用映像データの人気度としてもよい。また、例えば、人気度取得部１１２は、映像効果に対応する期間における肯定的なコメントの数を人気度としてもよい。

＜情報処理装置の動作＞
図１０を参照して、情報処理装置１００の動作について説明する。図１０は、実施形態１に係る情報処理装置１００の処理フローの一例を示すフローチャートである。まず、Ｓ１００１にて、映像取得部１０１は、対象映像データを取得する。対象映像データに対応するタグ情報が設定されている場合、映像取得部１０１は、対象映像データに加えて、タグ情報についても取得する。

次に、Ｓ１００２にて、映像解析部１０２は、Ｓ１００１にて取得した対象映像データを解析する。映像解析部１０２は、当該解析により、対象映像データの映像の特徴を特定して、対象映像データに対応する映像特徴情報を生成する。続いてＳ１００２にて、映像解析部１０２は、Ｓ１００１にて取得した対象映像データを解析することにより、対象映像データの映像のジャンルの特定を行い、対象映像データに対応する映像ジャンル情報を生成する。なお、映像解析部１０２は、解析による映像のジャンルの特定に替えて、Ｓ１００１にて取得したタグ情報に基づいて対象映像データの映像のジャンルを特定してもよい。映像解析部１０２における映像の特徴の特定方法、及び、映像のジャンルの特定方法は、第１サーバ１１０の映像解析部１１３における映像の特徴の特定方法、及び、映像のジャンルの特定方法と同様であるため、説明を省略する。

次に、Ｓ１００３にて、効果取得部１０３は、第１サーバ１１０が生成した映像効果特定用データと、Ｓ１００２にて生成した映像特徴情報とに基づいて、対象映像データに付与する映像効果を示す情報を取得する。具体的には、例えば、まず、効果取得部１０３は、第１サーバ１１０に映像効果特定用データ９００を要求して、第１サーバ１１０の効果出力部１１４が出力する映像効果特定用データ９００を取得する。第１サーバ１１０に映像効果特定用データ９００を要求する際、効果取得部１０３は、Ｓ１００２にて生成した映像ジャンル情報が示す映像のジャンルを指定して、指定した映像のジャンルに対応する映像効果特定用データ９００を取得してもよい。続いて、効果取得部１０３は、取得した映像効果特定用データ９００のうちからＳ１００２にて生成した映像特徴情報が示す映像の特徴と同一又は類似の映像特徴９０１に対応する映像効果９０２を特定する。続いて、効果取得部１０３は、特定した映像効果９０２の情報を対象映像データに付与する映像効果の情報として取得する。

対象映像データに付与する映像効果を示す情報の取得方法は、上述のものに限定されるものではない。例えば、効果取得部１０３は、以下のようにして、対象映像データに付与する映像効果を示す情報を取得してもよい。まず、効果取得部１０３は、Ｓ１００２にて生成した映像特徴情報を第１サーバ１１０に対して送信する。第１サーバ１１０は、映像効果特定用データ９００のうちから当該映像特徴情報が示す映像の特徴と同一又は類似の映像特徴９０１に対応する映像効果９０２を特定して、特定した映像効果９０２を示す情報（映像効果情報）を情報処理装置１００に出力する。続いて、効果取得部１０３は、第１サーバ１１０が出力する映像効果情報を受信して、受信した映像効果情報を対象映像データに付与する映像効果を示す情報として取得する。

なお、効果取得部１０３は、Ｓ１００２にて生成した映像特徴情報を第１サーバ１１０に対して送信する際に、映像特徴情報に加えて、Ｓ１００２にて生成した映像ジャンル情報を送信してもよい。この場合、第１サーバ１１０は、映像効果特定用データ９００のうちから当該映像ジャンル情報が示す映像のジャンルが同一で、且つ、当該映像特徴情報が示す映像の特徴と同一又は類似の映像特徴９０１に対応する映像効果９０２を特定する。

Ｓ１００３の後、Ｓ１００４にて、効果付与部１０４は、Ｓ１００３にて取得した映像効果情報に基づいて、対象映像データに対して映像効果を付与する。具体的には、効果付与部１０４は、対象映像データと参照用映像データとにおいて互いに映像の特徴が同一又は類似の映像の位置に、映像効果を付与する。なお、映像の特徴の類似とは、例えば、Ｓ１００２にて対象映像データの映像の特徴として特定した実況者の発話の内容が、映像特徴９０１の発話内容と所定の文字数以上等しい場合等を意味する。また、感情曲線同士の類似度を算出し、類似度が所定の閾値以上である場合に、映像の内容が類似していると判定してもよい。Ｓ１００４の後、Ｓ１００５にて、映像出力部１０５は、Ｓ１００４にて映像効果が付与された後の対象映像データ（付与後映像データ）を出力する。Ｓ１００５の後、情報処理装置１００は、図１０に示すフローチャートの処理を終了する。以上のように構成した情報処理装置１００によれば、視聴者の嗜好により適合する映像効果を映像データに付与することができる。

これまで、第１サーバ１１０が、人気度が所定の条件を満たす参照用映像データのみを対象として、映像効果特定用データ９００を生成する形態について説明したが、これに限定されるものではない。例えば、第１サーバ１１０は、人気度が所定の条件を満たすか否かに関わらず、全ての参照用映像データを対象として、映像効果特定用データ９００を生成してもよい。この場合、例えば、情報処理装置１００は、以下のようにして、対象映像データに付与する映像効果を示す情報を取得してもよい。

まず、効果取得部１０３は、第１サーバ１１０に映像効果特定用データ９００を要求して、第１サーバ１１０の効果出力部１１４が出力する映像効果特定用データ９００を取得する。第１サーバ１１０に映像効果特定用データ９００を要求する際、効果取得部１０３は、Ｓ１００２にて生成した映像ジャンル情報が示す映像のジャンルを指定して、指定した映像のジャンルに対応する映像効果特定用データ９００を取得してもよい。続いて、効果取得部１０３は、取得した映像効果特定用データ９００のうちから、人気度が所定の条件を満たす映像効果９０２を検索する。続いて、効果取得部１０３は、当該検索により検出された１以上の映像効果９０２のうちから、Ｓ１００２にて生成した映像特徴情報が示す映像の特徴と同一又は類似の映像特徴９０１に対応する映像効果９０２を特定する。続いて、効果取得部１０３は、特定した映像効果９０２の情報を対象映像データに付与する映像効果を示す情報として取得する。

また、実施形態１では、情報処理装置１００が、第１サーバ１１０が生成した映像効果特定用データ９００を用いて、対象映像データに映像効果を付与する形態について説明したが、これに限定されるものではない。例えば、情報処理装置１００が映像効果特定用データ９００を生成するために必要な機能構成を有していてもよい。この場合、情報処理装置１００は、映像効果特定用データ９００を生成して、生成した映像効果特定用データ９００を用いて対象映像データに映像効果を付与する。また、例えば、第１サーバ１１０が、対象映像データに映像効果を付与するために必要な機能構成を有していてもよい。この場合、例えば、情報処理装置１００は、対象映像データを第１サーバ１１０に送信し、第１サーバ１１０は、これを受信して、受信した対象映像データに対して映像効果を付与し、付与後映像データを情報処理装置１００に送信する。すなわち、この場合、第１サーバ１１０は、対象映像データに対して映像効果を付与するサービスを提供するクラウドサーバ等の装置として動作する。

また、実施形態１では、参照用映像データは、第２サーバ１２０から取得されるものとして説明したが、参照用映像データの取得元は、第２サーバ１２０に限定されるものではない。例えば、第１サーバ１１０は、第２サーバ１２０以外の外部の装置、又は、第１サーバ１１０の補助記憶装置２０４から参照用映像データを取得してもよい。この場合、補助記憶装置２０４に予め記憶されている参照用映像データは、例えば、ユーザが予め第２サーバ１２０からダウンロードした映像データである。また、実施形態１では、第１サーバ１１０は、第２サーバ１２０に登録されている全ての参照用映像データを対象として、参照用映像データを取得するものとして説明したが、参照用映像データの取得対象はこれに限定されるものではない。例えば、第１サーバ１１０は、第２サーバ１２０に登録されている参照用映像データのうちのユーザが予め指定した参照用映像データを対象として、参照用映像データを取得してもよい。

［実施形態２］
実施形態１では、一例として、対象映像データがゲーム実況映像のデータである場合を例として説明した。これに対して、実施形態２では、対象映像データが、映像に登場する者（以下「話者」と呼ぶ。）が雑談をしている映像（以下「雑談映像」と呼ぶ。）のデータである場合について説明する。実施形態２に係る情報処理システム、情報処理装置、及び第１サーバの構成は、図１及び図２に示す実施形態１に係る情報処理システム１、情報処理装置１００、及び第１サーバ１１０の構成と同様である。そのため、以下、実施形態２に係る情報処理システム、情報処理装置、及び第１サーバの構成の説明では、図１及び図２の符号を参照して説明する。

図１１は、実施形態２に係る対象映像データの映像の一例を示す図である。具体的には、図１１（ａ）は、対象映像データの映像であって、雑談映像１１００の一例を示す図であり、図１１（ｂ）は、図１１（ａ）に示す対象映像データに対応する付与後映像データの映像１１１０の一例を示す図である。図１１（ａ）に示す雑談映像１１００には、１人の話者１１０１がＰＣ又はタブレット端末等のモニタ１１０２を見ながら話している様子が映っている。情報処理装置１００は、対象映像データを解析し、解析により得た映像の特徴に基づいて、対象映像データに適した映像効果を付与して付与後映像データを生成する。例えば、話者１１０１がネガティブな発言を繰り返している場合に、対象映像データには、例えば、図１１（ｂ）に示す映像１１１０のように、話者１１０１の背景１１１１のうちの上方等の一部をグレーにするといった映像効果が付与される。

図１２を参照して、映像解析部１１３により特定される、参照用映像データに付与された映像効果について説明する。図１２は、映像解析部１１３により特定される、参照用映像データに付与された映像効果の一例を示す図である。具体的には、図１２に示す映像効果は、参照用映像データの映像のジャンルが雑談映像である場合の映像効果の例である。図１２（ａ）に示す背景色１２０１は、参照用映像データに動画像の映像効果として付与されている、動画像の背景領域における色の変化の情報であって、一例として、変化させる背景領域の色及び位置を示している。図１２（ｂ）に示す視聴者コメント表示１２０２は、参照用映像データに動画像の映像効果として、視聴者からのコメントを動画像の画像領域内に表示させているか否かを示す情報である。図１２（ｃ）に示す効果音１２０３は、参照用映像データに音の映像効果として付与されている、挿入された効果音の種類を示す情報である。図１２（ｄ）に示すＢＧＭ１２０４は、参照用映像データに音の映像効果として付与されている、挿入されたＢＧＭの種類を示す情報である。

図１３を参照して、映像解析部１１３により特定される、参照用映像データの映像の特徴について説明する。図１３は、映像解析部１１３により特定される、参照用映像データの映像の特徴の一例を示す図である。具体的には、図１３に示す映像の特徴は、参照用映像データの映像のジャンルが雑談映像である場合の映像の特徴の例である。図１３（ａ）は、映像解析部１１３により特定される映像の特徴の一例を示す図であって、話者１１０１の声の大きさの経時変化の一例を、音量曲線１３０１を用いて示す図である。映像解析部１１３は、映像の再生時刻に対応する所定の期間における、話者１１０１の声の大きさを音声データに基づいて解析することにより、音量曲線１３０１を取得する。例えば、映像解析部１１３は、話者１１０１の声を連続的に解析し、解析により得られた声の大きさをそのままグラフ化して音量曲線１３０１を取得する。音量曲線１３０１の取得方法は、上述のものに限定されるものではない。例えば、映像解析部１１３は、話者１１０１が発する言葉を単語又は文章等の単位に区切って、当該単位ごとの話者１１０１の平均の声の大きさを解析することにより、音量曲線１３０１を取得してもよい。

図１３（ｂ）は、映像解析部１１３により特定される映像の特徴の一例を示す図であって、視聴者からのコメントに基づくポジティブ度の経時変化の一例を、曲線１３０２を用いて示す図である。例えば、映像解析部１１３は、視聴者からのコメントがポジティブなものであるかネガティブなものであるかをコメントごとに判定し、ポジティブなコメントの数とネガティブなコメントの数との差分を時系列に数値化して曲線１３０２を取得する。具体的には、例えば、所定の時間間隔ごとの、視聴者からのコメントにおけるポジティブなコメントの数とネガティブなコメントの数との差分を算出して、これを時系列にグラフ化することにより曲線１３０２を取得する。視聴者からのコメントがポジティブなものであるかネガティブなものであるかの判定は、例えば、ＢＥＲＴ等を用いた自然言語処理モデル等の周知の言語解析技術を用いて行うことができる。

図１４は、映像解析部１１３が生成する映像効果特定用データ１４００の一例を示す図である。具体的には、図１４は、参照用映像データの映像のジャンルが雑談映像である場合の映像効果特定用データ１４００の例である。映像特徴１４０１、及び、映像効果１４０２のそれぞれは、映像解析部１１３が特定した映像の特徴及び映像効果である。また、人気度１４０３は、人気度取得部１１２が取得した人気度である。情報処理装置１００は、対象映像データの映像のジャンルが雑談映像である場合、図１４に一例として示す映像効果特定用データ１４００に基づいて、対象映像データに映像効果を付与する。対象映像データへの映像効果の付与方法は実施形態１に係る情報処理装置１００における映像効果の付与方法と同様であるため、説明を省略する。

［実施形態３］
実施形態１では、一例として、対象映像データがゲーム実況映像のデータである場合を例として説明した。また、実施形態２では、一例として、対象映像データが雑談映像のデータである場合を例として説明した。これに対して、実施形態３では、対象映像データが、映像に登場する者（以下「講演者」と呼ぶ。）が講義をしている映像（以下「講義映像」と呼ぶ。）のデータである場合について説明する。実施形態３に係る情報処理システム、情報処理装置、及び第１サーバの構成は、図１及び図２に示す実施形態１に係る情報処理システム１、情報処理装置１００、及び第１サーバ１１０の構成と同様である。そのため、以下、実施形態３に係る情報処理システム、情報処理装置、及び第１サーバの構成の説明では、図１及び図２の符号を参照して説明する。

図１５は、実施形態２に係る対象映像データの映像の一例を示す図である。具体的には、図１５（ａ）は、対象映像データの映像であって、講義映像１５００の一例を示す図であり、図１５（ｂ）は、図１５（ａ）に示す対象映像データに対応する付与後映像データの映像１１１０の一例を示す図である。

図１５（ａ）に示す講義映像１５００には、１人の講演者１５０１が指し棒１５０２でホワイトボード１５０３を指しながら講義をしている様子が映っている。情報処理装置１００は、対象映像データを解析し、解析により得た映像の特徴に基づいて、対象映像データに適した映像効果を付与して付与後映像データを生成する。例えば、講演者１５０１が声を大きくして発話する場合に、対象映像データには、例えば、図１５（ｂ）に示す映像１５１０のように、講演者１５０１の発話の内容を、テロップを用いて強調表示するといった映像効果が付与される。

図１６を参照して、映像解析部１１３により特定される、参照用映像データに付与された映像効果について説明する。図１６は、映像解析部１１３により特定される、参照用映像データに付与された映像効果の一例を示す図である。具体的には、図１６に示す映像効果は、参照用映像データの映像のジャンルが講義映像である場合の映像効果の例である。図１６（ａ）に示すテロップ表現１６０１は、参照用映像データに動画像の映像効果として付与されている、挿入されたテロップの位置、並びに、当該テロップ内の文字の大きさ、色、及び形状等の情報である。図１６（ｂ）に示すテロップ内容１６０２は、参照用映像データに動画像の映像効果として付与されている、挿入されたテロップに含まれる文字列の情報である。図１６（ｃ）に示す効果音１６０３は、参照用映像データの音声データに映像効果として付与されている効果音の種類を示す情報である。

図１７を参照して、映像解析部１１３により特定される、参照用映像データの映像の特徴について説明する。図１７は、映像解析部１１３により特定される、参照用映像データの映像の特徴の一例を示す図である。具体的には、図１７に示す映像の特徴は、参照用映像データの映像のジャンルが講義映像である場合の映像の特徴の例である。図１７（ａ）は、映像解析部１１３により特定される映像の特徴の一例を示す図であって、映像内において、講演者１５０１が指し棒１５０２でホワイトボード１５０３を指しているか否かの状態１７０１を示す図である。図１７（ｂ）は、映像解析部１１３により特定される映像の特徴の一例を示す図であって、講演者１５０１の体の向きの状態１７０２を示す図である。図１７（ｃ）は、映像解析部１１３により特定される映像の特徴の一例を示す図であって、講演者１５０１の声の抑揚の経時変化の一例を、抑揚曲線１７０３を用いて示す図である。映像解析部１１３は、映像の再生時刻に対応する所定の期間における講演者１５０１の声の抑揚を音声データに基づいて解析することにより、抑揚曲線１７０３を取得する。

図１８は、映像解析部１１３が生成する映像効果特定用データ１８００の一例を示す図である。具体的には、図１８は、参照用映像データの映像のジャンルが講義映像である場合の映像効果特定用データ１８００の例である。映像特徴１８０１、及び、映像効果１８０２のそれぞれは、映像解析部１１３が特定した映像の特徴及び映像効果である。また、人気度１８０３は、人気度取得部１１２が取得した人気度である。情報処理装置１００は、対象映像データの映像のジャンルが講義映像である場合、図１８に一例として示す映像効果特定用データ１８００に基づいて、対象映像データに映像効果を付与する。対象映像データへの映像効果の付与方法は実施形態１に係る情報処理装置１００における映像効果の付与方法と同様であるため、説明を省略する。

［その他の実施形態］
本開示は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

［本開示の構成］
＜構成１＞
動画像データを少なくとも含む編集対象映像データの特徴を示す対象特徴情報を取得する対象取得手段と、
前記対象特徴情報が示す特徴に類似する特徴を含む参照用映像データであって、人気度が所定の条件を満たす前記参照用映像データに含まれる映像効果を示す参照効果情報を取得する効果取得手段と、
前記参照効果情報が示す映像効果と同一又は類似の映像効果を前記編集対象映像データに付与する付与手段と、
を有することを特徴とする情報処理装置。

＜構成２＞
前記対象取得手段は、前記編集対象映像データに含まれる前記動画像データを解析することにより、前記対象特徴情報を取得すること
を特徴とする構成１に記載の情報処理装置。

＜構成３＞
前記対象取得手段は、前記編集対象映像データに含まれる前記動画像データに基づいて、当該動画像データが示す動画像に映る人物の動作及び表情、並びに、当該動画像に映る視聴者からのコメントの少なくいずれかを解析することにより、前記対象特徴情報を取得すること
を特徴とする構成２に記載の情報処理装置。

＜構成４＞
前記編集対象映像データは、前記編集対象映像データに含まれる前記動画像データと同期して再生される音声データを含み、
前記対象取得手段は、前記編集対象映像データに含まれる前記音声データを解析することにより、前記対象特徴情報を取得すること
を特徴とする構成１乃至３のいずれか１つに記載の情報処理装置。

＜構成５＞
前記対象取得手段は、前記編集対象映像データに含まれる前記音声データに基づいて、前記編集対象映像データが示す映像に登場する人物の声の大きさ及び抑揚、並びに、前記人物の発話内容の少なくいずれかを解析することにより、前記対象特徴情報を取得すること
を特徴とする構成４に記載の情報処理装置。

＜構成６＞
前記編集対象映像データの映像のジャンルを特定する対象ジャンル特定手段、
を更に有し、
前記効果取得手段は、前記編集対象映像データの映像のジャンルと同一の映像のジャンルの前記参照用映像データに含まれる映像効果を示す前記参照効果情報を取得すること
を特徴とする構成１乃至５のいずれか１つに記載の情報処理装置。

＜構成７＞
前記対象ジャンル特定手段は、前記編集対象映像データに予め対応付けられたタグ情報に基づいて、前記編集対象映像データの映像のジャンルを特定すること
を特徴とする構成６に記載の情報処理装置。

＜構成８＞
前記対象ジャンル特定手段は、前記編集対象映像データを解析することにより、前記編集対象映像データの映像のジャンルを特定すること
を特徴とする構成６に記載の情報処理装置。

＜構成９＞
前記付与手段は、前記参照効果情報が示す映像効果が付与されている前記参照用映像データの区間における前記参照用映像データの特徴に類似する特徴を含む前記編集対象映像データにおける区間に対して、前記参照効果情報に基づいて前記編集対象映像データに映像効果を付与すること
を特徴とする構成１乃至８のいずれか１つに記載の情報処理装置。

＜構成１０＞
前記人気度は、前記参照用映像データの再生回数、前記参照用映像データの視聴者からのコメント数、及び前記参照用映像データに投じられた投げ銭の額の少なくともいずれかに基づいて算出される値であること
を特徴とする構成１乃至９のいずれか１つに記載の情報処理装置。

＜構成１１＞
前記参照効果情報が示す映像効果は、動画像へのテロップの挿入、動画像の色調変更、動画像のフェードイン、動画像のフェードアウト、動画像へのフィルタ付与、音声への効果音の挿入、及び音声へのＢＧＭの挿入、少なくともいずれかであること
を特徴とする構成１乃至１０のいずれか１つに記載の情報処理装置。

＜構成１２＞
前記参照用映像データは、映像配信サービスから配信される映像データであること
を特徴とする構成１乃至１１のいずれか１つに記載の情報処理装置。

＜構成１３＞
前記参照用映像データは、前記映像配信サービスから配信される映像データのうちのユーザにより指定された映像データであること
を特徴とする構成１２に記載の情報処理装置。

＜構成１４＞
前記参照用映像データを取得する参照データ取得手段と、
取得した前記参照用映像データの前記人気度を取得する人気度取得手段と、
前記参照用映像データを解析して、前記参照用映像データの特徴と、前記参照用映像データに含まれる映像効果とを特定する特定手段と、
前記特定された特徴及び映像効果のそれぞれを示す情報と、前記人気度とを互いに対応付けた参照特徴情報を生成する情報生成手段と、
を更に有し、
前記効果取得手段は、前記参照特徴情報に基づいて前記参照効果情報を取得すること
を特徴とする構成１乃至１３のいずれか１つに記載の情報処理装置。

＜構成１５＞
動画像データを少なくとも含む編集対象映像データの特徴を示す対象特徴情報を取得する対象取得工程と、
前記対象特徴情報が示す特徴に類似する特徴を含む参照用映像データであって、人気度が所定の条件を満たす前記参照用映像データに含まれる映像効果を示す参照効果情報を取得する効果取得工程と、
前記参照効果情報が示す映像効果と同一又は類似の映像効果を前記編集対象映像データに付与する付与工程と、
を含むことを特徴とする情報処理方法。

＜構成１６＞
コンピュータを、構成１乃至１４のいずれか１つに記載の情報処理装置として機能させるためのプログラム。

１００情報処理装置
１０２映像解析部
１０３効果取得部
１０４効果付与部

Claims

動画像データを少なくとも含む編集対象映像データの特徴を示す対象特徴情報を取得する対象取得手段と、
前記対象特徴情報が示す特徴に類似する特徴を含む参照用映像データであって、人気度が所定の条件を満たす前記参照用映像データに含まれる映像効果を示す参照効果情報を取得する効果取得手段と、
前記参照効果情報が示す映像効果と同一又は類似の映像効果を前記編集対象映像データに付与する付与手段と、
を有することを特徴とする情報処理装置。
前記対象取得手段は、前記編集対象映像データに含まれる前記動画像データを解析することにより、前記対象特徴情報を取得すること
を特徴とする請求項１に記載の情報処理装置。
前記対象取得手段は、前記編集対象映像データに含まれる前記動画像データに基づいて、当該動画像データが示す動画像に映る人物の動作及び表情、並びに、当該動画像に映る視聴者からのコメントの少なくいずれかを解析することにより、前記対象特徴情報を取得すること
を特徴とする請求項２に記載の情報処理装置。
前記編集対象映像データは、前記編集対象映像データに含まれる前記動画像データと同期して再生される音声データを含み、
前記対象取得手段は、前記編集対象映像データに含まれる前記音声データを解析することにより、前記対象特徴情報を取得すること
を特徴とする請求項１に記載の情報処理装置。
前記対象取得手段は、前記編集対象映像データに含まれる前記音声データに基づいて、前記編集対象映像データが示す映像に登場する人物の声の大きさ及び抑揚、並びに、前記人物の発話内容の少なくいずれかを解析することにより、前記対象特徴情報を取得すること
を特徴とする請求項４に記載の情報処理装置。
前記編集対象映像データの映像のジャンルを特定する対象ジャンル特定手段、
を更に有し、
前記効果取得手段は、前記編集対象映像データの映像のジャンルと同一の映像のジャンルの前記参照用映像データに含まれる映像効果を示す前記参照効果情報を取得すること
を特徴とする請求項１に記載の情報処理装置。
前記対象ジャンル特定手段は、前記編集対象映像データに予め対応付けられたタグ情報に基づいて、前記編集対象映像データの映像のジャンルを特定すること
を特徴とする請求項６に記載の情報処理装置。
前記対象ジャンル特定手段は、前記編集対象映像データを解析することにより、前記編集対象映像データの映像のジャンルを特定すること
を特徴とする請求項６に記載の情報処理装置。
前記付与手段は、前記参照効果情報が示す映像効果が付与されている前記参照用映像データの区間における前記参照用映像データの特徴に類似する特徴を含む前記編集対象映像データにおける区間に対して、前記参照効果情報に基づいて前記編集対象映像データに映像効果を付与すること
を特徴とする請求項１に記載の情報処理装置。
前記人気度は、前記参照用映像データの再生回数、前記参照用映像データの視聴者からのコメント数、及び前記参照用映像データに投じられた投げ銭の額の少なくともいずれかに基づいて算出される値であること
を特徴とする請求項１に記載の情報処理装置。
前記参照効果情報が示す映像効果は、動画像へのテロップの挿入、動画像の色調変更、動画像のフェードイン、動画像のフェードアウト、動画像へのフィルタ付与、音声への効果音の挿入、及び音声へのＢＧＭの挿入、少なくともいずれかであること
を特徴とする請求項１に記載の情報処理装置。
前記参照用映像データは、映像配信サービスから配信される映像データであること
を特徴とする請求項１に記載の情報処理装置。
前記参照用映像データは、前記映像配信サービスから配信される映像データのうちのユーザにより指定された映像データであること
を特徴とする請求項１２に記載の情報処理装置。
前記参照用映像データを取得する参照データ取得手段と、
取得した前記参照用映像データの前記人気度を取得する人気度取得手段と、
前記参照用映像データを解析して、前記参照用映像データの特徴と、前記参照用映像データに含まれる映像効果とを特定する特定手段と、
前記特定された特徴及び映像効果のそれぞれを示す情報と、前記人気度とを互いに対応付けた参照特徴情報を生成する情報生成手段と、
を更に有し、
前記効果取得手段は、前記参照特徴情報に基づいて前記参照効果情報を取得すること
を特徴とする請求項１に記載の情報処理装置。
動画像データを少なくとも含む編集対象映像データの特徴を示す対象特徴情報を取得する対象取得工程と、
前記対象特徴情報が示す特徴に類似する特徴を含む参照用映像データであって、人気度が所定の条件を満たす前記参照用映像データに含まれる映像効果を示す参照効果情報を取得する効果取得工程と、
前記参照効果情報が示す映像効果と同一又は類似の映像効果を前記編集対象映像データに付与する付与工程と、
を含むことを特徴とする情報処理方法。
コンピュータを、請求項１乃至１４のいずれか１項に記載の情報処理装置として機能させるためのプログラム。