JP2021157007A - フォトムービー生成システム、フォトムービー生成装置、ユーザ端末、フォトムービー生成方法、及びプログラム - Google Patents

フォトムービー生成システム、フォトムービー生成装置、ユーザ端末、フォトムービー生成方法、及びプログラム Download PDF

Info

Publication number
JP2021157007A
JP2021157007A JP2020055808A JP2020055808A JP2021157007A JP 2021157007 A JP2021157007 A JP 2021157007A JP 2020055808 A JP2020055808 A JP 2020055808A JP 2020055808 A JP2020055808 A JP 2020055808A JP 2021157007 A JP2021157007 A JP 2021157007A
Authority
JP
Japan
Prior art keywords
music
photo movie
server
image
user terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020055808A
Other languages
English (en)
Other versions
JP7456232B2 (ja
Inventor
健秀 岸本
Takehide Kishimoto
健秀 岸本
健二朗 村田
Kenjiro Murata
健二朗 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2020055808A priority Critical patent/JP7456232B2/ja
Publication of JP2021157007A publication Critical patent/JP2021157007A/ja
Application granted granted Critical
Publication of JP7456232B2 publication Critical patent/JP7456232B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

【課題】 ユーザの好みの楽曲をフォトムービー付きで再生可能とし、ユーザが楽しんで音楽を視聴することができるフォトムービー生成システム等を提供する。【解決手段】 フォトムービー生成システム1において、サーバ2は、音響解析部22、画像取得部23、画像素材生成部24、及びフォトムービー生成部25等を備え、ユーザ端末3は、楽曲指定部31、画像指定部32、送信部33、及び受信部34等を備える。ユーザ端末3において楽曲及び画像を指定してサーバ2に音源データ(または楽曲ID)や画像データを送信すると、サーバ2は音源データの音響特徴量データ45を取得し、音響特徴量データ45から検出できる楽曲構成の変化に応じて画面が変化するフォトムービーを生成し、ユーザ端末3に送信する。ユーザ端末3はフォトムービーを音源データと同期再生する。【選択図】図4

Description

本発明は、フォトムービーを生成し、提供するフォトムービー生成システム等に関する。
クラウドフォトストレージサービスにおいて、クラウドストレージに保存されている写真を使用してフォトムービーを自動作成するサービスが提供されている(非特許文献1)。例えば、非特許文献1のクラウドフォトストレージサービスでは、ユーザがクラウドストレージに保存した画像からムービーにしたい写真や動画を選択し、予め用意されているいくつかのテーマの中から所望のテーマを選択すると、サービス側でムービーが自動生成される。
また、撮影した動画に印象の合った楽曲を付与する手法が報告されている(非特許文献2)。非特許文献2には、撮影した動画の特徴量(動画特徴量)を抽出し、音楽の特徴量(音楽特徴量)を抽出し、動画とメロディ・リズムの印象の関係性を算出し、ユーザの印象に合った楽曲を生成する手法が提案されている。
一方、特許文献1には、任意の音響データにおける印象またはタイミングを表す音響表現を取得する表現取得部と、音響表現に応じた視覚効果等を画像等に付与する効果付与部と、音響データ及び効果を付与した画像等を再生するディスプレイと、を備える音響再生装置について記載されている。これにより、市販の音楽データ等の音響コンテンツの音響表現を取得して、音響表現に応じた視覚効果等の付与を可能としている。
特開2013−114088号公報
Google(登録商標)フォト、"ムービーを作成"、[online]、[令和2年3月23日検索]、インターネット〈URL:https://photos.***.com/movies/create〉 清水柚里奈、他4名、"動画特徴量からの印象推定に基づく動画BGMの自動素材選出"、NICOGRAPH 2016,pp177-184
しかしながら、上述の非特許文献1のムービー作成機能では、フォトムービーに付加する音楽(BGM)をユーザが選択することも可能であるが、選択できる音楽は、デフォルトのカテゴリー単位(dramatic、electronic、rockin'、upbeat、…等)か、或いはユーザ端末内の音楽アプリにある音楽のうちDRM(Digital
Rights Management;デジタル著作権管理)で保護されていない楽曲のみとしている。また、非特許文献2の提案手法は、動画の印象に合った楽曲を生成する手法である。よって、いずれの手法も市販のCDや音楽配信サービスによって得た楽曲をフォトムービーのBGMに使用することができない。これに対し、特許文献1の手法は、市販の音楽データから音響表現を抽出し、音響表現に応じた視覚効果等の付与を可能とするものであるが、表現に対して設定された視覚効果が固定的であるため、何度か視聴するとユーザが飽きてしまうおそれがある。
本発明は上記の問題に鑑みてなされたものであり、ユーザの好みの楽曲をフォトムービー付きで再生可能とし、ユーザが楽しんで音楽を視聴することができるフォトムービー生成システム等を提供することを目的とする。
前述した課題を解決するための第1の発明は、サーバとユーザ端末とがネットワークを介して通信接続されたフォトムービー生成システムであって、前記ユーザ端末は、フォトムービーに使用する楽曲の指定を受け付け、指定された楽曲の音源データまたは楽曲の識別情報である楽曲IDを前記サーバに送信する楽曲指定手段と、前記サーバから送信されたフォトムービーを受信し、再生する再生手段と、を備え、前記サーバは、前記ユーザ端末において指定された楽曲の音響特徴量データを取得する音響特徴量データ取得手段と、前記フォトムービーに使用する画像を取得する画像取得手段と、前記画像取得手段により取得した画像を使用し、前記音響特徴量データに基づき楽曲の変化に応じて表示が変化するフォトムービーを生成し、前記ユーザ端末に送信するフォトムービー生成手段と、を備えることを特徴とするフォトムービー生成システムである。
第1の発明によれば、サーバは、ユーザ端末において指定された楽曲の音響特徴量データを取得し、フォトムービーに使用する画像を取得すると、取得した画像を使用し、音響特徴量データに基づき楽曲の変化に応じて表示が変化するフォトムービーを生成し、ユーザ端末に送信する。ユーザ端末は、フォトムービーを受信して生成する。これにより、ユーザが指定した楽曲に対し、楽曲の変化に応じて表示が変化するフォトムービーを生成してユーザ端末に提供できるため、ユーザは、好きな楽曲をフォトムービー付きで視聴できる。このため、ユーザは音楽視聴をより楽しむことができる。
第1の発明のフォトムービー生成システムにおいて、前記サーバは、前記フォトムービーを構成する情報であるムービー構成情報を前記楽曲IDに紐づけて記憶する記憶手段を備え、前記フォトムービー生成手段は、指定された楽曲IDに紐づけて記憶されたムービー構成情報を参照し、前記記憶手段に記憶されているムービー構成情報と異なる構成のフォトムービーを生成する。これにより、同じ楽曲に対し異なるムービー表現を生成してユーザ端末に提供できるため、ユーザに多様な楽しみを提供できる。
また、前記サーバの記憶手段は、前記楽曲の音響特徴量データを前記楽曲IDと紐づけて記憶し、前記音響特徴量データ取得手段は、前記記憶手段に記憶されている音響特徴量データを取得することを特徴とすることが望ましい。これにより、一度解析した楽曲については音響解析を省略することができるため、短時間でフォトムービーを提供できる。また、前記サーバの音響特徴量データ取得手段は、前記ユーザ端末において指定された楽曲の音響特徴量データをネットワークを介して通信接続された音楽配信サーバから取得するようにしてもよい。これによりサーバ側で音響解析処理を行うことなく音響特徴量データを取得でき、サーバの負荷を軽減できる。
また、前記サーバは、楽曲の音響解析処理を行って音響特徴量データを得る音響解析手段を更に備え、前記音響特徴量データ取得手段は、前記音響解析手段により得た音響特徴量データを取得するようにしてもよい。この際、前記サーバは、前記楽曲の音源データをネットワークを介して通信接続された音楽配信サーバから取得してもよいし、前記ユーザ端末から取得してもよい。これにより、ユーザの所望の楽曲に合ったフォトムービーを生成できる。
また、前記サーバのフォトムービー生成手段は、前記フォトムービーを音源を付加せずに生成し、前記楽曲の楽曲IDと紐づけて出力し、前記ユーザ端末の再生手段は、前記フォトムービーに紐づけられた楽曲IDに対応する楽曲の音源データを取得し、取得した音源データと前記フォトムービーとを同期して再生することが望ましい。これにより、音楽付きフォトムービーよりファイルサイズの小さいフォトムービーを生成でき、フォトムービーを保存するためのストレージ容量を節約できる。
また、前記サーバは、前記画像取得手段により取得した画像から画像素材を生成する画像素材生成手段を更に備え、前記フォトムービー生成手段は、前記画像素材生成手段により生成された画像素材を使用して前記フォトムービーを生成することが望ましい。
また、前記ユーザ端末は、前記フォトムービーに使用する画像を前記サーバに送信する画像送信手段を更に備え、前記サーバの画像取得手段は、前記ユーザ端末から送信された画像を受信することが望ましい。これにより、ユーザが指定した画像やその画像から生成された画像素材を使用してフォトムービーを生成できる。
第2の発明は、画像を取得する画像取得手段と、楽曲の音響特徴量データを取得する音響特徴量データ取得手段と、前記画像取得手段により取得した画像を使用し、前記音響特徴量データに基づき楽曲の変化に応じて表示が変化するフォトムービーを生成するフォトムービー生成手段と、を備えることを特徴とするフォトムービー生成装置である。
第2の発明により、楽曲の音響特徴量データに基づいて楽曲の変化に応じて表示が変化するフォトムービーを生成することが可能となる。
第3の発明は、画像を取得する画像取得手段と、楽曲の音源データを取得する音源データ取得手段と、前記音源データを解析して音響特徴量データを取得する音響解析手段と、前記画像取得手段により取得した画像を使用し、前記音響特徴量データに基づき楽曲の変化に応じて表示が変化するフォトムービーを生成するフォトムービー生成手段と、を備えることを特徴とするフォトムービー生成装置である。
第3の発明により、取得した音源データについて音響解析を実施して音響特徴量データを取得し、音響特徴量データに基づいて楽曲の変化に応じて表示が変化するフォトムービーを生成することが可能となる。
第4の発明は、サーバとネットワークを介して通信接続可能なユーザ端末であって、楽曲の指定を受け付け、指定された楽曲の音源データまたは楽曲の識別情報である楽曲IDを前記サーバに送信する楽曲指定手段と、前記サーバから送信された、前記楽曲の変化に応じて表示が変化するフォトムービーを受信し、再生する再生手段と、を備えることを特徴とするユーザ端末である。
第4の発明により、ユーザ端末において、楽曲を指定してサーバに楽曲の音源データまたは楽曲の識別情報である楽曲IDをサーバに送信すると、前記楽曲の変化に応じて表示が変化するフォトムービーをサーバから受信し、再生することが可能となる。
第5の発明は、サーバとユーザ端末とがネットワークを介して通信接続されたフォトムービー生成システムにおけるフォトムービー生成方法であって、前記ユーザ端末が、フォトムービーに使用する楽曲の指定を受け付け、指定された楽曲の音源データまたは楽曲の識別情報である楽曲IDを前記サーバに送信するステップと、前記サーバが、画像を取得するステップと、前記サーバが、前記ユーザ端末において指定された楽曲の音響特徴量データを取得するステップと、前記サーバが、前記画像を使用し、前記音響特徴量データに基づき楽曲の変化に応じて表示が変化するフォトムービーを生成し、前記ユーザ端末に送信するステップと、前記ユーザ端末が、前記サーバから送信されたフォトムービーを受信し、再生するステップと、を含むことを特徴とするフォトムービー生成方法である。
第5の発明によれば、サーバは、ユーザ端末において指定された楽曲の音響特徴量データを取得し、フォトムービーに使用する画像を取得すると、取得した画像を使用し、音響特徴量データに基づき楽曲の変化に応じて表示が変化するフォトムービーを生成し、ユーザ端末に送信する。ユーザ端末は、フォトムービーを受信して生成する。これにより、ユーザが指定した楽曲に対し、楽曲の変化に応じて表示が変化するフォトムービーを生成してユーザ端末に提供できるため、ユーザは、好きな楽曲をフォトムービー付きで視聴できる。このため、ユーザは音楽視聴をより楽しむことができる。
第6の発明は、コンピュータを、画像を取得する画像取得手段、楽曲の音響特徴量データを取得する音響特徴量データ取得手段、前記画像取得手段により取得した画像を使用し、前記音響特徴量データに基づき楽曲の変化に応じて表示が変化するフォトムービーを生成するフォトムービー生成手段、として機能させるためのプログラムである。
第6の発明により、コンピュータを第2の発明のフォトムービー生成装置として機能させることが可能となる。
第7の発明は、コンピュータを、画像を取得する画像取得手段、楽曲の音源データを取得する音源データ取得手段、前記音源データを解析して音響特徴量データを取得する音響解析手段、前記画像取得手段により取得した画像を使用し、前記音響特徴量データに基づき楽曲の変化に応じて表示が変化するフォトムービーを生成するフォトムービー生成手段、として機能させるためのプログラムである。
第7の発明により、コンピュータを第3の発明のフォトムービー生成装置として機能させることが可能となる。
第8の発明は、サーバとネットワークを介して通信接続可能なコンピュータを、楽曲の指定を受け付け、指定された楽曲の音源データまたは楽曲の識別情報である楽曲IDを前記サーバに送信する楽曲指定手段、前記サーバから送信された、前記楽曲の変化に応じて表示が変化するフォトムービーを受信し、再生する再生手段、として機能させるためのプログラムである。
第8の発明により、コンピュータを第1及び第4の発明のユーザ端末として機能させることが可能となる。
本発明により、ユーザの好みの楽曲をフォトムービー付きで再生可能とし、ユーザが楽しんで音楽を視聴することができるフォトムービー生成システム等を提供することが可能となる。
フォトムービー生成システム1の全体構成を示す図 サーバ2のハードウェア構成を示す図 ユーザ端末3のハードウェア構成を示す図 フォトムービー生成システム1の機能構成を示す図 音響特徴量データ45のデータ構成例を示す図 フォトムービー生成システム1が実行する処理の流れを示すフローチャート 音響解析処理の流れを示すフローチャート エフェクトテンプレート221の例を示す図 エフェクト対応テーブル223の例を示す図 フォトムービー生成処理の流れを示すフローチャート フォトムービー61、62、63の例を示す図 ムービー構成情報224の例を示す図 フォトムービー生成システム1Aの全体構成を示す図 音楽配信サーバ4のハードウェア構成を示す図 フォトムービー生成システム1Aの機能構成を示す図 音源データ44のデータ構成例を示す図 フォトムービー生成システム1Aが実行する処理の流れを示すフローチャート
以下、図面に基づいて本発明の好適な実施形態について詳細に説明する。
[第1の実施形態]
図1は本発明の第1の実施形態に係るフォトムービー生成システム1の全体構成を示す図である。図1に示すように、本発明に係るフォトムービー生成システム1は、ユーザ端末3及びサーバ2がネットワーク5を介して通信接続される。サーバ2は、ユーザ端末3からの要求に応答してフォトムービーを生成するコンピュータ(フォトムービー生成装置)であり、ユーザ端末3と通信接続される。
ユーザ端末3は、ユーザが利用する電子機器であり、フォトムービー生成システム1を利用するための専用のアプリケーションプログラム(以下、フォトムービーアプリという)を搭載する。またはユーザ端末3は、サーバ2がネットワーク5上に開設したWEBサイトを閲覧可能なブラウザを搭載し、WEBサイトを介してサーバ2との間で処理を行うことによりフォトムービーの注文及び受信を行うものとしてもよい。ユーザ端末3は、例えば、スマートフォンやタブレット、PC、音楽プレーヤー、ゲーム機等により構成される。
図2は、サーバ2の構成を示す図である。図に示すように、サーバ2は、例えば制御部201、記憶部202、通信部203等をバス204等により接続して構成したコンピュータにより実現できる。但しこれに限ることなく、適宜様々な構成をとることができる。
制御部201は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等により構成される。CPUは、記憶部202、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス204を介して接続された各部を駆動制御する。ROMは、コンピュータのブートプログラムやBIOS等のプログラム、データ等を恒久的に保持する。RAMは、ロードしたプログラムやデータを一時的に保持するとともに、制御部201が各種処理を行うために使用するワークエリアを備える。制御部201は、上記プログラムを読み出して実行することにより、サーバ2の各手段として機能する。
記憶部202は、例えば、ハードディスクドライブやソリッドステートドライブ、フラッシュメモリ等の記憶装置である。記憶部202には制御部201が実行するプログラムや、プログラム実行に必要なデータ、オペレーティングシステム等が格納されている。これらのプログラムコードは、制御部201により必要に応じて読み出されてRAMに移され、CPUに読み出されて実行される。また、サーバ2の記憶部202には、図4に示すように、エフェクトテンプレート221、一般画像素材222、エフェクト対応テーブル223、及びムービー構成情報224等のフォトムービーの生成に必要なデータが記憶される。これらのデータの詳細については後述する。
通信部203は、通信制御装置、通信ポート等を有し、ネットワーク5等との通信を制御する。ネットワーク5は、LAN(Local Area Network)や、より広域に通信接続されたWAN(Wide
Area Network)、またはインターネット等の公衆の通信回線、基地局等を含む。ネットワーク5は有線、無線を問わない。サーバ2はネットワーク5を介してユーザ端末3と通信接続し、各種のデータを送受信可能である。
バス204は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
図3は、ユーザ端末3の構成を示す図である。図に示すように、ユーザ端末3は、例えば制御部301、記憶部302、通信部303、表示部304、入力部305、周辺機器I/F部306、及び音声出力部307等をバス308等により接続して構成したコンピュータ等により実現できる。但しこれに限ることなく、適宜様々な構成をとることができる。制御部301、記憶部302、通信部303の構成は、サーバ2の制御部201、記憶部202、通信部203の構成と同様である。
表示部304は、例えば液晶パネル、CRTモニタ等のディスプレイ装置と、ディスプレイ装置と連携して表示処理を実行するための論理回路(ビデオアダプタ等)で構成され、制御部301の制御により入力された表示情報をディスプレイ装置上に表示させる。なお、入力部305及び表示部304は、表示画面にタッチパネル等の入力装置を一体的に設けたタッチパネルディスプレイとしてもよい。
入力部305は、例えば、タッチパネル、キーボード、マウス等のポインティング・デバイス、テンキー等の入力装置であり、入力されたデータを制御部301へ出力する。
周辺機器I/F(インタフェース)部306は、周辺機器を接続させるためのポートであり、周辺機器I/F部306を介して周辺機器とのデータの送受信を行う。周辺機器I/F部306は、USB等で構成されており、通常複数の周辺機器I/Fを有する。周辺機器との接続形態は有線、無線を問わない。
音声出力部307は、制御部301から入力された音声データをスピーカから出力する。
なお、ユーザ端末3の記憶部302には後述する処理(図6)を実施するためのアプリケーションプログラム(フォトムービーアプリ)が格納され、このアプリケーションプログラムに従って後述する処理をユーザ端末3の制御部301が実行する。
次に、図4を参照してフォトムービー生成システム1の機能構成について説明する。図4に示すように、フォトムービー生成システム1において、サーバ2は、上述の記憶部202の他、音源データ取得部21、音響解析部22、画像取得部23、画像素材生成部24、及びフォトムービー生成部25等を備える。ユーザ端末3は、上述の記憶部302、表示部304、音声出力部307の他、楽曲指定部31、画像指定部32、送信部33、及び受信部34等を備える。
ユーザ端末3の楽曲指定部31は、ユーザから楽曲の指定を受け付ける。第1の実施形態において楽曲指定部31は、ユーザ端末3の記憶部302に記憶されている音源データ、或いはCD等から読み取った音源データの中からユーザの操作によって楽曲を指定する。
画像指定部32は、ユーザからフォトムービーの画像素材として使用する画像の指定を受け付ける。指定する画像は、ユーザ端末3の記憶部302に記憶されている画像でもよいし、サーバ2の記憶部302に記憶されている一般画像素材222から指定してもよい。サーバ2の記憶部302に記憶されている一般画像素材222を指定する場合、例えば、サーバ2はユーザ端末3に対して一般画像素材222を選択するための画像選択画面を送信し、ユーザによる選択を受け付ける。
送信部33は、楽曲指定部31により指定された楽曲の音源データや画像指定部32により指定された画像データを記憶部302から取得してサーバ2に送信する。指定画像がサーバ2の一般画像素材222である場合は、画像の指定情報(画像の識別情報等)を送信する。
記憶部302には、楽曲の音源データが楽曲の識別情報である楽曲IDと紐づけて記憶される。楽曲の音源データはCDから読み込んだ音源データ、或いは音楽配信サービスのサーバからダウンロードした音源データ等である。また、記憶部302には、画像データが記憶される。画像データは、ユーザがカメラで撮影した画像やスキャナで読み取った画像、またはネットワーク5を介してダウンロードした画像等である。
楽曲IDは、例えば、アルバム名+アーティスト名+曲名+再生時間等の複合情報を使用する。音楽CDデータベース(CDDB;Compact Disc DataBase)では、アルバム名、アーティスト名、及び曲名がDisc
IDと紐づけて管理されている。ユーザ端末3に搭載されている音楽アプリは、音楽CDのTOC(Table of Contents)という領域に記録されている情報からDisc IDを算出し、ネットワーク5を介して音楽CDデータベースにアクセスして、Disc IDに対応するアルバム名、アーティスト名、及び曲名を得ることができる。本実施形態では、このようにして得たアルバム名、アーティスト名、及び曲名と、楽曲の再生時間等とを複合した情報を楽曲IDとして使用するものとする。
サーバ2の音源データ取得部21は、ユーザ端末3から送信された音源データ及び楽曲IDを取得する。
音響解析部22は、音源データ取得部21が取得した音源データについて音響解析処理を行い、音響特徴量データ45を取得する。
ここで、音響解析部22による音響解析処理及び音響特徴量データ45について説明する。図5は音響特徴量データ45の一例を示す図である。音響解析処理では、楽曲構成(Aメロ、Bメロ、サビ等)、楽曲のテンポ(BPM;Beats Per Minute)、ビート(拍子)、特定の楽器の発音タイミング等の特徴量が解析される。また、これらに加え、和音進行(音楽の持つ曲調の流れ)、音量変化(聴感上の音量変化)、周波数重心(音楽の盛り上がり度合い)、音程パワー分離(音楽の持つ複雑さ)等の特徴量について解析してもよい。
音響解析処理は、公知の手法(例えば、株式会社CRI・ミドルウェア、“超高速・高精度
楽曲解析ミドルウェアBEATWIZ(登録商標)”、[onine]、[令和2年3月15日検索]、インターネット、< URL :https://www.cri-mw.co.jp/product/amusement/beatwiz/index.html>、または、堀内直明、他5名共著、"Song
Surfing:類似フレーズで音楽ライブラリを散策する音楽再生システム"、PIONEER R&D(Vol.17,No.2/2007)等)を利用して行うことができる。なお、図5に示す音響特徴量データ45は、一例であり、これに限定されない。音響解析部22は、図5に示す音響特徴量データ45の各項目以外の特徴量についても解析してもよい。
音響解析部22は、音響解析処理の結果、取得した音響特徴量データ45をフォトムービー生成部25に出力するとともに、記憶部202に楽曲IDと紐づけて記憶する。なお、音響解析部22は、一度音響解析処理を実施した楽曲については、記憶部202に記憶されている音響特徴量データ45を取得するのみとする。これにより、音響解析処理に要するサーバ2の負荷を削減でき、かつ処理時間を低減できる。
画像取得部23は、ユーザ端末3から送信された画像データ、または一般画像素材222の指定情報を取得する。一般画像素材222の指定情報を取得した場合は、指定情報に従って記憶部202から一般画像素材222を取得する。
画像素材生成部24は、画像取得部23により取得した画像データから画像素材を生成する。画像素材生成部24は、例えば、写真等の画像データから人物、動物、物品等の対象物を検出し、検出した対象物を切り出してそれぞれ個々の画像素材とする。画像素材生成部24は、生成した画像素材をフォトムービー生成部25に出力する。
フォトムービー生成部25は、画像取得部23により取得した画像または画像素材生成部24により生成した画像素材を使用し、音響解析部22から取得した音響特徴量データ45に基づき楽曲の変化に応じて表示が変化するフォトムービーを生成する。フォトムービー生成部25は、記憶部202に記憶されているエフェクト対応テーブル223及びエフェクトテンプレート221を参照して楽曲の変化に応じて表示が変化するフォトムービーを生成する。楽曲の変化は、音響特徴量データ45の「楽曲構成」や「特定の楽器の発音タイミング」等から検出される。フォトムービー生成処理の詳細については、後述する。
なお、フォトムービー生成部25が生成するフォトムービーは、音楽付きフォトムービーまたは音楽無しフォトムービーである。音楽付きフォトムービーはユーザ端末3から指定された楽曲の音源データをBGMとして付加したフォトムービーである。すなわち、映像データと音声データとが含まれるフォトムービーである。音楽無しフォトムービーは、楽曲の音源(BGM)を付加せずに映像データのみのフォトムービーである。音楽無しフォトムービーは再生時に楽曲の音源データと同期して再生される。
フォトムービー生成部25は、フォトムービーを生成すると、データ(映像データ)をmpeg4方式等で圧縮符号化し、ユーザ端末3において再生可能なデータ形式に変換する。そして、フォトムービーの構成を表す情報であるムービー構成情報224を楽曲IDと紐づけて記憶部202に記憶するとともに、フォトムービーのデータを楽曲IDと紐づけてユーザ端末3に送信する。
ユーザ端末3の受信部34は、サーバ2から送信されたフォトムービーを受信し、再生処理部35へ送る。
再生処理部35は、フォトムービーを再生する。音楽無しフォトムービーを受信した場合は、再生処理部35は、フォトムービーに紐づけられた楽曲IDに対応する楽曲の音源データを記憶部302から取得し、取得した音源データとフォトムービー(音楽無しフォトムービー)とを同期して再生する。再生処理部35は、フォトムービーを復号して符号化前の映像データとし、表示部304に表示するとともに、音源データを同期再生して音声出力部307から出力する。
音楽付きフォトムービーを受信した場合は、再生処理部35は、受信したフォトムービーのデータを復号して符号化前の映像データ及び音声データとし、映像を表示部304に表示するとともに、音声(音源)を音声出力部307から出力する。なお、フォトムービーの再生方法は、ストリーミング再生でもダウンロード再生でもよい。
次に、図6を参照して、フォトムービー生成システム1が実行する処理の流れを説明する。以下の説明では、ユーザ端末3の記憶部302には、フォトムービー生成システム1を利用するためのアプリであるフォトムービーアプリがインストールされ、ユーザ端末3の制御部301がこのフォトムービーアプリを読み出して実行する手順について説明する。
ユーザ端末3において、フォトムービーアプリを起動すると、ユーザ端末3の制御部301は、フォトムービーに使用する楽曲の指定(ステップS101)、及び画像の指定(ステップS102)を受け付ける。ステップS101〜ステップS102において、制御部301は、楽曲や画像を選択入力するための入力画面を表示してもよい。
第1の実施形態では、指定できる楽曲は、ユーザ端末3の記憶部302に記憶されている楽曲(音源データ)またはCDドライブにより読み取り可能な楽曲の音源データとする。また、指定できる画像は、ユーザ端末3の記憶部302に記憶されている画像、及びサーバ2に記憶されている一般画像素材222とする。
楽曲及び画像が指定されると、制御部301は、指定された音源データ及び画像データを記憶部302から取得し(ステップS103)、サーバ2に送信する(ステップS104)。なお、一般画像素材222が指定された場合は、制御部301は、指定された一般画像素材222の識別情報をサーバ2に送信する。
サーバ2は、音源データ及び画像データ(一般画像素材222が指定された場合は、一般画像素材222の識別情報)を受信すると(ステップS105)、制御部201(音響解析部22)は、受信した音源データについて音響解析処理を実行し、楽曲の音響特徴量データ45を取得する(ステップS106)。
図7は、音響解析処理の流れを示すフローチャートである。図7に示すように、制御部201(音響解析部22)は楽曲の音源データを取得し(ステップS201)、音響解析処理を実行する(ステップS202)。音響解析処理では、楽曲のテンポ(BPM;Beats Per Minute)、ビート(拍子)、楽曲構成(Aメロ、Bメロ、サビ等)、特定の楽器の発音タイミング等が解析される。
制御部201は、音響解析結果を音響特徴量データ45として、楽曲IDと紐づけて記憶部202に記憶する(ステップS203)。音響特徴量データ45を楽曲IDと紐づけてサーバ2に記憶しておくことにより、一度解析した楽曲について、2回目以降は解析が不要となる。
また、サーバ2の制御部201(画像素材生成部24)は、ステップS105で受信した画像データについて必要に応じて画像素材生成処理を実行し、画像データから画像素材を切り出す(ステップS107)。なお、受信した画像データをそのまま画像素材として使用してもよい。
サーバ2の制御部201(フォトムービー生成部25)は、画像素材と所定のエフェクトテンプレート221を使用し、音響特徴量データ45(例えば、「楽曲構成」の変化)に応じて画面が変化するフォトムービーを生成する(ステップS108)。
ここで、エフェクトテンプレート221及びエフェクト対応テーブル223について説明する。
エフェクトテンプレート221は、画像に所定の加工(エフェクト)を加えるためのプログラムであり、図8に示すように、複数のエフェクトテンプレート221がエフェクトNo.及び使用画像枚数と対応付けて記憶されている。
エフェクトテンプレート221は、例えば、複数の表示画像を順に切り替える「画像切替」、画像をモノクロからカラーに変化させる「モノクロ→カラー」、画像の透過率を変化させる「透過率変化」、画像の表示位置を画面内で移動させる「画面移動」、画像を回転させる「回転」、画像を拡大させる「拡大」、画像を縮小させる「縮小」、表示画面内における画像の表示割合を変化させる「表示割合変化」、画像を出現させる「出現」、画像を拡大させながら移動させる「拡大移動」、画像を拡大させながら回転させる「拡大回転」、画像を縮小させながら移動させる「縮小移動」、画像を縮小させながら回転させる「縮小回転」、小画像を徐々に増加させていく「小画像増加」、複数の画像を一画面内に表示する「複数画像一画面表示」、一画面内に複数表示させた画像をスライドさせる「複数画像一画面表示+スライド」等がある。
なお、図8に示すエフェクトテンプレート221は一例であり、他のエフェクトを含むものとしてもよい。また、各エフェクトについて移動量や変化の速さ等のパラメータを複数パターン用意してもよい。例えば、エフェクト「拡大」について、拡大率によって「拡大1」、「拡大2」、「拡大3」、…を用意したり、エフェクト「透過率変化」について、変化の速さによって「透過率変化1」、「透過率変化2」…を用意したりする。
制御部201(フォトムービー生成部25)は、フォトムービーを生成するにあたり、どのエフェクトを使用するかを、エフェクト対応テーブル223を参照して決定する。図9はエフェクト対応テーブル223の例を示す図である。エフェクト対応テーブル223は、楽曲構成要素(イントロ、Aメロ、Bメロ、Cメロ、ソロ、サビ等)とそれに適したエフェクトテンプレート221とを対応づけたテーブルであり、図9に示すように、複数のパターンが定義されている。
図9の例では、パターン(1)の場合、制御部201(フォトムービー生成部25)は、楽曲の「イントロ」でエフェクト「モノクロ→カラー」を適用し、楽曲の「Aメロ」でエフェクト「移動3」を適用し、楽曲の「Bメロ」でエフェクト「小画像増加」を適用し、楽曲の「Cメロ」で「複数画像一画面表示1」を適用し、楽曲の「ソロ」でエフェクト「拡大1」を適用し、楽曲の「サビ」でエフェクト「画像切替1」を適用する。
また、図9のパターン(2)の場合、制御部201(フォトムービー生成部25)は、楽曲の「イントロ」でエフェクト「画像切替1」を適用し、楽曲の「Aメロ」でエフェクト「縮小回転1」を適用し、楽曲の「Bメロ」でエフェクト「拡大回転1」を適用し、「Cメロ」でエフェクト「画面移動」を適用し、楽曲の「ソロ」でエフェクト「拡大2」を適用し、楽曲の「サビ」でエフェクト「画像切替2」を適用する。このように、複数のパターンのエフェクト適用例がエフェクト対応テーブル223に定義されている。
ステップS108において、制御部201(フォトムービー生成部25)は、エフェクト対応テーブル223のどのパターンでフォトムービーを生成するかを、例えば図10に示す処理により決定する。
図10に示すように、サーバ2の制御部201(フォトムービー生成部25)は、まず、楽曲IDに対応するムービー構成情報224が記憶部202に記憶されているか否かを判定する(ステップS301)。ムービー構成情報224は、フォトムービーに使用する画像データや画像の切替タイミング、画像に適用するエフェクト等のフォトムービーを構成するための情報が格納されたデータである(図12参照)。サーバ2で生成済みのフォトムービーについては、楽曲IDと対応づけてムービー構成情報224が記憶部202に記憶されている。
ステップS301において、ユーザ端末3から送信された音源データの楽曲IDに対応するムービー構成情報224が記憶部202に記憶されていない場合は(ステップS301;No)、その楽曲についてはフォトムービーを作成した履歴が無いため、サーバ2の制御部201は、エフェクト対応テーブル223から任意のパターンを読み出し(ステップS302)、読み出したパターンのエフェクト対応テーブル223に従ってフォトムービーを生成する(ステップS303)。
一方、ステップS301において、ユーザ端末3から送信された音源データの楽曲IDに対応するムービー構成情報224が既に記憶部202に記憶されている場合は(ステップS301;Yes)、制御部201は、エフェクト対応テーブル223から未使用のパターンを読み出し(ステップS304)、読み出したパターンのエフェクト対応テーブル223に従ってフォトムービーを生成する(ステップS303)。このように、フォトムービーを作成したことがある楽曲については、2回目以降は別のパターンのフォトムービーが作成される。このため、同じ楽曲に対し異なるムービー表現を生成することができ、ユーザに多様な楽しみを提供できる。
図11は、楽曲(音源データ44)について生成される様々なフォトムービー61、62、63の例を示す図である。図11(a)のフォトムービー61は、画像取得部23により取得した画像71、72、73、…をそのまま使用して生成したものである。楽曲(音源データ44)の楽曲構成が変化するタイミング(AメロからBメロに変わるタイミングt1、Bメロからサビに変わるタイミングt2等)で表示する画像が変更される。
また、図11(b)のフォトムービー62は、画像取得部23により取得した画像71、72、73、…にエフェクトテンプレート221を適用したものである。楽曲(音源データ44)の楽曲構成が変化するタイミング(AメロからBメロに変わるタイミングt1、Bメロからサビに変わるタイミングt2)で画像が変更されるとともに、各区間(t0〜t1、t1〜t2、t2〜)で所定のエフェクトが画像に施される。
図11(b)の例では、「Aメロ」の区間t0〜t1において画像71に対しエフェクト「モノクロ→カラー」が適用され、モノクロの画像71aからカラーの画像71bへと徐々に変更される。次に、AメロからBメロへ変わる時刻t1で画像が切り替えるとともにエフェクトも「縮小回転1」に変更される。区間t1〜t2では、背景に画像71、前景に画像72を使用し、前景画像72が画像72aの状態から画像72bの状態へ縮小回転するアニメーションが生成される。次に、Bメロからサビへ変わる時刻t2で画像が切り替えられるとともにエフェクトも「縮小回転2」に変更される。区間t2〜は、背景に画像71、前景に画像73を使用し、前景画像73が画像73aの状態から画像73bの状態へ縮小回転するアニメーションが生成される。
また、図11(c)のフォトムービー63は、画像取得部23により取得した画像74、76、79、…を背景画像とし、前景に画像素材75、77、81、82(画像素材生成部24により生成した画像素材)を使用して生成したものである。楽曲(音源データ44)の楽曲構成が変化するタイミング(AメロからBメロに変わるタイミングt1、Bメロからサビに変わるタイミングt2)で背景画像が変更されるとともに、各区間(t0〜t1、t1〜t2、t2〜)で前景画像に所定のエフェクトが施される。
図11(c)の例では、Aメロの区間t0〜t1において画像74が背景として表示され、前景の画像素材75に対しエフェクト「画面移動」が適用されて画像75a→75b→75cに移動する。次に、AメロからBメロへ変わる時刻t1で背景画像が画像76に切り替えられるとともに前景の画像素材77に対し、エフェクト「交互表示」が適用されて、画像77aと画像77bが交互に表示されるアニメーションが生成される。次に、Bメロからサビへ変わる時刻t2で背景画像が画像79に切り替えられるとともに前景の画像も画像素材81、82に変更される。区間t2〜は、前景の画像素材81、82に対し、エフェクト「出現」が適用されて、バスドラムの発音タイミングに合わせて画像素材81、82が順に出現するように表示される。
制御部201(フォトムービー生成部25)はフォトムービーを生成すると、生成したフォトムービーのムービー構成情報224を楽曲IDと紐づけて記憶部202に記憶する。ムービー構成情報224は、図12に示すように、楽曲IDと紐づけて、楽曲構成、時間、適用エフェクト、使用画像枚数、使用画像ファイル名が格納される。
図12の例は、楽曲ID「*****(アルバム名+アーティスト名+曲名+再生時間等)」の楽曲をBGMとするフォトムービーのムービー構成情報224である。楽曲構成「イントロ」の区間の時間は「0−15」であり、「モノクロ→カラー1」のエフェクトが適用される。このエフェクトでの使用画像枚数は「1」枚であり、使用する画像のファイル名は「image15」である。
また、楽曲構成「Aメロ」の区間の時間は「15−50」であり、「拡大回転3」のエフェクトが適用される。このエフェクトでの使用画像枚数は「2」枚であり、使用する画像のファイル名は、前景は「image8」(拡大回転する画像)、背景は「image2」である。
また、楽曲構成「Bメロ」の区間の時間は「50−70」であり、「縮小回転2」のエフェクトが適用される。このエフェクトでの使用画像枚数は「2」枚であり、使用する画像のファイル名は、前景は「image8」(縮小回転する画像)、背景は「image17」である。
また、楽曲構成「サビ」の区間の時間は「70−120」であり、「画像切替5」のエフェクトが適用される。このエフェクトでの使用画像枚数は「5」枚であり、使用する画像のファイル名は、「image10」(最初に表示される画像)、「image11」(2番目に表示される画像)、「image12」(3番目に表示される画像)、「image13」(4番目に表示される画像)、「image14」(5番目に表示される画像)である。
また、楽曲構成「バスドラムタイミング」の時間(時刻)は「70、110、111、112、113」であり、「出現5」のエフェクトが適用される。このエフェクトでの使用画像枚数は「6」枚であり、使用する画像のファイル名は、背景は「image15」、前景は「人物1」(最初のバスドラムタイミング(70)において出現する画像)、「人物2」(2番目のバスドラムタイミング(110)において出現する画像)、「人物3」(3番目のバスドラムタイミング(111)において出現する画像)、「人物4」(4番目のバスドラムタイミング(112)において出現する画像)、「人物5」(5番目のバスドラムタイミング(113)において出現する画像)である。
ムービー構成情報224の「楽曲構成」と「時間」の項目は、楽曲の音響特徴量データ45に対応している。「適用エフェクト」の項目は、図9に示すエフェクト対応テーブル223から取得され、「使用画像枚数」の項目は、図8に示すエフェクトテンプレート221から取得される。どのエフェクト対応テーブル223を使用するかは、制御部201(フォトムービー生成部25)が図10の処理を実行することにより決定される。また、「使用画像ファイル名」の項目は、画像取得部23により取得した画像や画像素材生成部24により生成した画像から、制御部201(フォトムービー生成部25)が任意に決定する。
図6の説明に戻る。
ステップS108の処理によりフォトムービーが生成されると、サーバ2は生成したフォトムービーをユーザ端末3に送信する(ステップS109)。
ユーザ端末3はサーバ2から送信されるフォトムービーを受信し(ステップS110)、フォトムービーを再生する(ステップS111)。受信したフォトムービーが音楽付きフォトムービーである場合は、制御部301(再生処理部35)は、受信したフォトムービーを復号し再生することで音楽及び映像が同期再生される。
また、受信したフォトムービーが音楽無しフォトムービーである場合は、制御部301(再生処理部35)は、指定した楽曲を記憶部302から読み出し、フォトムービーと同期させて再生する。ユーザ端末3の制御部301(再生処理部35)は、フォトムービーと音源データとを同期再生することで、楽曲構成の変化に応じて画面が変化するフォトムービーが再生される。
以上説明したように、第1の実施形態のフォトムービー生成システム1は、ユーザ端末3において楽曲及び画像を指定してサーバ2に音源データや画像データを送信すると、サーバ2側で音源データの音響解析処理を行い、音響特徴量データ45に基づいてフォトムービーを生成する。ユーザ端末3は、サーバ2で生成したフォトムービーを受信し、音楽無しフォトムービーの場合は、音源データと同期再生する。
このように、フォトムービー生成システム1は、音響特徴量データ45から検出できる楽曲の変化に応じて画面が変化するフォトムービーを生成してユーザに提供できる。また、サーバ2は、以前にフォトムービーを生成した楽曲については、ムービー構成情報224を蓄積記憶しておき、別のパターンのフォトムービーを生成するため、ユーザに多様な楽しみを提供できる。また、サーバ2は、以前に取得した音源データについては、音響特徴量データ45を蓄積記憶しておくため、音響解析処理を省略して短時間でフォトムービーを生成できる。また、音楽無しフォトムービーを生成してユーザ端末3側で音源データと同期再生させることにより、音楽付きフォトムービーよりもファイルサイズを小さくでき、保存容量や通信容量を低減できる。
[第2の実施形態]
次に、第2の実施形態のフォトムービー生成システム1Aについて説明する。第2の実施形態では、ユーザ端末3が音源データを持たない場合のシステム構成について説明する。
図13は本発明の第2の実施形態に係るフォトムービー生成システム1Aの全体構成を示す図である。図に示すように、フォトムービー生成システム1Aは、ユーザ端末3及びサーバ2がネットワーク5を介して通信接続される。また、ユーザ端末3及びサーバ2は、楽曲データベース40を備えた音楽配信サーバ4とネットワーク5を介して通信接続可能となっている。サーバ2及びユーザ端末3のハードウェア構成は第1の実施形態と同様である。第1の実施形態と同一の各部は同一の符号を付し、重複する説明を省略する。
図14は、音楽配信サーバ4の構成を示す図である。図に示すように、音楽配信サーバ4は、例えば制御部401、記憶部402、通信部403等をバス404等により接続して構成したコンピュータにより実現できる。但しこれに限ることなく、適宜様々な構成をとることができる。制御部401、記憶部402、通信部403の構成は、サーバ2の制御部201、記憶部202、通信部203の構成と同様である。音楽配信サーバ4の楽曲データベース40には、楽曲の音源データ44及び音響特徴量データ45が記憶される。
次に、図15を参照して第2の実施形態のフォトムービー生成システム1Aの機能構成について説明する。図に示すように、フォトムービー生成システム1Aにおいて、サーバ2は、記憶部202、音響特徴量データ取得部26、画像取得部23、画像素材生成部24、及びフォトムービー生成部25等を備える。ユーザ端末3は、記憶部302、表示部304、音声出力部307の他、楽曲指定部31、画像指定部32、送信部33、受信部34、音源データ取得部36等を備える。音楽配信サーバ4は、楽曲データベース40、送信部41、及び音響解析部42を備える。
第2の実施形態のフォトムービー生成システム1Aにおいて、第1の実施形態のフォトムービー生成システム1と異なる点は、サーバ2に音源データ取得部21及び音響解析部22を設けず、音響特徴量データ取得部26を設けた点、ユーザ端末3の記憶部302に音源データを記憶せず音源データ取得部36を設けた点、及び楽曲データベース40及び音響解析部42を備えた音楽配信サーバ4を備えた点である。
音楽配信サーバ4は、様々な楽曲の音源データ44や音響特徴量データ45、楽曲歌詞情報、楽曲書誌情報等を楽曲IDと紐づけて楽曲データベース40に記憶している。音源データ44は、図16に示すように、楽曲IDに紐づけられて記憶されている。
音楽配信サーバ4の音響解析部42は、楽曲データベース40に記憶されている楽曲について音響解析処理を実施し、解析結果として音響特徴量データ45を求め、楽曲IDと紐づけて楽曲データベース40に記憶する。音響特徴量データ45は、図5に示す音響特徴量データ45と同様とする。
音楽配信サーバ4の送信部41は、ユーザ端末3からの要求に応じて音源データ44をユーザ端末3に送信する。また、サーバ2からの要求に応じて音源データ44や音響特徴量データ45をサーバ2に送信する。
サーバ2の音響特徴量データ取得部26は、ユーザ端末3の楽曲指定部31により指定された楽曲の楽曲IDを受信すると、楽曲IDに対応する楽曲の音響特徴量データ45を音楽配信サーバ4に要求し、取得する。
ユーザ端末3の音源データ取得部36は、楽曲指定部31により指定された楽曲の音源データ44を音楽配信サーバ4に要求し、取得する。音楽無しフォトムービーがサーバ2から送信された場合、ユーザ端末3の再生処理部35は、音源データ取得部36によって音楽配信サーバ4から音源データを取得し、受信した音楽無しフォトムービーと同期再生する。
次に、図17を参照して、第2の実施形態のフォトムービー生成システム1Aにおける処理の流れを説明する。
ユーザ端末3において、フォトムービーアプリを起動すると、ユーザ端末3の制御部301は、フォトムービーに使用する楽曲の指定(ステップS401)、及び画像の指定(ステップS402)を受け付ける。ステップS401〜ステップS402において、制御部301は、楽曲や画像を選択入力するための入力画面を表示してもよい。
第2の実施形態では、指定できる楽曲は、音楽配信サーバ4の楽曲データベース40に記憶されている楽曲(音源データ44)とする。また、指定できる画像は、第1の実施形態と同様に、ユーザ端末3の記憶部302に記憶されている画像、及びサーバ2に記憶されている一般画像素材222とする。
楽曲及び画像が指定されると、制御部301は、指定された画像データを記憶部302から取得し(ステップS403)、指定された楽曲の楽曲IDとともにサーバ2に送信する(ステップS404)。なお、一般画像素材222が指定された場合は、制御部301は、指定された一般画像素材222の識別情報をサーバ2に送信する。
サーバ2は、楽曲ID及び画像データ(一般画像素材222が指定された場合は、一般画像素材222の識別情報)を受信すると(ステップS405)、制御部201(音響特徴量データ取得部26)は、受信した楽曲IDに対応する音響特徴量データ45を音楽配信サーバ4に要求する(ステップS406)。
音楽配信サーバ4はサーバ2から楽曲IDに対応する音響特徴量データ45の要求を受信すると(ステップS407)、要求された楽曲IDに対応する音響特徴量データ45を楽曲データベース40から読み出し、サーバ2に送信する(ステップS408)。サーバ2は楽曲IDに対応する音響特徴量データ45を受信する(ステップS409)。
なお、ステップS408において、音楽配信サーバ4の楽曲データベース40に該当する音響特徴量データ45が記憶されていない場合、音楽配信サーバ4は要求された楽曲IDの楽曲について音響解析部42により音響解析処理を実行し、音響特徴量データ45を得る。音楽配信サーバ4は音響特徴量データ45を楽曲IDと紐づけて楽曲データベース40に記憶するとともに、要求元のサーバ2に送信する。
また、サーバ2の制御部201(画像素材生成部24)は、ステップS405で受信した画像データについて必要に応じて画像素材生成処理を実行し、画像データから画像素材を切り出す(ステップS410)。なお、受信した画像データをそのまま画像素材として使用してもよい。
サーバ2の制御部201(フォトムービー生成部25)は、画像素材と所定のエフェクトテンプレート221を使用し、音響特徴量データ45(例えば、「楽曲構成」の変化)に応じて画面が変化するフォトムービー(音楽無しフォトムービー)を生成する(ステップS411)。
フォトムービーの生成方法は第1の実施形態と同様である。すなわち、制御部201(フォトムービー生成部25)は、図10に示すように、ユーザ端末3から指定された楽曲IDに対応するムービー構成情報224が既に記憶部202に記憶されているか否かを判定し、記憶部202に記憶されていない場合はエフェクト対応テーブル223から任意のパターンのエフェクト対応テーブル223を使用してフォトムービーを生成する。
また、ユーザ端末3から指定された楽曲IDに対応するムービー構成情報224が既に記憶部202に記憶されている場合は、制御部201は、エフェクト対応テーブル223から未使用のパターンのエフェクト対応テーブル223を読み出し(ステップS304)、読み出したパターンのエフェクト対応テーブル223に従ってフォトムービーを生成する。
制御部201(フォトムービー生成部25)はフォトムービーを生成すると、生成したフォトムービーのムービー構成情報224を楽曲IDと紐づけて記憶部202に記憶する。ムービー構成情報224は、図12に示すように、楽曲IDと紐づけて、楽曲構成、時間、適用エフェクト、使用画像枚数、使用画像ファイル名が格納される。また、サーバ2は生成したフォトムービーをユーザ端末3に送信する(ステップS412)。
ユーザ端末3はサーバ2からフォトムービーを受信すると(ステップS413)、再生処理を行う。受信したフォトムービーは音楽無しフォトムービーであるため、制御部301(再生処理部35)は、ステップS401で指定した楽曲の楽曲IDの音源データ44を音楽配信サーバ4に要求する(ステップS414)。
音楽配信サーバ4は、ユーザ端末3から楽曲IDの音源データ44の要求を受信すると(ステップS415)、要求された楽曲IDの音源データ44を楽曲データベース40から読み出し、要求元のユーザ端末3に送信する(ステップS416)。
ユーザ端末3は、音楽配信サーバ4から音源データ44を受信すると(ステップS417)、ユーザ端末3の制御部301(再生処理部35)は、ステップS413で受信した音楽無しフォトムービーと音源データ44とを同期させて再生する(ステップS418)。これにより、楽曲構成の変化に応じて画面が変化するフォトムービーを再生できる。
なお、上述の例は、音楽無しフォトムービーを生成する場合の手順について説明したが、ステップS406でサーバ2に音楽配信サーバ4に対して音響特徴量データ45の送信を要求する際に、音源データ44の送信も要求し、該当の楽曲の音源データ44を取得すれば、音楽付きフォトムービーを生成することも可能である。サーバ2により音楽付きフォトムービーが生成された場合、ユーザ端末3は音楽付きフォトムービーを受信し、制御部301(再生処理部35)により受信したフォトムービーを復号し再生することで音楽及び映像が同時に再生される。
以上のように、第2の実施形態では、ユーザ端末3が音源データを持たず、サーバ2が音楽配信サーバ4から音響特徴量データ45を取得してフォトムービーを生成するフォトムービー生成システム1Aについて説明した。第2の実施形態のフォトムービー生成システム1Aによれば、サーバ2は音響解析処理を実施せず、既に解析済みの音響特徴量データ45を音楽配信サーバ4から取得してフォトムービーの生成に使用するため、サーバ2の処理負担が軽減される。また、ユーザ端末3とサーバ2との間で音源データ44の送受信を行わないため、通信量が少なくなり、通信に要する時間が短縮される。
以上、添付図面を参照して、本発明の好適な実施形態について説明したが、本発明は係る例に限定されない。例えば、音楽配信サーバ4に音響解析部42や音響特徴量データ45を持たず、サーバ2が音響解析部42を備え、音楽配信サーバ4から受信した楽曲について音響解析処理を実施し、各楽曲の音響特徴量データ45を蓄積記憶しておく構成としてもよい。
また、上述の実施形態では、サーバ2は、主に楽曲構成の変化に応じて表示が変化するフォトムービーを生成する例を示したが、本発明はこれに限定されず、楽曲構成以外の変化、例えば、楽曲のテンポの変化、ビート(拍子)の変化等に応じて表示が変化するフォトムービーを生成してもよい。その他、当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
1・・・・・・・・・・フォトムービー生成システム
2・・・・・・・・・・サーバ
3・・・・・・・・・・ユーザ端末
4・・・・・・・・・・音楽配信サーバ
5・・・・・・・・・・ネットワーク
21・・・・・・・・・音源データ取得部
22・・・・・・・・・音響解析部
23・・・・・・・・・画像取得部
24・・・・・・・・・画像素材生成部
25・・・・・・・・・フォトムービー生成部
26・・・・・・・・・音響特徴量データ取得部
31・・・・・・・・・楽曲指定部
32・・・・・・・・・画像指定部
33・・・・・・・・・送信部
34・・・・・・・・・受信部
35・・・・・・・・・再生処理部
36・・・・・・・・・音源データ取得部
40・・・・・・・・・楽曲データベース
41・・・・・・・・・送信部
42・・・・・・・・・音響解析部
44・・・・・・・・・音源データ
45・・・・・・・・・音響特徴量データ
61、62、63・・・フォトムービー
221・・・・・・・・エフェクトテンプレート
222・・・・・・・・一般画像素材
223・・・・・・・・エフェクト対応テーブル
224・・・・・・・・ムービー構成情報
201、301・・・・制御部
202、302・・・・記憶部
203、303・・・・通信部
304・・・・・・・・入力部
305・・・・・・・・表示部
306・・・・・・・・周辺機器I/F部
307・・・・・・・・音声処理部

Claims (17)

  1. サーバとユーザ端末とがネットワークを介して通信接続されたフォトムービー生成システムであって、
    前記ユーザ端末は、
    フォトムービーに使用する楽曲の指定を受け付け、指定された楽曲の音源データまたは楽曲の識別情報である楽曲IDを前記サーバに送信する楽曲指定手段と、
    前記サーバから送信されたフォトムービーを受信し、再生する再生手段と、を備え、
    前記サーバは、
    前記ユーザ端末において指定された楽曲の音響特徴量データを取得する音響特徴量データ取得手段と、
    前記フォトムービーに使用する画像を取得する画像取得手段と、
    前記画像取得手段により取得した画像を使用し、前記音響特徴量データに基づき楽曲の変化に応じて表示が変化するフォトムービーを生成し、前記ユーザ端末に送信するフォトムービー生成手段と、
    を備えることを特徴とするフォトムービー生成システム。
  2. 前記サーバは、
    前記フォトムービーを構成する情報であるムービー構成情報を前記楽曲IDに紐づけて記憶する記憶手段を備え、
    前記フォトムービー生成手段は、指定された楽曲IDに紐づけて記憶されたムービー構成情報を参照し、前記記憶手段に記憶されているムービー構成情報と異なる構成のフォトムービーを生成することを特徴とする請求項1に記載のフォトムービー生成システム。
  3. 前記サーバの記憶手段は、前記楽曲の音響特徴量データを前記楽曲IDと紐づけて記憶し、
    前記音響特徴量データ取得手段は、前記記憶手段に記憶されている音響特徴量データを取得することを特徴とする請求項2に記載のフォトムービー生成装置。
  4. 前記サーバの音響特徴量データ取得手段は、
    前記ユーザ端末において指定された楽曲の音響特徴量データをネットワークを介して通信接続された音楽配信サーバから取得することを特徴とする請求項1または請求項2に記載のフォトムービー生成システム。
  5. 前記サーバは、楽曲の音響解析処理を行って音響特徴量データを得る音響解析手段を更に備え、
    前記音響特徴量データ取得手段は、前記音響解析手段により得た音響特徴量データを取得することを特徴とする請求項1または請求項2に記載のフォトムービー生成システム。
  6. 前記サーバは、前記楽曲の音源データをネットワークを介して通信接続された音楽配信サーバから取得することを特徴とする請求項5に記載のフォトムービー生成システム。
  7. 前記サーバは、前記楽曲の音源データを前記ユーザ端末から取得することを特徴とする請求項5に記載のフォトムービー生成システム。
  8. 前記サーバのフォトムービー生成手段は、前記フォトムービーを音源を付加せずに生成し、前記楽曲の楽曲IDと紐づけて出力し、
    前記ユーザ端末の再生手段は、前記フォトムービーに紐づけられた楽曲IDに対応する楽曲の音源データを取得し、取得した音源データと前記フォトムービーとを同期して再生する
    ことを特徴とする請求項1から請求項7のいずれかに記載のフォトムービー生成システム。
  9. 前記サーバは、
    前記画像取得手段により取得した画像から画像素材を生成する画像素材生成手段を更に備え、
    前記フォトムービー生成手段は、前記画像素材生成手段により生成された画像素材を使用して前記フォトムービーを生成することを特徴とする請求項1から請求項8のいずれかに記載のフォトムービー生成システム。
  10. 前記ユーザ端末は、前記フォトムービーに使用する画像を前記サーバに送信する画像送信手段を更に備え、
    前記サーバの画像取得手段は、前記ユーザ端末から送信された画像を受信することを特徴とする請求項1から請求項9のいずれかに記載のフォトムービー生成システム。
  11. 画像を取得する画像取得手段と、
    楽曲の音響特徴量データを取得する音響特徴量データ取得手段と、
    前記画像取得手段により取得した画像を使用し、前記音響特徴量データに基づき楽曲の変化に応じて表示が変化するフォトムービーを生成するフォトムービー生成手段と、
    を備えることを特徴とするフォトムービー生成装置。
  12. 画像を取得する画像取得手段と、
    楽曲の音源データを取得する音源データ取得手段と、
    前記音源データを解析して音響特徴量データを取得する音響解析手段と、
    前記画像取得手段により取得した画像を使用し、前記音響特徴量データに基づき楽曲の変化に応じて表示が変化するフォトムービーを生成するフォトムービー生成手段と、
    を備えることを特徴とするフォトムービー生成装置。
  13. サーバとネットワークを介して通信接続可能なユーザ端末であって、
    楽曲の指定を受け付け、指定された楽曲の音源データまたは楽曲の識別情報である楽曲IDを前記サーバに送信する楽曲指定手段と、
    前記サーバから送信された、前記楽曲の変化に応じて表示が変化するフォトムービーを受信し、再生する再生手段と、
    を備えることを特徴とするユーザ端末。
  14. サーバとユーザ端末とがネットワークを介して通信接続されたフォトムービー生成システムにおけるフォトムービー生成方法であって、
    前記ユーザ端末が、フォトムービーに使用する楽曲の指定を受け付け、指定された楽曲の音源データまたは楽曲の識別情報である楽曲IDを前記サーバに送信するステップと、
    前記サーバが、画像を取得するステップと、
    前記サーバが、前記ユーザ端末において指定された楽曲の音響特徴量データを取得するステップと、
    前記サーバが、前記画像を使用し、前記音響特徴量データに基づき楽曲の変化に応じて表示が変化するフォトムービーを生成し、前記ユーザ端末に送信するステップと、
    前記ユーザ端末が、前記サーバから送信されたフォトムービーを受信し、再生するステップと、
    を含むことを特徴とするフォトムービー生成方法。
  15. コンピュータを、
    画像を取得する画像取得手段、
    楽曲の音響特徴量データを取得する音響特徴量データ取得手段、
    前記画像取得手段により取得した画像を使用し、前記音響特徴量データに基づき楽曲の変化に応じて表示が変化するフォトムービーを生成するフォトムービー生成手段、
    として機能させるためのプログラム。
  16. コンピュータを、
    画像を取得する画像取得手段、
    楽曲の音源データを取得する音源データ取得手段、
    前記音源データを解析して音響特徴量データを取得する音響解析手段、
    前記画像取得手段により取得した画像を使用し、前記音響特徴量データに基づき楽曲の変化に応じて表示が変化するフォトムービーを生成するフォトムービー生成手段、
    として機能させるためのプログラム。
  17. サーバとネットワークを介して通信接続可能なコンピュータを、
    楽曲の指定を受け付け、指定された楽曲の音源データまたは楽曲の識別情報である楽曲IDを前記サーバに送信する楽曲指定手段、
    前記サーバから送信された、前記楽曲の変化に応じて表示が変化するフォトムービーを受信し、再生する再生手段、
    として機能させるためのプログラム。
JP2020055808A 2020-03-26 2020-03-26 フォトムービー生成システム、フォトムービー生成装置、ユーザ端末、フォトムービー生成方法、及びプログラム Active JP7456232B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020055808A JP7456232B2 (ja) 2020-03-26 2020-03-26 フォトムービー生成システム、フォトムービー生成装置、ユーザ端末、フォトムービー生成方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020055808A JP7456232B2 (ja) 2020-03-26 2020-03-26 フォトムービー生成システム、フォトムービー生成装置、ユーザ端末、フォトムービー生成方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2021157007A true JP2021157007A (ja) 2021-10-07
JP7456232B2 JP7456232B2 (ja) 2024-03-27

Family

ID=77918232

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020055808A Active JP7456232B2 (ja) 2020-03-26 2020-03-26 フォトムービー生成システム、フォトムービー生成装置、ユーザ端末、フォトムービー生成方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP7456232B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102410840B1 (ko) 2017-01-27 2022-06-21 소니그룹주식회사 정보 처리 장치, 정보 처리 방법 및 그 프로그램

Also Published As

Publication number Publication date
JP7456232B2 (ja) 2024-03-27

Similar Documents

Publication Publication Date Title
US8173883B2 (en) Personalized music remixing
EP2337018A1 (en) A method and system for a &#34;Karaoke Collage&#34;
KR101442606B1 (ko) Ucc를 이용하는 온라인 게임을 제공하는 게임 서비스방법 및 그 게임 서버
WO2007066818A1 (ja) 音楽編集装置及び音楽編集方法
JP4755672B2 (ja) コンテンツ編集装置、方法及びプログラム
JP2012209856A (ja) 動画情報配信システム
KR100798547B1 (ko) 콘텐츠 분배 서버, 콘텐츠 분배 방법 및 콘텐츠 분배 프로그램
JP2010066789A (ja) アバター編集サーバ及びアバター編集プログラム
JP6058991B2 (ja) 歌唱音声に対応する歌唱動画選択システム
JP2021157007A (ja) フォトムービー生成システム、フォトムービー生成装置、ユーザ端末、フォトムービー生成方法、及びプログラム
JP2012018282A (ja) 演奏ファイル管理装置、演奏ファイル再生装置および演奏ファイル再生方法
JP5498444B2 (ja) 動画情報配信システム
JP2014123085A (ja) カラオケにおいて歌唱に合わせて視聴者が行う身体動作等をより有効に演出し提供する装置、方法、およびプログラム
JP6144477B2 (ja) コラボレーション歌唱映像表示システム
JP2007316842A (ja) モーション画像生成プログラム
JP2022023581A (ja) フォトムービー生成システム、フォトムービー生成装置、ユーザ端末、フォトムービー生成方法、及びプログラム
JP2020095665A (ja) 音楽投稿装置及び音楽投稿システム
JP2007025170A (ja) 統一テンポのメドレー選曲処理に特徴を有するカラオケ装置
JP6121139B2 (ja) カラオケ歌唱映像の歌唱音声選択システム
JP3621906B2 (ja) カラオケ映像作品のコンテストを行うカラオケ演奏装置
JP6505307B1 (ja) 音楽投稿装置及び音楽投稿プログラム
JP5566512B2 (ja) カラオケシステム、中央装置及びコンテンツデータ生成方法
JP2000200089A (ja) 通信カラオケシステム
Exarchos ‘Past’masters, present beats: exponential sound staging as sample-based (re) mastering in contemporary hip hop practice
JP6611633B2 (ja) カラオケシステム用サーバ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240226

R150 Certificate of patent or registration of utility model

Ref document number: 7456232

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150