JP2006238357A - 出力装置、出力方法、プログラム、及び音声提供システム - Google Patents

出力装置、出力方法、プログラム、及び音声提供システム Download PDF

Info

Publication number
JP2006238357A
JP2006238357A JP2005053720A JP2005053720A JP2006238357A JP 2006238357 A JP2006238357 A JP 2006238357A JP 2005053720 A JP2005053720 A JP 2005053720A JP 2005053720 A JP2005053720 A JP 2005053720A JP 2006238357 A JP2006238357 A JP 2006238357A
Authority
JP
Japan
Prior art keywords
imaging
unit
image
captured
music
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005053720A
Other languages
English (en)
Inventor
Nobuyoshi Nakajima
延淑 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Holdings Corp
Original Assignee
Fuji Photo Film Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Photo Film Co Ltd filed Critical Fuji Photo Film Co Ltd
Priority to JP2005053720A priority Critical patent/JP2006238357A/ja
Publication of JP2006238357A publication Critical patent/JP2006238357A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Studio Devices (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】撮像した場所に関連する音声を容易に得ることができる出力装置、出力方法、プログラム、及び音声提供システムを提供すること。
【解決手段】撮像された画像と、当該画像が撮像された位置とを対応づけて格納する画像格納部と、画像格納部が格納する複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域を判断する撮像領域判断部と、撮像領域判断部が判断した撮像領域の広さに応じて音声データベースが格納する音声を取得する音声取得部と、画像格納部が格納する複数の画像とともに、音声取得部が取得した音声を出力する出力部とを備える。
【選択図】図2

Description

本発明は、出力装置、出力方法、プログラム、及び音声提供システムに関する。特に本発明は、画像及び音声を出力する出力装置及び出力方法、並びに出力装置用のプログラム、並びに出力装置を備える音声提供システムに関する。
従来、静止画だけでなく動画もメモリカードに記録することができるデジタルスチルカメラがある。このようなデジタルスチルカメラでは、静止画や動画の撮影記録時にマイクロホンで検出した音声を画像に対応させて記録できる(例えば、特許文献1参照。)。また、デジタルスチルカメラで撮影した静止画や動画を表示しながら、画像に対応させて記録された音声を再生することができる電子フォトスタンドが知られている。
特開平7−154734号公報
このような電子フォトスタンドによって、撮影した画像を、撮影記録時に録音された音声とともに鑑賞することができる。しかし、例えば観光地で撮像した画像を鑑賞するときには、撮影記録時に録音された周囲の音声よりも、訪れた観光地の説明等の、観光地に関する音声とともに画像を鑑賞した方がより楽しい場合がある。また、ユーザにとっては画像と音声の編集等の煩雑な作業をすることなく、撮影した画像と観光地に関する音声とを簡単に鑑賞することができることが望ましい。
そこで本発明は、上記の課題を解決することができる出力装置、出力方法、プログラム、及び音声提供システムを提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。
本発明の第1の形態における出力装置は、撮像された画像と、当該画像が撮像された位置とを対応づけて格納する画像格納部と、画像格納部が格納する複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域を判断する撮像領域判断部と、撮像領域判断部が判断した撮像領域の広さに応じて音声データベースが格納する音声を取得する音声取得部と、画像格納部が格納する複数の画像とともに、音声取得部が取得した音声を出力する出力部とを備える。
画像格納部が格納する画像から、ユーザの指示入力に基づいて複数の画像を選択する画像選択部をさらに備え、撮像領域判断部は、画像選択部が選択した複数の画像のそれぞれが撮像された複数の位置を含む撮像領域を判断し、出力部は、画像選択部が選択した複数の画像とともに、音声取得部が取得した音声を出力してよい。
音声取得部は、撮像領域判断部が判断した撮像領域がより狭い場合に、撮像領域判断部が判断した撮像領域についてのより詳しい説明の音声を取得してよい。
撮像領域判断部が判断した撮像領域内における、画像格納部が格納する複数の画像のそれぞれが撮像された複数の位置の分布を算出する撮像位置分布算出部をさらに備え、音声取得部は、撮像位置分布算出部が算出した分布の偏りが予め定められた偏りより大きい部分領域についての説明の音声を取得してよい。
撮像領域判断部が判断した撮像領域に含まれる複数の部分領域毎に、画像格納部が格納する複数の画像のそれぞれが撮像された撮像枚数を算出する撮像枚数算出部をさらに備え、音声取得部は、撮像枚数算出部が算出した撮像枚数がより多い場合に、音声データベースが格納する部分領域についての詳しさが異なる複数の説明のうちのより詳しい説明の音声を取得してよい。
画像格納部は、撮像された画像に対応づけて、当該画像が撮像された時刻をさらに格納し、当該出力装置は、画像格納部が格納する複数の画像のそれぞれが撮像された複数の時刻を含む撮像期間を判断する撮像期間判断部をさらに備え、音声取得部は、撮像期間判断部が判断した撮像期間の長さにさらに応じて音声データベースが格納する音声を取得してよい。
音声取得部は、撮像期間判断部が判断した撮像期間がより長い場合に、撮像領域判断部が判断した撮像領域についてのより詳しい説明の音声を取得してよい。
本発明の第2の形態における出力方法は、撮像された画像と、当該画像が撮像された位置とを対応づけて格納する画像格納段階と、画像格納段階において格納される複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域を判断する撮像領域判断段階と、撮像領域判断段階において判断された撮像領域の広さに応じて音声データベースが格納する音声を取得する音声取得段階と、画像格納段階において格納される複数の画像とともに、音声取得段階において取得された音声を出力する出力段階とを備える。
本発明の第3の形態によると、画像を出力する出力装置用のプログラムであって、出力装置を、撮像された画像と、当該画像が撮像された位置とを対応づけて格納する画像格納部、画像格納部が格納する複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域を判断する撮像領域判断部、撮像領域判断部が判断した撮像領域の広さに応じて音声データベースが格納する音声を取得する音声取得部、画像格納部が格納する複数の画像とともに、音声取得部が取得した音声を出力する出力部として機能させる。
本発明の第4の形態によると、画像を出力する出力装置と、音声データベースとを備える音声提供システムであって、出力装置は、撮像された画像と、当該画像が撮像された位置とを対応づけて格納する画像格納部と、画像格納部が格納する複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域を判断する撮像領域判断部と、撮像領域判断部が判断した撮像領域の広さに応じて音声データベースが格納する音声を取得する音声取得部と、画像格納部が格納する複数の画像とともに、音声取得部が取得した音声を出力する出力部とを有する。
なお上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションもまた発明となりうる。
本発明によれば、撮像した場所に関連する音声を容易に得ることができる出力装置、出力方法、プログラム、及び音声提供システムを提供することができる。
以下、発明の実施形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、本発明の一実施形態に係る音声提供システムの一例を示す。音声提供システムは、撮像装置100、出力装置140、音声データベース170、及び音楽データベース172を有する。この例では、撮像装置100は、観光地において記念写真を撮像する。撮像装置100は、撮像装置100が撮像した画像及び撮像したときの撮像位置を、インターネット等の通信回線150を通じて出力装置140に送信する。
出力装置140は、撮像装置100から受け取った撮像位置に関する音声データ、例えば観光地の特色を説明する音声データを音声データベース170から取得して、撮像装置100から受け取った画像とともに出力する。なお、撮像装置100は、撮像装置100の周囲の音声を録音しておき、出力装置140は、撮像装置100で録音された音声を受け取ってもよい。そして出力装置140は、当該音声の中から音楽を抽出して、抽出した音楽と同じ音楽を音楽データベース172から取得して、画像とともに出力してもよい。なお、出力装置140は、音声データベース170から取得した音声データと、音楽データベース172から取得した音楽とを同時に出力してもよい。
出力装置140は、例えば、HDTV、電子フォトスタンド、コンピュータ等の、画像及び音声を出力する装置であってよい。また、出力装置140は、音声を文字として出力してもよい。例えば、出力装置140は、液晶等の表示デバイスに画像を表示するときに、音声データベース170から取得した音声及び/又は音楽データベース172から取得した音楽データに含まれる歌詞等を文字として表示デバイスに表示させてよい。なお、出力装置140は、画像を表示させる表示デバイスに文字を表示させてよく、画像を表示させる表示デバイスとは別の表示デバイスに文字を表示させてもよい。他にも、出力装置140は、プリンタ等の画像を印刷する印刷装置であってもよく、画像を印刷するとともに音声を文字として印刷してもよい。
撮像装置100は、例えば、デジタルスチルカメラ、カメラ付携帯電話等であってよい。また、撮像装置100が画像及び音声データを記録媒体に記録して、出力装置140は当該記録媒体から画像及び音声データを受け取ってもよい。また、撮像装置100は、画像及び音声データを、通信回線150に接続されたサーバの、ユーザ180毎にそれぞれ設けられたディレクトリ、例えば撮像装置100と関連付けられたディレクトリに格納してもよい。そして出力装置140は、ユーザ180毎にサーバに格納された画像及び音声データを受け取ってもよい。
以上説明した出力装置140によれば、撮像装置100で撮像した画像を、撮像した場所に関する音声とともにユーザ180に提供することができる。このため、ユーザ180は、観光地等の特色等を思い出しながら、楽しく画像を鑑賞することができる。また、撮像装置100で撮像したときに周囲で流れていた音楽をユーザ180に提供することができる。このため、ユーザ180は、観光地等を訪れたときに流行していた音楽を聴きながら、楽しく画像を鑑賞することができる。
図2は、出力装置140のブロック構成の一例を示す。出力装置140は、画像格納部210、画像選択部278、撮像領域判断部282、撮像期間判断部284、撮像位置分布算出部286、撮像枚数算出部288、出力部224、及び音声取得部262を備える。
画像格納部210は、撮像された画像と、当該画像が撮像された位置とを対応づけて格納する。例えば、撮像装置100は、画像を撮像したときの撮像装置100の位置における緯度及び経度情報をGPS衛星から受信する。そして、画像格納部210は、撮像装置100から受け取った画像を、撮像装置100が検出した緯度及び経度情報と対応づけて格納する。
画像選択部278は、画像格納部210が格納する画像から、ユーザ180の指示入力に基づいて複数の画像を選択する。撮像領域判断部282は、画像格納部210が格納する複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域を判断する。
具体的には、撮像領域判断部282は、画像選択部278が選択した複数の画像のそれぞれが撮像された複数の位置を含む撮像領域を判断する。例えば、撮像領域判断部282は、画像格納部210が格納する複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域の地理的な範囲、例えば緯度及び経度の範囲を判断してよい。
撮像位置分布算出部286は、撮像領域判断部282が判断した撮像領域内における、画像格納部210が格納する複数の画像のそれぞれが撮像された複数の位置の分布を算出する。撮像枚数算出部288は、撮像領域判断部282が判断した撮像領域に含まれる複数の部分領域毎に、画像格納部210が格納する複数の画像のそれぞれが撮像された撮像枚数を算出する。
音声取得部262は、撮像領域判断部282が判断した撮像領域の広さに応じて音声データベース170が格納する音声を取得する。具体的には、音声取得部262は、撮像領域判断部282が判断した撮像領域がより狭い場合に、撮像領域判断部282が判断した撮像領域についてのより詳しい説明の音声を取得する。
より具体的には、音声取得部262は、撮像位置分布算出部286が算出した分布の偏りが予め定められた偏りより大きい部分領域についての説明の音声を取得する。また、音声取得部262は、撮像枚数算出部288が算出した撮像枚数がより多い場合に、音声データベース170が格納する部分領域についての詳しさが異なる複数の説明のうちのより詳しい説明の音声を取得する。
出力部224は、画像格納部210が格納する複数の画像とともに、音声取得部262が取得した音声を出力する。具体的には、出力部224は、画像選択部278が選択した複数の画像とともに、音声取得部262が取得した音声を出力する。
画像格納部210は、撮像された画像に対応づけて、当該画像が撮像された時刻をさらに格納する。撮像期間判断部284は、画像格納部210が格納する複数の画像のそれぞれが撮像された複数の時刻を含む撮像期間を判断する。具体的には、撮像期間判断部284は、画像選択部278が選択した複数の画像が撮像された複数の時刻を含む撮像期間を判断する。
そして、音声取得部262は、撮像期間判断部284が判断した撮像期間の長さにさらに応じて音声データベース170が格納する音声を取得する。具体的には、音声取得部262は、撮像期間判断部284が判断した撮像期間がより長い場合に、撮像領域判断部282が判断した撮像領域についてのより詳しい説明の音声を取得する。
図3は、音声データベース170が格納するデータの一例をテーブル形式で示す。音声データベース170は、領域に対応づけて、領域の位置する範囲を示す位置範囲及び領域についての音声データを格納する。位置範囲は、例えば、領域が含まれる領域の起点となる緯度及び経度、並びに、終点となる緯度及び経度を含んでよい。なお、位置範囲には、領域の位置する複数の範囲を含んでよい。音声データは、例えば、各領域についての詳しさの異なる複数の音声データ、例えば概要説明、詳細説明の音声データを含んでよい。また、音声データには、各領域に関するニュース等を含んでもよい。
例えば、日本についての概要説明データとは、日本全体の特色、人口、面積等を説明する音声データであってよい。また、日本についての詳細を説明する音声データとは、日本に含まれる各地域の特色、人口、面積等を説明する音声データであってよく、日本の歴史等を説明する音声データであってもよい。
図4は、画像が撮像された位置の分布の一例を示す。図4の例では、画像格納部210は、長崎、広島、京都、静岡、東京、及び北海道で撮像した、それぞれ10枚、9枚、10枚、7枚、8枚、及び6枚の画像を格納している。撮像領域判断部282は、例えば、予め定めた緯度及び経度範囲毎の部分領域に区切り、画像が撮像された位置を含む部分領域を判断する。撮像枚数算出部288は、部分領域のそれぞれで撮像された画像の枚数を算出する。そして、撮像位置分布算出部286は、画像が撮像された位置が含まれる部分領域の分布を判断する。
そして、音声取得部262は、撮像位置が広い範囲に分布しているか否かを判断する。例えば、音声取得部262は、長崎で撮像した画像が画像選択部278によって選択されたときには、撮像位置が狭い範囲に分布していると判断して、日本をより詳しく説明する音声データとして、例えば長崎を説明する音声データを音声データベース170から取得する。また、長崎、広島、京都、静岡、東京、及び北海道で撮像した画像が画像選択部278によって選択された場合には、撮像位置がより広い範囲に分布していると判断して、撮像領域についての概要を説明する音声データとして、例えば日本を説明する音声データを音声データベース170から取得する。
なお、撮像枚数算出部288によって算出される枚数がより多い場合には、音声取得部262は、それぞれの撮像領域についてのより詳しい説明の音声データを音声データベース170から取得し、枚数がより少ない場合は、それぞれの撮像領域についてのより概要を説明する音声データを音声データベース170から取得してよい。
また、音声取得部262は、選択された枚数に対する、特定の部分領域で撮像された画像の枚数の比率を計算して、当該比率が予め定めた比率よりも大きい場合に、当該特定の部分領域について説明する音声データを音声データベース170から取得する。例えば、画像格納部210が、長崎、広島、京都、東京、及び北海道で撮像した、それぞれ6枚、7枚、30枚、4枚、3枚の合計50枚の画像を格納しており、半数以上の30枚が京都で撮像された画像である場合には、音声取得部262は、京都を説明する音声データを音声データベース170から取得する。このため、出力装置140は、ユーザ180が特に多く撮像した場所について説明する音声をユーザ180に提供することができる。
図5は、画像が撮像された時刻の分布の一例を示す。撮像期間判断部284は、画像が撮像された時間範囲を、部分領域毎に判断する。例えば、撮像期間判断部284は、長崎、広島、京都、静岡、東京、及び北海道のそれぞれを含む部分領域で撮像された時間範囲(t1〜t10、t11〜t19、t20〜t29、t30〜t36、t37〜t44、及びt45〜t50)を判断する。
そして、音声取得部262は、撮像期間の長さを判断する。例えば、音声取得部262は、長崎で撮像した画像が画像選択部278によって選択されたときには、長崎で撮像された期間(t1〜t10)がより短いと判断して、長崎を説明する音声データを音声データベース170から取得する。また、長崎、広島、京都、静岡、東京、及び北海道で撮像した画像が画像選択部278によって選択された場合には、撮像された期間(t1〜t50)がより長いと判断して、撮像領域についての詳しい説明の音声データとして、例えば日本の詳しい説明の音声データを音声データベース170から取得する。
そして、音声取得部262は、選択された画像が撮像された期間に対する、特定の部分領域で撮像された期間の比率を計算して、当該比率が予め定めた比率よりも大きい場合に、当該特定の部分領域について説明する音声データを音声データベース170から取得する。例えば、画像格納部210が、長崎、広島、京都、東京、及び北海道で撮像した画像を格納している場合に、京都で撮像された期間(t64〜t93)が、選択された画像が撮像された期間の合計(t51〜t56、t57〜t63、t64〜t93、t94〜t97、t98〜t10の合計期間)の半分の期間以上である場合に、音声取得部262は京都について説明する音声データを音声データベース170から取得する。このため、出力装置140は、ユーザ180が特に長く滞在して撮像した場所について説明する音声をユーザ180に提供することができる。
図6は、撮像装置600のブロック構成の一例を示す。撮像装置600は、図1で説明した撮像装置100の他の例であって、特に撮像された画像とともに録音された音声から音楽を抽出して格納する機能を有する。撮像装置600は、モード設定部692、撮像部602、表示部670、データ格納部698、録音部650、音楽抽出部694、及び音楽取得部696を備える。
撮像部602は、画像を撮像する。撮像部602は、具体的には、被写体からの光をCCD等の撮像デバイスで受光して、被写体を撮像する。なお、撮像部602は所定の時間間隔で連続的に被写体を撮像してもよい。そして、撮像部602は、連続的に撮像して得られる所定の個数の画像を保持してもよい。そして、撮像部602は、撮像部602が保持している画像のうち、撮像を指示された時刻に最も近いタイミングで撮像された画像を撮像画像としてもよい。
表示部670は、撮像部602が有する受光素子により受光した光の画像を表示する。モード設定部692は、表示部670が画像を表示している状態の動作モードである撮像モード、又は表示部670が画像を表示していない状態の動作モードである非撮像モードに当該撮像装置を設定する。
録音部650は、撮像部602の周囲の音声を録音する。なお、録音部650は、モード設定部692が撮像モードに設定している場合、及びモード設定部692が非撮像モードに設定している場合の双方において、撮像部602の周囲の音声を録音する。
音楽抽出部694は、録音部650が録音した音声から音楽を抽出する。具体的には、音楽抽出部694は、音声の周波数スペクトルに基づいて基本周波数を抽出して、音階を決定する。そして、音楽抽出部694は、決定した音階に基づいて、リズム、テンポ、調性等の音楽の特徴量を判断して、音符データを抽出する。また、音楽抽出部694は、更に、音符データに基づいて音楽のコード進行を抽出してもよい。
なお、音楽抽出部694は、撮像部602が画像を撮像した時刻から予め設定された時間内に、録音部650が録音した音声から音楽を抽出する。具体的には、音楽抽出部694は、モード設定部692が撮像モードに設定している時間を含み、モード設定部692が撮像モードに設定している時間より長い、予め設定された時間内に、録音部650が録音した音声から音楽を抽出する。
音楽データベース172は、時代別に複数の音楽を格納する。また、音楽データベース172は、ジャンル別に複数の音楽を格納する。具体的には、音楽データベース172は、音楽データに対応づけて、音楽のジャンル及び時代を格納する。また、音楽データベース172は、音楽データに対応づけて、音符データ、リズム、テンポ、調性、及びコード進行等の、音楽の特徴量を格納してよい。
音楽取得部696は、音楽データベース172から、音楽抽出部694が抽出した音楽と同一の音楽を取得する。具体的には、音楽取得部696は、音楽抽出部694が抽出した音符データと一致する音符データを有する音楽を音楽データベース172から取得する。
また、音楽取得部696は、複数の音楽を格納する音楽データベース172から、音楽抽出部694が抽出した音楽と同一の種類の音楽を取得する。具体的には、音楽取得部696は、音楽データベース172から、音楽抽出部694が抽出した音楽と同じ時代の音楽を取得する。また、音楽取得部696は、音楽データベース172から、音楽抽出部694が抽出した音楽と同じジャンルの音楽を取得する。具体的には、音楽取得部696は、音楽抽出部694が抽出したリズム、テンポ、調性、及びコード進行等の特徴量に基づいて音楽のジャンル及び/又は時代を特定して、特定したジャンル及び/又は時代の音楽を音楽データベース172から取得する。
データ格納部698は、音楽取得部696が取得した音楽と撮像部602が撮像した画像とを同期して出力させるべく対応づけて格納する。以上説明した撮像装置600によれば、撮像装置600によって撮像したときに撮像装置600の周囲を流れていたBGMと同じ音楽を、画像とともにユーザ180に提供することができる。
図7は、音楽データベース172が格納するデータの一例をテーブル形式示す。音楽データベース172は、音楽データに対応づけて、時代、音楽が属するジャンル、音楽が有するリズム、音楽が有するテンポ、音楽が有する調性、音楽が有するコード進行、音楽の楽譜を示す音符データを格納する。なお、音楽データベース172が格納する時代とは、音楽が作成された時代、音楽が発表された時代、音楽が流行した時代等であってよい。
図8は、撮像装置600が録音する音声と時間範囲の一例を示す。撮像装置600は、動作モードとして、撮像モード、出力モード、及び待機モードを有する。撮像モードとは、撮像装置600が撮像及び/又は録音することのできる動作モードであってよい。また、出力モードは、例えば、撮像装置600が画像及び/又は音声を出力することのできる動作モードであってよい。なお、非撮像モードは、出力モード及び待機モードを含む。そして、撮像装置600は、撮像モードに設定されている期間(t1〜t3)、出力モードに設定されている期間(t3〜t4)、及び待機モードに設定されている期間(t0〜t1及びt4〜t5)における撮像装置600の周囲の音声を録音する。
なお、撮像装置600は、起動された直後には撮像装置600は待機モードに設定される。撮像装置600は、動作モードが待機モード又は出力モードに設定されている場合に、ユーザ180によって撮像動作又は録音動作に関する操作がなされた場合に撮像モードに遷移する。撮像動作に関する操作は、例えば、画像を撮像する操作、シャッタスピード、焦点距離等の、撮像条件を調整する操作等を含む。また、録音動作に関する操作は、例えば、音声を録音する操作、録音感度の調整等の、録音条件を調整する操作等を含む。また、撮像装置600は、動作モードが待機モード又は撮像モードに設定されている場合に、ユーザ180によって撮像装置600の出力動作に関する操作がなされた場合に、出力モードに遷移する。出力動作に関する操作は、例えば、画像を出力する操作、出力する画像を選択する操作、出力速度の調節等の、出力条件を調整する操作等を含む。なお、撮像装置600は、撮像装置600が撮像モード又は出力モードに設定されている場合に、ユーザ180による撮像装置600の操作が所定の期間操作されなかったことを条件として、待機モードに遷移してよい。
音楽抽出部694は、撮像時刻t2から予め定めた時間だけ前又は後の時間範囲において、録音部650で録音された音声から音楽を抽出する。例えば、撮像装置600がユーザ180から時刻t2におおいて撮像するよう指示された場合に、音楽抽出部694は、撮像時刻t2を含む撮像モードに設定されていた期間(t1〜t3)を含む、待機モード又は出力モードに設定されていた期間、例えば期間(t0〜t5)において録音された音声から音楽を抽出する。
なお、音楽抽出部694は、撮像時刻t2を含む、期間(t0〜t5)において録音部650によって録音された音声のうち、撮像時刻t2の最も近い時刻で録音された音声から音楽を抽出してよい。また、音楽抽出部694は、最も音量の大きい音量の音声の中から音楽を抽出してよい。
図9は、音楽を取得する手順の一例を示す。音楽抽出部694は、録音部650が録音した音声から撮像した時刻を含む期間の音声を抽出する(S912)。そして、音楽抽出部694は、S912で抽出した期間の音声から、音楽の特徴量を抽出する(S914)。音楽の特徴量とは、例えば音符データ、リズム、テンポ、調性、コード進行等であってよい。
そして、音楽取得部696は、音楽抽出部694が抽出した音符データと一致する音楽を音楽データベース172の中から検索する(S916)。そして、音楽抽出部694は、抽出した音符データと一致する音楽が音楽データベース172に格納されているか否かを判断する(S918)。音楽取得部696は、S918において、一致する音楽があると判断した場合には、音楽データベース172の中から一致する音楽を取得する(S920)。
音楽取得部696は、S918において一致する音楽がないと判断した場合には、音楽抽出部694がS914で抽出した音楽の特徴量に基づいて、S912で抽出した音楽と同じジャンル及び/又は年代を特定する(S922)。例えば、音楽取得部696は、音楽データベース172に格納された音楽の中で、最も類似する特徴量を持つ音楽を最も多く含むジャンル及び/又は時代を特定する。そして、音楽取得部696は、S922で特定したジャンル及び/又は年代の音楽を、音楽データベース172に格納された音楽の中から取得する(S924)。
なお、音楽取得部696は、S918で同一の音楽と判断された音楽が音楽データベース172から複数検索された場合は、検索された複数の音楽を音楽データベース172から取得してユーザ180に選択させてもよい。また、音楽取得部696は、S924においても、音楽データベース172から取得した同じジャンル及び/又は年代の音楽を複数取得して、ユーザ180に選択させてもよい。
図10は、出力装置1040のブロック構成の一例を示す。出力装置1040は、音声提供システムが有する出力装置140の他の一例であってよい。なお、撮像装置100は、撮像した画像及び撮像したときの周囲の音声の他に、周囲の音声を録音した時刻も出力装置1040に送信する。
出力装置1040は、画像格納部1010、出力部1024、音楽取得部1096、音楽抽出部1094、音声格納部1020、許容時間設定部1043、出力時刻検出部1044、出力要求取得部1048を備える。
画像格納部1010は、撮像装置100によって撮像された画像を格納する。また、画像格納部1010は、画像に対応づけて当該画像が撮像された撮像時刻を格納する。
音声格納部1020は、撮像装置100によって録音された音声を格納する。音声格納部1020は、音声に対応づけて当該音声の録音時刻を格納する。具体的には、音声格納部1020は、撮像装置100の周囲の音声を格納する。なお、録音時刻とは、音声の録音を開始した時刻であってよく、録音を終了した時刻であってよい。
音楽抽出部1094は、音声格納部1020が格納する音声から音楽を抽出する。音楽取得部1096は、複数の音楽を格納する音楽データベース172から、音楽抽出部1094が抽出した音楽と同一の種類の音楽を取得する。なお、音楽取得部1096が音声を取得する具体的な動作は、図9で説明した音楽取得部696の動作と同一であるので、説明を省略する。
出力要求取得部1048は、画像格納部1010が格納する画像の出力要求を取得する。許容時間設定部1043は、出力要求取得部1048が出力要求を取得した時刻と、画像格納部1010が格納する画像の撮像時刻との差がより大きい場合に、音声を抽出する期間である許容時間をより長く設定する。そして、音楽抽出部1094は、画像が撮像された時刻から予め設定された許容時間内に録音された音声から音楽を抽出する。出力部1024は、音楽取得部1096が取得した音楽と画像格納部1010が格納する画像とを同期して出力する。
本実施形態の出力装置1040によれば、撮像した画像を、当該画像を撮像したときに流れていた音楽、例えば撮像当時に流行していた音楽とともにユーザ180に提供することができる。
図11は、許容時間設定部1043が設定する許容時間の一例を示す。例えば、ユーザ180から、時刻t12で撮像された画像を出力する指示を時刻t13において受け付けた場合に、許容時間設定部1043は、出力を指示された時刻と出力される画像が撮像された時刻との差(t13−t12)に基づいて、音楽抽出部1094に音楽を抽出する音声をさせる許容範囲Δt52を決定する。そして、音楽抽出部1094は、音声格納部1020に格納されている音声のうち、時刻t12からΔt52だけ前又は後の時間範囲(時刻t12―Δt52〜時刻t12+Δt52)に録音された音声の中から音楽を抽出する。
なお、音楽抽出部1094は、時刻t12から許容範囲Δt52だけ前の時刻から時刻t12までの間に録音された音声の中から音声を抽出してもよいし、時刻t12から許容範囲Δt52だけ後の時刻までの間に録音された音声の中から音声を抽出してもよい。
また、許容時間設定部1043は、画像格納部1010が格納する撮像画像が撮像された時刻と、出力する指示を受け付けた時刻との差が大きいほど、許容時間をより大きく設定する。図11の例では、許容時間設定部1043は、時刻t12よりも前の時刻t11に撮像された画像を出力するよう時刻t13において指示された場合には、許容範囲Δt52に比べて時間的により長い許容範囲Δt51を設定する。そして、音楽抽出部1094は、時刻(t11−Δt51)から時刻(t11+Δt50)までの時間範囲内で録音された音声の中から音楽を抽出する。
なお、許容時間設定部1043は、撮像された時刻と出力を指示された時刻との間の時間を予め定められた数で割って得られた期間を許容時間として設定してよい。この場合、音楽抽出部1094は、例えば10日前に撮像した画像を出力するときには、撮像時刻の前後1日の間に録音された音声から音楽を抽出する。また、音楽抽出部1094は、10年前に撮像した画像を出力するときには、撮像時刻の前後1年の間に録音された音声の中から音楽を抽出する。
以上説明した出力装置1040によれば、例えば観光地からの帰りの列車内を流れていたBGMと同じ音楽とともに画像を鑑賞することができる。また、出力装置1040は、より過去に撮像された画像を出力するときには、撮像された時刻を含むより広い時間範囲で録音された音声の中から音楽を選択するので、ユーザ180は撮像当時に最も流行していた音楽を思い出しながら楽しく画像を鑑賞することができる。
図12は、出力装置140、撮像装置600、及び出力装置1040に係るコンピュータ1500のハードウェア構成の一例を示す。コンピュータ1500は、ホスト・コントローラ1582により相互に接続されるCPU1505、RAM1520、グラフィック・コントローラ1575、及び表示装置1580を有するCPU周辺部と、入出力コントローラ1584によりホスト・コントローラ1582に接続される通信インターフェイス1530、ハードディスクドライブ1540、及びCD−ROMドライブ1560を有する入出力部と、入出力コントローラ1584に接続されるROM1510、フレキシブルディスク・ドライブ1550、及び入出力チップ1570を有するレガシー入出力部とを備える。
ホスト・コントローラ1582は、RAM1520と、高い転送レートでRAM1520をアクセスするCPU1505、及びグラフィック・コントローラ1575とを接続する。CPU1505は、ROM1510、及びRAM1520に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ1575は、CPU1505等がRAM1520内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置1580上に表示させる。これに代えて、グラフィック・コントローラ1575は、CPU1505等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。
入出力コントローラ1584は、ホスト・コントローラ1582と、比較的高速な入出力装置であるハードディスクドライブ1540、通信インターフェイス1530、CD−ROMドライブ1560を接続する。ハードディスクドライブ1540は、コンピュータ1500内のCPU1505が使用するプログラム、及びデータを格納する。通信インターフェイス1530は、ネットワークを介して出力装置140、撮像装置600、又は出力装置1040と通信し、出力装置140、撮像装置600、又は出力装置1040にプログラム、及びデータを提供する。CD−ROMドライブ1560は、CD−ROM1595からプログラムまたはデータを読み取り、RAM1520を介してハードディスクドライブ1540、及び通信インターフェイス1530に提供する。
また、入出力コントローラ1584には、ROM1510と、フレキシブルディスク・ドライブ1550、及び入出力チップ1570の比較的低速な入出力装置とが接続される。ROM1510は、コンピュータ1500が起動時に実行するブート・プログラムや、コンピュータ1500のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ1550は、フレキシブルディスク1590からプログラムまたはデータを読み取り、RAM1520を介してハードディスクドライブ1540、及び通信インターフェイス1530に提供する。入出力チップ1570は、フレキシブルディスク・ドライブ1550や、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を接続する。
RAM1520を介して通信インターフェイス1530に提供されるプログラムは、フレキシブルディスク1590、CD−ROM1595、またはICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、RAM1520を介して通信インターフェイス1530に提供され、ネットワークを介して出力装置140、撮像装置600、又は出力装置1040に送信される。出力装置140、撮像装置600、又は出力装置1040に送信されたプログラムは、出力装置140、撮像装置600、又は出力装置1040においてインストールされて実行される。
出力装置140にインストールされて実行されるプログラムは、出力装置140を図1から図5において説明した出力装置140として機能させる。また、撮像装置600にインストールされて実行されるプログラムは、撮像装置600を、図6から図9において説明した撮像装置600として機能させる。また、出力装置1040にインストールされて実行されるプログラムは、出力装置1040を、図10及び図11において説明した出力装置1040として機能させる。
以上に示したプログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フレキシブルディスク1590、CD−ROM1595の他に、DVDやPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスクまたはRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムをコンピュータ1500に提供してもよい。
以上、実施形態を用いて本発明を説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。上記実施形態に、多様な変更又は改良を加えることができる。そのような変更又は改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
音声提供システムの一例を示す図である。 出力装置140のブロック構成の一例を示す図である。 音声データベース170が格納するデータの一例をテーブル形式で示す図である。 画像が撮像された位置の分布の一例を示す図である。 画像が撮像された時刻の分布の一例を示す図である。 撮像装置600のブロック構成の一例を示す図である。 音楽データベース172が格納するデータの一例をテーブル形式示す図である。 撮像装置600が録音する音声と時間範囲の一例を示す図である。 音楽を取得する手順の一例を示す図である。 出力装置1040のブロック構成の一例を示す図である。 許容時間の一例を示す図である。 コンピュータ1500のハードウェア構成の一例を示す図である。
符号の説明
100 撮像装置
140 出力装置
150 通信回線
170 音声データベース
172 音楽データベース
180 ユーザ
210 画像格納部
224 出力部
262 音声取得部
278 画像選択部
282 撮像領域判断部
284 撮像期間判断部
286 撮像位置分布算出部
288 撮像枚数算出部
600 撮像装置
602 撮像部
650 録音部
670 表示部
692 モード設定部
694 音楽抽出部
696 音楽取得部
698 データ格納部
1010 画像格納部
1020 音声格納部
1024 出力部
1040 出力装置
1043 許容時間設定部
1048 出力要求取得部
1094 音楽抽出部
1096 音楽取得部
1044 出力時刻検出部

Claims (10)

  1. 撮像された画像と、当該画像が撮像された位置とを対応づけて格納する画像格納部と、
    前記画像格納部が格納する複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域を判断する撮像領域判断部と、
    前記撮像領域判断部が判断した撮像領域の広さに応じて音声データベースが格納する音声を取得する音声取得部と、
    前記画像格納部が格納する複数の画像とともに、前記音声取得部が取得した音声を出力する出力部と
    を備える出力装置。
  2. 前記画像格納部が格納する画像から、ユーザの指示入力に基づいて複数の画像を選択する画像選択部
    をさらに備え、
    前記撮像領域判断部は、前記画像選択部が選択した複数の画像のそれぞれが撮像された複数の位置を含む撮像領域を判断し、
    前記出力部は、前記画像選択部が選択した複数の画像とともに、前記音声取得部が取得した音声を出力する
    請求項1に記載の出力装置。
  3. 前記音声取得部は、前記撮像領域判断部が判断した撮像領域がより狭い場合に、前記撮像領域判断部が判断した撮像領域についてのより詳しい説明の音声を取得する
    請求項1に記載の出力装置。
  4. 前記撮像領域判断部が判断した撮像領域内における、前記画像格納部が格納する複数の画像のそれぞれが撮像された複数の位置の分布を算出する撮像位置分布算出部
    をさらに備え、
    前記音声取得部は、前記撮像位置分布算出部が算出した分布の偏りが予め定められた偏りより大きい部分領域についての説明の音声を取得する
    請求項3に記載の出力装置。
  5. 前記撮像領域判断部が判断した撮像領域に含まれる複数の部分領域毎に、前記画像格納部が格納する複数の画像のそれぞれが撮像された撮像枚数を算出する撮像枚数算出部
    をさらに備え、
    前記音声取得部は、前記撮像枚数算出部が算出した撮像枚数がより多い場合に、前記音声データベースが格納する部分領域についての詳しさが異なる複数の説明のうちのより詳しい説明の音声を取得する
    請求項4に記載の出力装置。
  6. 前記画像格納部は、撮像された画像に対応づけて、当該画像が撮像された時刻をさらに格納し、
    当該出力装置は、
    前記画像格納部が格納する複数の画像のそれぞれが撮像された複数の時刻を含む撮像期間を判断する撮像期間判断部
    をさらに備え、
    前記音声取得部は、前記撮像期間判断部が判断した撮像期間の長さにさらに応じて音声データベースが格納する音声を取得する
    請求項1に記載の出力装置。
  7. 音声取得部は、前記撮像期間判断部が判断した撮像期間がより長い場合に、前記撮像領域判断部が判断した撮像領域についてのより詳しい説明の音声を取得する
    請求項6に記載の出力装置。
  8. 撮像された画像と、当該画像が撮像された位置とを対応づけて格納する画像格納段階と、
    前記画像格納段階において格納される複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域を判断する撮像領域判断段階と、
    前記撮像領域判断段階において判断された撮像領域の広さに応じて音声データベースが格納する音声を取得する音声取得段階と、
    前記画像格納段階において格納される複数の画像とともに、前記音声取得段階において取得された音声を出力する出力段階と
    を備える出力方法。
  9. 画像を出力する出力装置用のプログラムであって、前記出力装置を、
    撮像された画像と、当該画像が撮像された位置とを対応づけて格納する画像格納部、
    前記画像格納部が格納する複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域を判断する撮像領域判断部、
    前記撮像領域判断部が判断した撮像領域の広さに応じて音声データベースが格納する音声を取得する音声取得部、
    前記画像格納部が格納する複数の画像とともに、前記音声取得部が取得した音声を出力する出力部
    として機能させるプログラム。
  10. 画像を出力する出力装置と、
    音声データベースと
    を備える音声提供システムであって、
    前記出力装置は、
    撮像された画像と、当該画像が撮像された位置とを対応づけて格納する画像格納部と、
    前記画像格納部が格納する複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域を判断する撮像領域判断部と、
    前記撮像領域判断部が判断した撮像領域の広さに応じて前記音声データベースが格納する音声を取得する音声取得部と、
    前記画像格納部が格納する複数の画像とともに、前記音声取得部が取得した音声を出力する出力部と
    を有する音声提供システム。
JP2005053720A 2005-02-28 2005-02-28 出力装置、出力方法、プログラム、及び音声提供システム Pending JP2006238357A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005053720A JP2006238357A (ja) 2005-02-28 2005-02-28 出力装置、出力方法、プログラム、及び音声提供システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005053720A JP2006238357A (ja) 2005-02-28 2005-02-28 出力装置、出力方法、プログラム、及び音声提供システム

Publications (1)

Publication Number Publication Date
JP2006238357A true JP2006238357A (ja) 2006-09-07

Family

ID=37045475

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005053720A Pending JP2006238357A (ja) 2005-02-28 2005-02-28 出力装置、出力方法、プログラム、及び音声提供システム

Country Status (1)

Country Link
JP (1) JP2006238357A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010198502A (ja) * 2009-02-26 2010-09-09 Pioneer Electronic Corp 不動産物件検索装置、不動産物件検索方法、不動産物件検索プログラムおよび記録媒体
JP2019079122A (ja) * 2017-10-20 2019-05-23 シャープ株式会社 音声出力システム、サーバ、端末装置、音声出力方法、及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010198502A (ja) * 2009-02-26 2010-09-09 Pioneer Electronic Corp 不動産物件検索装置、不動産物件検索方法、不動産物件検索プログラムおよび記録媒体
JP2019079122A (ja) * 2017-10-20 2019-05-23 シャープ株式会社 音声出力システム、サーバ、端末装置、音声出力方法、及びプログラム
JP6997585B2 (ja) 2017-10-20 2022-01-17 シャープ株式会社 音声出力システム、サーバ、端末装置、音声出力方法、及びプログラム

Similar Documents

Publication Publication Date Title
KR101321969B1 (ko) 화상 처리 시스템 및 방법, 화상 처리 장치 및 방법, 촬상장치 및 방법, 프로그램 기록 매체, 및 프로그램
US7512335B2 (en) Image capturing apparatus, an image capturing method, and a machine readable medium storing thereon a computer program for capturing images
KR101720774B1 (ko) 디지털 촬영 장치 및 그의 사진 제공 방법
JP6016322B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US20060193624A1 (en) Image capturing apparatus, image capturing method, output apparatus, output method and program
JP2007081681A (ja) 撮像装置、方法
JP2007164269A (ja) 検索装置、検索再生装置及び画像再生装置
JP2022140458A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2010021638A (ja) タグ情報付加装置、タグ情報付加方法及びコンピュータプログラム
JP2006203860A (ja) 撮像装置、撮像方法、再生装置、再生方法、及びプログラム
JP2006086823A (ja) 画像記録装置、画像検索方法、画像採点方法及び画像採点システム
JP5112901B2 (ja) 画像再生装置、画像再生方法、画像再生用サーバー、および画像再生システム
JP5320913B2 (ja) 撮像装置およびキーワード作成プログラム
JP2004032131A (ja) 撮像装置及び画像処理装置
JP2006238357A (ja) 出力装置、出力方法、プログラム、及び音声提供システム
JP2006304257A (ja) 撮像装置、撮像方法、出力装置、出力方法、及びプログラム
JP3937787B2 (ja) 映像データ処理装置
JP4893062B2 (ja) 撮像装置およびプログラム
JP4130517B2 (ja) 音楽再生機能付きディジタル・スチル・カメラおよび画像音楽再生装置
JP2006203867A (ja) 撮像装置、撮像方法、及びプログラム
JP2010262072A (ja) デジタルテレビ対応カラオケシステム
JP4741362B2 (ja) 出力装置、出力方法、及びプログラム
JP6038256B2 (ja) 画像検索システムおよび画像検索方法
US20060009976A1 (en) Method for transforming image imto music
JP3853678B2 (ja) 画像処理装置、画像処理システム、及び画像処理プログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20061208