JP2005346259A - 情報処理装置及び情報処理方法 - Google Patents

情報処理装置及び情報処理方法 Download PDF

Info

Publication number
JP2005346259A
JP2005346259A JP2004163362A JP2004163362A JP2005346259A JP 2005346259 A JP2005346259 A JP 2005346259A JP 2004163362 A JP2004163362 A JP 2004163362A JP 2004163362 A JP2004163362 A JP 2004163362A JP 2005346259 A JP2005346259 A JP 2005346259A
Authority
JP
Japan
Prior art keywords
sound
setting
data
information
sound information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004163362A
Other languages
English (en)
Other versions
JP2005346259A5 (ja
JP4429081B2 (ja
Inventor
Kohei Yamada
耕平 山田
Hiroki Yamamoto
寛樹 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004163362A priority Critical patent/JP4429081B2/ja
Priority to US11/139,261 priority patent/US20050267749A1/en
Priority to CNB2005100742337A priority patent/CN100454388C/zh
Priority to EP05253344A priority patent/EP1603028B1/en
Priority to AT05253344T priority patent/ATE553430T1/de
Priority to KR1020050046243A priority patent/KR100733095B1/ko
Publication of JP2005346259A publication Critical patent/JP2005346259A/ja
Publication of JP2005346259A5 publication Critical patent/JP2005346259A5/ja
Application granted granted Critical
Publication of JP4429081B2 publication Critical patent/JP4429081B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2101/00Still video cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3261Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal
    • H04N2201/3264Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal of sound signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3274Storage or retrieval of prestored additional information
    • H04N2201/3277The additional information being stored in the same storage device as the image data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Circuits Of Receivers In General (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Communication Control (AREA)

Abstract

【課題】 デジタルカメラなどで画像に音声を付与し、付与した音声に対して音声認識を適用することで画像検索機能を提供するシステムにおいて、音声認識を行う画像をあらかじめユーザが指定しておくことで、不必要な音声認識を行わずに済み、誤認識・誤検索を削減できるため、ユーザにとって利用しやすい画像検索環境を提供する。
【解決手段】 データに関連付ける音情報を取得し、取得した音情報を音声認識の対象とするか否かを設定し、音声認識の対象とするよう設定された場合に、前記データ及び前記音情報を関連付けて記憶する。
【選択図】 図3

Description

本発明は、取得した音情報とデータを関連付けて記憶する情報処理装置に関する。
現在多くのデジタルカメラには、撮影した画像に音声情報を入力する機能が搭載されている。そして、画像に添付した音声情報を用いることで、画像の効果的な整理機能や所望の画像を探し出す検索機能を提供するなど様々な提案がされている。例えば、デジタルカメラで撮った画像に音声を付与して、音声情報を利用してデジタルカメラ上で画像の検索や整理を行う手段が特許文献1で提案されている。また、特許文献2では編集装置上で画像に付与された音声情報を認識して、音声認識した結果を用いて画像の閲覧や整理に加えて画像処理も行う手段が提案されている。
特開平9−135417号公報 特開2003−111009号公報
上記従来技術では、撮影した画像に付与するすべての音声情報を対象にして音声認識を行い、検索や整理や画像処理などが実施されるが、画像に付与する音は音声ばかりとは限らず、撮影場所の周囲音や撮影画像に合った効果音など音声認識の必要のない音のデータも含まれることが想定される。一般に音声以外の周囲音を音声認識した場合、認識結果は予想できず画像の検索、整理のために音声認識結果を用いるのは難しい。そのような音声認識の必要がないデータは、あらかじめ音声認識による検索対象から外して保持することで、無用な音声認識を行わずに済み、データ検索機能の高速化を図ることができる。
上記課題を解決するために、本発明は、データに関連付ける音情報を取得する取得手段と、前記取得手段で取得した音情報をデータ検索に利用するか否かを設定する設定手段と、前記設定手段でデータ検索に利用するよう設定された場合に、前記データ及び前記音情報を関連付けて記憶する記憶手段とを備えたことを特徴とする。
また本発明は、データに関連付ける音情報を取得する取得手段と、前記取得手段で取得した音情報を音声認識の対象とするか否かを設定する設定手段と、前記設定手段で音声認識の対象とするよう設定された場合に、前記データ及び前記音情報を関連付けて記憶する記憶手段とを備えたことを特徴とする。
また本発明は、データに関連付ける音情報を取得する取得手段と、前記取得手段で取得した音情報を音分類の対象とするか否かを設定する設定手段と、前記設定手段で音分類の対象とするよう設定された場合に、前記データ及び前記音情報を関連付けて記憶する記憶手段とを有することを特徴とする。
また本発明は、データ、該データに関連付けられた音情報及び該音情報をデータ検索に利用するか否かを設定した設定情報とを受信する受信手段と、前記受信手段で受信した設定情報がデータ検索に利用する設定となっている設定情報に対応する音情報に関連付けられているデータのみを、該音情報に基づいて検索する検索手段とを備えたことを特徴とする。
また本発明は、データ、該データに関連付けられた音情報及び該音情報を音声認識の対象とするか否かを設定した設定情報とを受信する受信手段と、前記受信手段で受信した設定情報が音声認識の対象とする設定となっている場合に、前記音情報を音声認識する音声認識手段と、前記音声認識手段で認識された結果を前記データに関連付けて記憶する記憶手段とを備えたことを特徴とする情報処理装置。
また本発明は、データ、該データに関連付けられた音情報及び該音情報を音分類の対象とするか否かを設定した設定情報を受信する受信手段と、前記受信手段で受信した設定情報が音分類の対象とする設定となっている場合に、前記音情報を音の属性に分類する分類手段と、前記分類手段において分類された音の属性を文字列として、前記音情報に関連付けられた前記データに関連付けて記憶する記憶手段とを備えたことを特徴とする。
例えば音声認識を利用した画像検索システムにおいて、音声認識する必要のない音が関連付けられた画像をあらかじめ省くことができ、検索の高速化を図ることができる。
以下、本発明の一実施形態について、添付図面を参照して説明する。
本実施例では、画像をデータとして扱う例をあげ、取得した画像に音声情報を関連付けて記憶する画像検索装置を例にあげて、本発明の情報処理装置について説明する。
図1は本発明を適用した画像検索装置の構成を示すブロック図である。101はマイクロフォンなどの音入力部、102はボタンやキーボードなどの入力部、103はCPUやメモリ(RAM、ROM)などを含む制御部、104はレンズやCMOSセンサーなどを含む光学機器またはスキャナーなどの画像入力部、105はディスプレイや液晶画面などの情報表示部、106はCFカードやSDメモリまたはハードディスクなどの外部記憶部、107は上記の各部を接続するバスである。
図2は本実施例における音声認識を利用した画像検索処理を実現する制御プログラムのモジュール構成を示すブロック図である。
画像入力モジュール201は、画像入力部104を介して画像の入力処理を行い、入力した画像をデータに変換して制御部103へ入力する。同様に録音モジュール202は、音入力部101を介して音をデータに変換して制御部103へ入力する。付加情報入力モジュール203は、入力部102を介して入力されるユーザの設定情報や画像入力機器が出力する画像に関連した付加情報をデータに変換して制御部103へ入力する。そして、画像データ生成モジュール204において、各モジュールが出力した各々のデータを画像データという枠組みで互いに関連付けて外部記憶部106に保存する。
音声認識モジュール205は、制御部103上で動作し画像データ生成モジュール204で生成した画像データを読み込み、画像に関連付けられた音が音声認識の対象であるか否かなどの設定情報を付加情報から獲得し、音声認識の対象となる音を音声認識して認識結果を画像データに関連付けて外部記憶部106に保存する。画像検索モジュール206は、得られた音声認識結果と入力部102を介してユーザが入力するキーワードとのマッチングを行い、情報表示部105を介して検索結果をユーザに表示する。
図3は本実施形態において音声認識を利用した画像検索を実現する処理を示すフローチャートである。まず、ステップS301において、画像入力モジュール201を実行することにより画像を入力し、画像をデータとして取得する。
次に分岐ステップS302において、取得した画像に対して音を録音する場合は録音モジュール202を実行することにより録音を開始し、録音しない場合はS306へ進む。また、ここで録音するかどうかの設定は画像の取得前に事前に行ってもよい。
続いてステップS303において、録音した音をデータに変換して取得する。そして分岐ステップS304において、録音した音を音声認識の対象とする場合はS305に進み、録音した音を音声認識の対象としない場合はS306へ進む。ステップS305では、ユーザが入力部102を介して、録音した音を音声認識の対象とするか否かの設定情報を付加情報として入力しS307に進む。
ステップS307において、付加情報入力モジュールを実行し、機器内部で出力する画像に関する付加情報やユーザが設定する付加情報などを取得し、ステップS307へ進む。ステップS307において、画像データ出力モジュール204を実行することにより、入力した画像と音と付加情報を互いに関連付け画像データとして出力し、画像データを外部記憶部106に保存する。
分岐ステップS308では、前ステップで出力した画像データを読み込み、画像に関連付けられた音が認識対象であればS309に進み、音声認識の対象ではなければ、画像データは画像検索の対象とならず終了する。ステップS309において、音声認識モジュール205を実行することにより画像に関連付けられた音を音声認識し、認識結果を画像データに関連付けて保存する。最後にステップS310において、画像検索モジュール206を実行することにより前ステップで得た音声認識結果を使用して画像検索を行い、ユーザに対して検索結果を表示して終了する。
これら一連の処理をすべてデジタルカメラやスキャナー機能を備えた画像取得機器などで行ってもよいし、S308以降をパソコンなどの別の情報処理装置で行ってもよい。
図11は環境音認識を利用した音分類を実現する処理を示すフローチャートである。上記図3で示したフローチャートにおいて認識を分類に置き換え、音声認識を環境音認識に置き換えたものであり、音分類および環境音認識に関しては実施例2で詳細に示す。
次にS302〜S305で示した音を音声認識の対象とするか否かを設定する方法の一例を示す。図4は本実施形態を適用したデジタルカメラの概観構成例を示す斜視図である。
図4Aおよび図4Bはデジタルカメラの筐体401を後面から見たものである。402はマイクロフォン、403は液晶画面、404はシャッターボタン、405および406はボタンを示す。本実施形態において、例えば405のボタンを「音声メモボタン」、406のボタンを「録音ボタン」のように動作機能をボタンに割り当てると、405を押下することにより音声認識用の録音を行い、406を押下することにより音声認識をしない音の録音を行うことができる。また別の例として、図4Bのように例えば単一のボタン407を「音声認識ボタン」として割り当てることにより、ボタン407を押下すれば画像を音声認識の対象とすることができる。更に、単一ボタン407を半押ししている最中は音声認識の対象としない音を録音することができる機能を割り当てることもできる。ここでボタンの半押しとは、完全にボタンを押下しない程度の力でボタンを押下し、ある一定の状態でボタンを押下し続けることのできる状態のことをいう。
このように、本実施形態によれば、画像に音を関連付けた時にその音を音声認識の対象とするかどうかをユーザが行うことができ、図3で示したシステムにおいてユーザが録音した音を音声認識による検索対象とするかどうかを任意に決めることができる。こうすることにより、例えば音声認識を利用した画像検索装置において、音声認識する必要のない音が関連付けられた画像をあらかじめ省くことができ、検索の高速化を図ることができる。
実施例1は、画像に関連付けた音を認識対象としないものについては特に処理を行わない場合を述べたが、本実施形態では音声認識の対象としない音を分析し、画像に関連付けた音を分類し音属性を付与して保存する手法を示す。
図5は本実施形態における音声認識を利用した画像検索処理を実現する制御プログラムのモジュール構成を示すブロック図である。本実施形態のモジュール構成は図2で示すモジュール構成に環境音認識モジュール501を更に加えた構成となる。そのため図2と同一のモジュールには同一の番号をふる。
環境音認識モジュール501は、音声認識の対象としない音を分析し、音に対して例えば「水の音」「風の音」などの音属性を付与し、画像データに音属性を関連付けるモジュールである。
図6は本実施形態において音声認識を利用した画像検索を実現する処理を示すフローチャートである。まず、ステップS601において、画像入力モジュール201を実行することにより画像を入力し、画像をデータとして取得する。次に分岐ステップS602において、取得した画像に対して音を録音する場合は録音モジュール202を実行することにより録音を開始し、録音しない場合はS606へ進む。また、ここで録音するかどうかの設定は画像の取得前に事前に行ってもよい。続いてステップS603において、録音した音をデータに変換して取得する。そして分岐ステップS604において、録音した音を音声認識の対象とする場合はS605に進み、録音した音を音声認識の対象としない場合はS606へ進む。ステップS605では、ユーザが情報入力装置102を介して、録音した音を音声認識の対象とするか否かの設定情報を付加情報として入力しS607に進む。ステップS607において、付加情報入力モジュールを実行し、機器内部で出力する画像に関する付加情報やユーザが設定する付加情報などを取得し、ステップS607へ進む。ステップS607において、画像データ出力モジュール204を実行することにより、入力した画像と音と付加情報を互いに関連付け画像データとして出力し、画像データを外部記憶装置106に保存する。
分岐ステップS608では、前ステップで出力した画像データを読み込み、画像に関連付けられた音が存在しなければ、画像データは画像検索の対象とならず終了し、音が画像に関連付けられていればS609に進む。分岐ステップS609では、画像に関連付けられた付加情報を読み込み、画像に関連付けられた音が認識対象であればS610に進み、音声認識の対象ではなければS611に進む。S610において、音声認識モジュール205を実行することにより画像に関連付けられた音を音声認識し、認識結果を画像データに関連付けて保存する。ステップS611では、環境音認識モジュール501を実行することにより音声認識の対象としない画像に関連付けられた音を分析して分類を行い、分類名を音属性として画像データに関連付けて保存する。音を分析して分類する方法は、例えば「水の音」や「風の音」など様々な環境音を考慮して環境音ごとに音響モデルを作成し、音声認識と同様に音の特徴量とモデルとのマッチングを行い、高い尤度を出した音響モデルの環境音を分類名とする。最後にステップS612において、画像検索モジュール206を実行することにより、前ステップで得た音声認識結果や環境音認識結果を使用して画像検索を行い、ユーザに対して検索結果を表示して終了する。
これら一連の処理はすべてデジタルカメラやスキャナ機能を備えた画像取得装置などで行ってもよいし、S608以降をパソコンなどの別の情報処理装置で行ってもよい。
このように、本実施形態によれば、画像に音を関連付けた時にその音を音声認識の対象とするかどうかの設定をユーザが指定することができ、また音声認識の対象としない音に対しても音属性を付与することで検索対象とすることができる。これにより、音を関連付けたれたすべての画像が検索対象となり、かつ検索に不必要な音声認識を省略することができるため、音声認識を利用した画像検索装置の利便性が向上するとともに検索の高速化を期待できる。
上記実施例1及び2は、ユーザがボタンなどを操作して画像に関連付けて付与する音を任意に音声認識の対象とすることについて述べたが、本実施形態では音/音声識別を行うことで音声認識の対象とする音を自動的に識別して保持する手法を示す。
図7は本実施形態における音声認識を利用した画像検索処理を実現する制御プログラムのモジュール構成を示すブロック図である。
本実施形態のモジュール構成は図2で示すモジュール構成に音/音声識別モジュール701を更に加えた構成となる。音/音声識別モジュール701は、画像に関連付けられた音情報が音声であるか否かを自動で識別し、識別結果を付加情報として画像に関連付けて出力するモジュールである。
図8は本実施形態において音声認識を利用した画像検索を実現する処理を示すフローチャートである。まず、ステップS801において、画像入力モジュール201を実行することにより画像を入力し、画像をデータとして取得する。次に分岐ステップS802において、取得した画像に対して音を録音する場合は録音モジュール202を実行することにより録音を開始し、録音しない場合はS804へ進む。また、ここで録音するかどうかの設定は画像の取得前に事前に行ってもよい。続いてステップS803において、録音した音をデータに変換して取得する。ステップS804において、付加情報入力モジュールを実行し、機器内部で出力する画像に関する付加情報やユーザが設定する付加情報などを取得し、ステップS805へ進む。ステップS805において、画像データ出力モジュール204を実行することにより、入力した画像と音と付加情報を互いに関連付け画像データとして出力し、画像データを外部記憶装置106に保存する。
分岐ステップS806では、前ステップで出力した画像データを読み込み、画像に関連付けられた音が存在しなければ、画像データは画像検索の対象とならず終了し、音が画像に関連付けられていればS807に進む。そしてステップS807において、音/音声識別モジュール701を実行することにより画像に関連付けられた音が音声であるか否かを識別しS808に進む。音声であるか否かを自動で識別する手段として、例えば様々な音声を用いて作成した音声音響モデルと環境音だけ使用して作成した環境音響モデルを使用して画像に関連付けられた音に対して音声認識を行い、音声音響モデルの尤度が環境音響モデルの尤度より高ければ音声として識別する。あるいは、例えば撮影機器の設定状態(例えば、赤目補正モードや人物撮影モードなど)から画像に人物が写っていると明らかに判別できる場合や、画像認識により撮影した画像に人物が写っている場合は、画像に関連付けられた音を音声と識別する。
そして分岐ステップS808において、前ステップによる結果から音声認識の対象とするか否かを自動的に識別し、音声以外と識別された音が関係付けられた画像データは画像検索の対象をならず終了し、音声と識別された場合はS809に進む。ステップS809において、音声認識モジュール205を実行することにより画像に関連付けられた音を音声認識し、認識結果を画像データに関連付けて保存する。最後にステップS810において、画像検索モジュール206を実行することにより、前ステップで得た音声認識結果や環境音認識結果を使用して画像検索を行い、ユーザに対して検索結果を表示して終了する。
これら一連の処理はすべてデジタルカメラやスキャナー機能を備えた画像取得機器などで行ってもよいし、S806以降をパソコンなどの別の情報処理機器で行ってもよい。
このように、本実施形態によれば、画像に音を関連付けた際に、その音を自動的に音声認識の対象とするか否かを識別することができ、音声認識を利用した画像検索装置において検索対象となる画像を自動的に選別することができる。これにより、例えば音声認識に関連するユーザの機器操作における負担が軽減され、システムが自動的に音声認識する必要のない画像を省き、音声認識を利用した画像検索装置の利便性が大幅に向上することを期待できる。
上記の実施例3は、画像に関連付けて付与する音に対して音/音声識別を行うことで自動的に音声認識の対象とすることについて述べたが、本実施形態では更に音声認識の対象としない音に対して環境音分析を行い、画像に関連付けて付与した音を分類し音属性を付与して保存する手法を示す。
図9は本実施形態における音声認識を利用した画像検索処理を実現する制御プログラムのモジュール構成を示すブロック図である。本実施形態のモジュール構成は図7で示すモジュール構成に図5で記載した環境音認識モジュール501を更に加えた構成となる。
図10は本実施形態において音声認識を利用した画像検索を実現する処理を示すフローチャートである。まず、ステップS1001において、画像入力モジュール201を実行することにより画像を入力し、画像をデータとして取得する。次に分岐ステップS1002において、取得した画像に対して音を録音する場合は録音モジュール202を実行することにより録音を開始し、録音しない場合はS1004へ進む。また、ここで録音するかどうかの設定は画像の取得前に事前に行ってもよい。続いてステップS1003において、録音した音をデータに変換して取得する。ステップS1004において、付加情報入力モジュールを実行し、機器内部で出力する画像に関する付加情報やユーザが設定する付加情報などを取得し、ステップS1005へ進む。ステップS1005において、画像データ出力モジュール204を実行することにより、入力した画像と音と付加情報を互いに関連付け画像データとして出力し、画像データを外部記憶装置106に保存する。
分岐ステップS1006では、前ステップで出力した画像データを読み込み、画像に関連付けられた音が存在しなければ、画像データは画像検索の対象とならず終了し、音が画像に関連付けられていればS1007に進む。そしてステップS1007において、音/音声識別モジュール701を実行することにより画像に関連付けられた音が音声であるか否かを識別しS1008に進む。音声であるか否かを自動で識別する手段として、例えば様々な音声を用いて作成した音声音響モデルと環境音だけ使用して作成した環境音響モデルを使用して画像に関連付けられた音に対して音声認識を行い、音声音響モデルの尤度が環境音響モデルの尤度より高ければ音声として識別する。あるいは、例えば撮影機器の設定状態(例えば、赤目補正モードや人物撮影モードなど)から画像に人物が写っていると明らかに判別できる場合や、画像認識により撮影した画像に人物が写っている場合は画像に関連付けられた音を音声と識別する。
そして分岐ステップS1008において、前ステップによる結果から音声認識の対象とするか否かを自動的に識別し、音声以外と識別された場合はS1010へ進み、音声と識別された場合はS1009に進む。ステップS1009において、音声認識モジュール205を実行することにより画像に関連付けられた音を音声認識し、認識結果を画像データに関連付けて保存する。そしてステップS1010において、環境音認識モジュール501を実行することにより音声認識の対象としない画像に関連付けられた音を分析して分類を行い、分類名を音属性として画像データに関連付けて保存する。音を分析して分類する方法は、例えば水の音や風の音など様々な環境音を考慮して環境音ごとに音響モデルを作成し、音声認識と同様に音の特徴量とモデルとのマッチングを行い、高い尤度を出した音響モデルの環境音を分類名することができる。最後にステップS1011において、画像検索モジュール206を実行することにより、前ステップで得た音声認識結果や環境音認識結果を使用して画像検索を行い、ユーザに対して検索結果を表示して終了する。
これら一連の処理はすべてデジタルカメラやスキャナー機能を備えた画像取得機器などで行ってもよいし、S1006以降をパソコンなどの別の情報処理機器で行ってもよい。
このように、本実施形態によれば画像に音を関連付けた際に、その音を自動的に音声認識の対象とするか否かを識別することができ、音声認識を利用した画像検索装置において検索対象となる画像を自動的に選別することができ、また音声認識に使用しない音に対しても音属性を付与することで検索対象とすることができる。こうすることにより、音声認識に関連するユーザの機器操作における負担が軽減され、システムが自動的に音声認識する必要のない画像を省き、かつ音が関係付けられた画像すべてを検索対象とすることができるため、音声認識を利用した画像検索装置の利便性が大幅に向上することを期待できる。
上記実施例4において、音/音声識別モジュール701と環境音認識モジュール501を個別のモジュールとして図9に示したが、これらのモジュールは個別のモジュールである必要はなく、音声か否かを識別すると同時に、画像に関連付けられた音を環境音認識することもできる。例えば、図10におけるステップS1010をステップS1007に組み込み、音声音響モデルと複数の環境音モデルを使って音声認識を行うことで、音/音声識別および環境音認識を同時に行うことができる。
上記の実施例1から5は画像に関して述べてきたが、音を関連付けて保存するデータは画像だけに限らずドキュメントやビデオなど、あらゆるデジタルコンテンツに対して本発明を適用した検索システムを構築できるものとする。
なお、本発明の目的は、前述した実施例の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
実施例の画像検索装置の構成を示すブロック図 実施例の画像検索処理を実現する制御プログラムのモジュール構成を示すブロック図 実施例の画像検索を実現する処理を示すフローチャート 本発明を適用したデジタルカメラの概観構成例を示す斜視図 画像に関連付けた音を音声認識の対象として保存する処理と、音声認識の対象としない音を分析し音属性を付与して保存する処理を備えた画像検索処理を実現する制御プログラムのモジュール構成を示すブロック図 画像に関連付けた音を音声認識の対象として保存する処理と、音声認識の対象としない音を分析し音属性を付与して保存する処理を備えた画像検索を実現する処理を示すフローチャート 画像に関連付けられた音が音声であるか否かを自動で識別する処理を備えた画像検索処理を実現する制御プログラムのモジュール構成を示すブロック図 画像に関連付けられた音が音声であるか否かを自動で識別する処理を備えた画像検索を実現する処理を示すフローチャート 画像に関連付けられた音が音声であるか否かを自動で識別する処理と、音声認識の対象としない音を分析し音属性を付与して保存する処理を備えた画像検索処理を実現する制御プログラムのモジュール構成を示すブロック図 画像に関連付けられた音が音声であるか否かを自動で識別する処理と、音声認識の対象としない音を分析し音属性を付与して保存する処理を備えた画像検索を実現する処理を示すフローチャート 環境音認識を利用した音分類を実現する処理を示すフローチャート

Claims (18)

  1. データに関連付ける音情報を取得する取得手段と、
    前記取得手段で取得した音情報をデータ検索に利用するか否かを設定する設定手段と、
    前記設定手段でデータ検索に利用するよう設定された場合に、前記データ及び前記音情報を関連付けて記憶する記憶手段とを備えたことを特徴とする情報処理装置。
  2. データに関連付ける音情報を取得する取得手段と、
    前記取得手段で取得した音情報を音声認識の対象とするか否かを設定する設定手段と、
    前記設定手段で音声認識の対象とするよう設定された場合に、前記データ及び前記音情報を関連付けて記憶する記憶手段とを備えたことを特徴とする情報処理装置。
  3. 前記取得手段で取得した音情報が音声であるかを識別する識別手段を更に備え、
    前記設定手段は、前記識別手段で前記音情報が音声であると識別された場合に前記音情報を音声認識の対象とするよう設定することを特徴とする請求項2記載の情報処理装置。
  4. 前記識別手段で前記音情報が音声でないと識別された場合に、前記音情報を音分類の対象として設定する第2設定手段を更に備えたことを特徴とする請求項3記載の情報処理装置。
  5. データに関連付ける音情報を取得する取得手段と、
    前記取得手段で取得した音情報を音分類の対象とするか否かを設定する設定手段と、
    前記設定手段で音分類の対象とするよう設定された場合、前記データ及び前記音情報を関連付けて記憶する記憶手段とを有することを特徴とする情報処理装置。
  6. データ、該データに関連付けられた音情報及び該音情報をデータ検索に利用するか否かを設定した設定情報とを受信する受信手段と、
    前記受信手段で受信した設定情報がデータ検索に利用する設定となっている設定情報に対応する音情報に関連付けられているデータのみを、該音情報に基づいて検索する検索手段とを備えたことを特徴とする情報処理装置。
  7. データ、該データに関連付けられた音情報及び該音情報を音声認識の対象とするか否かを設定した設定情報とを受信する受信手段と、
    前記受信手段で受信した設定情報が音声認識の対象とする設定となっている場合に、前記音情報を音声認識する音声認識手段と、
    前記音声認識手段で認識された結果を前記データに関連付けて記憶する記憶手段とを備えたことを特徴とする情報処理装置。
  8. データ、該データに関連付けられた音情報及び該音情報を音分類の対象とするか否かを設定した設定情報を受信する受信手段と、
    前記受信手段で受信した設定情報が音分類の対象とする設定となっている場合に、前記音情報を音の属性に分類する分類手段と、
    前記分類手段において分類された音の属性を文字列として、前記音情報に関連付けられた前記データに関連付けて記憶する記憶手段とを備えたことを特徴とする情報処理装置。
  9. データに関連付ける音情報を取得する取得ステップと、
    前記取得ステップで取得した音情報をデータ検索に利用するか否かを設定する設定ステップと、
    前記設定ステップでデータ検索に利用するよう設定された場合、前記データ及び前記音情報を関連付けて記憶する記憶ステップとを備えたことを特徴とする情報処理方法。
  10. データに関連付ける音情報を取得する取得ステップと、
    前記取得ステップで取得した音情報を音声認識の対象とするか否かを設定する設定ステップと、
    前記設定ステップで音声認識の対象とするよう設定された場合、前記データ及び前記音情報を関連付けて記憶する記憶ステップとを備えたことを特徴とする情報処理方法。
  11. 前記取得ステップで取得した音情報が音声であるかを識別する識別ステップを更に備え、
    前記設定ステップは、前記識別ステップで前記音情報が音声であると識別された場合に前記音情報を音声認識の対象とするよう設定することを特徴とする請求項10記載の情報処理方法。
  12. 前記識別ステップで前記音情報が音声でないと識別された場合に、前記音情報を音分類の対象として設定する第2設定ステップを更に備えたことを特徴とする請求項11記載の情報処理方法。
  13. データに関連付ける音情報を取得する取得ステップと、
    前記取得ステップで取得した音情報を音分類の対象とするか否かを設定する設定ステップと、
    前記設定ステップで音分類の対象とするよう設定された場合、前記データ及び前記音情報を関連付けて記憶する記憶ステップとを有することを特徴とする情報処理方法。
  14. データ、該データに関連付けられた音情報及び該音情報をデータ検索に利用するか否かを設定した設定情報とを受信する受信ステップと、
    前記受信ステップで受信した設定情報がデータ検索に利用する設定となっている設定情報に対応する音情報に関連付けられているデータのみを、該音情報に基づいて検索する検索ステップとを備えたことを特徴とする情報処理方法。
  15. データ、該データに関連付けられた音情報及び該音情報を音声認識の対象とするか否かを設定した設定情報とを受信する受信ステップと、
    前記受信ステップで受信した設定情報が音声認識の対象とする設定となっている場合に、前記音情報を音声認識する音声認識ステップと、
    前記音声認識ステップで認識された結果を前記データに関連付けて記憶する記憶ステップとを備えたことを特徴とする情報処理方法。
  16. データ、該データに関連付けられた音情報及び該音情報を音分類の対象とするか否かを設定した設定情報を受信する受信ステップと、
    前記受信ステップで受信した設定情報が音分類の対象とする設定となっている場合に、前記音情報を音の属性に分類する分類ステップと、
    前記分類ステップにおいて分類された音の属性を文字列として、前記音情報に関連付けられた前記データに関連付けて記憶する記憶ステップとを備えたことを特徴とする情報処理方法。
  17. 請求項9から請求項16に記載の情報処理方法をコンピュータに実行させるための制御プログラム。
  18. 請求項17に記載の制御プログラムを格納したコンピュータ読み取り可能な記憶媒体。
JP2004163362A 2004-06-01 2004-06-01 情報処理装置及び情報処理方法 Expired - Fee Related JP4429081B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2004163362A JP4429081B2 (ja) 2004-06-01 2004-06-01 情報処理装置及び情報処理方法
US11/139,261 US20050267749A1 (en) 2004-06-01 2005-05-27 Information processing apparatus and information processing method
EP05253344A EP1603028B1 (en) 2004-06-01 2005-05-31 Information processing apparatus and information processing method
AT05253344T ATE553430T1 (de) 2004-06-01 2005-05-31 Dispositif de traitement d'information et procede de traitement d'information
CNB2005100742337A CN100454388C (zh) 2004-06-01 2005-05-31 信息处理设备和信息处理方法
KR1020050046243A KR100733095B1 (ko) 2004-06-01 2005-05-31 정보 처리 장치 및 정보 처리 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004163362A JP4429081B2 (ja) 2004-06-01 2004-06-01 情報処理装置及び情報処理方法

Publications (3)

Publication Number Publication Date
JP2005346259A true JP2005346259A (ja) 2005-12-15
JP2005346259A5 JP2005346259A5 (ja) 2006-08-10
JP4429081B2 JP4429081B2 (ja) 2010-03-10

Family

ID=34941523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004163362A Expired - Fee Related JP4429081B2 (ja) 2004-06-01 2004-06-01 情報処理装置及び情報処理方法

Country Status (6)

Country Link
US (1) US20050267749A1 (ja)
EP (1) EP1603028B1 (ja)
JP (1) JP4429081B2 (ja)
KR (1) KR100733095B1 (ja)
CN (1) CN100454388C (ja)
AT (1) ATE553430T1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7831598B2 (en) 2006-07-06 2010-11-09 Samsung Electronics Co., Ltd. Data recording and reproducing apparatus and method of generating metadata

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8275399B2 (en) 2005-09-21 2012-09-25 Buckyball Mobile Inc. Dynamic context-data tag cloud
US9042921B2 (en) 2005-09-21 2015-05-26 Buckyball Mobile Inc. Association of context data with a voice-message component
US8509827B2 (en) 2005-09-21 2013-08-13 Buckyball Mobile Inc. Methods and apparatus of context-data acquisition and ranking
US9166823B2 (en) * 2005-09-21 2015-10-20 U Owe Me, Inc. Generation of a context-enriched message including a message component and a contextual attribute
US8489132B2 (en) 2005-09-21 2013-07-16 Buckyball Mobile Inc. Context-enriched microblog posting
US8509826B2 (en) 2005-09-21 2013-08-13 Buckyball Mobile Inc Biosensor measurements included in the association of context data with a text message
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
JP5053950B2 (ja) * 2008-07-29 2012-10-24 キヤノン株式会社 情報処理方法、情報処理装置、プログラムおよび記憶媒体
US20120102066A1 (en) * 2009-06-30 2012-04-26 Nokia Corporation Method, Devices and a Service for Searching
US20110314401A1 (en) 2010-06-22 2011-12-22 Thermoteknix Systems Ltd. User-Profile Systems and Methods for Imaging Devices and Imaging Devices Incorporating Same

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4951079A (en) * 1988-01-28 1990-08-21 Konica Corp. Voice-recognition camera
WO1995010915A1 (en) * 1993-10-12 1995-04-20 Orad, Inc. Sports event video
US5675390A (en) * 1995-07-17 1997-10-07 Gateway 2000, Inc. Home entertainment system combining complex processor capability with a high quality display
JPH09135417A (ja) * 1995-11-10 1997-05-20 Ricoh Co Ltd デジタルスチルビデオカメラ
US5960447A (en) * 1995-11-13 1999-09-28 Holt; Douglas Word tagging and editing system for speech recognition
US5930749A (en) * 1996-02-02 1999-07-27 International Business Machines Corporation Monitoring, identification, and selection of audio signal poles with characteristic behaviors, for separation and synthesis of signal contributions
US5903892A (en) * 1996-05-24 1999-05-11 Magnifi, Inc. Indexing of media content on a network
US5995936A (en) * 1997-02-04 1999-11-30 Brais; Louis Report generation system and method for capturing prose, audio, and video by voice command and automatically linking sound and image to formatted text locations
WO1999005611A1 (de) * 1997-07-23 1999-02-04 Siemens Aktiengesellschaft Verfahren zum abspeichern von suchmerkmalen einer bildsequenz
US6128446A (en) * 1997-12-11 2000-10-03 Eastman Kodak Company Method and apparatus for annotation of photographic film in a camera
US20020036694A1 (en) * 1998-05-07 2002-03-28 Merril Jonathan R. Method and system for the storage and retrieval of web-based educational materials
US6714909B1 (en) * 1998-08-13 2004-03-30 At&T Corp. System and method for automated multimedia content indexing and retrieval
JP3252282B2 (ja) * 1998-12-17 2002-02-04 松下電器産業株式会社 シーンを検索する方法及びその装置
US6462778B1 (en) * 1999-02-26 2002-10-08 Sony Corporation Methods and apparatus for associating descriptive data with digital image files
US6434520B1 (en) * 1999-04-16 2002-08-13 International Business Machines Corporation System and method for indexing and querying audio archives
US6442518B1 (en) * 1999-07-14 2002-08-27 Compaq Information Technologies Group, L.P. Method for refining time alignments of closed captions
JP4320487B2 (ja) * 1999-09-03 2009-08-26 ソニー株式会社 情報処理装置および方法、並びにプログラム格納媒体
US7053938B1 (en) * 1999-10-07 2006-05-30 Intel Corporation Speech-to-text captioning for digital cameras and associated methods
KR100367824B1 (ko) * 2000-02-18 2003-01-10 주식회사 메세지 베이 아시아 인터넷을 통한 컨텐츠 서비스 방법
US6499016B1 (en) * 2000-02-28 2002-12-24 Flashpoint Technology, Inc. Automatically storing and presenting digital images using a speech-based command language
US6901362B1 (en) * 2000-04-19 2005-05-31 Microsoft Corporation Audio segmentation and classification
KR20000058970A (ko) * 2000-07-07 2000-10-05 손종모 동영상 정보제공과 검색 방법
WO2002019147A1 (en) * 2000-08-28 2002-03-07 Emotion, Inc. Method and apparatus for digital media management, retrieval, and collaboration
US6760042B2 (en) * 2000-09-15 2004-07-06 International Business Machines Corporation System and method of processing MPEG streams for storyboard and rights metadata insertion
US6738427B2 (en) * 2000-09-15 2004-05-18 International Business Machines Corporation System and method of processing MPEG streams for timecode packet insertion
US6934756B2 (en) * 2000-11-01 2005-08-23 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
CN1175398C (zh) * 2000-11-18 2004-11-10 中兴通讯股份有限公司 一种从噪声环境中识别出语音和音乐的声音活动检测方法
JP2002223401A (ja) * 2001-01-29 2002-08-09 Fuji Photo Film Co Ltd デジタルカメラのデータ処理方法
US7221405B2 (en) * 2001-01-31 2007-05-22 International Business Machines Corporation Universal closed caption portable receiver
US6970185B2 (en) * 2001-01-31 2005-11-29 International Business Machines Corporation Method and apparatus for enhancing digital images with textual explanations
US7013273B2 (en) * 2001-03-29 2006-03-14 Matsushita Electric Industrial Co., Ltd. Speech recognition based captioning system
US6820055B2 (en) * 2001-04-26 2004-11-16 Speche Communications Systems and methods for automated audio transcription, translation, and transfer with text display software for manipulating the text
US20020184196A1 (en) * 2001-06-04 2002-12-05 Lehmeier Michelle R. System and method for combining voice annotation and recognition search criteria with traditional search criteria into metadata
JP4240867B2 (ja) * 2001-09-28 2009-03-18 富士フイルム株式会社 電子アルバム編集装置
JP2003204282A (ja) * 2002-01-07 2003-07-18 Toshiba Corp 無線通信機能付きヘッドセット、これを用いたコミュニケーション記録システム、およびコミュニケーション制御方式を選択可能なヘッドセットシステム
US7165029B2 (en) * 2002-05-09 2007-01-16 Intel Corporation Coupled hidden Markov model for audiovisual speech recognition
US6693663B1 (en) * 2002-06-14 2004-02-17 Scott C. Harris Videoconferencing systems with recognition ability
CN1188804C (zh) * 2002-11-15 2005-02-09 郑方 一种声纹识别方法
US6834265B2 (en) * 2002-12-13 2004-12-21 Motorola, Inc. Method and apparatus for selective speech recognition
US7324943B2 (en) * 2003-10-02 2008-01-29 Matsushita Electric Industrial Co., Ltd. Voice tagging, voice annotation, and speech recognition for portable devices with optional post processing
GB2409365B (en) * 2003-12-19 2009-07-08 Nokia Corp Image handling
US20050192808A1 (en) * 2004-02-26 2005-09-01 Sharp Laboratories Of America, Inc. Use of speech recognition for identification and classification of images in a camera-equipped mobile handset

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7831598B2 (en) 2006-07-06 2010-11-09 Samsung Electronics Co., Ltd. Data recording and reproducing apparatus and method of generating metadata

Also Published As

Publication number Publication date
KR100733095B1 (ko) 2007-06-27
ATE553430T1 (de) 2012-04-15
CN1705367A (zh) 2005-12-07
CN100454388C (zh) 2009-01-21
KR20060066597A (ko) 2006-06-16
EP1603028A3 (en) 2008-11-12
EP1603028B1 (en) 2012-04-11
JP4429081B2 (ja) 2010-03-10
US20050267749A1 (en) 2005-12-01
EP1603028A2 (en) 2005-12-07

Similar Documents

Publication Publication Date Title
KR100733095B1 (ko) 정보 처리 장치 및 정보 처리 방법
KR20070118038A (ko) 정보처리 장치 및 정보처리 방법과 컴퓨터·프로그램
WO2021109678A1 (zh) 视频生成方法、装置、电子设备及存储介质
US20060036441A1 (en) Data-managing apparatus and method
JP2009060394A (ja) 撮像装置、画像検出装置及びプログラム
CN104580888A (zh) 一种图像处理方法及终端
US9525841B2 (en) Imaging device for associating image data with shooting condition information
WO2005094437A2 (en) System and method for automatically cataloguing data by utilizing speech recognition procedures
JP2009141555A (ja) 音声入力機能付き撮像装置及びその音声記録方法
KR20060046317A (ko) 정보처리장치 및 정보처리방법
US9449646B2 (en) Methods and systems for media file management
JP4866396B2 (ja) タグ情報付加装置、タグ情報付加方法及びコンピュータプログラム
JP2003111009A (ja) 電子アルバム編集装置
JP5320913B2 (ja) 撮像装置およびキーワード作成プログラム
US20060082664A1 (en) Moving image processing unit, moving image processing method, and moving image processing program
JP2012178028A (ja) アルバム作成装置、アルバム作成装置の制御方法、及びプログラム
JPH09135417A (ja) デジタルスチルビデオカメラ
CN108255917B (zh) 图像管理方法、设备及电子设备
JP4235635B2 (ja) データ検索装置及びその制御方法
JP5389594B2 (ja) 画像ファイル生成方法、そのプログラム、その記録媒体および画像ファイル生成装置
JP4295540B2 (ja) 音声記録方法および装置、デジタルカメラ、並びに画像再生方法および装置
JP7288491B2 (ja) 情報処理装置、及び制御方法
JP4474348B2 (ja) 情報処理装置、情報処理方法、プログラム、及び記憶媒体
JP2006107109A (ja) 情報管理装置及び情報管理方法
CN104869302B (zh) 摄影设备和图像记录方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060623

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090623

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091009

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20091028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091208

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091215

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121225

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4429081

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131225

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees