JP4904691B2 - カメラ装置、及び撮影方法 - Google Patents

カメラ装置、及び撮影方法 Download PDF

Info

Publication number
JP4904691B2
JP4904691B2 JP2004378386A JP2004378386A JP4904691B2 JP 4904691 B2 JP4904691 B2 JP 4904691B2 JP 2004378386 A JP2004378386 A JP 2004378386A JP 2004378386 A JP2004378386 A JP 2004378386A JP 4904691 B2 JP4904691 B2 JP 4904691B2
Authority
JP
Japan
Prior art keywords
stage
utterance
series
focus adjustment
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004378386A
Other languages
English (en)
Other versions
JP2006184589A (ja
Inventor
滋 加福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2004378386A priority Critical patent/JP4904691B2/ja
Publication of JP2006184589A publication Critical patent/JP2006184589A/ja
Application granted granted Critical
Publication of JP4904691B2 publication Critical patent/JP4904691B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Details Of Cameras Including Film Mechanisms (AREA)
  • Studio Devices (AREA)

Description

本発明は、音声シャッター機能を有するカメラ装置、及び撮影方法に関するものである。
従来、カメラ装置においては、登録されている命令語(認識対象語)の音声を認識したことをトリガとしてオートフォーカスによるピント合わせ、及び露光からなる一連の撮影動作を行う音声シャッター機能を備えたものが下記の特許文献1等に記載されている。
特開平11−194392
しかしながら、上記の技術においては、例えば「ハイ、チーズ」という命令語の認識を完了した後で合焦動作と露光動作とを行うため、ユーザーが命令語を発してから、実質的な撮影動作が行われるまでの間に若干のタイムラグが発生するという問題があった。
本発明は、かかる従来の課題に鑑みてなされたものであり、撮影のための命令語を発してから、実際の撮影動作が行われるまでの間のタイムラグを殆どなくすことが可能となるカメラ装置、及び撮影方法を提供することを目的とする。
前記課題を解決するため請求項1の発明にあっては、所定の命令語の音声入力をトリガとして複数段階の動作からなる一連の撮影動作を行う自動焦点調整機能を備えるカメラ装置であって、入力する音声を認識する音声認識手段と、前記所定の命令語を記憶する命令語記憶手段と、この命令語記憶手段に記憶されている命令語に設定されている複数の発声段階と、前記一連の撮影動作における各段階の動作との対応関係を示す対応情報を記憶する対応情報記憶手段と、前記音声認識手段により認識された音声の認識段階が前記命令語の各発声段階に達する毎に、前記対応情報記憶手段に記憶されている段階情報により示される、当該発声段階に対応する前記一連の撮影動作における各段階の動作を順に開始させる制御手段とを備え、前記一連の撮影動作における複数段階の動作には自動焦点調整機能による合焦動作及び露光動作を含み、前記音声認識手段は、撮影動作における自動焦点調整の動作中に生じるノイズ成分を含む音響モデルと含まない音響モデルを有し、前記一連の撮影動作における自動焦点調整を指示した命令語の認識に応答して前記ノイズ成分を含む音響モデルに、含まない音響モデルから変更して、自動焦点調整を指示した前記命令語の発声段階の次の発声段階の音声を、認識するものとした。
かかる構成においては、所定の命令語が音声入力されたとき、命令語の音声認識が完了する以前の段階から、一連の撮影動作における各段階の動作が順に開始される。
また、請求項2の発明にあっては、前記一連の撮影動作におけるいずれかの段階の動作は、連続して行われる複数の動作からなるものとした。
また、請求項4の発明にあっては、前記命令語記憶手段に複数の命令語が記憶されるとともに、前記対応情報記憶手段に、前記命令語記憶手段に記憶されている複数の命令語の各々に設定されている各発声段階と、複数の一連の撮影動作の各々における各段階の動作との対応関係を示す複数の対応情報が記憶されたものとした。
また、請求項5の発明にあっては、前記音声認識手段により認識された音声からなる語句を新たな命令語として前記命令語記憶手段に記憶させる登録手段と、この登録手段により前記命令語記憶手段に記憶された新たな命令語における複数の発声段階と、前記一連の撮影動作における各段階の動作との対応関係を示す新たな対応情報を生成し、前記対応情報記憶手段に記憶させる生成手段とを備えたものとした。
また、請求項5の発明にあっては、所定の命令語の音声入力をトリガとして複数段階の動作からなる一連の撮影動作を行う自動焦点調整機能を備えるカメラ装置における撮影方法であって、入力する音声を逐次認識する工程と、認識した音声の認識段階が前記命令語に設定されている複数の発声段階の各発声段階に達する毎に、各発声段階に対応付けられている前記一連の撮影動作における各段階の動作を順に開始する工程とを含み、前記一連の撮影動作における複数段階の動作には自動焦点調整機能による合焦動作及び露光動作を含み、音声を逐次認識する工程は、前記一連の撮影動作における自動焦点調整を指示した命令語の認識に応答して前記ノイズ成分を含む音響モデルに、含まない音響モデルから変更して、自動焦点調整を指示した前記命令語の発声段階の次の発声段階の音声を、認識する方法とした。
かかる方法によれば、所定の命令語が音声入力されたとき、命令語の音声認識が完了する以前の段階から、一連の撮影動作における各段階の動作が順に開始される。
また、請求項6の発明にあっては、所定の命令語の音声入力をトリガとして複数段階の動作からなる一連の撮影動作を行う自動焦点調整機能を備えるカメラ装置が有するコンピュータに、入力する音声を音声認識手段に逐次認識させる処理と、前記音声認識手段により認識した音声の認識段階が前記命令語に設定されている複数の発声段階の各発声段階に達する毎に、各発声段階に対応付けられている前記一連の撮影動作における各段階の動作を装置各部に順に開始させる処理とを実行させ、前記一連の撮影動作における複数段階の動作には自動焦点調整機能による合焦動作及び露光動作を含み、音声を音声認識手段に逐次認識する処理は、前記一連の撮影動作における自動焦点調整を指示した命令語の認識に応答して前記ノイズ成分を含む音響モデルに、含まない音響モデルから変更して、自動焦点調整を指示した前記命令語の発声段階の次の発声段階の音声を、認識するプログラムとした。
以上のように本発明においては、所定の命令語が音声入力されたとき、命令語の音声認識が完了する以前の段階から、一連の撮影動作における各段階の動作が順に開始されるようにした。よって、撮影のための命令語を発してから、実際の撮影動作が行われるまでの間のタイムラグを殆どなくすことが可能となる。
以下、本発明の一実施の形態を図にしたがって説明する。図1は本発明に係るデジタルカメラの電気的な概略構成を示すブロック図である。
このデジタルカメラは音声シャッター機能を備えたものであり、キー入力部1と、合焦部2、露光部3、画像入力部4、画像圧縮部5、画像記憶部6、画像表示部7、マイク8、音声入力部9、A/D変換部(A/D)10、ワークメモリ11、音声認識部12、プログラムメモリ13を含み、キー入力部1及びマイク8を除く上記各部2〜7、8〜13が制御部14によって駆動及び制御される構成である。
前記キー入力部1は、電源キーやシャッターキー、撮影/再生モードのモード切替キーや、各種機能の設定に使用される操作キー等、ユーザーがデジタルカメラの操作に使用する各種のキーからなり、いずれかのキーが操作されるとそれが制御部14により検出される。前記合焦部2には、撮影モードにおいて、図示しない光学系におけるフォーカスレンズを被写体距離に応じた位置に駆動するフォーカス・モータや、その駆動回路が含まれる。
前記露光部3には、前記光学系により結像された被写体像を撮像するCCD等の撮像素子と、その駆動回路、撮像素子から出力されるアナログの撮像信号をデジタル信号に変換するA/D変換器等を含みデジタルの撮像信号を出力する。前記画像入力部4は、デジタルに変換された撮像信号に種々の信号処理を施すための各種の信号処理回路により構成される。前記画像圧縮部5は、画像入力部4で処理された後の画像データを圧縮し、また圧縮状態の画像データを伸張する回路により構成される。前記画像記憶部6は圧縮された画像データを記憶する各種メモリカード等により構成される。前記画像表示部7は、液晶表示器や、その駆動回路等から構成され、画像入力部4で信号処理された被写体画像や、画像記憶部6から読み出された記録画像を液晶表示器に表示させる。
前記音声入力部9は、マイク8から入力した音声を増幅するアンプや他の音声処理回路から構成され、処理後の音声信号を出力する。A/D変換部10は音声入力部9から出力されるアナログの音声信号をディジタル信号に変換する。ワークメモリ11は、変換後の音声信号(音声データ)を逐次記憶したり、制御部14が各部の制御に際して生成したり使用する各種のデータ等を随時記憶するRAMである。
前記音声認識部12は、音声シャッター機能がオン設定されているときの撮影待機状態において、ワークメモリ11に逐次記憶される入力音声に対し、そのデータの蓄積速度と同じ又はそれ以上(遅れた場合にすぐ追いつけるという意味)の速度で、前記プログラムメモリ13に記録されている音響モデルを使用し、特徴抽出とビタビアルゴリズムによる認識処理を行う。認識結果を制御部14に逐次送る。
制御部14は、主としてCPUや入出力インターフェイスを含む周辺回路から構成されている。前記プログラムメモリ13はEEPROM等の不揮発性のメモリであり、音声認識部12が音声認識に際して使用する前述した音響モデル等のデータや、制御部14に上記各部を制御させるための各種のプログラム、例えばAE(自動露出)、AF(自動焦点調整)等の制御プログラム、さらには制御部14を本発明の制御手段、登録手段、生成手段として機能させるためのプログラムが格納されている。
また、プログラムメモリ13は本発明の命令語記憶手段、対応情報記憶手段であって、プログラムメモリ13には、前述したプログラムやデータと共に図2に示した登録テーブルTを構成するデータとが格納されている。登録テーブルTは、複数種の予約語(音声パターン)101、及び各々の予約語101に設定されている複数の発声段階と、一連の撮影動作における各段階の動作との関係を示す対応情報102から構成される。予約語101は音声シャッター機能を用いた撮影時に使用可能な命令語であり、予約語101には、その内容に応じた複数の発声段階が設定されている。
発声段階数は、予約語101「ハイ、チーズ」が「ハイ」まで(第1の発声段階)と、「・・・チーズ」まで(第2の発声段階)の2段階である以外は3段階である。また、本実施の形態において各々の発声段階に対応して設定可能な動作は、自動焦点調整、露光、記録の3種類であり、動作の数は予約語101「ハイ、トリマス、モウイチマイ」の第3の発声段階(「・・・モウイチマイ」)に対応する記録、露光、記録の3動作が最大である。また、前述した音響モデルのうち、上記複数の予約語101に含まれる「チーズ」と「トリマス」部分の音響モデルには、自動焦点調整に伴い生じるノイズ(光学系やモータの駆動音)を重畳したPCMで学習済みのHMM(Hidden Markov Model、隠れマルコフ ・モデル)が用意されている。
次に、以上の構成からなるデジタルカメラの本発明に係る動作を説明する。図3は、音声シャッター機能がオン設定されているときの音声シャッターモードによる動作を示したフローチャートである。
音声シャッターモードでは、例えばユーザーによるシャッターキーの押下に応じてマイク8からの音声入力処理を開始する(ステップSA1)。そして、入力される新たな音節部分を音声認識部12により逐次認識し、認識中の音声パターンを逐次蓄積する(ステップSA2)。音声認識部12における音声認識の手法は以下の通りである。
プログラムメモリ13には前述した予約語101が図4に示したような文法でセットされている。同図は「ハイ、チーズ」である例である。「無」は無音を表すサイレントモデルであり、「ハイ、チーズ」の発話の前後と「ハイ」の後に「無音」があっても無くても対応できる文法である。ここでは、説明を簡単にするため音節を単位とした音響モデル(HMM)で説明する。なお、音響モデルは、「はいチーズ」という単語HMMであっても良いし、音素や半音素、トライフォンなどもっと細かい単位のHMMでもよい。
ここで、無音モデルは1状態モデル、音節モデルは3状態モデルであるとする。
例として「は」で説明すると、
「は」の第1状態とは
「は」の子音「h」の部分の音響的特徴を出力する確率が高いHMMモデル
「は」の第2状態とは
「は」の子音と母音のつなぎ部分の音響的特徴を出力する確率が高いHMMモデル
「は」の第3状態とは
「は」の母音「a」の部分の音響的特徴を出力する確率が高いHMMモデル
というように学習されたモデルである。
累積尤度計算は図5のように行われる。
例えば時刻Nの「い」の第1状態の累積尤度は、
A=(時刻N−1の「は」の第3状態の累積尤度)×(時刻Nの特徴値が「い」の第1状態である出力確率)×(「は」の第3状態から「は」を終了する状態遷移確率)
B=(時刻N−1の「い」の第1状態の累積尤度)×(時刻何の特徴値が「い」の第1状態である出力確率)×(「い」の第1状態から「い」の第1状態に遷移する(ループ遷移)状態遷移確率)
として求めたA,Bを比較し、確率の大きい方を時刻Nの「い」の第1状態の累積尤度とする。
このようにして、全ての状態についての累積尤度を時刻毎に更新していく。例えば時刻Nが、「はいチーズ」と発話する際の「い」の発話後、「ち」を発話する直前の瞬間であったとすれば、累積尤度では「い」の第3状態か、「い」の第3状態と「ち」の第1状態の間の「無」モデルの尤度が最も高くなっている筈である。
しかし、ここで問題となるのが、無関係な発話をした場合やノイズを拾った場合であって、その際にも累積尤度が最も高い点は存在するので、偶然「い」の最終状態の尤度が高くなってしまうことが考えられる。そこで、発話の信頼度を計算する必要がある。「はいチーズ」に使われない音節(たとえば「あ」とか「う」「ん」など)についても毎フレーム出力確率を求め、各フレームで最も出力確率の高かったモデルの値を乗算(ビタビならばlogを使うので加算しておく)する。もし発話が本当に「はい」であったならば、各フレームで最も尤度の高いモデルは「は」又は「い」のどこかの状態である可能性が高いので、「はい」の累積尤度との差は少なくなる。これを基に信頼度を求める。もちろん信頼度の計算方法は、必ずしもこの方法である必要はない。
以上の手法により音声認識部12は、「い」の最終状態、または「い」と「ち」の間の「無」モデルの累積尤度が最も高く、かつ信頼度がしきい値以上である時、制御部14に、現時点で「はい」の発話が終わったことを示す信号を送る。同様に「ず」の最終状態の尤度、またはそれに続く「無」モデルの累積尤度が最も高く、かつ信頼度がしきい値以上となった時、「はいチーズ」の発話が終わったことを示す信号を示す信号を送る。
一方、音声認識部12が音声認識を行う間に、制御部14は逐次認識された音声パターンを内部メモリに蓄積しており、音声認識部12から上記信号が送られる毎に、認識中の音声パターンと登録テーブルTの内容とを比較して、候補となる予約語101とその発声段階とを特定し(ステップSA3)、それらを示す認識状況情報を更新する(ステップSA4)。図6は、ある時点の認識状況情報103の内容を示したものであり、同図(a)は「ハイ」までが認識された時点の内容である。
引き続き、制御部14は、予約語101の候補が残されていれば(ステップSA5でYES)、さらに次の発声段階に進んだか否かを判別する(ステップSA6)。そして、未だ次の発声段階に進んでいなければ(ステップSA6でNO)、ステップS2以降の処理を繰り返す。やがて次の発声段階に進んだら、つまり前の発声段階が終了したことが確定したら(ステップSA6でYES)、その時点での認識状況情報103に基づき、残されている予約語候補に対応する現段階の動作を行うための処理を実施する(ステップSA7)。すなわち認識状況情報103の内容が図6(a)に示した内容であり、ユーザーが「はい」までを発話した段階では自動焦点調整を開始する。以後、現在の発声段階が、認識中の予約語(候補)の最終段階となるまで(ステップSA8でNO)、ステップAS2へ戻って前述した処理を繰り返す。
その後、認識状況情報103の内容が例えば図6(b)に示したものとなり、ユーザーが「はい、撮ります」までを発話した段階では、ステップSA7において露光を行い、さらに認識状況情報103の内容が例えば図6(c)に示したものとなり、ユーザーが「ハイ、トリマス、オーケー」までを発話した段階では、ステップSA7において記録を行う。やがて上記処理を繰り返す間に予約語候補がなくなった場合や(ステップSA5でNO)、現在の発声段階が認識中の予約語101の最終段階となったら(ステップSA8でYES)、認識状況情報103の内容をクリアする(ステップSA9)。しかる後、ステップAS2へ戻り、以降の処理を初めから繰り返す。
以上のように音声シャッターモードにおいては、予め登録されている予約語(命令語)を音声認識して一連の撮影動作を行うが、予約語全体の認識が完了する以前の認識途中において、その認識段階が予約語に設定されている発声段階に達する毎に、撮影に要する動作を開始する。したがって、ユーザーが予約語を発してから、実質的な撮影動作である露光が行われるまでの間のタイムラグを殆どなくすことができる。
また、一連の撮影動作の内容が異なる複数の予約語が登録されているため、ユーザーは、複数の予約語を使い分けることにより、全体の動作内容が異なる撮影動作を指示することができる。しかも「チーズ」と「トリマス」部分、つまり自動焦点調整直後の露光を指示する部分の認識が、自動焦点調整に伴い生じるノイズの成分を含む音響モデルを用いて行われるため、上記部分が自動焦点調整中に発声されたとしても、その部分にも高い認識率を確保することができる。
一方、図7は、前記デジタルカメラにおいて予め用意されているコマンド登録モードによる制御部14の処理手順を示すフローチャートである。
コマンド登録モードが設定されると制御部14は、コマンド入力方法の選択画面を画像表示部7のLCD画面に表示させ、ユーザーに入力方法を選択させる(ステップSB1)。本実施の形態では、入力方法として「選択」と「自由」の2種類が用意されている。ここでユーザーが「選択」を選ぶと(ステップSB2でYES)、既に登録されている予約語(図2参照)の各発声段階部分からいずれかの言葉をコマンド要素として選択させる(ステップSB3)。また、ユーザーが「自由を」を選ぶと(ステップSB2でNO)、所定のキー操作によって任意の言葉をコマンド要素として入力させる(ステップSB4)。なお、任意の言葉の入力方法は、例えば画像表示部7のLCD画面に50音等の文字選択画面を表示し、キー操作で複数の文字を選択させることにより行う。
引き続き、指定可能な撮影時における動作、すなわち本実施の形態では「自動焦点調整」、「露光」、「記録」の3種類を表示して、その中から選択又は入力されたコマンド要素に対応する1又は複数の動作を選択させる(ステップSB5)。そして、発声段階数をインクリメントした後(ステップSB1)、コマンド入力の終了指示がなければ(ステップSB7でNO)、ステップSB1へ戻り、前述と同様の処理によってユーザーに次の発生段階のコマンド要素を選択又は入力させ、かつそれと対応する動作を選択させる。
そして、ステップSB6で1又は複数の動作を選択させた後、コマンド入力の終了指示があったら(ステップSB7でYES)、選択又は入力された複数のコマンド要素の間に「、」(発声段階の区切り)を自動的に挿入し、新たな予約語を生成する(ステップSB8)。なお、図示しないが係る処理はユーザーによって選択又は入力されたコマンド要素が1つであった場合には、そのコマンド要素をそのまま予約語とする。そして、生成した新たな予約語を追加して登録テーブルTを更新する(ステップSB9)。
したがって、ユーザーにおいてはコマンド登録モードを選択することにより、前述した音声シャッターモードでの撮影時に使用可能な命令語を、自由に追加することができる。
なお、以上の説明においては本発明を専用機としてのデジタルカメラに採用した場合について説明したが、これに限らず本発明は、カメラ付き携帯電話、さらには銀塩カメラ等の他のカメラ装置にも採用することができる。
本発明に係るデジタルカメラの概略構成を示すブロック図である。 プログラムメモリに記憶されているデータを示す概念図である。 音声シャッターモードでの動作を示すフローチャートである。 記録されている予約語の文法を示す図である。 音声認識中の累積尤度計算方法を示す図である。 音声認識中における認識状況情報の変化例を示した図である。 コマンド登録モードでの制御部の処理手順を示すフローチャートである。
符号の説明
1 キー入力部
2 合焦部
3 露光部
7 画像表示部
8 マイク
9 音声入力部
10 A/D変換部
11 ワークメモリ
12 音声認識部
13 プログラムメモリ
14 制御部
101 予約語
102 対応情報
T 登録テーブル

Claims (6)

  1. 所定の命令語の音声入力をトリガとして複数段階の動作からなる一連の撮影動作を行う自動焦点調整機能を備えるカメラ装置であって、
    入力する音声を認識する音声認識手段と、
    前記所定の命令語を記憶する命令語記憶手段と、
    この命令語記憶手段に記憶されている命令語に設定されている複数の発声段階と、前記一連の撮影動作における各段階の動作との対応関係を示す対応情報を記憶する対応情報記憶手段と、
    前記音声認識手段により認識された音声の認識段階が前記命令語の各発声段階に達する毎に、前記対応情報記憶手段に記憶されている段階情報により示される、当該発声段階に対応する前記一連の撮影動作における各段階の動作を順に開始させる制御手段とを備え、
    前記一連の撮影動作における複数段階の動作には自動焦点調整機能による合焦動作及び露光動作を含み、前記音声認識手段は、撮影動作における自動焦点調整の動作中に生じるノイズ成分を含む音響モデルと含まない音響モデルを有し、前記一連の撮影動作における自動焦点調整を指示した命令語の認識に応答して前記ノイズ成分を含む音響モデルに、含まない音響モデルから変更して、自動焦点調整を指示した前記命令語の発声段階の次の発声段階の音声を、認識することを特徴とするカメラ装置。
  2. 前記一連の撮影動作におけるいずれかの段階の動作は、連続して行われる複数の動作からなることを特徴とする請求項1記載のカメラ装置。
  3. 前記命令語記憶手段に複数の命令語が記憶されるとともに、前記対応情報記憶手段に、前記命令語記憶手段に記憶されている複数の命令語の各々に設定されている各発声段階と、複数の一連の撮影動作の各々における各段階の動作との対応関係を示す複数の対応情報が記憶されたことを特徴とする請求項1又は2記載のカメラ装置。
  4. 前記音声認識手段により認識された音声からなる語句を新たな命令語として前記命令語記憶手段に記憶させる登録手段と、
    この登録手段により前記命令語記憶手段に記憶された新たな命令語における複数の発声段階と、前記一連の撮影動作における各段階の動作との対応関係を示す新たな対応情報を生成し、前記対応情報記憶手段に記憶させる生成手段と
    を備えたことを特徴とする請求項1乃至3のいずれか1項に記載のカメラ装置。
  5. 所定の命令語の音声入力をトリガとして複数段階の動作からなる一連の撮影動作を行う自動焦点調整機能を備えるカメラ装置における撮影方法であって、
    入力する音声を逐次認識する工程と、
    認識した音声の認識段階が前記命令語に設定されている複数の発声段階の各発声段階に達する毎に、各発声段階に対応付けられている前記一連の撮影動作における各段階の動作を順に開始する工程とを含み、
    前記一連の撮影動作における複数段階の動作には自動焦点調整機能による合焦動作及び露光動作を含み、音声を逐次認識する工程は、前記一連の撮影動作における自動焦点調整を指示した命令語の認識に応答して前記ノイズ成分を含む音響モデルに、含まない音響モデルから変更して、自動焦点調整を指示した前記命令語の発声段階の次の発声段階の音声を、認識することを特徴とする撮影方法。
  6. 所定の命令語の音声入力をトリガとして複数段階の動作からなる一連の撮影動作を行う自動焦点調整機能を備えるカメラ装置が有するコンピュータに、
    入力する音声を音声認識手段に逐次認識させる処理と、
    前記音声認識手段により認識した音声の認識段階が前記命令語に設定されている複数の発声段階の各発声段階に達する毎に、各発声段階に対応付けられている前記一連の撮影動作における各段階の動作を装置各部に順に開始させる処理とを実行させ、
    前記一連の撮影動作における複数段階の動作には自動焦点調整機能による合焦動作及び露光動作を含み、音声を音声認識手段に逐次認識する処理は、前記一連の撮影動作における自動焦点調整を指示した命令語の認識に応答して前記ノイズ成分を含む音響モデルに、含まない音響モデルから変更して、自動焦点調整を指示した前記命令語の発声段階の次の発声段階の音声を、認識することを特徴とするプログラム。
JP2004378386A 2004-12-28 2004-12-28 カメラ装置、及び撮影方法 Expired - Fee Related JP4904691B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004378386A JP4904691B2 (ja) 2004-12-28 2004-12-28 カメラ装置、及び撮影方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004378386A JP4904691B2 (ja) 2004-12-28 2004-12-28 カメラ装置、及び撮影方法

Publications (2)

Publication Number Publication Date
JP2006184589A JP2006184589A (ja) 2006-07-13
JP4904691B2 true JP4904691B2 (ja) 2012-03-28

Family

ID=36737750

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004378386A Expired - Fee Related JP4904691B2 (ja) 2004-12-28 2004-12-28 カメラ装置、及び撮影方法

Country Status (1)

Country Link
JP (1) JP4904691B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US7995106B2 (en) 2007-03-05 2011-08-09 Fujifilm Corporation Imaging apparatus with human extraction and voice analysis and control method thereof
JP2008219449A (ja) * 2007-03-05 2008-09-18 Fujifilm Corp 撮像装置およびその制御方法
JP2008219450A (ja) * 2007-03-05 2008-09-18 Fujifilm Corp 撮像装置およびその制御方法
KR101056511B1 (ko) 2008-05-28 2011-08-11 (주)파워보이스 실시간 호출명령어 인식을 이용한 잡음환경에서의음성구간검출과 연속음성인식 시스템
JP5053950B2 (ja) 2008-07-29 2012-10-24 キヤノン株式会社 情報処理方法、情報処理装置、プログラムおよび記憶媒体
JP2011139498A (ja) * 2011-02-14 2011-07-14 Fujifilm Corp 撮像装置およびその制御方法
JP6134803B2 (ja) * 2013-09-12 2017-05-24 日立マクセル株式会社 映像記録装置およびカメラ機能制御プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259198A (ja) * 1999-03-04 2000-09-22 Sony Corp パターン認識装置および方法、並びに提供媒体
JP2001305642A (ja) * 2000-04-25 2001-11-02 Fuji Photo Film Co Ltd 撮像装置
JP2003066990A (ja) * 2001-08-28 2003-03-05 Clarion Co Ltd 音声認識装置

Also Published As

Publication number Publication date
JP2006184589A (ja) 2006-07-13

Similar Documents

Publication Publication Date Title
JP4975813B2 (ja) 音声による遠隔制御
WO2005094437A2 (en) System and method for automatically cataloguing data by utilizing speech recognition procedures
JP2010219692A (ja) 撮像装置及びカメラ
JP2006201749A (ja) 音声による選択装置、及び選択方法
JP6716300B2 (ja) 議事録生成装置、及び議事録生成プログラム
JP6731632B2 (ja) 音声処理装置、音声処理方法及び音声処理プログラム
JP4904691B2 (ja) カメラ装置、及び撮影方法
JP7406874B2 (ja) 電子機器、その制御方法、およびそのプログラム
WO2018135276A1 (ja) 言動制御装置、ロボット、制御プログラムおよび言動制御装置の制御方法
JP2010283605A (ja) 映像処理装置及び方法
KR100567828B1 (ko) 향상된 음성인식 장치 및 방법
JP2004301893A (ja) 音声認識装置の制御方法
JP2006058641A (ja) 音声認識装置
JP2009104047A (ja) 情報処理方法及び情報処理装置
JP2007041302A (ja) 音声再生装置および音声再生処理プログラム
JP2005197867A (ja) 議事進行支援システム及び議事進行支援方法、及び発言入力装置
JP6772881B2 (ja) 音声対話装置
JP5495612B2 (ja) カメラ制御装置及び方法
JP2006267934A (ja) 議事録作成装置および議事録作成処理プログラム
JP2017146402A (ja) 学習支援装置及びプログラム
JP6851491B2 (ja) 音声対話制御装置および音声対話制御方法
JP4675514B2 (ja) 音声処理装置、音声処理方法、及びその方法を実施するためのプログラムを記録したコンピュータにより読取り可能な記録媒体
JP5476760B2 (ja) コマンド認識装置
JPH10326175A (ja) 音声指示装置および音声指示情報記憶媒体
JP2002123282A (ja) 翻訳装置および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110414

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111011

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20111019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111213

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111226

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150120

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4904691

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees