JP2000069348A - 撮像装置 - Google Patents

撮像装置

Info

Publication number
JP2000069348A
JP2000069348A JP10233970A JP23397098A JP2000069348A JP 2000069348 A JP2000069348 A JP 2000069348A JP 10233970 A JP10233970 A JP 10233970A JP 23397098 A JP23397098 A JP 23397098A JP 2000069348 A JP2000069348 A JP 2000069348A
Authority
JP
Japan
Prior art keywords
voice
pattern
coincidence rate
command
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10233970A
Other languages
English (en)
Other versions
JP2000069348A5 (ja
Inventor
Masamine Maeda
昌峰 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP10233970A priority Critical patent/JP2000069348A/ja
Publication of JP2000069348A publication Critical patent/JP2000069348A/ja
Publication of JP2000069348A5 publication Critical patent/JP2000069348A5/ja
Pending legal-status Critical Current

Links

Landscapes

  • Studio Devices (AREA)

Abstract

(57)【要約】 【課題】 音声入力で、周囲音などによる誤操作を防止
する。 【解決手段】 適当な値を一致率の閾値として設定する
(S1)。入力音からその周波数スペクトルのパターン
(入力パターン)が作成される(S2)。入力パターン
と各種制御コマンドの登録パターンから一致率を算出す
る(S3)。一致率が閾値を越えるものがなければ(S
4)、コマンドを出力せずにS1に戻る。一致率が閾値
を上回るコマンドがある場合(S4)、一致率の高いコ
マンドが録画開始又は録画停止であれば(S5)、より
高い閾値が設定され、一致率と閾値が再度、比較される
(S6)。その結果、高くした閾値より一致率が低い場
合(S7)、コマンドは出力されずにS1に戻り、そう
でない場合、最も一致率の高いコマンドが出力される
(S8)。一致率の高いコマンドが録画開始でも録画停
止でもない場合(S5)、最も一致率の高いコマンドが
出力され(S9)、S1に戻る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、撮像装置に関し、
より具体的には、撮影者の音声を認識し、その認識結果
に応じて諸機能を制御するビデオカメラに関する。
【0002】
【従来の技術】近年、ビデオカメラは非常に多機能化さ
れる一方で、本体は小型化が進みつつある。それに伴
い、これらの機能を操作するために押し釦、スライドス
イッチ及び回転レバー等の操作部材が数多く用いられ、
操作方法が判りにくくなるとともに、ビデオカメラの限
られたサイズに多くの操作部材が配置されて、操作性を
損なうこととなっていた。
【0003】このような問題点を解決する手段として、
階層的なメニュー機構を用いる方法があった。これは、
ビューファインダ等の表示手段上に機能の項目及びその
設定状態を表示させ、操作者はこの表示を見ながら各種
機能を設定するものである。例えば、メニューオン/オ
フ・キー、設定項目選択キー及び設定状態変更キーの最
低3つのキーで、約10種類以上の機能の設定が可能と
なる。
【0004】
【発明が解決しようとする課題】しかし、階層的なメニ
ュー構造は、ごく簡単なものの場合には使いにくいこと
はないが、階層が深くなったり項目が増えたりすると、
階層をたどる操作が必須となり、これが撮影者又は利用
者にとって面倒で複雑なものになっていた。また、迅速
な操作が難しく、即時性に欠けるといった問題があっ
た。
【0005】本発明は、このような不都合を解消する撮
像装置を提示することを目的とする。
【0006】本発明はまた、音声により各種機能を設定
できる撮像装置を提示することを目的とする。
【0007】
【課題を解決するための手段】本発明に係る撮像装置
は、使用者の音声を入力する音声入力手段と、音声コマ
ンドに対応する内容の音声パターン情報を保持する音声
パターン保持手段と、当該音声入力手段により入力され
た音声を当該音声パターン保持手段に保持される音声パ
ターンと照合して音声内容を認識し、その認識結果に対
応する制御信号を出力する音声認識手段と、当該音声認
識手段から出力される制御信号に応じて各部を制御する
制御手段とを有する撮像装置であって、当該音声識別手
段が、入力音声と当該音声パターン保持手段に保持され
る音声パターンとの一致の信頼度を判定する信頼度判定
手段を具備し、当該信頼度の閾値が制御対象で異なるこ
とを特徴とする。
【0008】
【実施例】以下、図面を参照して、本発明の実施例を詳
細に説明する。
【0009】図1は、本発明の一実施例の概略構成ブロ
ック図を示す。10は撮影レンズ、12は、撮影レンズ
をその光軸方向に移動させるレンズ駆動モータ、14は
撮影レンズ10による光学像を電気信号に変換する撮像
素子、16は撮像素子14に入射する光量を制限する絞
り、18は、撮像素子14から出力される画像信号をサ
ンプルホールドし、適正な信号レベルで出力するCDS
/AGC回路、20は、CDS/AGC回路14のアナ
ログ出力をディジタル信号に変換して、ディジタル信号
処理するディジタル信号処理回路である。
【0010】22は、ディジタル信号処理回路20から
出力されるディジタル画像信号を圧縮する画像圧縮回
路、24は、画像圧縮回路22から出力される圧縮画像
情報を記録する記録媒体、26は、記録媒体24から再
生された圧縮画像情報を伸長して元のディジタル画像信
号に戻す画像伸長回路である。
【0011】28は、ディジタル信号処理回路20の出
力(即ち、撮像素子14の出力画像)又は画像伸長回路
26の出力画像(再生画像)を選択するスイッチ、30
は、スイッチ28により選択された画像信号をNTSC
形式に変換して出力端子32から外部に出力するNTS
Cエンコーダ、34は、液晶ディスプレイ36を駆動し
て、スイッチ28により選択された画像を表示させる液
晶駆動回路である。
【0012】38は全体を制御するシステム制御回路、
40はシステム制御回路38に種々の指示を入力する操
作キーである。但し、本実施例では、詳細は後述する
が、操作キーを使用しなくても、一定の操作をシステム
制御回路38に入力できる。42は、システム制御回路
38の制御下で、撮影レンズ10のフォーカス、絞り1
6及び撮像素子14を制御するカメラ制御回路である。
【0013】44は、使用者の音声を取り込むマイク、
46は、マイク44のアナログ音声出力をディジタル化
するA/D変換器、48は、A/D変換器46から出力
される音声データの音声レベルを自動調整するAGC回
路、50は、AGC回路48の出力音声データを音声認
識する音声認識回路である。音声認識回路50はシステ
ム制御回路38への指令を認識すると、その指令内容に
応じた制御コマンドをシステム制御回路38に出力す
る。
【0014】使用者の音声は、マイク44により電気オ
ーディオ信号に変換される。そしてA/D変換器46
は、マイク44の出力をサンプリングによる折り返し雑
音を防ぐための帯域制御用LPFを通した後に、ディジ
タル信号に変換する。AGC回路48は、A/D変換器
46から出力される音声データを所定レベルに調整し
て、音声認識回路50に供給する。
【0015】図2は、音声認識回路50の概略構成ブロ
ック図を示す。52は、AGC回路48の出力信号から
音声帯域を抽出するバンドパスフィルタ(BPF)、5
4はBPF52の出力をフーリエ変換して周波数スペク
トルを解析する高速フーリエ変換回路(FFT)、56
はFFT54により得られた周波数スペクトルを所定閾
値Vthと比較するレベル比較回路、58は、予め登録
されている撮影者の音声の周波数スペクトル・パターン
(以下、登録パターンという。)60とレベル比較回路
56の比較結果とを対照して、入力音声の指示内容を判
別し、判別内容に応じた制御コマンドを発生する判別回
路である。
【0016】なお、登録パターン60は、メニュー設
定、録画開始・停止及び再生開始・停止などビデオカメ
ラが有する機能に対応した内容のパターンを含む。
【0017】このような構成において、BPF52は、
AGC回路48の出力信号から音声帯域を抽出し、抽出
した音声帯域の信号をFFT54が周波数スペクトルに
変換する。レベル比較回路56が、FFT54から出力
される周波数スペクトルを所定の閾値Vthと比較する
が、その際、登録パターン60に時間軸を合わせるため
にデータの間引き及び補間が行なわれる。レベル比較回
路56は、各周波数スペクトルが閾値レベルVthを越
えているかいないかで、”1”又は”0”の2値信号を
わりふる。図3は、レベル比較回路56の出力のマトリ
クス表示例を示す。図4は、登録パターン60のマトリ
クス表示例を示す。図4に示すように、この例では、登
録パターン60は、時間方向に1〜10で規定されてい
るので、これに合わせて、レベル比較回路56の出力
も、図3に示すように、その時間方向に1〜10で規定
されている。各周波数成分が2値化され、0又は1で表
現されている。
【0018】判別回路58は、図3及び図4に示すマト
リクスを各要素について比較し、入力音声の周波数スペ
クトルが登録パターン60と類似している場合のみ、対
応する制御信号を出力する。入力音声の周波数スペクト
ルが何れの登録パターン60とも類似していない場合、
判別回路58は、入力音を通常のオーディオ信号と見做
して、何の制御信号も出力しない。
【0019】判別回路58から出力される制御信号は、
ビデオカメラの機能を実行するコマンドとしてシステム
制御回路38に送られる。また、比較パターンと類似し
ていない場合は、通常のオーディオ信号とみなし制御信
号は出力しない。
【0020】本実施例では、音声認識回路50は、登録
パターン60のマトリクスと入力音のマトリクスを比較
して、音声による命令又は指示かどうかとその命令内容
を判別する。具体的には、登録パターン60の”1”及
び”0”に対して、入力音パターンの”1”及び”0”
が一致する割合を算出し、一致率が高い場合は、入力パ
ターンと登録パターン60が類似していると判定し、一
致率が低いときには、入力パターンと登録パターン60
が類似していないと判定する。
【0021】図4は、判別回路58の動作フローチャー
トを示す。先ず、一致率の閾値として適当な値、例えば
80%を設定する(S1)。入力音からその周波数スペ
クトルのパターン(入力パターン)が作成される(S
2)。入力パターンと各種制御コマンドに対する登録パ
ターン60が比較され、前述のように一致率が算出され
る(S3)。図3及び図4に示す例では、登録パターン
の”1”及び”0”に対して、入力パターンの”1”及
び”0”が一致する割合は、54/60=90%とな
る。
【0022】登録パターン60の各操作に対応するパタ
ーンと入力パターンとの比較結果で一致率が閾値を上回
るものが1つでもあるかどうかを調べる(S4)。一致
率が閾値を越えるものがなければ(S4)、入力された
音声は通常の音声と判断され、コマンドは出力されず
に、S1に戻る。一致率が閾値を上回るコマンドがあっ
た場合(S4)、通常ならば、最も一致率が高いコマン
ドが選択されるべきであるが、本実施例ではその前に、
一致率の高いコマンドが録画開始又は録画停止であるか
どうかを調べる(S5)。
【0023】一致率の高いコマンドが録画開始又は録画
停止である場合(S5)、判別回路58には、より高い
閾値が設定され、一致率と閾値が再度、比較される(S
6)。その結果、高くした閾値より一致率が低い場合
(S7)、コマンドは出力されずにS1に戻る。高くし
た閾値より一致率が低い場合(S7)、最も一致率の高
いコマンドが出力される(S8)。ここで出力されるコ
マンドは、録画開始又は録画停止のコマンドである。
【0024】一致率の高いコマンドが録画開始でも録画
停止でもない場合(S5)、最も一致率の高いコマンド
が出力され(S9)、S1に戻る。
【0025】本実施例では、スペクトルと時間軸による
マトリクスパターンによって一致率を算出しているが、
入力された音声コマンドの信頼性を他の方法で判定して
もよい。
【0026】
【発明の効果】以上の説明から容易に理解できるよう
に、本発明によれば、録画動作に関するコマンド以外は
比較的判定条件を緩くする設定が可能となり、より即時
性のよい音声認識を行うことが出来る。更には、録画動
作に関するコマンドは、他のコマンドと比較して判定が
厳しくなるので、無意識に又は周囲の雑音によって誤動
作するのを防止できる。
【図面の簡単な説明】
【図1】 本発明の一実施例の概略構成ブロック図であ
る。
【図2】 音声認識回路50の概略構成ブロック図であ
る。
【図3】 登録パターン60のデータ例である。
【図4】 入力パターンのデータ例である。
【図5】 図4は、判別回路58の動作フローチャート
である。
【符号の説明】
10:撮影レンズ 12:レンズ駆動モータ 14:撮像素子 16:絞り 18:CDS/AGC回路 20:ディジタル信号処理回路 22:画像圧縮回路 24:記録媒体 26:画像伸長回路 28:スイッチ 30:NTSCエンコーダ 32:出力端子 34:液晶駆動回路 36:液晶ディスプレイ 38:システム制御回路 40:操作キー 42:カメラ制御回路 44:マイク 46:A/D変換器 48:AGC回路 50:音声認識回路 52:バンドパスフィルタ(BPF) 54:高速フーリエ変換回路(FFT) 56:レベル比較回路 58:判別回路 60:予め登録されている撮影者の音声の周波数スペク
トル・パターン

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 使用者の音声を入力する音声入力手段
    と、 音声コマンドに対応する内容の音声パターン情報を保持
    する音声パターン保持手段と、 当該音声入力手段により入力された音声を当該音声パタ
    ーン保持手段に保持される音声パターンと照合して音声
    内容を認識し、その認識結果に対応する制御信号を出力
    する音声認識手段と、 当該音声認識手段から出力される制御信号に応じて各部
    を制御する制御手段とを有する撮像装置であって、 当該音声識別手段が、入力音声と当該音声パターン保持
    手段に保持される音声パターンとの一致の信頼度を判定
    する信頼度判定手段を具備し、当該信頼度の閾値が制御
    対象で異なることを特徴とする撮像装置。
  2. 【請求項2】 当該信頼度の閾値は、記録動作に関する
    ものが、それ以外よりも高い請求項1に記載の撮像装
    置。
  3. 【請求項3】 当該音声パターン保持手段が、当該使用
    者の音声パターンを保持する請求項1に記載の撮像装
    置。
JP10233970A 1998-08-20 1998-08-20 撮像装置 Pending JP2000069348A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10233970A JP2000069348A (ja) 1998-08-20 1998-08-20 撮像装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10233970A JP2000069348A (ja) 1998-08-20 1998-08-20 撮像装置

Publications (2)

Publication Number Publication Date
JP2000069348A true JP2000069348A (ja) 2000-03-03
JP2000069348A5 JP2000069348A5 (ja) 2005-04-14

Family

ID=16963502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10233970A Pending JP2000069348A (ja) 1998-08-20 1998-08-20 撮像装置

Country Status (1)

Country Link
JP (1) JP2000069348A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6937982B2 (en) 2000-07-21 2005-08-30 Denso Corporation Speech recognition apparatus and method using two opposite words
JP2009253966A (ja) * 2008-04-09 2009-10-29 Akira Tomita 指先カメラii
CN1841187B (zh) * 2005-04-01 2010-05-12 佳能株式会社 图像摄取设备及其控制方法
CN105721752A (zh) * 2009-07-03 2016-06-29 奥林巴斯株式会社 摄像装置和摄像方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6937982B2 (en) 2000-07-21 2005-08-30 Denso Corporation Speech recognition apparatus and method using two opposite words
DE10134908B4 (de) * 2000-07-21 2013-05-08 Denso Corporation Spracherkennungsvorrichtung und Verfahren, welche zwei gegenteilige Wörter verwenden
CN1841187B (zh) * 2005-04-01 2010-05-12 佳能株式会社 图像摄取设备及其控制方法
JP2009253966A (ja) * 2008-04-09 2009-10-29 Akira Tomita 指先カメラii
CN105721752A (zh) * 2009-07-03 2016-06-29 奥林巴斯株式会社 摄像装置和摄像方法
CN105721752B (zh) * 2009-07-03 2019-04-05 奥林巴斯株式会社 摄像装置和摄像方法

Similar Documents

Publication Publication Date Title
US8823864B2 (en) Image capturing apparatus and associated methodology for auto-focus and facial detection
JP5623915B2 (ja) 撮像装置
US7924324B2 (en) Sound-controlled electronic apparatus
JP2008206018A (ja) 撮像装置およびプログラム
US10334336B2 (en) Method of controlling digital photographing apparatus and digital photographing apparatus using the same
KR100770637B1 (ko) 디지털 카메라
JP6137965B2 (ja) 電子機器、電子機器の制御方法、及び電子機器の制御プログラム
JP2005267000A (ja) 電子機器および機能割り当て方法
JP2000069348A (ja) 撮像装置
JP2004301893A (ja) 音声認識装置の制御方法
US20220329732A1 (en) Imaging apparatus, sound processing method, and program
JP2000083186A (ja) 映像機器
JP4565276B2 (ja) カメラ及びそのモード切換方法
KR20080057048A (ko) 야간 촬영 모드에서의 디지털 촬영 장치의 제어 방법
JP2000155595A (ja) 撮像装置
KR101156683B1 (ko) 디지털 이미지 처리장치의 분할촬영 방법
KR100258330B1 (ko) 캠코더의 피사체 이동 감지 방법 및 장치
KR101268986B1 (ko) 디지털 영상 처리 방법
JP2004208276A (ja) 撮像装置
KR20060034453A (ko) 음성 인식을 통한 디지털 카메라 동작 장치 및 방법
KR100659862B1 (ko) 디지털 이미지의 북마크 표시방법, 북마크된 디지털이미지의 재생방법 및 이를 수행하는 디지털 이미지처리장치
JP2021089368A (ja) 電子機器、電子機器の制御方法及びそのプログラム
JPH0784302A (ja) 音声入力カメラ
KR20080041463A (ko) 디지털 영상 처리 장치의 영상 트리밍 방법
JP2016071212A (ja) 撮影装置、制御方法、及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040609

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060214

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060613