JP2011065108A - 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム - Google Patents
画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2011065108A JP2011065108A JP2009218132A JP2009218132A JP2011065108A JP 2011065108 A JP2011065108 A JP 2011065108A JP 2009218132 A JP2009218132 A JP 2009218132A JP 2009218132 A JP2009218132 A JP 2009218132A JP 2011065108 A JP2011065108 A JP 2011065108A
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- compound
- speech
- phrases
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 92
- 238000000034 method Methods 0.000 title claims description 35
- 238000004590 computer program Methods 0.000 title claims description 4
- 150000001875 compounds Chemical class 0.000 claims abstract description 97
- 238000003860 storage Methods 0.000 claims description 41
- 239000002245 particle Substances 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 8
- 238000003825 pressing Methods 0.000 description 7
- 238000007726 management method Methods 0.000 description 6
- 102100025374 Butyrophilin-like protein 9 Human genes 0.000 description 3
- 101000934743 Homo sapiens Butyrophilin-like protein 9 Proteins 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 102100027140 Butyrophilin subfamily 1 member A1 Human genes 0.000 description 2
- 102100025375 Butyrophilin-like protein 10 Human genes 0.000 description 2
- 101000901683 Homo sapiens Battenin Proteins 0.000 description 2
- 101000984929 Homo sapiens Butyrophilin subfamily 1 member A1 Proteins 0.000 description 2
- 101000934745 Homo sapiens Butyrophilin-like protein 10 Proteins 0.000 description 2
- 101100437920 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) BTN2 gene Proteins 0.000 description 2
- 101100480850 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) TDA3 gene Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 102100025429 Butyrophilin-like protein 2 Human genes 0.000 description 1
- 102100036825 Erythroid membrane-associated protein Human genes 0.000 description 1
- 101000934738 Homo sapiens Butyrophilin-like protein 2 Proteins 0.000 description 1
- 101000851733 Homo sapiens Erythroid membrane-associated protein Proteins 0.000 description 1
- 101001115699 Homo sapiens Myelin-oligodendrocyte glycoprotein Proteins 0.000 description 1
- 101000658138 Homo sapiens Thymosin beta-10 Proteins 0.000 description 1
- 102100023302 Myelin-oligodendrocyte glycoprotein Human genes 0.000 description 1
- 102100034998 Thymosin beta-10 Human genes 0.000 description 1
- -1 compounds Compound Chemical class 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Facsimiles In General (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】原稿の画像を読み取る画像読取装置を備えた画像処理装置に、マイク、音声を認識するための認識語句を記憶する認識辞書テーブルTB3、複数の所定の語句についての順序の異なる全ての組合せからなる複数の複合語句WFを生成する複合語句生成部34b、生成された複合語句WFを認識語句として認識辞書テーブルTB3に書き込む複合語句登録部34dと、複数の所定の語句を任意の順序で発声した発声語句に係る音声が入力されたときに、認識辞書テーブルTB3の中から当該発声語句と一致する複合語句WFを検索することによって当該音声を認識する音声認識処理部35、音声の認識の結果に基づいて画像に対する処理を実行する画像処理部を設ける。
【選択図】図11
Description
〔第1実施形態〕
次に、画像形成装置1の第1実施形態について、図4〜図15を参照して説明する。
〔第2実施形態〕
次に、画像形成装置1の第2実施形態について図16〜図22を参照して説明する。なお、第1実施形態における画像形成装置1と同一の構成要素には、同一の符号を付してその詳細な説明は適宜省略する。以下同様である。
〔第3実施形態〕
次に、画像形成装置1の第3実施形態について、図23〜図28を参照して説明する。
〔第4実施形態〕
次に、画像形成装置1の第4実施形態について、図29および図30を参照して説明する。
10g スキャナ部(画像読取装置)
30 総合情報記憶部(関連情報記憶手段)
31 機能語句情報記憶部(機能語句記憶手段)
32 表示制御部
33 情報書込み部(任意語句記憶手段)
34a 辞書データベース(辞書記憶手段)
34b 複合語句生成部(複合語句生成手段)
34d 複合語句書込み部(複合語句登録手段)
35 音声認識処理部(音声認識手段)
37 画像処理部(画像処理手段)
MK マイク(音声入力手段)
TP タッチパネル(表示装置)
GM1 宛先登録画面(操作画面)
GM2 読み方登録画面(操作画面)
GM3 検索文字入力画面(操作画面)
GM4 宛先選択画面(操作画面)
GM5 宛先選択画面(操作画面)
DT1、DT4、DT7 宛先情報、ボックス情報、保存文書情報(関連情報)
TB3、TB6、TB8 認識辞書テーブル(辞書)
WU ユーザ語句
WS システム語句(機能語句)
WC コマンド語句
Claims (10)
- 原稿の画像を読み取る画像読取装置を備えた画像処理装置であって、
ユーザに音声を入力させるための音声入力手段と、
前記音声を認識するための語句情報によって構成される辞書を記憶する辞書記憶手段と、
複数の所定の語句についての順序の異なる全ての組合せからなる複数の複合語句を生成する複合語句生成手段と、
生成された前記複数の複合語句を前記語句情報として前記辞書に登録する複合語句登録手段と、
前記複数の所定の語句を任意の順序で発声した発声語句に係る音声が入力されたときに、前記辞書の中から当該発声語句と一致する前記複合語句を検索することによって当該音声を認識する、音声認識手段と、
前記音声認識手段による前記音声の認識の結果に基づいて前記画像に対する処理を実行する画像処理手段と、
を有することを特徴とする画像処理装置。 - 前記複合語句に関連付けられた関連情報を記憶する関連情報記憶手段を有し、
前記画像処理手段は、前記音声認識手段による前記音声の認識の結果に基づいて前記関連情報記憶手段から前記関連情報を抽出し、当該関連情報を用いて前記画像に対する処理を実行する、
請求項1記載の画像処理装置。 - 当該画像処理装置が有する機能に関する機能語句を記憶する機能語句記憶手段と、
ユーザにより指定されたユーザ語句を前記関連情報記憶手段に書き込むユーザ語句書込み手段と、を有し、
前記複合語句生成手段は、前記機能語句および前記ユーザ語句についての前記複合語句を生成する、
請求項1または請求項2記載の画像処理装置。 - 表示装置に表示するために準備された複数の操作画面のそれぞれに対応して前記辞書が設けられており、
前記音声認識手段は、音声が入力されたときに前記表示装置に表示されている前記操作画面に対応する前記辞書を用いて当該音声を認識する、
請求項1ないし請求項3のいずれかに記載の画像処理装置。 - ユーザにより指定されたユーザ語句が前記関連情報記憶手段に既に書き込まれている場合に、前記表示装置に当該ユーザに対する警告のための表示を行う、
請求項3または請求項4に記載の画像処理装置。 - 前記複合語句生成手段は、前記複合語句が一文となるように所定の助詞および動詞を付加した前記組合せを生成する、
請求項1ないし請求項5のいずれかに記載の画像処理装置。 - 音声を認識するための音声認識処理装置であって、
ユーザに音声を入力させるための音声入力手段と、
前記音声を認識するための語句情報によって構成される辞書を記憶する辞書記憶手段と、
複数の所定の語句についての順序の異なる全ての組合せからなる複数の複合語句を生成する複合語句生成手段と、
生成された前記複数の複合語句を前記語句情報として前記辞書に登録する複合語句登録手段と、
前記複数の所定の語句を任意の順序で発声した発声語句に係る音声が入力されたときに、前記辞書の中から当該発声語句と一致する前記複合語句を検索することによって当該音声を認識する、音声認識手段と、
を有することを特徴とする音声認識処理装置。 - 前記複合語句に関連付けられた関連情報を記憶する関連情報記憶手段を有し、
前記画像処理手段は、前記音声認識手段による前記音声の認識の結果に基づいて前記関連情報記憶手段から前記関連情報を抽出し、当該関連情報を用いて前記画像に対する処理を実行する、
請求項7記載の音声認識処理装置。 - 音声認識処理装置において音声を認識するための制御方法であって、
音声を認識するための語句情報によって構成される辞書を前記音声認識処理装置に記憶しておき、
複数の所定の語句についての順序の異なる全ての組合せからなる複数の複合語句を生成し、
生成された前記複数の複合語句を前記語句情報として前記辞書に登録し、
前記複数の所定の語句を任意の順序で発声した発声語句に係る音声が入力されたときに、前記辞書の中から当該発声語句と一致する前記複合語句を検索することによって当該音声を認識する、
ことを特徴とする音声認識処理装置の制御方法。 - 音声を認識するための音声認識処理装置を制御するコンピュータのためのコンピュータプログラムであって、
前記コンピュータによって実行されたときに、前記音声認識処理装置に、
複数の所定の語句についての順序の異なる全ての組合せからなる複数の複合語句を生成する手段と、
生成された前記複数の複合語句を、音声を認識するための語句情報として辞書に登録する手段と、
前記複数の所定の語句を任意の順序で発声した発声語句に係る音声が入力されたときに、前記辞書の中から当該発声語句と一致する前記複合語句を検索することによって当該音声を認識させる手段と、
を実現させることを特徴とするコンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009218132A JP5146429B2 (ja) | 2009-09-18 | 2009-09-18 | 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム |
US12/883,388 US8630852B2 (en) | 2009-09-18 | 2010-09-16 | Image processing apparatus, speech recognition processing apparatus, control method for speech recognition processing apparatus, and computer-readable storage medium for computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009218132A JP5146429B2 (ja) | 2009-09-18 | 2009-09-18 | 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011065108A true JP2011065108A (ja) | 2011-03-31 |
JP5146429B2 JP5146429B2 (ja) | 2013-02-20 |
Family
ID=43757400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009218132A Active JP5146429B2 (ja) | 2009-09-18 | 2009-09-18 | 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8630852B2 (ja) |
JP (1) | JP5146429B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013190957A1 (ja) * | 2012-06-19 | 2013-12-27 | 株式会社エヌ・ティ・ティ・ドコモ | 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム |
JP2020038348A (ja) * | 2018-09-04 | 2020-03-12 | キヤノン株式会社 | 音声対話装置及びその制御方法、並びにプログラム |
JP2020065171A (ja) * | 2018-10-17 | 2020-04-23 | コニカミノルタ株式会社 | 画像形成装置、画像形成システム、及び画像読取装置 |
US11159684B2 (en) | 2018-12-27 | 2021-10-26 | Canon Kabushiki Kaisha | Image forming system and image forming apparatus |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10713426B2 (en) | 2013-11-14 | 2020-07-14 | Elsevier B.V. | Systems, computer-program products and methods for annotating multiple controlled vocabulary-defined concepts in single noun phrases |
JP6674216B2 (ja) * | 2015-09-15 | 2020-04-01 | キヤノン株式会社 | 画像通信装置とその制御方法、及びプログラム |
US10547729B2 (en) | 2017-03-27 | 2020-01-28 | Samsung Electronics Co., Ltd. | Electronic device and method of executing function of electronic device |
CN107886947A (zh) * | 2017-10-19 | 2018-04-06 | 珠海格力电器股份有限公司 | 一种图像处理的方法以及装置 |
JP7159608B2 (ja) * | 2018-05-14 | 2022-10-25 | コニカミノルタ株式会社 | 操作画面の表示装置、画像処理装置及びプログラム |
JP7175696B2 (ja) * | 2018-09-28 | 2022-11-21 | キヤノン株式会社 | 画像処理システム、画像処理装置、及びその制御方法 |
JP7415350B2 (ja) * | 2019-07-08 | 2024-01-17 | コニカミノルタ株式会社 | 音声操作システム、制御装置、および制御プログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001027540A (ja) * | 1999-07-14 | 2001-01-30 | Fujitsu Ten Ltd | 音声認識機能を用いたナビゲーション方法 |
JP2004294872A (ja) * | 2003-03-27 | 2004-10-21 | Matsushita Electric Ind Co Ltd | 音声認識を利用した電子機器 |
JP2004309654A (ja) * | 2003-04-03 | 2004-11-04 | Mitsubishi Electric Corp | 音声認識装置 |
JP2005338274A (ja) * | 2004-05-25 | 2005-12-08 | Mitsubishi Electric Corp | 音声対話装置 |
JP2008268571A (ja) * | 2007-04-20 | 2008-11-06 | Xanavi Informatics Corp | 音声認識装置、その音声認識方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0607615B1 (en) * | 1992-12-28 | 1999-09-15 | Kabushiki Kaisha Toshiba | Speech recognition interface system suitable for window systems and speech mail systems |
US6349282B1 (en) * | 1999-04-20 | 2002-02-19 | Larnout & Hauspie Speech Products N.V. | Compound words in speech recognition systems |
US7120582B1 (en) * | 1999-09-07 | 2006-10-10 | Dragon Systems, Inc. | Expanding an effective vocabulary of a speech recognition system |
JP2002108389A (ja) | 2000-09-29 | 2002-04-10 | Matsushita Electric Ind Co Ltd | 音声による個人名称検索、抽出方法およびその装置と車載ナビゲーション装置 |
AU2003277587A1 (en) * | 2002-11-11 | 2004-06-03 | Matsushita Electric Industrial Co., Ltd. | Speech recognition dictionary creation device and speech recognition device |
WO2006127504A2 (en) * | 2005-05-20 | 2006-11-30 | Sony Computer Entertainment Inc. | Optimisation of a grammar for speech recognition |
US7957968B2 (en) * | 2005-12-22 | 2011-06-07 | Honda Motor Co., Ltd. | Automatic grammar generation using distributedly collected knowledge |
JP4867622B2 (ja) * | 2006-11-29 | 2012-02-01 | 日産自動車株式会社 | 音声認識装置、および音声認識方法 |
GB2457855B (en) * | 2006-11-30 | 2011-01-12 | Nat Inst Of Advanced Ind Scien | Speech recognition system and speech recognition system program |
-
2009
- 2009-09-18 JP JP2009218132A patent/JP5146429B2/ja active Active
-
2010
- 2010-09-16 US US12/883,388 patent/US8630852B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001027540A (ja) * | 1999-07-14 | 2001-01-30 | Fujitsu Ten Ltd | 音声認識機能を用いたナビゲーション方法 |
JP2004294872A (ja) * | 2003-03-27 | 2004-10-21 | Matsushita Electric Ind Co Ltd | 音声認識を利用した電子機器 |
JP2004309654A (ja) * | 2003-04-03 | 2004-11-04 | Mitsubishi Electric Corp | 音声認識装置 |
JP2005338274A (ja) * | 2004-05-25 | 2005-12-08 | Mitsubishi Electric Corp | 音声対話装置 |
JP2008268571A (ja) * | 2007-04-20 | 2008-11-06 | Xanavi Informatics Corp | 音声認識装置、その音声認識方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013190957A1 (ja) * | 2012-06-19 | 2013-12-27 | 株式会社エヌ・ティ・ティ・ドコモ | 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム |
JP2020038348A (ja) * | 2018-09-04 | 2020-03-12 | キヤノン株式会社 | 音声対話装置及びその制御方法、並びにプログラム |
JP7458716B2 (ja) | 2018-09-04 | 2024-04-01 | キヤノン株式会社 | 音声対話装置及びその制御方法、並びにプログラム |
JP2020065171A (ja) * | 2018-10-17 | 2020-04-23 | コニカミノルタ株式会社 | 画像形成装置、画像形成システム、及び画像読取装置 |
JP7135704B2 (ja) | 2018-10-17 | 2022-09-13 | コニカミノルタ株式会社 | 画像形成装置、画像形成システム、及び画像読取装置 |
US11159684B2 (en) | 2018-12-27 | 2021-10-26 | Canon Kabushiki Kaisha | Image forming system and image forming apparatus |
Also Published As
Publication number | Publication date |
---|---|
US20110071829A1 (en) | 2011-03-24 |
JP5146429B2 (ja) | 2013-02-20 |
US8630852B2 (en) | 2014-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5146429B2 (ja) | 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム | |
US10652178B2 (en) | Information processing apparatus, information processing system, and information processing method | |
JP2006330576A (ja) | 機器操作システム、音声認識装置、電子機器、情報処理装置、プログラム、及び記録媒体 | |
US11140284B2 (en) | Image forming system equipped with interactive agent function, method of controlling same, and storage medium | |
US11327697B2 (en) | Information processing apparatus and startup method for input-output device | |
US12015746B2 (en) | Image processing system, setting control method, image processing apparatus, and storage medium | |
JP5343652B2 (ja) | 操作画面制御装置、画像形成装置、およびコンピュータプログラム | |
JP2020027132A (ja) | 情報処理装置およびプログラム | |
US11792338B2 (en) | Image processing system for controlling an image forming apparatus with a microphone | |
US11595535B2 (en) | Information processing apparatus that cooperates with smart speaker, information processing system, control methods, and storage media | |
TWI453655B (zh) | 多功能事務機及其警示方法 | |
US11036441B1 (en) | System and method for creation and invocation of predefined print settings via speech input | |
US11838459B2 (en) | Information processing system, information processing apparatus, and information processing method | |
JP2021092982A (ja) | 画像処理システム、画像処理装置、画像処理方法 | |
US11838460B2 (en) | Information processing system, information processing apparatus, and information processing method | |
JP7361509B2 (ja) | 周辺装置管理システム、印刷装置制御システム、制御方法、印刷制御装置及びプログラム | |
US11700338B2 (en) | Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor | |
JP2020112933A (ja) | 情報処理システム、情報処理装置、制御方法、プログラム | |
JP2020038348A (ja) | 音声対話装置及びその制御方法、並びにプログラム | |
JP4562547B2 (ja) | 画像形成装置、プログラムおよび記録媒体 | |
JP7388272B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2015088890A (ja) | 操作案内サーバ、操作案内システム、画像形成装置およびプログラム | |
JP7327939B2 (ja) | 情報処理システム、情報処理装置、制御方法、プログラム | |
US20210360113A1 (en) | Image forming system allowing voice operation, control method therefor, and storage medium storing control program therefor | |
JP2022096305A (ja) | 情報処理システム、画像処理装置、情報処理システムの制御方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120424 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121030 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121112 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5146429 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151207 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |