JP5146429B2 - 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム - Google Patents
画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム Download PDFInfo
- Publication number
- JP5146429B2 JP5146429B2 JP2009218132A JP2009218132A JP5146429B2 JP 5146429 B2 JP5146429 B2 JP 5146429B2 JP 2009218132 A JP2009218132 A JP 2009218132A JP 2009218132 A JP2009218132 A JP 2009218132A JP 5146429 B2 JP5146429 B2 JP 5146429B2
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- compound
- speech
- user
- phrases
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 89
- 238000000034 method Methods 0.000 title claims description 34
- 238000004590 computer program Methods 0.000 title claims description 4
- 150000001875 compounds Chemical class 0.000 claims description 91
- 238000003860 storage Methods 0.000 claims description 41
- 239000002245 particle Substances 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 8
- 238000003825 pressing Methods 0.000 description 7
- 238000007726 management method Methods 0.000 description 6
- 102100025374 Butyrophilin-like protein 9 Human genes 0.000 description 3
- 101000934743 Homo sapiens Butyrophilin-like protein 9 Proteins 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 102100027140 Butyrophilin subfamily 1 member A1 Human genes 0.000 description 2
- 102100025375 Butyrophilin-like protein 10 Human genes 0.000 description 2
- 101000901683 Homo sapiens Battenin Proteins 0.000 description 2
- 101000984929 Homo sapiens Butyrophilin subfamily 1 member A1 Proteins 0.000 description 2
- 101000934745 Homo sapiens Butyrophilin-like protein 10 Proteins 0.000 description 2
- 101100437920 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) BTN2 gene Proteins 0.000 description 2
- 101100480850 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) TDA3 gene Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 102100025429 Butyrophilin-like protein 2 Human genes 0.000 description 1
- 102100036825 Erythroid membrane-associated protein Human genes 0.000 description 1
- 101000934738 Homo sapiens Butyrophilin-like protein 2 Proteins 0.000 description 1
- 101000851733 Homo sapiens Erythroid membrane-associated protein Proteins 0.000 description 1
- 101001115699 Homo sapiens Myelin-oligodendrocyte glycoprotein Proteins 0.000 description 1
- 101000658138 Homo sapiens Thymosin beta-10 Proteins 0.000 description 1
- 102100023302 Myelin-oligodendrocyte glycoprotein Human genes 0.000 description 1
- 102100034998 Thymosin beta-10 Human genes 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
- Facsimiles In General (AREA)
Description
〔第1実施形態〕
次に、画像形成装置1の第1実施形態について、図4〜図15を参照して説明する。
〔第2実施形態〕
次に、画像形成装置1の第2実施形態について図16〜図22を参照して説明する。なお、第1実施形態における画像形成装置1と同一の構成要素には、同一の符号を付してその詳細な説明は適宜省略する。以下同様である。
〔第3実施形態〕
次に、画像形成装置1の第3実施形態について、図23〜図28を参照して説明する。
〔第4実施形態〕
次に、画像形成装置1の第4実施形態について、図29および図30を参照して説明する。
10g スキャナ部(画像読取装置)
30 総合情報記憶部(関連情報記憶手段)
31 機能語句情報記憶部(機能語句記憶手段)
32 表示制御部
33 情報書込み部(任意語句記憶手段)
34a 辞書データベース(辞書記憶手段)
34b 複合語句生成部(複合語句生成手段)
34d 複合語句書込み部(複合語句登録手段)
35 音声認識処理部(音声認識手段)
37 画像処理部(画像処理手段)
MK マイク(音声入力手段)
TP タッチパネル(表示装置)
GM1 宛先登録画面(操作画面)
GM2 読み方登録画面(操作画面)
GM3 検索文字入力画面(操作画面)
GM4 宛先選択画面(操作画面)
GM5 宛先選択画面(操作画面)
DT1、DT4、DT7 宛先情報、ボックス情報、保存文書情報(関連情報)
TB3、TB6、TB8 認識辞書テーブル(辞書)
WU ユーザ語句
WS システム語句(機能語句)
WC コマンド語句
Claims (9)
- 原稿の画像を読み取る画像読取装置を備えた画像処理装置であって、
ユーザに音声を入力させるための音声入力手段と、
前記音声を認識するための語句情報によって構成される辞書を記憶する辞書記憶手段と、
複数の所定の語句についての順序の異なる全ての組合せからなるとともに、一文となるように所定の助詞および動詞を付加した複数の複合語句を生成する複合語句生成手段と、
生成された前記複数の複合語句を前記語句情報として前記辞書に登録する複合語句登録手段と、
前記複数の所定の語句を任意の順序で発声した発声語句に係る音声が入力されたときに、前記辞書の中から当該発声語句と一致する前記複合語句を検索することによって当該音声を認識する、音声認識手段と、
前記音声認識手段による前記音声の認識の結果に基づいて前記画像に対する処理を実行する画像処理手段と、
を有することを特徴とする画像処理装置。 - 前記複合語句に関連付けられた関連情報を記憶する関連情報記憶手段を有し、
前記画像処理手段は、前記音声認識手段による前記音声の認識の結果に基づいて前記関連情報記憶手段から前記関連情報を抽出し、当該関連情報を用いて前記画像に対する処理を実行する、
請求項1記載の画像処理装置。 - 当該画像処理装置が有する機能に関する機能語句を記憶する機能語句記憶手段と、
ユーザにより指定されたユーザ語句を前記関連情報記憶手段に書き込むユーザ語句書込み手段と、を有し、
前記複合語句生成手段は、前記機能語句および前記ユーザ語句についての前記複合語句を生成する、
請求項2記載の画像処理装置。 - 表示装置に表示するために準備された複数の操作画面のそれぞれに対応して前記辞書が設けられており、
前記音声認識手段は、音声が入力されたときに前記表示装置に表示されている前記操作画面に対応する前記辞書を用いて当該音声を認識する、
請求項1ないし請求項3のいずれかに記載の画像処理装置。 - ユーザにより指定されたユーザ語句が前記関連情報記憶手段に既に書き込まれている場合に、前記表示装置に当該ユーザに対する警告のための表示を行う、
請求項4に記載の画像処理装置。 - 音声を認識するための音声認識処理装置であって、
ユーザに音声を入力させるための音声入力手段と、
前記音声を認識するための語句情報によって構成される辞書を記憶する辞書記憶手段と、
複数の所定の語句についての順序の異なる全ての組合せからなるとともに、一文となるように所定の助詞および動詞を付加した複数の複合語句を生成する複合語句生成手段と、
生成された前記複数の複合語句を前記語句情報として前記辞書に登録する複合語句登録手段と、
前記複数の所定の語句を任意の順序で発声した発声語句に係る音声が入力されたときに、前記辞書の中から当該発声語句と一致する前記複合語句を検索することによって当該音声を認識する、音声認識手段と、
を有することを特徴とする音声認識処理装置。 - 前記複合語句に関連付けられた関連情報を記憶する関連情報記憶手段を有し、
前記音声認識手段による前記音声の認識の結果に基づいて前記関連情報記憶手段から前記関連情報を抽出し、当該関連情報を用いて画像に対する処理を実行する、
請求項6記載の音声認識処理装置。 - 音声認識処理装置において音声を認識するための制御方法であって、
音声を認識するための語句情報によって構成される辞書を前記音声認識処理装置に記憶しておき、
複数の所定の語句についての順序の異なる全ての組合せからなるとともに、一文となるように所定の助詞および動詞を付加した複数の複合語句を生成し、
生成された前記複数の複合語句を前記語句情報として前記辞書に登録し、
前記複数の所定の語句を任意の順序で発声した発声語句に係る音声が入力されたときに、前記辞書の中から当該発声語句と一致する前記複合語句を検索することによって当該音声を認識する、
ことを特徴とする音声認識処理装置の制御方法。 - 音声を認識するための音声認識処理装置を制御するコンピュータのためのコンピュータプログラムであって、
前記コンピュータによって実行されたときに、前記音声認識処理装置に、
複数の所定の語句についての順序の異なる全ての組合せからなるとともに、一文となるように所定の助詞および動詞を付加した複数の複合語句を生成する手段と、
生成された前記複数の複合語句を、音声を認識するための語句情報として辞書に登録する手段と、
前記複数の所定の語句を任意の順序で発声した発声語句に係る音声が入力されたときに、前記辞書の中から当該発声語句と一致する前記複合語句を検索することによって当該音声を認識させる手段と、
を実現させることを特徴とするコンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009218132A JP5146429B2 (ja) | 2009-09-18 | 2009-09-18 | 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム |
US12/883,388 US8630852B2 (en) | 2009-09-18 | 2010-09-16 | Image processing apparatus, speech recognition processing apparatus, control method for speech recognition processing apparatus, and computer-readable storage medium for computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009218132A JP5146429B2 (ja) | 2009-09-18 | 2009-09-18 | 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011065108A JP2011065108A (ja) | 2011-03-31 |
JP5146429B2 true JP5146429B2 (ja) | 2013-02-20 |
Family
ID=43757400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009218132A Active JP5146429B2 (ja) | 2009-09-18 | 2009-09-18 | 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8630852B2 (ja) |
JP (1) | JP5146429B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5819261B2 (ja) * | 2012-06-19 | 2015-11-18 | 株式会社Nttドコモ | 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム |
US10713426B2 (en) | 2013-11-14 | 2020-07-14 | Elsevier B.V. | Systems, computer-program products and methods for annotating multiple controlled vocabulary-defined concepts in single noun phrases |
JP6674216B2 (ja) * | 2015-09-15 | 2020-04-01 | キヤノン株式会社 | 画像通信装置とその制御方法、及びプログラム |
US10547729B2 (en) | 2017-03-27 | 2020-01-28 | Samsung Electronics Co., Ltd. | Electronic device and method of executing function of electronic device |
CN107886947A (zh) * | 2017-10-19 | 2018-04-06 | 珠海格力电器股份有限公司 | 一种图像处理的方法以及装置 |
JP7159608B2 (ja) * | 2018-05-14 | 2022-10-25 | コニカミノルタ株式会社 | 操作画面の表示装置、画像処理装置及びプログラム |
JP7458716B2 (ja) * | 2018-09-04 | 2024-04-01 | キヤノン株式会社 | 音声対話装置及びその制御方法、並びにプログラム |
JP7175696B2 (ja) * | 2018-09-28 | 2022-11-21 | キヤノン株式会社 | 画像処理システム、画像処理装置、及びその制御方法 |
JP7135704B2 (ja) * | 2018-10-17 | 2022-09-13 | コニカミノルタ株式会社 | 画像形成装置、画像形成システム、及び画像読取装置 |
JP2020107130A (ja) | 2018-12-27 | 2020-07-09 | キヤノン株式会社 | 情報処理システム、情報処理装置、制御方法、プログラム |
JP7415350B2 (ja) * | 2019-07-08 | 2024-01-17 | コニカミノルタ株式会社 | 音声操作システム、制御装置、および制御プログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69326431T2 (de) * | 1992-12-28 | 2000-02-03 | Toshiba Kawasaki Kk | Spracherkennungs-Schnittstellensystem, das als Fenstersystem und Sprach-Postsystem verwendbar ist |
US6349282B1 (en) * | 1999-04-20 | 2002-02-19 | Larnout & Hauspie Speech Products N.V. | Compound words in speech recognition systems |
JP4262837B2 (ja) * | 1999-07-14 | 2009-05-13 | 富士通テン株式会社 | 音声認識機能を用いたナビゲーション方法 |
US7120582B1 (en) * | 1999-09-07 | 2006-10-10 | Dragon Systems, Inc. | Expanding an effective vocabulary of a speech recognition system |
JP2002108389A (ja) | 2000-09-29 | 2002-04-10 | Matsushita Electric Ind Co Ltd | 音声による個人名称検索、抽出方法およびその装置と車載ナビゲーション装置 |
US20060106604A1 (en) * | 2002-11-11 | 2006-05-18 | Yoshiyuki Okimoto | Speech recognition dictionary creation device and speech recognition device |
JP2004294872A (ja) * | 2003-03-27 | 2004-10-21 | Matsushita Electric Ind Co Ltd | 音声認識を利用した電子機器 |
JP4236502B2 (ja) * | 2003-04-03 | 2009-03-11 | 三菱電機株式会社 | 音声認識装置 |
JP4554272B2 (ja) * | 2004-05-25 | 2010-09-29 | 三菱電機株式会社 | 音声対話装置 |
US7921011B2 (en) * | 2005-05-20 | 2011-04-05 | Sony Computer Entertainment Inc. | Structure for grammar and dictionary representation in voice recognition and method for simplifying link and node-generated grammars |
US7957968B2 (en) * | 2005-12-22 | 2011-06-07 | Honda Motor Co., Ltd. | Automatic grammar generation using distributedly collected knowledge |
JP4867622B2 (ja) * | 2006-11-29 | 2012-02-01 | 日産自動車株式会社 | 音声認識装置、および音声認識方法 |
US8401847B2 (en) * | 2006-11-30 | 2013-03-19 | National Institute Of Advanced Industrial Science And Technology | Speech recognition system and program therefor |
JP5009037B2 (ja) * | 2007-04-20 | 2012-08-22 | クラリオン株式会社 | 音声認識装置、その音声認識方法 |
-
2009
- 2009-09-18 JP JP2009218132A patent/JP5146429B2/ja active Active
-
2010
- 2010-09-16 US US12/883,388 patent/US8630852B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011065108A (ja) | 2011-03-31 |
US8630852B2 (en) | 2014-01-14 |
US20110071829A1 (en) | 2011-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5146429B2 (ja) | 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム | |
US10652178B2 (en) | Information processing apparatus, information processing system, and information processing method | |
JP2006330576A (ja) | 機器操作システム、音声認識装置、電子機器、情報処理装置、プログラム、及び記録媒体 | |
US11140284B2 (en) | Image forming system equipped with interactive agent function, method of controlling same, and storage medium | |
US12015746B2 (en) | Image processing system, setting control method, image processing apparatus, and storage medium | |
US11327697B2 (en) | Information processing apparatus and startup method for input-output device | |
US20200267268A1 (en) | Image forming apparatus, display control method, and recording medium | |
JP5343652B2 (ja) | 操作画面制御装置、画像形成装置、およびコンピュータプログラム | |
US11792338B2 (en) | Image processing system for controlling an image forming apparatus with a microphone | |
US11595535B2 (en) | Information processing apparatus that cooperates with smart speaker, information processing system, control methods, and storage media | |
US11036441B1 (en) | System and method for creation and invocation of predefined print settings via speech input | |
US11838459B2 (en) | Information processing system, information processing apparatus, and information processing method | |
JP6832503B2 (ja) | 情報提示方法、情報提示プログラム及び情報提示システム | |
JP2021092982A (ja) | 画像処理システム、画像処理装置、画像処理方法 | |
US11838460B2 (en) | Information processing system, information processing apparatus, and information processing method | |
JP6810363B2 (ja) | 情報処理装置、情報処理システム、および情報処理プログラム | |
JP7286321B2 (ja) | 情報処理システム、情報処理装置、制御方法、プログラム | |
US11700338B2 (en) | Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor | |
JP7388272B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2020038348A (ja) | 音声対話装置及びその制御方法、並びにプログラム | |
JP7327939B2 (ja) | 情報処理システム、情報処理装置、制御方法、プログラム | |
JP7383885B2 (ja) | 情報処理装置及びプログラム | |
JP2022096305A (ja) | 情報処理システム、画像処理装置、情報処理システムの制御方法、及びプログラム | |
JP2006235040A (ja) | 画像形成装置、プログラムおよび記録媒体 | |
JPH08297561A (ja) | 複合情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120424 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121030 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121112 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5146429 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151207 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |