JP2019153133A - 文字入力装置、文字入力方法、及び、文字入力プログラム - Google Patents

文字入力装置、文字入力方法、及び、文字入力プログラム Download PDF

Info

Publication number
JP2019153133A
JP2019153133A JP2018038508A JP2018038508A JP2019153133A JP 2019153133 A JP2019153133 A JP 2019153133A JP 2018038508 A JP2018038508 A JP 2018038508A JP 2018038508 A JP2018038508 A JP 2018038508A JP 2019153133 A JP2019153133 A JP 2019153133A
Authority
JP
Japan
Prior art keywords
voice
input
replacement
character
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018038508A
Other languages
English (en)
Inventor
悠介 秋野
Yusuke AKINO
悠介 秋野
賢一 鵜飼
Kenichi Ukai
賢一 鵜飼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP2018038508A priority Critical patent/JP2019153133A/ja
Priority to US16/278,779 priority patent/US11107474B2/en
Publication of JP2019153133A publication Critical patent/JP2019153133A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】効率的な音声入力を実現する。【解決手段】文字入力装置は、音声入力を受け付ける音声入力部と、音声入力部に入力された一連の音声入力の中に、置き換え用音声があれば、置き換え用音声を置き換えた一連の音声入力に対応する、予測候補を推測する制御部と、予測候補を出力する候補出力部とを備える。【選択図】図1

Description

この発明は、音声入力を用いた文字入力技術に関する。
特許文献1に記載の構成では、音声入力を行うことによって、語彙リストを生成している。
特開2014−164260号公報
しかしながら、特許文献1の構成を用いた場合、読み込んだ音声は、そのまま文字変換され、出力される。すなわち、利用者は、入力したい文字列を間違えずに発声する必要があり、例えば入力したい文字列が思い出せない場合には、文字入力を行えない虞がある。
したがって、本発明の目的は、効率的な音声入力を実現することである。
この文字入力装置は、音声入力を受け付ける音声入力部と、音声入力部に入力された一連の音声入力の中に、置き換え用音声があれば、置き換え用音声を置き換えた一連の音声入力に対応する、予測候補を推測する制御部と、予測候補を出力する候補出力部とを備える。
この構成では、音声入力を行う際に、置き換え用音声から推測される文字を他の文字に置き換えた予測候補を出力でき、利用者の利便性が向上する。
この文字入力装置の制御部は、一連の音声入力に対応し、語彙が成立するような予測候補を検索してもよい。
この構成では、置き換え用記号の前後関係を含んだ予測候補を出力できる。
この文字入力装置の制御部は、音声入力データから推測された予測候補が複数である場合には、音声入力データの関連度が高い順に表示してもよい。
この構成では、関連度が高い順に予測候補を出力できる。
この文字入力装置は、任意で設定した置き換え用音声を保存可能な保存部を備えていてもよい。
この構成では、利用者毎にカスタマイズが可能であり、利便性が向上する。
この発明によれば、効率的な音声入力を実現できる。
本発明の第1の実施形態に係る文字入力装置のブロック図である。 本発明の第1の実施形態に係る文字入力装置の概要図である。 本発明の第1の実施形態に係る文字入力装置の動作を表すフローチャートである。 本発明の第2の実施形態に係る文字入力装置の概要図である。
以下、本発明を実施するための形態について、幾つかの図を参照して説明する。
・適用例
まず、図1を用いて、本発明が適用される一例について説明する。図1は、本発明の第1の実施形態に係る文字入力装置のブロック図である。文字入力装置10は、例えば、スマートフォンであり、携帯通信端末等に含まれる音声入力機能を用いて、文字入力を行える機器で使用される。
文字入力装置10は、操作部100と、制御部200と、保存部300と、出力部400とを備える。操作部100は、キー操作部110と、音声入力部120とを備える。出力部400は、候補出力部410と、確定文字出力部420とを備える。保存部300は、例えば、辞書データと、利用者の入力履歴等のデータを有する。候補出力部410は、辞書データから検索できる通常の候補(以下、通常候補)と、音声データから推測される予測候補(以下、予測候補)とを表示する。
利用者が、キー操作部110を用いることによって、操作部100は、音声入力部120を起動する。利用者は、音声入力部120を用いて、音声入力を行う。
このとき、音声入力を行う文字列(以下、音声入力文字列)には、置き換え用音声が含まれている。置き換え用音声とは、例えば、「ピー」のような音声であり、ワイルドカードの役割を持つ。具体的には、利用者は、思い出すことが出来ない文字列、または、知らない文字列を「ピー」で置き換えて、音声入力を行う。
音声入力部120は、音声入力文字列を制御部200に出力する。制御部200は、音声入力文字列に置き換え用音声が含まれているかどうかを判断する。制御部200は、置き換え用音声が含まれていると判断した場合、上述の「ピー」を置き換えることにより、語彙が成立するように、保存部300から推測される予測候補を検索する。
制御部200は、当該予測候補を候補出力部410に出力する。利用者が候補出力部410から該当の文字列を選択することによって、候補出力部410は、該当の文字列を確定文字出力部420に出力する。
この構成を用いることによって、利用者が入力したい文字列を思い出せない場合でも、保存部300から予測候補を出力できる。すなわち、利用者は、効率的に音声入力を用いて、文字入力が行うことができ、利用者の利便性が向上する。
・構成例1
図1は、本発明の第1の実施形態に係る文字入力装置のブロック図である。図2は、本発明の第1の実施形態に係る文字入力装置の概要図である。図3は、本発明の第1の実施形態に係る文字入力装置の動作を表すフローチャートである。
上述の図1の文字入力装置10の構成に基づき、図2を用いて、より具体的な構成例を説明する。
図1、図2に示すように、文字入力装置10は、キー操作部110と、候補出力部410と、確定文字出力部420とを備える。キー操作部110は、音声入力切り替えボタン101を備えている。利用者が、この音声入力切り替えボタン101を押下することによって、キー操作部110と、音声入力部120を切り替える。
利用者が、音声入力切り替えボタン101を押下すると、操作部100は、音声入力部120を起動する。利用者は、音声入力部120に「人間万事」、「ピー」、「が馬」と発声する。
音声入力部120は、「人間万事」、「ピー」、「が馬」の文字列を制御部200に出力する。制御部200は、置き換え用音声である「ピー」が含まれていることを検知する。
制御部200は、保存部300から、「ピー」をワイルドカードとして、「人間万事ピーが馬」に関連する文字列を検索する。より具体的には、「ピー」を置き換えることにより、語彙が成立するように、保存部300から推測される予測候補を検索する。このことによって、制御部200は、「人間万事塞翁が馬」等の検索結果を候補出力部410に出力する。
利用者が、「人間万事塞翁が馬」を選択すると、候補出力部410は、確定文字出力部420に「人間万事塞翁が馬」という、所望の文字列を出力できる。
図3を用いて、置き換え用音声を用いた音声入力を行う際の具体的な動作について説明する。図3は、本発明の第1の実施形態に係る文字入力装置の動作を表すフローチャートである。
音声入力部120は、音声入力を受け付ける(S101)。
制御部200は、入力された音声を認識する(S102)。
制御部200は、音声入力文字列に置き換え用音声が含まれているかどうかを判断する(S103)。
音声入力文字列に置き換え用音声が含まれている場合(S103:Yes)、制御部200は、保存部300から予測候補を検索し、候補出力部410に出力する(S104)。
候補出力部410は、予測候補を表示する(S105)。
利用者が、該予測候補から該当の文字列を選択すると、候補出力部410は、該文字列を確定文字出力部420に出力する(S106)。
音声入力文字に置き換え用音声が含まれていない場合(S103:No)、制御部200は、保存部300から候補を検索し、候補出力部410に出力する(S114)。
候補出力部410は、予測候補を表示する(S105)。
利用者が、該候補から該当の文字列を選択すると、候補出力部410は、該文字列を確定文字出力部420に出力する(S106)。
このような構成とすることで、置き換え用音声を含む文字列である場合には、置き換え用音声をワイルドカードとして、保存部300を検索できる。すなわち、予測候補を検索することができ、利用者が望む文字列を候補として出力することができる。
また、上述の例では、音声入力文字列に、置き換え用音声を1つ含む構成を示したが、置き換え用音声が複数含まれていても同様の処理を行うことができる。
さらに、例えば、音声入力時に他の人に聞かれたくない音声を入力する時等に置き換え用音声を用いることで、プライバシーが保護され、利用者は、効率的な文字入力を行うことができる。
また、置き換え用音声は、利用者がカスタマイズ可能であり、当該置き換え用音声は保存部300に保存可能である。このことによって、利用者の利便性がさらに向上する。
・構成例2
次に、図4を用いて、文字入力装置が適用される具体的な構成について説明する。図4は、本発明の第2の実施形態に係る文字入力装置の概要図である。
第2の実施形態における文字入力装置10Aは、カーナビゲーションに適用される。第2実施形態における文字入力装置10Aの基本的な構成は、第1の実施形態と同様であり、同様の箇所の説明は省略する。
図4に示すように、利用者が、音声入力切り替えボタン101を押下すると、文字入力装置10Aは、音声入力部120を起動する。利用者は、音声入力部120に「ピー」、「博物館」と発声する。
音声入力部120は、「ピー」、「博物館」の文字列を制御部200に出力する。制御部200は、置き換え用音声である「ピー」が入力されていることを検知する。
制御部200は、保存部300から、「ピー」をワイルドカードとして、「ピー博物館」に関連する文字列を検索する。このとき、制御部200は、利用者が過去に入力した文字列に関連度の高いもの、もしくは辞書データを検索する。
このことによって、制御部200は、「AA国立博物館」、「BB博物館」等の検索結果を候補出力部410に出力する。利用者は、「AA国立博物館」を選択することによって、ナビゲーションを開始できる。
このように、文字入力装置10Aをカーナビゲーションに適用した構成であっても、置き換え用音声を含む文字列である場合には、置き換え用音声を予測することによって、利用者が望む文字列を候補として出力することができる。
なお、上述の各実施形態においては、候補出力部410に表示された、候補、または予測候補を選択することによって、文字列を出力している。しかしながら、候補出力部410に表示することなく、入力された音声に最も適合する候補、または予測候補を表示する構成であってもよい。
10、10A…文字入力装置
100…操作部
101…音声入力切り替えボタン
110…キー操作部
120…音声入力部
200…制御部
300…保存部
400…出力部
410…候補出力部
420…確定文字出力部

Claims (6)

  1. 音声入力を受け付ける音声入力部と、
    前記音声入力部に入力された一連の音声入力の中に、置き換え用音声があれば、前記置き換え用音声を置き換えた前記一連の音声入力に対応する、予測候補を推測する制御部と、
    前記予測候補を出力する候補出力部と、
    を備える、
    文字入力装置。
  2. 前記制御部は、
    前記一連の音声入力に対応し、語彙が成立するような前記予測候補を検索する、
    請求項1に記載の文字入力装置。
  3. 前記制御部は、
    前記音声入力から推測された前記予測候補が複数である場合には、前記音声入力の関連度が高い順に表示する、請求項1または請求項2に記載の文字入力装置。
  4. 任意で設定した、前記置き換え用音声を保存可能である保存部を備えた、
    請求項1乃至請求項3のいずれかに記載の文字入力装置。
  5. 音声入力を受け付けるステップと、
    一連の音声入力の中に、置き換え用音声があれば、前記置き換え用音声を置き換えた前記一連の音声入力に対応する、予測候補を推測するステップと、
    前記予測候補を出力するステップと、
    を、コンピュータが実行する、文字入力方法。
  6. 音声入力を受け付けるステップと、
    一連の音声入力の中に、置き換え用音声があれば、前記置き換え用音声を置き換えた前記一連の音声入力に対応する、予測候補を推測するステップと、
    前記予測候補を出力するステップと、
    を、コンピュータに実行させる、文字入力プログラム。
JP2018038508A 2018-03-05 2018-03-05 文字入力装置、文字入力方法、及び、文字入力プログラム Pending JP2019153133A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018038508A JP2019153133A (ja) 2018-03-05 2018-03-05 文字入力装置、文字入力方法、及び、文字入力プログラム
US16/278,779 US11107474B2 (en) 2018-03-05 2019-02-19 Character input device, character input method, and character input program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018038508A JP2019153133A (ja) 2018-03-05 2018-03-05 文字入力装置、文字入力方法、及び、文字入力プログラム

Publications (1)

Publication Number Publication Date
JP2019153133A true JP2019153133A (ja) 2019-09-12

Family

ID=67768164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018038508A Pending JP2019153133A (ja) 2018-03-05 2018-03-05 文字入力装置、文字入力方法、及び、文字入力プログラム

Country Status (2)

Country Link
US (1) US11107474B2 (ja)
JP (1) JP2019153133A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210110650A (ko) * 2018-12-28 2021-09-08 구글 엘엘씨 선택된 제안에 따라 자동 어시스턴트에 음성 입력 보충하기

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07191986A (ja) * 1993-12-27 1995-07-28 Nec Corp 文章入力装置
JPH1195793A (ja) * 1997-09-17 1999-04-09 Toshiba Corp 音声入力解釈装置及び音声入力解釈方法
JP2000330984A (ja) * 1999-05-25 2000-11-30 Hitachi Ltd 文書処理装置及び方法
JP2002091492A (ja) * 2000-07-13 2002-03-27 National Institute Of Advanced Industrial & Technology 音声補完方法、装置および記録媒体
US20150003735A1 (en) * 2013-07-01 2015-01-01 Lenovo (Singapore) Pte. Ltd. Special input for general character inquiries for input to information handling device

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5734749A (en) 1993-12-27 1998-03-31 Nec Corporation Character string input system for completing an input character string with an incomplete input indicative sign
US6975986B2 (en) * 2001-05-30 2005-12-13 International Business Machines Corporation Voice spelling in an audio-only interface
US7461059B2 (en) * 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US8249873B2 (en) * 2005-08-12 2012-08-21 Avaya Inc. Tonal correction of speech
US20070088549A1 (en) * 2005-10-14 2007-04-19 Microsoft Corporation Natural input of arbitrary text
US7831911B2 (en) * 2006-03-08 2010-11-09 Microsoft Corporation Spell checking system including a phonetic speller
US7676371B2 (en) * 2006-06-13 2010-03-09 Nuance Communications, Inc. Oral modification of an ASR lexicon of an ASR engine
JP2011145802A (ja) * 2010-01-13 2011-07-28 Nec Corp メッセージ仲介装置及びその制御方法
JP5587119B2 (ja) * 2010-09-30 2014-09-10 キヤノン株式会社 文字入力装置、その制御方法、及びプログラム
JP2014164260A (ja) 2013-02-27 2014-09-08 Canon Inc 情報処理装置およびその方法
US9244906B2 (en) * 2013-06-21 2016-01-26 Blackberry Limited Text entry at electronic communication device
CN105446572A (zh) * 2014-08-13 2016-03-30 阿里巴巴集团控股有限公司 一种用于屏幕显示设备的文字编辑方法及装置
US20160379638A1 (en) * 2015-06-26 2016-12-29 Amazon Technologies, Inc. Input speech quality matching
US9799327B1 (en) * 2016-02-26 2017-10-24 Google Inc. Speech recognition with attention-based recurrent neural networks
US10854181B2 (en) * 2017-07-18 2020-12-01 Vertical Craft, LLC Music composition tools on a single pane-of-glass
US10672393B2 (en) * 2018-01-12 2020-06-02 Intel Corporation Time capsule based speaking aid
US10770069B2 (en) * 2018-06-07 2020-09-08 International Business Machines Corporation Speech processing and context-based language prompting

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07191986A (ja) * 1993-12-27 1995-07-28 Nec Corp 文章入力装置
JPH1195793A (ja) * 1997-09-17 1999-04-09 Toshiba Corp 音声入力解釈装置及び音声入力解釈方法
JP2000330984A (ja) * 1999-05-25 2000-11-30 Hitachi Ltd 文書処理装置及び方法
JP2002091492A (ja) * 2000-07-13 2002-03-27 National Institute Of Advanced Industrial & Technology 音声補完方法、装置および記録媒体
US20150003735A1 (en) * 2013-07-01 2015-01-01 Lenovo (Singapore) Pte. Ltd. Special input for general character inquiries for input to information handling device

Also Published As

Publication number Publication date
US11107474B2 (en) 2021-08-31
US20190272826A1 (en) 2019-09-05

Similar Documents

Publication Publication Date Title
JP6570651B2 (ja) 音声対話装置および音声対話方法
EP3039531B1 (en) Display apparatus and controlling method thereof
US10850745B2 (en) Apparatus and method for recommending function of vehicle
JP4930379B2 (ja) 類似文検索方法、類似文検索システム及び類似文検索用プログラム
JP2019153133A (ja) 文字入力装置、文字入力方法、及び、文字入力プログラム
KR20100067629A (ko) 입력 순서와 무관한 문자 입력 메커니즘을 제공하는 방법, 기기 및 컴퓨터 프로그램 제품
JP2021039727A (ja) テキスト処理方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体
JP2018072508A (ja) 音声入力装置、音声入力方法
US20210383813A1 (en) Storage medium, editing support method, and editing support device
US11942086B2 (en) Description support device and description support method
JPWO2019103006A1 (ja) 情報処理装置及び情報処理方法
JP5103718B2 (ja) 自動翻訳システムおよび方法並びにそのプログラム
KR100919227B1 (ko) 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치
JP2006065651A (ja) 商標称呼検索プログラム、商標称呼検索装置及び商標称呼検索方法
JP4212633B2 (ja) 携帯端末
JP4622861B2 (ja) 音声入力システム、音声入力方法、および、音声入力用プログラム
JP2020022043A (ja) 放送制御装置、放送制御方法、及び放送制御プログラム
JP7503939B2 (ja) 情報処理装置、プログラム、および情報処理方法
JP2019153132A (ja) 文字入力装置、文字入力方法、及び、文字入力プログラム
JP2007293567A (ja) 検索装置および検索プログラム
JP2005316022A (ja) ナビゲーション装置及びプログラム
JP2023176156A (ja) 情報処理装置
JP4445371B2 (ja) 認識語彙の登録装置と音声認識装置および方法
JP2012174224A (ja) データ入力支援装置、及びデータ入力支援方法
JP6190251B2 (ja) 情報処理装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200305

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210426

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210928