JP2001249687A - ディクテーション方法、ディクテーションシステム及び携帯端末装置 - Google Patents

ディクテーション方法、ディクテーションシステム及び携帯端末装置

Info

Publication number
JP2001249687A
JP2001249687A JP2000062858A JP2000062858A JP2001249687A JP 2001249687 A JP2001249687 A JP 2001249687A JP 2000062858 A JP2000062858 A JP 2000062858A JP 2000062858 A JP2000062858 A JP 2000062858A JP 2001249687 A JP2001249687 A JP 2001249687A
Authority
JP
Japan
Prior art keywords
sentence
partial
unit
dictation
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000062858A
Other languages
English (en)
Inventor
Takeshi Inoue
剛 井上
Masakatsu Hoshimi
昌克 星見
Akira Ishida
明 石田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000062858A priority Critical patent/JP2001249687A/ja
Publication of JP2001249687A publication Critical patent/JP2001249687A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 狭い表示部を持つ機器において、ディクテー
ション結果を容易に修正できるヒューマンインターフェ
ースをもつディクテーションシステムを実現する。 【解決手段】 音声入力部1に入力した音声を音声認識
部5で認識したディクテーション結果105を部分文作
成部6によって表示部一行に及ばない形態素列に分け、
修正部9において、上記形態素列を行を変えて表示する
ことで見易く表示する。部分文表示部10では、少ない
操作数で修正箇所にカーソルを容易に移動させることに
より、ディクテーション結果の誤認識、漢字変換違いの
発見及び修正を容易に実現できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば、携帯電
話、電子手帳あるいはカーナビゲーション等、1行に入
る文字数が少ない表示部を要する携帯端末機器に用いて
好適なディクテーション方法、ディクテーションシステ
ム及びそれを用いた携帯端末装置に関するものである。
【0002】
【従来の技術】従来、ディクテーションはその動作に必
要な計算能力の大きさから、例えば「DIME」No1
8、1999年9月16日号(小学館発行)にあるよう
に大きな計算機やパソコンで行われてきた。
【0003】このような機器で行うディクテーションは
ある程度の大きさを持つディスプレイにより表示される
ため、ディクテーション結果も図5のように1行に多く
の文字が入る。このようなインターフェイスにおける入
力された文章での誤認識、漢字変換も見つけやすく、ま
たマウスやキーボードといった複雑な入力を持つので、
その修正も容易に行える技術であった。
【0004】
【発明が解決しようとする課題】このように従来比較的
大きな表示部を持つ機器でディクテーションは行われて
きたが、携帯電話や電子手帳など表示部が小さな機器で
ディクテーションを行った場合、一行に入る文字数がき
わめて少ないのでディクテーション結果が表示部に表示
されるとき、ディクテーション結果の誤認識・漢字変換
間違いを見つけ、修正する事が困難である。
【0005】また、例えば携帯電話のような機器におい
てはマウスやキーボードのような高度な入力手段がない
ので、ディクテーション結果を修正することが困難であ
る課題があった。
【0006】本発明の目的は一行で表示できる文字数が
少ない表示部を持つ機器においてもディクテーション結
果の誤認識・漢字変換誤りを容易に発見、修正できるデ
ィクテーション方法、ディクテーションシステム及びそ
れを用いた携帯端末装置を提供することにある。
【0007】
【課題を解決するための手段】この課題を解決するため
に本発明は、ディクテーション結果を表示部一行に及ば
ない部分文に分け、行を変えて表示、修正する手段とデ
ィクテーション結果の修正時において修正箇所により少
ない操作数でカーソルを容易に移動できる手段を設ける
ことにより、上記目的を達成するものである。
【0008】
【発明の実施の形態】本発明の請求項1に記載の発明
は、入力音声を認識し、予め設定された表示情報と文法
情報を用いて、前記認識結果から部分文を作成し、必要
に応じて修正された部分文を連結して文とし、前記部分
文または前記連結された文を表示することを特徴とする
ディクテーション方法であり、これにより表示サイズの
情報を用いたユーザーにとって見易いディクテーション
結果表示が可能となる作用を有する。
【0009】本発明の請求項2に記載の発明は、音声を
入力する入力手段と、前記入力手段からの入力音声を認
識する認識手段と、予め設定された表示情報と文法情報
を用いて、前記認識結果から部分文を作成する部分文作
成手段と、前記作成された部分文を修正する修正手段
と、前記修正手段により修正された部分文を連結し、文
にする部分連結手段と、前記部分文または前記連結され
た文を表示する表示手段とを有することを特徴とするデ
ィクテーションシステムであり、ディクテーション結果
が見易く、簡単に修正も行える作用を有する。
【0010】本発明の請求項3に記載の発明は、請求項
2記載のディクテーションシステムにおいて、表示手段
は、部分文を表示する領域と部分文を連結した文を表示
する領域とが分離していることを特徴とするものであ
り、ディクテーション結果の確認、修正を容易にする作
用を有する。
【0011】本発明の請求項4に記載の発明は、請求項
2記載のディクテーションシステムにおいて、表示情報
は、一行に表示可能な文字数であることを特徴とするも
のであり、様々な表示画面に適したディクテーション結
果の表示ができる作用を有する。
【0012】本発明の請求項5に記載の発明は、請求項
2〜4のいずれかに記載のディクテーションシステムに
おいて、部分文は、意味を持つ最小単位である形態素を
基本単位とすることを特徴とするものであり、部分文の
意味を理解し易く、修正を容易にする作用を有する。
【0013】本発明の請求項6に記載の発明は、請求項
2記載のディクテーションシステムにおいて、文法情報
は、部分文の始めや終わりを形態素の例えば品詞といっ
た分類結果によって決定することを特徴とするものであ
り、部分文の意味を即座に理解できる作用を有する。
【0014】本発明の請求項7に記載の発明は、複数の
例文を記憶した例文記憶手段と、例文を予め設定された
表示情報と文法情報を用いて、部分文に変換する部分文
変換手段と、前記部分文の修正位置にカーソルを移動す
る修正入力手段と、音声を入力する入力手段と、前記入
力手段からの入力音声を認識する認識手段と、前記認識
結果から部分文を作成する部分文作成手段と、前記作成
された部分文により前記修正位置に存在する部分文を修
正する修正手段と、前記修正手段により修正された部分
文を連結し、文にする部分連結手段と、前記部分文また
は前記連結された文を表示する表示手段とを有すること
を特徴とするディクテーションシステムであり、記憶し
た例文を簡単に編集できる作用を有する。
【0015】本発明の請求項8に記載の発明は、請求項
2から7のいずれかに記載のディクテーションシステム
を用いた携帯端末装置において、連結した文を送受信す
る通信手段を設けたことを特徴とする携帯端末装置であ
り、携帯端末における容易なディクテーション操作を提
供できる作用を有する。
【0016】本発明の請求項9に記載の発明は、請求項
7記載の携帯端末装置において、例文記憶手段は、送受
信した文を例文として記憶することを特徴とするもので
あり、携帯端末における容易な文章作成作用を有する。
【0017】以下、本発明の実施の形態について、図面
を用いて説明する。
【0018】(実施の形態1)図1は、本発明の実施の
形態1におけるディクテーションシステムを用いた携帯
端末装置の一実施例の構成図である。
【0019】図1において、1は音声を入力し電気信号
に変換する音声入力部、2は入力された音声を音響パラ
メータに変換する特徴抽出部、5は、特徴抽出部2で変
換された音響パラメータと予め求めた音響モデル3と言
語モデル4を用いて認識する音声認識部、16は音声認
識部5から得られた音声入力による例文114やキー等
による音声以外の情報入力による例文で書き換えが可能
な例文記憶部、6は予め設定された表示情報7と文法情
報8を用いて、前記認識結果もしくは例文記憶部16の
選択結果から部分文を作成する部分文作成部、9は作成
された部分文を音声以外の情報入力部11により入力さ
れる情報を元に部分文を修正する修正部、14は修正部
9により修正された部分文を連結し、文にする部分文連
結部、12は部分文または連結された文を表示する表示
部、15は連結文を無線または有線等で送信する通信部
である。
【0020】上記のように構成されたディクテーション
システムを用いた携帯端末装置の動作について、以下に
説明する。
【0021】音声入力部1に入力された音声は、音声入
力部1で電気信号としての入力音声信号101に変換さ
れ、特徴抽出部2でLPCケプストラム係数等の適当な
音響パラメータ104に変換される。音声認識部5は、
特徴抽出部2で得られた音響パラメータ104と、予め
求めておいた音響モデル3からの音響モデルデータ10
2、言語モデル4からの言語モデルデータ103を用い
て入力音声を認識する。部分文作成部6は、音声認識部
5の認識結果であるディクテーション結果105または
例文記憶部16から抽出された文を、表示情報7からの
一行で表示できる文字数等を用いて部分文の文字数を制
御する表示情報データ106と、文法情報8から例えば
名詞、助詞と続いている場合は部分文を名詞で終了しな
いなどの文法制限を行う文法情報データ107を用い
て、形態素を最小単位とした複数の部分文信号BS10
8に変換する。部分文信号BS108は、修正部9に送
られ、その結果である修正状態にある部分文信号109
は部分文表示部10において部分文信号毎に行を変えて
表示する。
【0022】なお、例文記憶部16における例文は音声
認識結果やキー入力、通信部より受け取った文を記憶し
ておき、それを利用できるものである。
【0023】また、表示情報7で必要な部分文の文字数
等の表示情報は、ハードウェア固定のものと限らず、ソ
フトウェアや外部からの情報により可変に成りうるもの
である。
【0024】さらに、部分文信号BS108は、部分文
表示部10において、例えば図2のように各行の先頭に
先頭番号22を表示し、各形態素23を区切る印(例え
ば、/)24を入れる。また、部分文表示部10で部分
文を表示したときカーソル25は自動的にディクテーシ
ョン結果の一番前である一番上の部分文の先頭に来るよ
うにする。
【0025】修正部9は、続いてこのカーソルを用いて
部分文単位で表示されているディクテーション結果の誤
認識や漢字変換誤りを修正する部分を指摘し、例えばキ
ーやボタンやジョグダイアルといった音声以外の情報入
力部11、もしくは音声認識部5より修正情報信号11
0を入力する。
【0026】ここで、具体的な修正方法について説明す
る。各行に表示されている部分文単位で修正する場合と
各行に表示されている部分文の先頭の形態素単位で修正
する場合を区別するため、例えば各行に表示されている
部分文を示すときは部分文の前にある数字上にカーソル
を置き、部分文の先頭の形態素を修正したいときは各形
態素を区切る印にカーソルを置いた後修正作業を行うも
のとする。
【0027】部分文表示部10は、部分文毎に行を変え
て表示してあるので、ディクテーション結果の誤認識や
漢字変換誤りを部分文単位で修正したい場合、カーソル
をそのまま下に動かし、修正したい部分文の前に移動す
るか、行番号を指定して、カーソルを部分文の前に移動
し、誤認識の場合は、その後部分文を発声し直すか文字
を打ち込む等の修正を行い、漢字変換誤りの場合は、カ
ーソルを修正部の前に持ってきた後、変換候補を表示
し、正しい漢字を選択する。
【0028】部分文中のある形態素単位で修正したい場
合は修正したい形態素を含む部分文の前までカーソルを
移動し、右に形態素単位で移動させるという修正時のカ
ーソル移動において制限を持つことで早く修正個所に移
動できる。また、一部分文中の形態素はそれほど多くは
ないので、修正したい形態素は何行目部分文の先頭から
何番目にあるかは見て容易に理解できる。そこで、例え
は携帯電話のように数字ボタンがある場合は行番号と形
態素が部分文先頭から何番目にあるかという番号を入力
することにより、容易に修正したい形態素の前にカーソ
ルを移動し、修正を行うことができる。なおこの形態素
を示す2数字は音声認識により行うこともできる。
【0029】修正部9での修正が終わると、確定操作を
行う。これは部分文に分割されているディクテーション
結果111を連結する部分文連結部14で部分文の連結
により修正されたディクテーション結果112を作成
し、それを確定用表示部13に送る。確定用表示部13
では以前に入力された文章に続けて新しく確定されたデ
ィクテーション結果を表示する。
【0030】確定した文113は、通信部15により有
線または無線等を用いて送信する。
【0031】なお、部分文表示部10と確定用表示部1
3は例えば図3のようにディクテーションシステムの持
つ表示部を二分する形で同時に表示しても良いし、例え
ば図4のようにディクテーション結果を修正するときは
ディクテーションシステムの持つ表示部に部分文表示部
のみを表示し、修正後確定操作を行った後はディクテー
ションシステムの表示部には確定用表示部のみを表示す
る。
【0032】ここで、確定用表示部は例えば、メールソ
フトやワープロソフトのアプリケーションの表示画面で
あり、他の表示サイズを持つ機器にディクテーション結
果を送信できる。
【0033】
【発明の効果】以上説明したように本発明では、一行に
入る文字数が少ない表示形態である機器に対し、ディク
テーション結果を見やすく分け、簡単に修正個所にカー
ソルを移動できる。よってユーザーは自分の発声結果を
容易に修正ができるため、狭い表示部しか持たない機器
でも、ディクテーションによる文章作成が容易なヒュー
マンインターフェイスを実現できる。
【図面の簡単な説明】
【図1】本発明の実施の形態1におけるディクテーショ
ンシステムの構成を示すブロック図
【図2】同実施の形態における部分文表示部の表示例を
示す表示画面図
【図3】同実施の形態における部分文表示部と確定用表
示部が同時に表示されている表示例を示す表示画面図
【図4】同実施の形態における部分文表示部と確定用表
示部が別に表示される表示例を示す表示画面図
【図5】従来技術の表示例を示す図
【符号の説明】
1 音声入力部 2 特徴抽出部 3 言語モデル 4 音響モデル 5 音声認識部 6 部分文作成部 7 表示情報 8 文法情報 9 修正部 10 部分文表示部 11 音声以外の情報入力部 12 表示部 13 確定用表示部 14 部分文連結部 15 通信部 16 例文記憶部 101 入力音声信号 102 音響モデルデータ 103 言語モデルデータ 104 音響パラメータ 105 ディクテーション結果 106 表示情報データ 107 文法情報データ 108 部分文信号 109 修正状態にある部分文信号 110 修正情報信号 111、112 ディクテーション結果 113 確定した文
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/00 G10L 3/00 551B 561C (72)発明者 石田 明 神奈川県川崎市多摩区東三田3丁目10番1 号 松下技研株式会社内 Fターム(参考) 5B009 KB04 RB01 5D015 AA05 KK02 5E501 AA04 AA11 AA23 AB03 AC34 EB15 EB17 EB19 EB20 FA02 FB22 9A001 HH15 HH17 JZ77

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 入力音声を認識し、予め設定された表示
    情報と文法情報を用いて、前記認識結果から部分文を作
    成し、必要に応じて修正された部分文を連結して文と
    し、前記部分文または前記連結された文を表示すること
    を特徴とするディクテーション方法。
  2. 【請求項2】 音声を入力する入力手段と、前記入力手
    段からの入力音声を認識する認識手段と、予め設定され
    た表示情報と文法情報を用いて、前記認識結果から部分
    文を作成する部分文作成手段と、前記作成された部分文
    を修正する修正手段と、前記修正手段により修正された
    部分文を連結し、文にする部分連結手段と、前記部分文
    または前記連結された文を表示する表示手段とを有する
    ことを特徴とするディクテーションシステム。
  3. 【請求項3】 表示手段は、部分文を表示する領域と部
    分文を連結した文を表示する領域とが分離していること
    を特徴とする請求項2記載のディクテーションシステ
    ム。
  4. 【請求項4】 表示情報は、一行に表示可能な文字数で
    あることを特徴とする請求項2記載のディクテーション
    システム。
  5. 【請求項5】 部分文は、意味を持つ最小単位である形
    態素を基本単位とすることを特徴とする請求項2から4
    のいずれかに記載のディクテーションシステム。
  6. 【請求項6】 文法情報は、部分文の始めや終わりを形
    態素の例えば品詞といった分類結果によって決定するこ
    とを特徴とする請求項2記載のディクテーションシステ
    ム。
  7. 【請求項7】 複数の例文を記憶した例文記憶手段と、
    例文を予め設定された表示情報と文法情報を用いて、部
    分文に変換する部分文変換手段と、前記部分文の修正位
    置にカーソルを移動する修正入力手段と、音声を入力す
    る入力手段と、前記入力手段からの入力音声を認識する
    認識手段と、前記認識結果から部分文を作成する部分文
    作成手段と、前記作成された部分文により前記修正位置
    に存在する部分文を修正する修正手段と、前記修正手段
    により修正された部分文を連結し、文にする部分連結手
    段と、前記部分文または前記連結された文を表示する表
    示手段とを有することを特徴とするディクテーションシ
    ステム。
  8. 【請求項8】 請求項2から7のいずれかに記載のディ
    クテーションシステムを用いた携帯端末装置において、
    連結した文を送受信する通信手段を設けたことを特徴と
    する携帯端末装置。
  9. 【請求項9】 例文記憶手段は、送受信した文を例文と
    して記憶することを特徴とする請求項7記載の携帯端末
    装置。
JP2000062858A 2000-03-08 2000-03-08 ディクテーション方法、ディクテーションシステム及び携帯端末装置 Pending JP2001249687A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000062858A JP2001249687A (ja) 2000-03-08 2000-03-08 ディクテーション方法、ディクテーションシステム及び携帯端末装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000062858A JP2001249687A (ja) 2000-03-08 2000-03-08 ディクテーション方法、ディクテーションシステム及び携帯端末装置

Publications (1)

Publication Number Publication Date
JP2001249687A true JP2001249687A (ja) 2001-09-14

Family

ID=18582814

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000062858A Pending JP2001249687A (ja) 2000-03-08 2000-03-08 ディクテーション方法、ディクテーションシステム及び携帯端末装置

Country Status (1)

Country Link
JP (1) JP2001249687A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009514020A (ja) * 2005-10-28 2009-04-02 マイクロソフト コーポレーション モバイルデバイスにおける音声および代替入力手法の組み合わせ

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009514020A (ja) * 2005-10-28 2009-04-02 マイクロソフト コーポレーション モバイルデバイスにおける音声および代替入力手法の組み合わせ

Similar Documents

Publication Publication Date Title
US8407039B2 (en) Method and apparatus of translating language using voice recognition
JP4574390B2 (ja) 音声認識方法
TWI293455B (en) System and method for disambiguating phonetic input
US7260529B1 (en) Command insertion system and method for voice recognition applications
US9123341B2 (en) System and method for multi-modal input synchronization and disambiguation
US20130080146A1 (en) Speech recognition device
JP6150268B2 (ja) 単語登録装置及びそのためのコンピュータプログラム
KR101819458B1 (ko) 음성 인식 장치 및 시스템
JP2010055044A (ja) 音声認識結果訂正装置および音声認識結果訂正方法、ならびに音声認識結果訂正システム
JP2002125050A (ja) 音声通訳サービス方法および音声通訳サーバ
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
JP2002116793A (ja) データ入力システム及びその方法
JP2016521383A (ja) 少なくとも一つの意味論的単位の集合を改善するための方法、装置およびコンピュータ読み取り可能な記録媒体
JP2010197669A (ja) 携帯端末、編集誘導プログラムおよび編集装置
JP3104661B2 (ja) 日本語文章作成装置
JP5396530B2 (ja) 音声認識装置および音声認識方法
JP5160594B2 (ja) 音声認識装置および音声認識方法
JP4189336B2 (ja) 音声情報処理システム、音声情報処理方法及びプログラム
JP5238395B2 (ja) 言語モデル作成装置および言語モデル作成方法
JP2013238880A (ja) 携帯端末、編集誘導プログラムおよび編集誘導方法
JP4230142B2 (ja) 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術
JP3726783B2 (ja) 音声認識装置
JP2001249687A (ja) ディクテーション方法、ディクテーションシステム及び携帯端末装置
JP3411198B2 (ja) 通訳装置及び方法並びに通訳装置制御プログラムを記憶した媒体
JP2011039468A (ja) 電子辞書で音声認識を用いた単語探索装置及びその方法