JP2000047688A - 音声入力方法、および、記録媒体 - Google Patents

音声入力方法、および、記録媒体

Info

Publication number
JP2000047688A
JP2000047688A JP10212135A JP21213598A JP2000047688A JP 2000047688 A JP2000047688 A JP 2000047688A JP 10212135 A JP10212135 A JP 10212135A JP 21213598 A JP21213598 A JP 21213598A JP 2000047688 A JP2000047688 A JP 2000047688A
Authority
JP
Japan
Prior art keywords
character string
character
voice input
punctuation
added
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10212135A
Other languages
English (en)
Inventor
Masahide Tanaka
雅英 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Corp
Original Assignee
Nikon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Corp filed Critical Nikon Corp
Priority to JP10212135A priority Critical patent/JP2000047688A/ja
Publication of JP2000047688A publication Critical patent/JP2000047688A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 自然な流れの口述によっても自動的に句読点
を挿入することができる音声入力方法、および音声入力
方法の実施プログラムを記録した記録媒体を提供する。 【解決手段】 入力された音声に基づいて認識された文
字列から句読点付加候補の文字列を識別するとともに、
句読点付加予定位置に対応する音声入力のあとに所定時
間を超える音声入力の空白時間があるか否かを識別し、
句読点の一つを自動的に付加する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ワードプロセッサ
やコンピュータなどへの文字入力に利用される音声入力
方法および音声入力方法の実施プログラムを記録した記
録媒体に関する。
【0002】
【従来の技術】ワードプロセッサやコンピュータなどへ
の文字入力は、通常キーボードによって行われるが、O
CRによる文書からの読み取りや、音声の識別による入
力も知られている。特に、音声による入力方法は、ワー
ドプロセッサやコンピュータなどに組み込まれる他、音
声入力方法を実施するプログラムソフトをCD−ROM
などの記録媒体に記録して実用化されている。
【0003】
【発明が解決しようとする課題】従来の音声入力方法に
よると、例えば「ただいまから、音声を入力します。」
という文章を入力する場合、句読点も含めて入力したい
なら「ただいまからテン音声を入力しますマル」と口述
しなければならなかった。これは、言葉の自然な流れを
阻害し、すでに文書化されているものを朗読する場合は
よいとしても、口述によって文章を創造する場合には思
考の流れをも阻害しかねない。かといって、「テン」や
「マル」を発音しなければ、入力される文章は切れ目な
く続くので、後で添削するのも容易ではない。
【0004】この発明の課題は、上記の欠点を改善し、
自然な流れの口述によっても自動的に句読点を挿入する
ことができる音声入力方法、および音声入力方法の実施
プログラムを記録した記録媒体を提供することにある。
【0005】
【課題を解決するための手段】上記の課題を解決するた
め、この発明は句読点を付加すべき文字列は比較的限ら
れていることに着目し、入力された音声に基づいて認識
された文字列からあらかじめ決められた特定の文字列を
識別して、句読点の一つを付加することを特徴とする。
【0006】さらに、句点と読点の区別のために、句点
付加用の文字列と読点付加用の文字列をあらかじめ区別
して決めておく。また、句読点付加予定位置に対応する
音声入力のあとに所定時間を超える音声入力の空白時間
があるか否かを識別し、特定文字列の識別と音声の空白
時間の識別により、識別された文字列に句読点の一つを
付加する。具体的には、句点の付加の場合、用言の識別
とその後の音声の空白の両者の識別によって用言が終止
形であると判断して句点を付加し、音声の空白がない場
合は連体形であると判断して句点を付加しない。また、
読点の付加の場合、体言の識別とその後の音声の空白の
両者の識別によって体言止め、または体言の列挙である
と判断して読点を付加し、音声の空白がない場合はその
体言が文章中の要素であると判断して読点を付加しな
い。
【0007】
【発明の実施の形態】以下、この発明を実施形態に基づ
いて説明する。実施形態において、この発明の方法は、
CD−ROMなどの記録媒体に記録されるプログラムソ
フトのフローとして示される。図1は実施形態のメイン
フローを示す。ステップ1のスタート後にステップ2で
音声入力が開始されると、公知の手法により音声の進行
に対応してステップ3でかな文字列が識別されていく。
ステップ4では、かな文字列から文節構造を分析し、ス
テップ5で文節毎にかな漢字自動変換を行う。なお、ス
テップ3からステップ5は一つの総合したステップとし
て処理してもよい。
【0008】ステップ6はこの発明の特徴部分であり、
入力された音声に基づいて認識された文字列から句読点
付加の必要性を分析して自動的に付加する。具体的に
は、文節の末尾があらかじめ決められた特定の文字また
は文字列であるか否かを識別して、句読点の一つを付加
するものであり、詳細については後述する。ステップ7
では、音声入力が終了したかどうかを見ており、終了で
なければステップ3に戻る。音声入力が継続される限
り、ステップ3から、ステップ7は繰り返され、音声入
力が終了すれば、ステップ8に進んでフローを終了す
る。
【0009】図2は、図1におけるステップ6の詳細を
示す。考え方としては、原稿どおりの完璧な句読点の付
加をめざすのではなく、文章の創造の際、自然な口述の
流れに沿って文章を音声入力しても文章が適度に句読点
によって区切られるようにして音声入力後の添削を容易
にすることを主眼としている。句読点の付加ミスは、添
削時にかな漢字変換ミスとともに修正する。音声入力後
の添削の能率を考えた場合、読点の抜けよりも句点の抜
けによる障害が大きい。また、日本語においては、読点
付加が作者の個性により振れる度合いが大きい反面、句
点は文章末尾にのみ付加されて原則が明確である。した
がって読点については、これがなければ文章に混乱が生
じる最低限の付加にとどめ、特に句点の付加を重視して
いる。
【0010】図2においてステップ61では、処理対象
の文節の末尾が第一種の文字又は文字列で終わっている
かどうかチェックする。ここで、第一種としては、体言
があらかじめ設定される。実際的には漢字又はカタカナ
であるかどうかをチェックする。以下、第一種の具体例
を示す。なお、以下の例においては、読点より前の部分
が、処理対象の文節であるが、理解を容易にするため、
読点に続く文字列もあわせて示す。
【0011】まず、「決定の際、注意をして」、「動く
時、結合部分が」、「第一の場合、前提としては」「認
められる他、別の要素も」のように節の区切りが漢字に
なる。また、「5月上旬、ネブラスカ州オマハ。」、
「昨年8月14日、政府は」などの漢字止めを使った簡
潔な言い回しの他、「筆頭株主、大塚氏」などの同格表
現、「人、物、金の投資を」などの列挙表現も文節末尾
が漢字になる。なお、同格表現や列挙表現では、「大手
メーカー、○○電気」、「ビール、チーズ、ミルクなど
の食品」のようにカタカナの場合も考慮している。これ
らの例の場合、読点がなければ文章が混乱し、添削に支
障をきたす。
【0012】ステップ61において文節が第一種に該当
すれば、ステップ62に進む。ステップ62では、文節
末尾の後に所定時間以上の音声入力の空白があるか否か
をチェックする。上記の場合、口述においても、読点に
該当するところで息を入れる可能性が高いからである。
そして、音声入力の空白があれば、ステップ63におい
て対象文節の末尾に読点を付加する処理をする。
【0013】一方、空白がなければ、ステップ64に進
んで句読点の付加なしに次の文節の処理に進む。これ
は、文節分析のエラーから本来文章の一要素である漢字
やカタカナの文字列が誤って文節の末尾と認識されたと
きの読点付加を防止するためである。このステップ62
の精度を上げようとすれば、口述の際、意識的に読点の
ところで息を継ぐのが望ましい。これは使用者にとって
わずらわしいことではあるが、口述の生理に合った要求
なので、読点のところで「テン」と発音することを要求
するのに比べ、使用者の思考を阻害する度合いや負担は
著しく少ない。
【0014】なお、報道文などにおける体言止めや語幹
止めにおいて、漢字やカタカナの後ろに句点を付加すべ
き場合もある。例えば、「年に10万件の出願。」、
「特許庁は早急に審査。」などの場合である。この実施
形態では、このような場合もステップ63に進むので読
点が付加されるが、これに対しては、必要に応じ後で添
削する。何も付加されない場合よりは読点が誤って付加
されているほうが、添削は容易である。なお、学習機能
により漢字を登録しておくことによって、これらの場合
に読点の代えて句点を自動的に付加するような改良も可
能である。
【0015】ステップス61において文節末尾が第一種
に該当しなければ、ステップ65に進み、処理対象の文
節の末尾が第二種の文字又は文字列で終わっているかど
うかチェックする。ステップ65以下で処理される文節
はすべて末尾がひらがなである。以下、第二種の具体例
を示す。まず、「従って、」、「しかし、」、「ま
ず、」など活用がない文字列が第二種として設定され
る。
【0016】第二種としては、この他、「投資利回り
は、」、「報道されたが、」などのように「は、」、
「が、」などの助詞が末尾にくる文節や、「当面静観
し、」、「利益を生み、」、「芋を洗い、」などの用言
の連用形の語尾も設定することができる。これらも大半
は語尾をチェックすることで判別可能であるが、「い」
のように形容詞の終止形と区別がつかない例もある。一
方これらの例では、仮に音声入力の際に読点が付加され
なくても、文章の判読は可能で、後から容易に添削でき
る。従って第二種の設定は読点付加誤りの可能性のない
ものに厳選するのが望ましい。
【0017】ステップ65において文節末尾が第二種に
該当すれば、ステップ66に進む。ステップ66では、
読点を付加しても次文節の先頭との不適合がないかどう
かをチェックする。例えば、「従って、この場合は」で
は読点の付加が適当であるが、「従っている」を「従っ
て、いる」とするのは不適合である。そこで、ステップ
66では、第二種で設定した語尾が次文節の先頭に読点
なしに続くべき場合を予め設定しておき、これに該当し
ないかどうかチェックする。そして不適合がない場合の
みステップ63に進み、文節末尾に読点を付加する。一
方、読点の加入に不適合があればステップ64に進ん
で、句読点の付加なしに文節の処理に入る。
【0018】ステップス65において文節末尾が第二種
に該当しなければ、ステップ67に進み、処理対象の文
節の末尾が第三種の文字又は文字列で終わっているかど
うかチェックする。文章の終わりは基本的には用言の終
止形であるので、これをチェックするのがステップ67
以下の機能である。以下、第三種の具体例を示す。第三
種としては、まず動詞の終止形に現れる「ウ段」末尾を
持つ文字列を設定しておく。具体的には、「う。」、
「く。」、「ぐ。」、「す。」、「つ。」、「ぶ。」、
「む。」、「る。」で終わるかどうかをチェックする。
さらに、形容詞、否定形、過去形、の終止形に現れる文
字を末尾に持つ文字列も設定しておく。具体的には、
「い。」、「か。」、「た。」、「だ。」、「ん。」で
終わるかどうかをチェックする。第三種としては最低限
以上をあらかじめ設定しておく。
【0019】なお、命令形に現れる「え。」、
「け。」、「げ。」、「せ。」、「て。」、「ね。」、
「べ。」、「め。」、「れ。」、「ろ。」、さらには、
文語調に現れる「ず。」、「ぬ。」、また、会話体に現
れる「さ。」、「な。」、「の。」、「よ。」、
「わ。」が末尾になる文字列を第三種として設定するこ
とも可能であるが、句点の付加誤りの可能性も高まる。
従って、文章の種類により適宜第三種の設定を変更して
もよい。
【0020】精度を上げるためには、末尾の一文字だけ
ではなく、末尾を含む何文字かを第三種として登録して
おくのが望ましい。学習機能により登録を綿密にして精
度を高めてもよい。なお、この実施形態では、同音異義
語による句点の付加誤りを少なくするため、ステップ6
7の前にステップ61とステップ65を置き、文章末尾
にくる可能性のない文節を除いているので、いきなりス
テップ67から始めるのに比べ、句点の自動付加の精度
が上がっている。
【0021】ステップ67において文節が第三種に該当
すれば、ステップ68において文節末尾の後に所定時間
以上の音声入力の空白があるか否かをチェックする。上
記の場合、口述においては、句点に該当するところで息
を入れる可能性がきわめて高いからである。口述の生理
から考えると、ステップ68の所定時間はステップ62
より長くしておくほうがよい。そして、音声入力の空白
があれば、ステップ69において対象文節の末尾に句点
を付加する処理をする。
【0022】一方、空白がなければ、ステップ64に進
んで句読点の付加なしに次の文節の処理に進む。これは
第三種の文字列が連体形となって次の文節に続く場合
に、誤って句点を付加するのを防止するためである。ス
テップ68の精度を上げようとすれば、口述の際、意識
的に句点のところで息を継ぐのが望ましいが、これは極
めて自然に行われるので、使用者の負担はほとんどな
い。
【0023】上記の説明では、図2のステップ63およ
びステップ69の機能について、文節末尾に句読点を付
加するものとしたが、これを、句読点付きの一括変換を
行う機能に置き換えることも可能である。例えば、「お
こなう」というかな文字列に対し、「行う」という句点
なしの変換と「行う。」と言う句点付きの変換を変換候
補として辞書登録しておき、変換ステップ68が「Y」
であればステップ69で「行う。」を選択し、ステップ
68が「N」であればステップ64で「行う」を選択す
るようにしてもよい。この発明において、「句読点の一
つを付加する」とは、句読点を別途付加する場合だけで
なく、このような、句読点付加を含む変換を一括して行
う場合をも意味するものとする。
【0024】さらに、変形形態としては、句点を付加す
るかどうかを、単に文節末尾の後に所定時間以上の音声
入力の空白があるか否かのチェックだけで行うようにす
ることも可能である。この場合、原稿の朗読の場合は有
効であるが、口述による文章の創造の場合は、文章途中
の考慮時間による途切れが文章の終了と誤って判断され
るおそれがある。従って、所定時間の設定を十分長くし
ておく必要がある。これに対し、上記実施形態のように
文節末尾の分析と音声入力の空白の両者によって句点を
付加するかどうか決めるようにすると、文章の途中で考
慮のため音声入力に空白が生じても、文節末尾が文章の
終わりとして不適であれば誤って句点が付加されること
がなく、使用者は安心して音声入力を中断することがで
きる。
【0025】
【発明の効果】以上のように、本発明によれば、音声入
力の際に「テン」や「マル」を発音しなくとも句読点が
精度よく自動的に付加されていくので、思考の流れにし
たがって快適に文章を口述により入力することができ
る。
【図面の簡単な説明】
【図1】 図1は本発明の実施形態におけるメインフロ
ーである。
【図2】 図2は本発明の実施形態における句読点分析
自動付加フローである。
【符号の説明】
2,3,4,5:文字を認識するステップ; 61,65,66:読点を付加すべき特定の文字または
文字列を識別するステップ; 63:読点を付加するステップ; 67:句点を付加すべき特定の文字または文字列を識別
するステップ; 69:句点を付加するステップ 62,68:所定時間を超える音声入力の空白時間があ
るか否かを識別するステップ

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声に基づいて文字を認識す
    るステップと、認識された文字列からあらかじめ決めら
    れた特定の文字または文字列を識別するステップと、識
    別された特定の文字または文字列に句読点の一つを付加
    するステップとを含む音声入力方法。
  2. 【請求項2】 前記特定の文字または文字列は句点付加
    用と読点付加用に区別されていることを特徴とする請求
    項1記載の音声入力方法。
  3. 【請求項3】 さらに、所定時間を超える音声入力の空
    白時間があるか否かを識別するステップを含み、 特定の文字または文字列の識別と音声入力の空白時間の
    識別とにより、識別された文字または文字列に句読点の
    一つを付加することを特徴とする請求項1記載の音声入
    力方法。
  4. 【請求項4】 付加候補位置が用言で終わっていれば句
    点を付加することを特徴とする請求項3記載の音声入力
    方法。
  5. 【請求項5】 用言は終止形または連体形であることを
    特徴とする請求項4記載の音声入力方法。
  6. 【請求項6】 付加候補位置が体言で終わっていれば読
    点を付加することを特徴とする請求項3記載の音声入力
    方法。
  7. 【請求項7】 入力された音声に基づいて文字を認識す
    るステップと、認識された文字列からあらかじめ決めら
    れた特定の文字または文字列を識別するステップと、識
    別された特定の文字または文字列に句読点の一つを付加
    するステップとを含む音声入力方法の実施プログラムを
    記録する記録媒体。
  8. 【請求項8】 さらに、所定時間を超える音声入力の空
    白時間があるか否かを識別するステップを含み、 特定の文字または文字列の識別と音声入力の空白時間の
    識別とにより、識別された文字または文字列に句読点の
    一つを付加することを特徴とする請求項7記載の音声入
    力方法の実施プログラムを記録する記録媒体。
JP10212135A 1998-07-28 1998-07-28 音声入力方法、および、記録媒体 Pending JP2000047688A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10212135A JP2000047688A (ja) 1998-07-28 1998-07-28 音声入力方法、および、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10212135A JP2000047688A (ja) 1998-07-28 1998-07-28 音声入力方法、および、記録媒体

Publications (1)

Publication Number Publication Date
JP2000047688A true JP2000047688A (ja) 2000-02-18

Family

ID=16617479

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10212135A Pending JP2000047688A (ja) 1998-07-28 1998-07-28 音声入力方法、および、記録媒体

Country Status (1)

Country Link
JP (1) JP2000047688A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6718303B2 (en) 1998-05-13 2004-04-06 International Business Machines Corporation Apparatus and method for automatically generating punctuation marks in continuous speech recognition
CN108564953A (zh) * 2018-04-20 2018-09-21 科大讯飞股份有限公司 一种语音识别文本的标点处理方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6718303B2 (en) 1998-05-13 2004-04-06 International Business Machines Corporation Apparatus and method for automatically generating punctuation marks in continuous speech recognition
CN108564953A (zh) * 2018-04-20 2018-09-21 科大讯飞股份有限公司 一种语音识别文本的标点处理方法及装置

Similar Documents

Publication Publication Date Title
Palmer Tokenisation and sentence segmentation
Khoja APT: Arabic part-of-speech tagger
JPH07325828A (ja) 文法チェックシステム
US7149970B1 (en) Method and system for filtering and selecting from a candidate list generated by a stochastic input method
US7802184B1 (en) Method and apparatus for processing text and character data
US20070198245A1 (en) Apparatus, method, and computer program product for supporting in communication through translation between different languages
US7873508B2 (en) Apparatus, method, and computer program product for supporting communication through translation between languages
JPH07325824A (ja) 文法チェックシステム
JPH0844719A (ja) 辞書アクセスシステム
JPH07325829A (ja) 文法チェックシステム
WO2007097176A1 (ja) 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム
US7328404B2 (en) Method for predicting the readings of japanese ideographs
CN110134766B (zh) 一种面向中医古籍文献的分词方法和装置
US20040193399A1 (en) System and method for word analysis
JP2000047688A (ja) 音声入力方法、および、記録媒体
JP2000250589A (ja) 音声認識誤り訂正装置
JP2000259176A (ja) 音声認識装置およびその記録媒体
JP2007048187A (ja) 見出語表示制御装置及びプログラム
JP2004265440A (ja) 未知語登録装置および方法並びに記録媒体
JP2000105597A (ja) 音声認識誤り訂正装置
Kwon et al. Stochastic Korean word-spacing with smoothing using Korean spelling checker
JPH10293811A (ja) 文書認識装置及び方法並びにプログラム記憶媒体
JPH0361219B2 (ja)
JPH0540853A (ja) 文字認識結果の後処理方式
JP2592993B2 (ja) 文節切り出し装置