JPS63111568A - 音声入力付仮名漢字変換装置 - Google Patents

音声入力付仮名漢字変換装置

Info

Publication number
JPS63111568A
JPS63111568A JP61257484A JP25748486A JPS63111568A JP S63111568 A JPS63111568 A JP S63111568A JP 61257484 A JP61257484 A JP 61257484A JP 25748486 A JP25748486 A JP 25748486A JP S63111568 A JPS63111568 A JP S63111568A
Authority
JP
Japan
Prior art keywords
kana
section
text
kanji conversion
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61257484A
Other languages
English (en)
Inventor
Hiromi Fujii
藤井 浩美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61257484A priority Critical patent/JPS63111568A/ja
Publication of JPS63111568A publication Critical patent/JPS63111568A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、ワードプロセッサ等で用いられる仮名漢字変
換装置における仮名漢字変換処理の性能向上と速度向上
に関するものである。
(従来の技術) 仮名漢字変換装置は、入力された仮名べた書き文を仮名
漢字交じり文に変換する装置であり、現在、ワードプロ
セッサなどに多く用いられている。
仮名べた書き文とは、漢字を含まない、仮名、旬読点、
よるだけで構成される文である。
以下に、従来装置について簡単に説明する。従来の仮名
漢字変換装置では、入力された仮名べた書き文に対して
、まず、辞書引きを行って辞書内の単語を検索して変換
文の候補を求める0通常の仮名べた書き文では、句読点
やまるがある場合を除いては、形態素、単語、文節など
の区切りが分からない、そのため、辞書引きは、可能性
のある総ての区切りに対して行い、照合に成功した語粟
の群より変換文候補を作成する。辞書引きの方法として
は例えば、文の始めより順に区切りをずらしながら行う
方法がある。以下にその方法について説明する0例えば
、「わたしはかいものにいきます」という仮名べた書き
文に対して処理を行う場合を考える。はじめに、区切り
が「わ」と「た」の間にあるとして、「わ」に対して辞
書引きを行い、変換候補「話」、「和」、「輪」、・・
・を求めておく0次に、区切りを1文字ずらし、「た」
と「シ」の間に区切りがあるとして「わな」に対して辞
書引きを行い同様に変換候補「棉」、「綿」。
・・・を求めておく、同様に区切りをずらし、「わたし
」に対する変換候補「私」、「渡」、・・・を求めてお
く0次のrわたしは」に対しては、辞書引きの結果候補
が存在しないため、ここまでで求められた変換候補で最
も文字数の多い「わなし」に対して最も優先度の高い単
語「私」を選択し、以下の「はかいもの・・・」に対し
ても同様の処理を行っていくという方法である。
しかし、辞書引きだけではその後「はかい」に対して「
破壊」、「もの」に対して[物j、などが選択され、正
しい変換文を得ることが難しい。
そのため、求められた複数の候補に対して、文法的知識
を用いて最も確からしい変換文を求める処理が行われて
いる0文法的知識の使用法にもさまざまなものが提案さ
れているが、例えば助詞などの優先度を高くしなり、品
詞の接続を制限するものなどがある。これにより、上記
の例では、「は]、「に」が助詞としての優先度が高く
なり、それらに囲まれな「かいもの」、「いきます」に
対する辞書引きで最適なものが求められた場合には正し
い変換文が得られることになる。
(発明が解決しようとする問題点) 以上説明した仮名漢字変換装置では、仮名べな書き文の
みから、仮名漢字変換処理を行っている。
そのため、句読点やまるがある場合を除いて、形態素、
単語、文節などの区切り方が分からず、辞書引きを可能
性のある総ての区切り方に対して行わなければならない
、従って、処理量が多くなってしまうという欠点があっ
た。また、候補文の数も多くなるなめ正しい仮名漢字変
換文を得ることが難しいという欠点があった。
さらに、従来装置においては、仮名べた書き文において
、形態素、単語、文節などの区切りを明確にするには、
それらの区切りにおいて、句読点やスペース、あるいは
、何か特別なコードを入力するか、それらの区切りごと
に変換処理を行わなければならなかうな、しかし、余分
な句読点、スペースなどは、変換後には不要な情報であ
り、また、そのような入力操作は非常に手間、時間がか
かり、人間工学的にも操作しやすいものではなかった。
また、従来の仮名漢字変換装置では、同音異義語のなめ
に候補が多数ある場合にもそれらの候補を絞ることは不
可能であった。
本発明の目的は、音声の情報を用いることにより、上記
のような欠点を除去し、従来よりも少ない処理量で、仮
名漢字変換を性能良く行うことのできる音声入力付仮名
漢字変換装置を提供することにある。
(問題点を解決するための手段) 本願の第1の発明による音声入力付仮名漢字変換装置は
、次のような各部を必要とする。すなわち、本願の第1
の発明は、音声を入力する入力部と、この入力部が入力
した音声を分析して特徴量を抽出する分析部と、仮名べ
た書き文を格納する仮名べた書き文格納部と、前記分析
部にて得られた特徴量を用いて前記仮名べた書き文格納
部の仮名べた書き文に対して区切りを入れる分割部と、
この分割部にて区切られた仮名べた書き文の各区間に対
して順次仮名漢字変換処理を施す仮名漢字変換部とを有
することを特徴とする音声入力付仮名漢字変換装置の各
部である。
本願の第2の発明による音声入力付仮名漢字変換装置は
、次のような各部を必要とする。すなわち、本願の第2
の発明は、音声を入力する入力部と、この入力部が入力
した音声を分析して持重量を抽出する分析部と、仮名べ
た書き文を格納する仮名べた書き文格納部と、前記分析
部にて得られた特徴量を用いて前記仮名べた書き文格納
部の仮名べた書き文に対して区切りを入れる分割部と、
この分割部にて区切られた仮名べた書き文の各区間に対
する韻律情報を前記分析部の特徴量より得る韻律情報抽
出部と、この韻律情報抽出部より得られた仮名べた書き
文の各区間に対する韻律情報を用いて前記分割部にて区
切られた仮名べた書き文の各区間に対して厘次仮名漢字
変換処理を施す仮名漢字変換部とを有することを特徴と
する音声入力付仮名漢字変換装置の各部である。
(作用) 本願の第1の発明による音声入力付仮名漢字変換装置は
、入力された音声より形態素、単語、文節などの区切り
を求め、その区切りに基づいて仮名漢字変換処理を行う
ことにより、従来よりも高性能で速い仮名漢字変換を実
現するものである。
すなわち、変換すべき文を形態素、単語、文節などの区
切りでポーズを入れながら音声を入力することにより、
入力された仮名べた書き文に区切り入れることができる
。そのため、その区切りごとに辞書引きをおこなうこと
により、従来よりも辞書引き回数が少なく、しかも、従
来のように区切り方の間違いによる誤変換をなくすこと
ができ、正確な仮名漢字変換をおこなうことができる。
本願の第2の発明による音声入力付仮名漢字変換装置は
、入力された音声より、さらに韻律的情報を抽出し、そ
の情報を用いて同音具a語の候補を絞る事ができるとい
うものである。
(実施例) 以下に、本発明の実施例について図面を参照しながら詳
細に説明する。第1図は、本願における第1の発明の音
声入力付仮名漢字変換装置の一実施例を示すブロック図
である0例として、「わたしはかいものにいきます、」
という仮名べた書き文を仮名漢字変換することを考える
第1図における仮名べた書き文格納部3には、「わたし
はかいものにいきます。」という仮名べた書き文が格納
される。これは、例えば、キーボードなどからの入力を
考えることができる。この入力は、逐次的でも良いし、
あらかじめ格納されていても良いが、ここでは、音声入
力とほぼ同時に逐次的に入力されることにする。入力部
1からは、音声「私・は・買い物・に・行きます、」が
発声される。ここで、“・”なる記号は、少しポーズを
おくことを意味する。つまり、「わなし」という発声の
後に若干の時間をおいてから「は」を発声するという要
領で音声を入力する。ポーズの位置は、使用者の意志で
自由に決定することができる0分析部2では、入力され
た音声を分析し、特徴量に変換する。特徴量としては、
フィルタバンク出力、LPG係数、ケプストラム係数の
ような周波数特性、零交差数、基本周波数、振幅などを
用いることができるが、ここでは、GtWを用いること
にする0分割部4では分析部2にて求められた特徴量、
すなわち、振幅から、ポーズをおいて発声された箇所を
区切りとして検出し、それに従い仮名べた書き文に区切
りを入れる。この処理は、発声された音節の数と、ポー
ズの位置を求めることにより行われる。すなわち、上記
の例「わたし・は・」では、3音節発声された後でポー
ズが検出され、その後1音節発声された後でまたポーズ
が検出されることになる。音節の数と、ポーズの検出は
、例えば、次のように行うことができる。まず、入力音
声の振幅を連続的に求めておき、それがあらかじめ定め
られた振幅の閾値THIを越えた時に1音節発声された
とみなす、そして、THIを一度下回ってから再びTH
Iを越えた時にさらに1音節発声されたとみなす、ポー
ズの検出は、あらかじめ定められた振幅の閾値TH2を
下回る時間が同じく定められた時間の閾値Tよりも長く
続く場合に検出されたとみなす。閾値′rは、固定的に
定めても良いし、発声速度に応じて求めても良い0例え
ば、2音節間の平均時間よりTを求める方法が考えられ
る。第3図は、上記の音節とポーズの検出の様子を示し
たものである。ポーズが検出されるごとに、仮名べな害
き文格納部3の仮名べた書き文に対して、ポーズに対応
する箇所に区切りを入れていく、上記の例では、3音節
の後にポーズが検出され、その後、1音節後に再びポー
ズが検出されることになるため、「わたし/は/・・・
」という具合に区切りが入れられる0区切りが総てつけ
られ、「わたし/は/かいもの/に/いきます、」が求
められると、仮名漢字変換部5では、分割部4にて区切
られた各区間に対して、辞書引きを行い変換候補を求め
、文法的な検査や候補の優先度に従い結果を出力する。
仮名漢字変換部5における処理は、各区間ごとに辞書引
きを行うこと以外には、従来と同様の処理で良い。
次に、本願の第2の発明について図面を用いて説明する
。第2図は、その第2の発明の一実施例を示すブロック
図である。第2図における仮名べた書き文格納部3には
、例として「あめがふる、」という仮名べた書き文が格
納されている。入方部1からは、音声「あめ・が・ふる
、」が発声され、分析部2では、入力された音声を分析
し、特徴量に変換する。分割部4において、上記の処理
により仮名べた書き文の区切りが求められると、韻律情
報抽出部6では、分析部2で求められた特徴量のうち、
基本周波数と振幅を用いて、区切られた各区間に対する
韻律情報を求める。11!律情報とは、アクセントや抑
揚を意味し、これらの情報により「箸」と「橋」、「交
点」と「好転」などの区別が可能になる。ここでは、そ
れらの時間変化すなわち、アクセントパターンと抑揚パ
ターンを求める。アクセントは、特に振幅の強い音節に
与えられ、アクセントパターンは「あ′め」となる、こ
こで、°なる記号はアクセントの存在を意味する。
抑揚は、例えば、基本周波数の高、中、低の変化で与え
られる。上記の「あめ」に対しては、「高−低」となる
、仮名漢字変換部5では、分割部4にて区切られた各区
間に対し、韻律情報抽出部6にて求められた韻律情報を
用いて、辞書引きを行う、この時、「あめ」の変換候補
は韻律情報から「雨」に絞られる。仮名漢字変換部うに
おけるその他の処理は、従来装置、または、本願の第1
の発明と同一の処理で良い。
以上、本発明による音声入力付仮名漢字変換装置の原理
を、仮名べた書き文の仮名の情報を用いない方式により
説明したが、区切りをより正確に入れるために、仮名情
報を用いることも可能である。ここで仮名情報を用いる
とは、どの仮名が入力されたかによって、その仮名の種
類に応じた処理を行うという意味である0例えば、上記
の閾値を用いる方法においては、音節ごとに異なる閾値
を用いることにより、音節の種類による振幅の差に対応
でき、検出をより確実に行うことができる。
また、同じく仮名文字情報を使用するものとして、音響
的特徴を音節ごとにルールなどで記述しておき、入力仮
名に対する音節のルールを入力音声に逐次適用してゆく
方法が考えられる。すなわち、上記の入力仮名文字の例
「わたし・・・」では、始め「わ」に対する音響的特徴
のルールを適用し、そのルールを満足することにより「
わ」を検出し、次に、「た」に対するルールを同様に適
用して、順次音節やポーズを検出してゆく方法である。
その他、音節ごとの特徴を用いる方法として、入力音声
と音節パターンとのパターンマツチングにより検出を行
う方法がある。すなわち、各音節の特徴量をパターンと
して保持し、それらの音節パターンと入力音声との間で
、動的計画法を利用した時間軸の対応付けを行うことに
より検出する方法を用いることができる。
(発明の効果) 以上説明した本願の第1の発明による音声入力付仮名漢
字変換装置では、音声情報を用いることにより仮名べた
書き文に区切りを付け、仮名漢字変換における辞書引き
の回数を減らすことができ処理が早くなる。また、従来
類繁に起こっていた区切り方が誤ったことによる誤変換
をなくすことができる。しかも、従来のキー入角による
区切りの設定に比べると、音声久方による区切りの設定
は入閣にとって自然で楽な方法であるため、使用者の負
担は少なくてすむ、さらに、区切りの設定は、従来の装
置では仮名漢字変換処理部の処理によって決定されるも
のであるため画一的であり、さまざまな文の意味に応じ
て適切に変化されるものではなかった。しかし、本発明
の装置によると、利用者によって自由に決定することが
でき、どのような文に対しても、利用者の意志にかなう
区切りが設定できる。
さらに、本願の第2の発明による音声入力付仮名漢字変
換装置では、音声の韻律的情報を用いることにより、同
’¥F ’A 8語の候補を絞ることができる。その結
果、従来装置よりも辞書引きの回数が減少し、変換処理
が早くなるという利点が生じるン
【図面の簡単な説明】
第1図は本願の第1の発明の一実施例を示すブロック図
、第2図は本願の第2の発明の一実施例を示すブロック
図、第3図は本願の第1の発明における分析部2におけ
る処理を説明するための図である。 1・・・入力部、2・・・分析部、3・・・仮名べた書
き文格納部、4・・・分割部、5・・・仮名漢字変換処
理部、6・・・韻律情報抽出部。

Claims (2)

    【特許請求の範囲】
  1. (1)音声を入力する入力部と、この入力部が入力した
    音声を分析して特徴量を抽出する分析部と、仮名べた書
    き文を格納する仮名べた書き文格納部と、前記分析部に
    て得られた特徴量を用いて前記仮名べた書き文格納部の
    仮名べた書き文に対して区切りを入れる分割部と、この
    分割部にて区切られた仮名べた書き文の各区間に対して
    順次仮名漢字変換処理を施す仮名漢字変換部とを有する
    ことを特徴とする音声入力付仮名漢字変換装置。
  2. (2)音声を入力する入力部と、この入力部が入力した
    音声を分析して特徴量を抽出する分析部と、仮名べた書
    き文を格納する仮名べた書き文格納部と、前記分析部に
    て得られた特徴量を用いて前記仮名べた書き文格納部の
    仮名べた書き文に対して区切りを入れる分割部と、この
    分割部にて区切られた仮名べた書き文の各区間に対する
    韻律情報を前記分析部の特徴量より得る韻律情報抽出部
    と、この韻律情報抽出部より得られた仮名べた書き文の
    各区間に対する韻律情報を用いて前記分割部にて区切ら
    れた仮名べた書き文の各区間に対して順次仮名漢字変換
    処理を施す仮名漢字変換部とを有することを特徴とする
    音声入力付仮名漢字変換装置。
JP61257484A 1986-10-29 1986-10-29 音声入力付仮名漢字変換装置 Pending JPS63111568A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61257484A JPS63111568A (ja) 1986-10-29 1986-10-29 音声入力付仮名漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61257484A JPS63111568A (ja) 1986-10-29 1986-10-29 音声入力付仮名漢字変換装置

Publications (1)

Publication Number Publication Date
JPS63111568A true JPS63111568A (ja) 1988-05-16

Family

ID=17306938

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61257484A Pending JPS63111568A (ja) 1986-10-29 1986-10-29 音声入力付仮名漢字変換装置

Country Status (1)

Country Link
JP (1) JPS63111568A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0352058A (ja) * 1989-07-20 1991-03-06 Fujitsu Ltd 音声入力の文書処理装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6076799A (ja) * 1983-10-03 1985-05-01 松下電器産業株式会社 同音語同定装置
JPS60225272A (ja) * 1984-04-20 1985-11-09 Sharp Corp 音声入力仮名漢字変換装置
JPS61121167A (ja) * 1984-11-19 1986-06-09 Fujitsu Ltd 区切り発声に基づく音声ワ−ドプロセツサ
JPS61175851A (ja) * 1985-01-31 1986-08-07 Canon Inc 文字処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6076799A (ja) * 1983-10-03 1985-05-01 松下電器産業株式会社 同音語同定装置
JPS60225272A (ja) * 1984-04-20 1985-11-09 Sharp Corp 音声入力仮名漢字変換装置
JPS61121167A (ja) * 1984-11-19 1986-06-09 Fujitsu Ltd 区切り発声に基づく音声ワ−ドプロセツサ
JPS61175851A (ja) * 1985-01-31 1986-08-07 Canon Inc 文字処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0352058A (ja) * 1989-07-20 1991-03-06 Fujitsu Ltd 音声入力の文書処理装置

Similar Documents

Publication Publication Date Title
US6490563B2 (en) Proofreading with text to speech feedback
US5787230A (en) System and method of intelligent Mandarin speech input for Chinese computers
US5220639A (en) Mandarin speech input method for Chinese computers and a mandarin speech recognition machine
Lee et al. A real-time Mandarin dictation machine for Chinese language with unlimited texts and very large vocabulary
Lee et al. Golden Mandarin (II)-an intelligent Mandarin dictation machine for Chinese character input with adaptation/learning functions
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
Szarvas et al. Automatic recognition of Hungarian: Theory and practice
KR100542757B1 (ko) 음운변이 규칙을 이용한 외래어 음차표기 자동 확장 방법및 그 장치
KR100369507B1 (ko) 표준 발음법 분석에 기반한 음성 인식/합성 시스템 및 방법
JPS63111568A (ja) 音声入力付仮名漢字変換装置
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
CN111429886A (zh) 一种语音识别方法及***
JPH10149365A (ja) 擬音語を用いた音検索システムおよび擬音語を用いた音検索方法
KR101604553B1 (ko) 비교사 분할 및 병합에 의한 의사형태소 음성 인식 단위 생성 장치 및 방법
JP2004206659A (ja) 読み情報決定方法及び装置及びプログラム
JPS62134698A (ja) 多数単語の音声入力方式
JPH05119793A (ja) 音声認識方法及び装置
JP3084864B2 (ja) 文章入力装置
JPH04232997A (ja) 音声認識装置における認識結果表示方式
JPH10340096A (ja) 音声認識装置
JPH09288494A (ja) 音声認識装置および音声認識方法
JPS60158496A (ja) 音声認識装置
JPH04296898A (ja) 音声認識装置
Lin-shan Lee et al. A REAL-TIME MANDARIN DICTATION MACHINE FOR CIUNESE LANGUAGE WITH UNLIMITED TEXTS AND VERY LARGE VOCABULARY