JPS6059416A - 日本語情報入力方式 - Google Patents

日本語情報入力方式

Info

Publication number
JPS6059416A
JPS6059416A JP58166480A JP16648083A JPS6059416A JP S6059416 A JPS6059416 A JP S6059416A JP 58166480 A JP58166480 A JP 58166480A JP 16648083 A JP16648083 A JP 16648083A JP S6059416 A JPS6059416 A JP S6059416A
Authority
JP
Japan
Prior art keywords
kana
key
paragraph
recognition
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58166480A
Other languages
English (en)
Other versions
JPH0625988B2 (ja
Inventor
Tsuneo Nitta
恒雄 新田
Yoichi Takebayashi
洋一 竹林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58166480A priority Critical patent/JPH0625988B2/ja
Publication of JPS6059416A publication Critical patent/JPS6059416A/ja
Publication of JPH0625988B2 publication Critical patent/JPH0625988B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Input From Keyboards Or The Like (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 日本語は、漢字・ひらがな・かたかな・英数字・記号を
含む数千字の文字を入力する必要があるため、欧米に比
較して一般ホワイドカラーの文1作成能力はかなり劣る
とされている。一方、近年我国においてもかな・漢字自
動変換方式を組み込んだ日本語のワードプロセッサが登
場した。この装置はかなで文章を入力すれば即時に漢字
かな混じり文を得ることができ、その使用法がこれまで
の漢字入力装置に比べ非常に楽であったため広く普及し
始めている。しかし、この人力に使用されるかを鍵盤の
数は欧文タイプのそれと比べてまだ格段に多い。このた
めキー操作に不慣れな一般の人にとって文書作成は未だ
多大の時間を必要とする作業に滞まっている。
オペレータをかな・キーボードの操作から解放する入力
手段としては、最近、手書き文字読み取シ装置あるいは
音声認識装置を用いた方式が注目を集めている。両者と
も初期訓練75i要らず、楽々姿勢で気軽に利用できる
点で理想的な方式と言える。しかし、こうしたパターン
認識を利用した方式では、認識結果が常に正しいとは限
らない。このため文字もしくは音声の認識結果としては
、複数の候補を出力し、文節もしくは文単位にかな一漢
字変換を行うことが考えられている。しかし、このよう
に複数候補を有する文字列の変換結果は当然−意に決定
できない場合を生ずる。例えば、「機械と」を入力する
意図でかな文字列「きかいと」を入力した時、認識装置
が「き(が、か)いと」と文字「か」を(カ、か)と第
2候補までを出力した場合を考える。この時、かな−漢
字変換の結果は「危害と、気概と9機会と9機械と、奇
怪と」のように「きかい」と「きかい」という異なり語
に対応した単語を検索して表示することになる。従来、
このような場合、オペレータは同音異義語の選択時と同
様に順次候補文字を「次候補キー」と「選択キー」を用
いて選択していた。第1図に表示の変化する様子を示し
、以下に選択の仕方の一例を述べる。同図(a)は、最
初の表示゛危害と“を表示している。このとき表示は、
例えば輝度変調により一段明るい輝度で表示され、複数
の候補が存在していることを示している。次にオペレー
タが「次候補キー」を押すことにより、表示は同図(b
)の1気概と“に変わる。同様の操作で同図(C)を経
て同図(d)にいたって初めて意図した1機械と“が表
示され、オペレータが「選択キー」を押すことにより、
他の候補文字列は棄てられ「機械と」のみが文盲ファイ
ルに登録されるとともに、同図(e)のようにこのとき
表示は通常の輝度に戻る。
このように、異なり飴がある上に同音異義語を伴なう場
合は、選択のだめの鍵盤操作回数が増えオペレータにと
って大きな負担となることが明らかになった。
〔発明の目的〕
本発明の目的は、上記の事実に鑑み、異なり語がお本土
に同音異義語を伴なうような場合においても、オペレー
タがこれを速やかに、かつ楽に選択できる日本語情報入
力方式を与えることにある。
〔発明の概吸〕
本発明は、音声パターンや文字パターンとして入力され
た文字列を単語もしくは文節もしくは文単位毎に別種の
文字列に変換し、この変換文字列に同音異義語と異なシ
飴が混在する場合、異な9語と同音意義語を別個に選択
する手段を与えたことを特徴とする。また、文字列中の
異なシ語の有無を表示する手段も併わせて提供するもの
である。
〔発明の実施例〕
以下、図面を参照して本発明の実施例につき説明する。
第2図は、文賀白単位に発声された音声パターンを認識
し、逐次的に日本語文章の入力を行う装置のiM成を示
す。1はマイクロホン、2は1よυ得られた18号を増
幅する増幅器である。3は文節単位に発話された音声パ
ターンを認識するg識部、4は認識結果を記憶する音節
候補系列メモリであり、−文節に対応する複数の音節系
列がイ8頓件の高い順に記憶されている。5はメモリ4
のあいまい性のある音節系列の夫々に対して処理を行う
カナ漢字変換部、6はカナ漢字変換文字列を収容するペ
ージバッファ、7はOR,T表示部、8は制御部、9は
ファンクシ罪ンキーボード、10は同−tHh選択キー
、11は異なp語選択キーである。12は文節の区切シ
を入力するための文節キーである。
オペレータはマイクロホン1に対し、文章を文節に分割
して発声する。例えば、「私はうみへ行く」という文章
を第2図の実施例装置で入力する場合、「わたしわ」と
まず発声した後文節キー12を打鍵する。マイクロホン
1より入力される文節音声は増幅器2を介して、認識部
3へ送られる。
認識3では始端と終端を検出した後、従来知られている
連絡単音節の認識法や音素認識や音節認識を基本とした
認識法により認、iikすることができる。
認識法については本発明の中心部ではないので、これ以
上触れない。音声認識では100%の認識は困難であシ
、あいまい性が含まれることがあるので1献結果として
単数あるいは複数のカナ文字で表わされた文節が、信頼
度の高い順番に音節候補系列メモリー4に収容される。
「わたしわ」の入力音声に対応する音節候補系列の例を
第3図に示す。
6棟類の音節候補系列は、信頼度の高い順に格納されて
いる。一方、文節キー12の打鍵により制御部8はカナ
漢字変換部5を駆動する。音声入力の場合、通常の日本
語ワードプロセッサにおけるカナ鍵盤入力とは異なり、
各文節に対してあいまい性に対処するため複数の音節系
列を対象として、カナ漢字変換が行われる。このとき、
文法に合致しない音節系列や辞書に含まれない語檗のあ
る音節系列の変換は行わないようにする。すなわち、音
声紹識部3で誤認識がありでも、言語の有する冗長性を
利用して言語的な検定を行い、日本語として存在可能な
文節だけが漢字カナ混じシ文に変換される。
第2図の例では、2種類の音節系列〔わだちわ〕と〔わ
たしわ〕のみがカナ漢字変換が可能でありこの場合音声
〔わ〕に対しては「わ」と「は」の表記があることを考
慮して助詞“は“の処理を行い、2種の音節系列「わだ
ちわJ「わたしわ」のみが文法的に適合し、「轍は」「
私は」「渡しは」がかな漢字変換結果として得られる。
制御部8は、このように複数の異なる音節系列に対応す
る候補がある場合、第4図(a)のように第1候補の「
$1は」の横に“*“を付けて変換結果を出力するよう
表示部7に指令する。なお、異なり語の存在を示す表示
の方法としては、従来の同音異義語の存在を示す表示と
異なる表示方法であればよい。この例の如く異なり語を
“*0を付して表示する場合、同音異義語については後
述するように下線をつけて表示することが考えられる。
表示の方法としては、この低輝度変調、網かけ1点滅な
どを組み合わせて使用できる。オペレータは「轍は」は
入力しようとする文節ではないので、77ンクシ1ンボ
ード9の異な9語キー11を打鍵して訂正を行う。制御
部8は、ページバッフ76の順序を変更し、表示部7の
CRT上での漢字かな混じり文の表示を変え、上記の例
では、次候補の音節系列の「わたしわ」のかな漢字変換
結果を表示するよう指令する。このとき、同音異義語「
私は」と「渡しは」が存在するので、制御部8は変換結
果に下線を付加し、「私は」と表示し、オペレータに同
音異義語の存在を知らせる。同音異義語の通知方法とし
ては、異な9語の表示以外の方法ならば、キー人力の日
本語ワードプロセッサで使用されている他の方法を採用
してもかまわない。オペレータは、CRT7上の「私は
」という下線表示を見て同音異義語の存在を知るが、「
私は」は入力すべき文節なので次の節「うみえ」と発声
し、文節キー12を打鍵し、音声による日本語入力を続
ける。もし先の同音異義61の「私は」では々く、「渡
しは」という文節を入力したい場合には、オペレータは
ファンクシトンポード9の同音異義語キー10をf′J
鍵するととにより、同音異義語の選択を行う。このとき
制御部8は、ページバッファ6に格納されている「私は
」と「渡しは」の優先順位を変え、表示部7の漢字かな
混じり文を変える。
続いて、次の文節を発声する仁とにより同音n義語の選
択が行われる。
以上述べたように、本実施例装置によれば入力された文
節音声に対して複数の認識候補を許容しかな漢字変換を
行うため、音声認識結実にあいまい性や誤認識が存在す
る場合でも、文章入力の際の再発声の回数を低減するこ
とができる。ところがかな漢字変換の結果には、異種の
音節系列である複数個の異なり語と複数個の同音異義語
を含むようになるため、本実施例装置では、異カリ語と
同音異義語の存在を区別して表示してオペレータに通知
することができ、さらにファンクシランキーボー上申に
同音語キーと異なり語キーの両方を備えており、不確実
なかな漢字変換結果の選択修正処理を効率的に行える。
なお、本実施例装置におけるファンクシ四ンキーボード
9中における文節キー12、同音語キー10、異カリ語
キーはキー操作ではなく音声認識により行うことも可能
であり、寸だ、文節キーには無音部の長さを検出して文
節音声の始端・終端を決定することにより除去すること
ができる。
さらに、上記実施例装置は文節単位の音声入力ではなく
、1音l音区切る単音節入力やあるいは連続してゆっく
り発声する連続単音節入力、さらには単語単位の入力や
文章入力に対しても適−用可能である。音声入力による
あいまい性は〔新美康永著「音声認識」、共立出版昭和
54年〕に記載されているように、意味・プラグマチイ
ックなレベルの言語情報を利用しても完全になくすこと
は不可能であり、本発明による日本語入力効率の増加は
絶大である。
本発明による他の実施例として、文節単位に発声された
音声を認識し、先に述べた異な9語と同音語の選択修正
処理を複数の文章音声で入力後に一括して行う日本語入
力装置について述べる。
本実施例装置では、その構成は第2図の逐次選択方式の
製置のファンクシ驕ンキーボード9の部分が異なってお
り、又制御部8による制御法が異なっている。第5図に
本実施例装置におけるファンクシ四ンキーボード13、
選択キー14、同音語キー15、異音語キー16、文節
キー17を示す。
本実施例装置では、第1の実施例と同様にオペレータは
音声を文節単位で発声し、次に文節キー17を打鍵し、
次々と文章を音声で入力して行く。認識結果は、第1の
実施例装置と同様に複数の音節系列を許容し、それらは
自動的に文節単位でかな漢字変換され、表示部7のcR
,’r上に漢字かな混じり文が次々と表示される。この
ときページバッファ中の各文節のかな漢字変換結果に、
同音語あるいは異音語が含まれる場合には、第1の実施
例と同様に何らかの方法でその存在を表示してもよい。
文全体あるいは複数の文章を音声入力した後、オペレー
タが選択キー14を打鍵すると、制御部8はページバッ
ファ6に格納されている同音語あるいは異音飴が含まれ
る文節のかな漢字変換結果のところにポインタを移動し
、OR’l’上に、例えば第6図に示したような方法で
表示する。オペレータは筑1の実施例と同様に、同音語
キー15及び異音語キー16を用いて目的とするかな漢
字変換結果を選択する。そして、次に選択キー14を打
鍵すると、制御8 lIj:ページバッフ76の中に格
納されている複数のかな漢字変換結果の中から適当な文
節を選択し、同様の処理を繰シ返す。このようにオペレ
ータは、板数候補のある文節へのポインタの移動をカー
ソル等を使用せずに、選択キーを用いて自動的に行い、
さらに複数の文節候補からの選択を同音語キー15と異
音語キー16を用いて能率的4行えるため、音声による
文章の入力速度゛を飛 的に増大させることができる。
また、第1の実施例装置6と同様に本実施例も単語単位
、複数の文ff1j単位、文章単位の発声による文章入
力に対しても適用できる。
上記の一括選択の実施例装置の変形として、第7図に示
すようなフ7ンクシーンキーボード18を用いて、異音
飴の選択と同音語の選択とを分離して杓うことができる
。19は異音語の選択キー、20は異音語キー、21は
同音語選択キー、22は異音胎キー、22は文節キーで
ある。すなわち第7図のファンクシ鱈ンキーボード18
の異音語選択キー19と異音飴キー20を用いてまず始
めに異音語の選択を行い、次に同音語選択キー21と異
音語キー22を用いて同音語の選択を行うことができる
。何れにせよ本発明によれば、釉々の同音語と異音語の
選択法によシ、能率のよい修正が可能となシ、音声によ
る総合的な文章の入力速度が向上する。
また上記各実施例では、音節系列を用いてかな漢字変換
を行・たが、符加脱落のある音素等のh己号系列を単語
辞書と照合し、構文・意味的な検定をして、漢字かな混
じ構文を出力しても良い。何れにしても、本発明では同
音語と異音飴の選択を効率良く行うところに特徴がある
第8図は、オンライン文字認識技術を用いてカナ文字系
列を入力したときの、文字認識個有の処理部を示してお
り、第2図の音声入力の場合のマイクロホン1、増幅器
2、音声認識部3と、タブレット24、前処理部25、
文字認識部26を圓き換えることにより、本発明を実施
することができる。課認識の傾向は音声の場合と異なる
が、不確実性が伴なう点では同一であり、複数のカナ文
字列を認識結果として許容することにより、誤まシ訂正
の回数を減少させることができ、同音語・異音曲を音声
入力の場合と同様に扱うことにXす、総合的な文章入力
速度を増加させることができる。
また、カナ文字を書く速度は漢字を書く速度に比べはる
かに速く、またカナ文字はカテゴリー数が少く認識が容
易であるという利点も有している。
さらに、本装置はカナ入力による光学的文字読取装置′
ガにも適用できる。
次に、異なり語と同音異義語が存在する際の他の表示・
選択方法を述べる。第9図は文章を文単位に確認・修正
する場合の表示例を示している。
この例では、異なり語を横に並べ同音異義語を縦に並べ
て表示しているが、表示の仕方は他の記号を用いたり、
他の並べ方をとってもよく要は異なり胎と同音異義語を
分離して表示してあればよい。
オペレータは、画面に対して直接指(この場合タッチパ
ネルが設けられている)もしくはライトベンで選択を行
なう。(図の例では「機械」を選択)もちろん正しい文
字列が最初の位置にあれば、そのま\次の文を入力すれ
ばよい。図の例では「正常」については、選択する必要
はなく次の文章を入力した時点で「清浄」は消える。以
上の表示・選択を実施する手段を第10図に示す。これ
までの実施例と比較して異なるのは、第2図のファンク
シ四ン・キー9の替シに表示部7にタッチパネルが取シ
伺けられ、この座標情報が制御部8に人力され、指示さ
れた単語もしくは文節を選択するようになっていること
で、他はこれまでの例と同じである。
【図面の簡単な説明】
第1図は従来技術を説明するだめの図、第2図は本発明
の一実施例を示すブロック図、第3図及び第4図は本発
明の一実施例の1ldJ作を説明するだめの図、第5図
乃至第10図は本発明の他の実施例を説明するための図
である。 1・・・マイクロホン、3・・・認識部、4・・・メモ
リ、5・・・かな漢字変換部、6・・・ページバッファ
、7・・表示部、9・・ファンクシ式ンキーボード。 第 1 図 第2図 第3図 第4図 <Q−ン (ら) (C) 第5図 第6図

Claims (1)

  1. 【特許請求の範囲】 +l)文字列をパターンとして順次入力するだめの入力
    手段と、この手段により入力されたパターンを認識する
    手段と、この手段より行われた複数候補文字列を単語も
    しくは文節もしくは文単位毎に別種の文字列に変換する
    手段と、この手段にょシ得られた変換文字列を表示する
    ための表示手段と、変換文字列中の同音異義語と異な!
    l1語を別個に選択する手段を有することを特徴とする
    日本語情報入力方式。 (2)変換文字列を表示する手段は、文字列中の異な9
    語の有無を表示する手段を有することを特徴とする特許
    請求の範囲第1項記載の日本語情報入力方式。 (3)かな文字列をパターンとして順次入力する入力手
    段と、この手段によυ入力されたパターンを認識する認
    識手段と、この手段にょシ、得られた認識結果を用いて
    かな漢字変換する変換手段と、この手段によシ得られた
    変換結果を表示する手段とを備え、この表示手段は前記
    変換結果中の同音意義語と異な9語とを区別して表示す
    ることを特徴とする日本語情報入力方式。
JP58166480A 1983-09-12 1983-09-12 日本語情報入力方式 Expired - Lifetime JPH0625988B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58166480A JPH0625988B2 (ja) 1983-09-12 1983-09-12 日本語情報入力方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58166480A JPH0625988B2 (ja) 1983-09-12 1983-09-12 日本語情報入力方式

Publications (2)

Publication Number Publication Date
JPS6059416A true JPS6059416A (ja) 1985-04-05
JPH0625988B2 JPH0625988B2 (ja) 1994-04-06

Family

ID=15832177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58166480A Expired - Lifetime JPH0625988B2 (ja) 1983-09-12 1983-09-12 日本語情報入力方式

Country Status (1)

Country Link
JP (1) JPH0625988B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62113264A (ja) * 1985-11-12 1987-05-25 Toshiba Corp 音声文書作成装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54136105A (en) * 1978-04-13 1979-10-23 Toshiba Corp Monosyllable identifying display unit
JPS5549772A (en) * 1978-10-02 1980-04-10 Toshiba Corp Homophone display control system in kana-chinese character conversion
JPS5624669A (en) * 1979-08-08 1981-03-09 Fujitsu Ltd System for converting kana (japanese syllabary) letter row into same sound word row
JPS5725074A (en) * 1980-07-21 1982-02-09 Fujitsu Ltd Character recognition post-processing system
JPS57120153A (en) * 1981-01-19 1982-07-27 Nec Corp Input system of japanese language
JPS5844528A (ja) * 1982-07-27 1983-03-15 Toshiba Corp 同音異義語選択方式

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54136105A (en) * 1978-04-13 1979-10-23 Toshiba Corp Monosyllable identifying display unit
JPS5549772A (en) * 1978-10-02 1980-04-10 Toshiba Corp Homophone display control system in kana-chinese character conversion
JPS5624669A (en) * 1979-08-08 1981-03-09 Fujitsu Ltd System for converting kana (japanese syllabary) letter row into same sound word row
JPS5725074A (en) * 1980-07-21 1982-02-09 Fujitsu Ltd Character recognition post-processing system
JPS57120153A (en) * 1981-01-19 1982-07-27 Nec Corp Input system of japanese language
JPS5844528A (ja) * 1982-07-27 1983-03-15 Toshiba Corp 同音異義語選択方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62113264A (ja) * 1985-11-12 1987-05-25 Toshiba Corp 音声文書作成装置

Also Published As

Publication number Publication date
JPH0625988B2 (ja) 1994-04-06

Similar Documents

Publication Publication Date Title
US6490563B2 (en) Proofreading with text to speech feedback
US3704345A (en) Conversion of printed text into synthetic speech
EP1096472B1 (en) Audio playback of a multi-source written document
US5787230A (en) System and method of intelligent Mandarin speech input for Chinese computers
US6282507B1 (en) Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
Wells Computer-coded phonetic transcription
JPS634206B2 (ja)
US7430503B1 (en) Method of combining corpora to achieve consistency in phonetic labeling
Tsunematsu et al. Neural Speech Completion.
KR100369507B1 (ko) 표준 발음법 분석에 기반한 음성 인식/합성 시스템 및 방법
JPS6059416A (ja) 日本語情報入力方式
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JPS58123129A (ja) 仮名漢字変換装置
CN111581991B (zh) 一种基于端到端神经机器翻译的汉盲翻译方法及***
WO2023166651A1 (ja) 情報処理装置及び情報処理プログラム
JPS62212870A (ja) 文章読み上げ校正装置
JPH03245192A (ja) 外国語単語の発音決定方法
JP2006302149A (ja) 日本語入力装置
Akinwonmi Rule-Induced Misanalysis of Nasal Syllables in Yoruba Declarative Syllabification Algorithm
JPH04232997A (ja) 音声認識装置における認識結果表示方式
KR20140059910A (ko) 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치
JP2022169012A (ja) 編集装置、音声合成装置及びプログラム
JPS61223971A (ja) 文章作成装置
JPS61139828A (ja) 言語入力装置