JP2660998B2

JP2660998B2 - 日本語処理装置

Info

Publication number: JP2660998B2
Application number: JP61044740A
Authority: JP
Inventors: 治一五十嵐
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1986-03-01
Filing date: 1986-03-01
Publication date: 1997-10-08
Anticipated expiration: 2012-10-08
Also published as: JPS62202283A

Description

【発明の詳細な説明】〔技術分野〕本発明は日本語処理装置に係り、詳しくは、主にワー
ドプロセッサにおいて仮名漢字変換処理に用いられてい
る形態素解析技術を、OCR文字認識や音声認識の後処理
にも共通に利用可能とした日本語処理装置に関する。〔従来技術〕ワードプロセッサにおいては、キーボード等から入力
された文字列に対する仮名漢字変換処理に主として形態
素解析の技術が用いられている。一方、OCR文字認識装
置や音声認識装置では、OCRあるいは音声による入力情
報について文字認識処理や音声認識処理を行って候補文
字を決めるが、該候補文字について更に後処理を施すこ
とにより認識精度を高めることができる。近年、上記OCR文字認識処理や音声認識処理の後処理
に形態素解析の技術を取り入れることが提案されてきて
いる。しかしながら、従来は該文字認識処理や音声認識
処理の後処理に形態素解析の技術を利用する場合、仮名
漢字変換処理で利用されている形態素解析とは別のアル
ゴリズムやプログラムで実現しており、非常に不経済で
あった。〔目的〕本発明の目的は、日本語処理装置において、形態素解
析機能を独立したサブルーチンとし、仮名漢字変換のみ
ならず、OCR文字認識や音声認識の後処理にも利用可能
とし、ソフトウェア資料の有効利用を図ることにある。〔構成〕以下、本発明の一実施例について図面により詳述す
る。第１図は本発明の一実施例の日本語処理装置の全体構
成図を示す。キーボード10は文字を入力する他に各種の
モード（仮名漢字変換、漢字仮名変換、OCR文字認識、
音声認識等）を指定するのに用いる。OCR11は原稿を光
学的に読取り、音声入力装置12は使用者の生の音声を入
力する。処理装置13はキーボード10やOCR11や音声入力
装置12からの入力情報について、指定されたモードに従
った処理を実行し、出力装置16に出力する。出力装置16
はディスプレイ装置、プリンタ、音声出力装置等を総称
して示したものである。処理装置13の処理に必要なプロ
グラムはプログラムメモリ（ROM）14に格納されるが、
こゝで注目すべきことは、形態素解析プログラム145を
独立したサブルーチンとし、仮名漢字変換141、及びOCR
文字認識142と音声認識143の後処理144のために共通化
したことである。データメモリ（RAM）15は処理装置13
での処理途中のデータやパラメータ、及び各種辞書を格
納するのに用いる。第１図の全体の処理フローを第２図に示す。こゝで、
モードｎは１〜７あり、それぞれの意味は第１表の通り
とする。まず、キーボード10により７つのモードのうち１つを
指定した後（ステップ201）、当該モードで必要なパラ
メータを設定する（ステップ202）、処理装置13は指定
されたモードを判定し（ステップ203）、ROM14のプログ
ラム141〜145に基づきモードごとに以下の処理を実行す
る。以下、入力文字列は「応用力をようせいするために
は、…」であるとする。ｎ＝１の場合キーボード１から仮名の文字列「おうようりょくをよ
うせいするためには、…」を入力する（ステップ20
4）。処理装置13は、このキー入力の文字コード列によ
り形態素解析を行う（ステップ205）、もし未知語が出
てきた場合には、１字読みとばしなどの未知語処理を行
い（ステップ206）、形態素解析を続行する。そして、
１ユニット（句読点で区切られた文字列）ごとに、単語
辞書中に登録されている“表記”の部分を出力して次の
ユニットの処理をする（ステップ207,211）。このよう
にして、最終的に「応用力を養成するためには、…」が
出力装置16に出力される。ｎ＝2,4,5,6の場合 OCR11で原稿を光学的に読み取る（ステップ208）。処
理装置13は、入力パターンについて文字認識し（ステッ
プ209）、候補文字と距離（相違度）を算出してデータ
メモリ15へ格納する（ステップ210,211,212）。この
時、ステップ211の前処理では、濁点・半濁点を１文字
として記入する場合の連結処理（例「は」＋「゛」→
「ば」）や、促音や拗音を認識した時に候補文字中に対
応する大文字を挿入する処理（例「ゃ」→「や」）を行
う。次に、形態素解析の技術を用いて誤認識文字の自動
訂正処理（後処理）を行う（ステップ213）。このよう
にして、ｎ＝2,4の場合は単語の“表記”部分を出力し
（ステップ211）、ｎ＝５の場合は単語の“よみ”部分
を出力し（ステップ220）、ｎ＝６の場合は認識文字を
出力して（ステップ219）、次のユニットの処理に移
る。こゝで、ｎ＝４のケースでは、「応用力をようせい
するためには、」を入力すると、「応用力を養成するた
めには、」が出力される。ｎ＝3,7の場合音声入力装置12から単音節ごとに、「お」「う」
「よ」「う」「り」「ょ」「く」「を（お）」「よ」
「う」「せ」「い」…を入力する（ステップ214）。ユ
ニットの区切りは、「まる」、「てん」などと発生し
て、これを認識するか、キーボード10の特定キーを押下
するなどの方法が考えられる。音声認識、候補文と距離
の算出（ステップ215,216）は基本的には原稿入力の場
合と同様である。ステップ218の訂正のための前処理で
は、認識された音素列を文字列に変換する。この場合、
拗音を考慮して第３図のように候補列を作成し、データ
メモリ15へ格納する。即ち、１音素に２文字分の文字コ
ードを対応させる。なお、これはステップ211でも同様
である。次に誤認文字の訂正処理を行い（ステップ21
3）、単語の“よみ”あるいは単語の“表記”部分を出
力する（ステップ220,211）。第４図は第２図中の形態素解析を利用した訂正処理
（ステップ213）の詳細フローである。まず、第１位候補文字のみからなる文字列を作成し
（ステップ401）、形態素解析処理を行う（ステップ40
2）。こゝで、単語辞書中には、音声入力の場合を考慮
して、例えば「おうよう」（応用）だけでなく「おおよ
う」などの“よみ”をもつ単語も記録しておく。「わ」
を“よみ”に、表記を「は」（格助詞）とする単語を登
録しておくことも同様である。次に、未知語部がある場合には、その先頭位置（この
位置をm₀とする）が返され（ステップ403）、そこから
長さL₁（ステップ401で、たとえばL₁＝６と初期設定し
ておく）の文字列に対して“距離”から誤認識文字の検
出を行う（ステップ404）。一般に、誤認識文字の個数
はｋ、その位置はm₁〜m_kで表わされる。今、ｎ＝４のケ
ースで入力文が「応用力をようせいするには、…」であ
ったとし、未知誤部「をようせいす」で「せ」と「す」
が誤認と判定されたとする（ｋ＝2,m₀＝4,m₁＝６）。こ
の場合、Ｎ＝N₁（＝３とおく）位までの候補文字を
「せ」と「す」に関して取り出してN₁ ²＝９通りの文字
列を作成し（ステップ405,406）、それぞれについて形
態素解析する（ステップ407）。そして、文字列ごとの
評価値（単語の評価値の和と、分割数とから計算する）
を計算し（ステップ408）、その判定を行う（ステップ4
09）。切り出された最尤文字列の中に「す」が含まれて
いればステップ410、420の処理へ進むが、そうでなけれ
ば、Ｎ→Ｎ＋１位までの候補を考えてステップ407〜409
の処理を繰り返す（ステップ411,412,413）。次に、候補文字の順位の或る上限値N₂をすぎると、見
出し語辞書中を検索し（ステップ214）、「せ」と
「す」を除した「をよう□い□」にマッチする見出し語
をもつ単語をさがし出す。ある長さL₂（L₂＝３とする）
以上のマッチする見出し語がなければステップ415〜418
の処理により、L₁＝９−４＝５となり、「をようしす」
に対してステップ404以下の処理を行う。このようにし
て、L₁＝３となった時に、「を」（助詞）が切り出され
（ステップ422,423）、ステップ420,421,402を経て、ス
テップ414でL₁＝４の時に「ようせい」がマッチし、ス
テップ410で「養成」が選択される。なお、誤認識文字を含む文字列の形態素解析は、誤字
周辺でバックトラックを多数回繰り返すので単語の評価
値に加減を設定し、無駄な探索をやめるようにする。〔効果〕以上の説明から明らかな如く、本発明によれば、形態
素解析処理手段（形態素解析サブルーチン）を独立させ
ることで、仮名漢字変換と、OCR文字認識処理及び／又
は音声認識処理の大半が共通化される。さらに、OCR文
字認識と音声認識における自動訂正処理とを同一アルゴ
リズムで行っているために、プログラムの共通化、単語
辞書等の共通化による省メモリ効果が大きい。したがっ
て、パソコンなどの小型コンピュータでの実行が可能と
なる。

【図面の簡単な説明】第１図は本発明方式を適用した日本語処理システムの全
体構成図、第２図は第１図の全体の処理フロー図、第３
図は候補文字列の一例を示す図、第４図は第２図におけ
る訂正処理の詳細フロー図である。 10……キーボード、11……光学文字読取装置（OCR）、1
2……音声入力装置、13……処理装置、14……プログラ
ムメモリ、141〜145……プログラム、15……データメモ
リ、16……出力装置。

Claims

(57)【特許請求の範囲】１．仮名漢字相互変換処理手段とOCR文字認識処理手段
を具備してなる日本語処理装置において、前記仮名漢字相互変換処理手段とOCR文字認識処理手段
とに共通に形態素解析処理手段を設け、前記仮名漢字相互変換処理手段の仮名漢字変換処理、及
び、前記OCR文字認識処理手段での入力文字の認識処理
と誤認文字の訂正処理に、各々前記形態素解析処理手段
を使用し、且つ、訂正処理において誤認文字を除いた候補文字列と
見出し語とのマッチングをとる際、前記形態素解析処理
手段の形態素解析にもとづき、マッチング範囲を段階的
にせばめて探索を繰り返すことを特徴とする日本語処理
装置。２．仮名漢字相互変換処理手段と音声認識処理手段を具
備してなる日本語処理装置において、前記仮名漢字相互変換処理手段と音声認識処理手段とに
共通に形態素解析処理手段を設け、前記仮名漢字相互変換処理手段での仮名漢字変換処理、
及び、前記音声認識処理手段での入力音声の認識処理と
誤認音声の訂正処理に、各々前記形態素解析処理手段を
使用し、且つ、訂正処理において誤認文字を除いた候補文字列と
見出し語とのマッチングをとる際、前記形態素解析処理
手段の形態素解析にもとづき、マッチング範囲を段階的
にせばめて探索を繰り返すことを特徴とする日本語処理
装置。３．仮名漢字相互変換処理手段、OCR文字認識処理手段
及び音声認識処理手段を具備してなる日本語処理装置に
おいて、前記仮名漢字相互変換処理手段とOCR文字認識処理手段
と音声認識処理手段とに共通に形態素解析処理手段を設
け、前記仮名漢字相互変換処理手段での仮名漢字変換処理、
前記OCR文字認識処理手段での入力文字の認識処理と誤
認文字の訂正処理、及び、前記音声認識処理手段での入
力音声の認識処理と誤認音声の訂正処理に、各々前記形
態素解析処理手段を使用し、且つ、訂正処理において誤認文字を除いた候補文字列と
見出し語とのマッチングをとる際、前記形態素解析処理
手段の形態素解析にもとづき、マッチング範囲を段階的
にせばめて探索を繰り返すことを特徴とする日本語処理
装置。