JPS6162175A - 日本語解析装置 - Google Patents

日本語解析装置

Info

Publication number
JPS6162175A
JPS6162175A JP59183700A JP18370084A JPS6162175A JP S6162175 A JPS6162175 A JP S6162175A JP 59183700 A JP59183700 A JP 59183700A JP 18370084 A JP18370084 A JP 18370084A JP S6162175 A JPS6162175 A JP S6162175A
Authority
JP
Japan
Prior art keywords
morphological analysis
words
character string
data
morphological
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59183700A
Other languages
English (en)
Other versions
JPH0580021B2 (ja
Inventor
Toshiyuki Funabe
舟部 敏行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59183700A priority Critical patent/JPS6162175A/ja
Publication of JPS6162175A publication Critical patent/JPS6162175A/ja
Publication of JPH0580021B2 publication Critical patent/JPH0580021B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は日本語解析装置に係シ、具体的には、機械翻訳
等の構文解析に利用できる日本語文の形態素解析を行な
う1本語処理装置に関する。
従来技術 機械翻訳等においては一般に、日本語文の構文解析に先
立ち、日本語文の形態素解析が行われる。従来の翻訳シ
ステムにあっては日本語文の形態素解析は、たとえば、
何らかの方法で入力されたべた書きの漢字かな混9文に
対して行われていたために次のような欠点があった。
すなわち、日本語入力された文章が漢字かな混シ文のべ
た書きであるために、これを形態素解析するためのアル
ゴリズムが非常に複雑で大きなものになっていた。また
漢字かな混り文がべた書きであるために単語分割に曖昧
さが生じ、その結果複数の解析結果が生じて形態素解析
処理を複数回行わざるを得ながった。
目   的 本発明はこのような従来技術の欠点を解消し、形態素解
析処理を複数回行うことなく適確に形態素解析を行うこ
とができる日本語解析装置を提供することを目的とする
ものである。
構成 本発明の構成について以下、実施’I=lJに基づいて
説明する。本発明では、かな漢字変換処理において行う
日本語文の形態素解析の結果を保持することにより、次
の段階でちる機械翻訳等の構文解析にこれを利用できる
ようにしている。
第1図には本発明に係る日本語解析装置の一実施例の構
成が示されておシ、同図において入力手段としてのキー
が一ド1oは数字を示すテンキー、ひらがな等の文字を
示す文字キー、かな漢字変換処理の実行の有無を指示す
るための変換キー、無変換キーを含む機能キー等から構
成されユーザはキーゲート10のキー操作にょシ構文解
析1−べき日本語文データ及びかな漢字変換処理のため
の指令を制御装置12に入力する。
制御装置12はキーボードlOよ多入力された日本語文
データ及び指令を判定装置14に送出する一方、形態素
解析装置16による日本語文データの形態素解析結果を
判定装置14を介して受取り、表示装置22に転送する
また判定装置14は制御装置12よシキーボード10か
ら入力された日本語文データを受は取り、該日本語文デ
ータを形態素解析装置16に転送し且つキーゲート10
における変換キー、無変換キーが操作されたか否かを記
憶すると共に、形態素解析装置16による日本語文デー
タの形態素解析結果を入力文パンツアメモリ20に転送
する。
更に単語辞書ROM l 8には、単語を示す文字  
 ′列のデータに対応してその意味等の情報が分類、記
憶されておシ、形態素解析装置16は制御装置12、判
定装置14を介してキーゲート10よ多入力された日本
語文データを取り込み、単語辞書ROM 1 gに記憶
されている。辞書情報を参照して日本語文データのかな
漢字変換処理を実行する。ここで判定装置14にキーゲ
ートNoにおける変換キーが操作されたことが記憶され
ている場合には形態素解析を含むかな漢字変換処理が実
行されるが、無変換キーが操作されたことが記憶されて
いる場合には形態素解析のみが行われる。なお、本明細
書において「かな漢字変換処理」とは形態素解析とかな
漢字変換の両方の処理を含むものとする。
入力文バッファメモリ2oはキーゲート1゜によ多入力
された日本語文データの形態素解析結果を判定装置14
を介して受は取)、記憶・蓄積する。
次に上記構成からなる日本語解析装置の具体的動作を以
下に説明する。まずユーザがキー号?−ド10のキー操
作によりたとえば「あなたは」という文字列を制御装置
12に入力し、且つ無変換キーを操作したものとする。
この結果、文字列データは制御装置12よシ判定装置1
4を介して形態素解析装置1Gに転送され且つ判定装置
14は無変換キーが操作されたことを記憶する。
一方、形態素解析装置16は前記文字列データを単語辞
W ROM l 8に記憶されている辞書情報を参照し
ながら形態素解析処理を行い、判定装置14に記憶され
ているかな漢字変換の実行の有無を示すデータを参照し
、この場合には無変換キーが操作されている旨、すなわ
ちかな漢字変換を実行しない旨のデータが判定装置14
に記憶されているので、形態素解析結果のみを判定装置
14に出力する。ここで形態素解析結果とは、単語分割
された文字列と分割された各単語の単語辞書ROM 1
8において登録されているアドレスを示すデータを意味
するものとする。
判定装置14は形態素解析装置16から受けた形態素解
析結果を入力文パンツアメモリ20に転送し、該入力文
バッファメモリ20には第2図囚に示すように単語分割
された文字列とこれに対応して単語辞書ROM 18に
登録されている分割された単語の辞書アドレスとが記憶
される。
次ニユーザがキーボード10のキー操作により「あなた
は」という文字列を制御装置12に入力し、次に変換キ
ーを操作したものとする。
この結果、文字列データは制御装置12よシ判定装置1
4を介して形態素解析装置16に転送され、判定装置1
4は変換キーが操作されたことを記憶する。
一方、形態素解析装置16は前記文字列データを単語辞
書ROM l 8に記憶されている辞書情報を参照しな
がら形態素解析処理を行い、且つ判定装置14に記憶さ
れているかな漢字変換の実行の有無を示すデータ(この
場合には変換キーが操作されている、すなわちかな漢字
変換を実行する旨を指示するデータ)を参照し、かな漢
字変換を行う。そして、かな漢字変換された形態素解析
結果、すなわち「貴方へは」というように単語分割され
た文字列とこの文字列の各単語が登録されている単語辞
書ROM l 8におけ  −る辞書アドレスを示すデ
ータが形態素解析装置16よシ判定装置14に送出され
る。
判定装置14は形態素解析された文字列データを制御装
置12を介して表示装置22に中力する一方、その形態
素解析された文字列データがユーザに確認された時(レ
リえはユーザによりキーボード10のキー操作により次
の文字列データが入力される等の処理がなされた時)に
、入力文バッファメモリ20に第2図(B)に示すよう
な単語分割され且つかな漢字変換された文字列とこの文
字列の辞書アドレスとを示すデータが転送され、入力文
バッファメモリ20にこれらのデータが記憶・蓄積され
る。
以上に説明したように本実施列によれば従来のように形
態素解析を複数回行うことなく適確に形B索解析を行う
ことができる。        −次に本発明に係る日
本語解析装置の他の実施例の構成を第3図に示す。本実
施例が第1図に示した実施例と構成上、異なる点は、格
助詞相当語のように本質的には単語分割されてはいけな
い語について、形態素解析されて単語分割された後にこ
れらの分割された単語を結合して一つの単語として形成
するように処理する文字列結合装置30を付加したこと
であシ、他の構成は基本的に変るところがないので第1
図゛に示した実施例と同一の機能ブロックには同一の参
照符号を付し、重複する説明は省略する。
まずユーザがキーボードlOのキー操作にょシたとえ″
ば文字列データ「あなたに」を制御装置12に入力し、
次に無変換キーを操作したものとする。この場合には第
1図に示した実施列と同様に形態素解析処理がなされ、
文字列「あなた」とこの文字列の単語辞書ROM 18
における辞書アドレスのデータが入力文バッフアメ°モ
IJ 20に記憶される。そして表示装置22には文字
列「あなたに」が表示される。ただこの処理が実行され
た際に「あなた」の付属語「に」のデータが文字列結合
装置30の内部スタックに記憶される。
次にユーザからキー?−ド1Gのキー操作により文字列
「かんする」が入力されて変換キーが操作されると、文
字列「かんする」は制御装置12、判定装置14を介し
て文字列結合装置30に転送される。文字列結合装置3
0では、文字列データ「に」と「かんする」が結合され
文字列「にかんする」が形成される。この文字列「にか
んする」は文字列結合装置30よシ形態素解析装置16
に送られ、形態素解析及びかな漢字変換がなされる。こ
こで文字列「に関する」は単語辞書ROM l 8に格
助詞相当語として登録されているものとする。
したがってかな漢字変換処理の結果、形態素解析装置1
6よシ文字列「に関する」及びこの格助詞相当語の辞書
アドレスを示すデータが文字列結合装置30に送出され
る。
文字列結合装置30では文字列「に関する」を内部スタ
ックの文字「に」を示すデータをインデックスとして検
索し、「にム関する」というように単語分割する(「ム
」は区切シ記号である。)、そしてこの文字列「にム関
する」を示すデータが文字列結合装置30よ)判定装置
14に送出され、判定装置14は文字列「にム関する」
のデータから「関する」の部分のデータを抽出し、この
文字列「関する」を示すデータを制御装置12を介して
表示装置22に送出する。
次に第1図の実施例の場合と同様に、ユーザがキーボー
ド10のキー操作により、形態素解析された文字列デー
タを確認した旨の指示を制御装置12に与えると、判定
装置14は制御装置12の制御指令に基づいて文字列「
にム関する」を示すデータを入力文バッファメモIJ 
20に、第4図に示すように、以前に入力された文字列
「あなた」の付属語の部分に対応させて文字列「に関す
る」を記憶し、この文字列「に関する」の記憶領域に対
応する記憶領域に文字列「に関する」の辞書アドレスを
記憶する。
以上に説明したように本実施例によれば、第1図の実施
例の効果に加えて、格助詞相当語等のように入力時には
単語分割されるが、本質的には分割されるべきではない
語についても形態素解析処理を行うことができるという
効果が発揮される。
効果 本発明によれば形態素解析処理を複数回実行することな
く、適確に形態素解析を行うことができる。
【図面の簡単な説明】
第1図は本発明に係る日本語解析装置の一実施例の構成
を示すブロック図、 第2図は入力文パンツアメモリの記憶内容の一例を示す
説明図、 第3図は本発明に係る日本語解析装置の他の実施例の構
成を示すブロック図、 第4図は入力文バッファメモリの記憶内容の他の91J
を示す説明図である。 主要部分の符号の説明 lO・・・キーボード 12・・・制御装置 14・・・判定装置 16・・・形態素解析装置 18・・・単語辞書ROM 20・・・入力文パンツアメモリ 22・・・表示装置 30・・・文字列結合装置 第1図 第2図 (A)       (B)

Claims (1)

  1. 【特許請求の範囲】 構文解析すべき日本語文データを入力するための入力手
    段と、 単語を示す文字列のデータに対応してその意味等の情報
    が分類・記憶されている第1の記憶手段と、 前記入力手段により入力された日本語文データの形態素
    解析結果を記憶・蓄積する第2の記憶手段と、 前記入力手段から入力された日本語文データを取り込み
    、前記第1の記憶手段に記憶されている辞書情報を参照
    して日本語文データの形態素解析およびかな漢字変換処
    理を実行する形態素解析手段と、 前記入力手段から入力された日本語文データを形態素解
    析手段に転送し、且つ該日本語文データの形態素解析結
    果を前記第2の記憶手段に転送すると共に、表示装置等
    の出力手段に出力する制御手段とを有することを特徴と
    する日本語解析装置。
JP59183700A 1984-09-04 1984-09-04 日本語解析装置 Granted JPS6162175A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59183700A JPS6162175A (ja) 1984-09-04 1984-09-04 日本語解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59183700A JPS6162175A (ja) 1984-09-04 1984-09-04 日本語解析装置

Publications (2)

Publication Number Publication Date
JPS6162175A true JPS6162175A (ja) 1986-03-31
JPH0580021B2 JPH0580021B2 (ja) 1993-11-05

Family

ID=16140413

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59183700A Granted JPS6162175A (ja) 1984-09-04 1984-09-04 日本語解析装置

Country Status (1)

Country Link
JP (1) JPS6162175A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01118961A (ja) * 1987-10-30 1989-05-11 Brother Ind Ltd 翻訳装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01118961A (ja) * 1987-10-30 1989-05-11 Brother Ind Ltd 翻訳装置

Also Published As

Publication number Publication date
JPH0580021B2 (ja) 1993-11-05

Similar Documents

Publication Publication Date Title
JPS6162175A (ja) 日本語解析装置
JPS628259A (ja) かな漢字変換方式
JPS6154559A (ja) 日本語処理装置
JPS60195664A (ja) 仮名漢字変換方式
JPH01259448A (ja) 漢字入力方式
JPS62163174A (ja) 機械翻訳装置
JPS61233862A (ja) かな漢字変換装置
JPH0380363A (ja) 文書処理装置
JPH04372047A (ja) 仮名漢字変換装置
JPH0944496A (ja) 自然語解析方法及び装置
JPS6327966A (ja) ワ−ドプロセツサにおけるカタカナ変換方式
JPH06223055A (ja) 文章入力装置
JPS63115264A (ja) 文書処理装置
JPS62237565A (ja) 文章入力装置
JPS6172360A (ja) べた書きかな漢字変換方式
JPS61134866A (ja) 日本語解析装置
JPH01111267A (ja) 文字変換装置
JPH0693237B2 (ja) 日本語文作成装置
JPH01119858A (ja) 日本語格納方式
JPH0468466A (ja) かな漢字変換装置
JPH0394367A (ja) 日本語入力方式
JPS62264358A (ja) 日本語文入力方式
JPH06131337A (ja) 文字入力装置
JPH02105254A (ja) かな漢字変換装置および方法
JPH05342197A (ja) 日本語ワードプロセッサ