JPS60193074A - 日本語解析装置 - Google Patents

日本語解析装置

Info

Publication number
JPS60193074A
JPS60193074A JP59047128A JP4712884A JPS60193074A JP S60193074 A JPS60193074 A JP S60193074A JP 59047128 A JP59047128 A JP 59047128A JP 4712884 A JP4712884 A JP 4712884A JP S60193074 A JPS60193074 A JP S60193074A
Authority
JP
Japan
Prior art keywords
keyword
japanese
word
sentence
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59047128A
Other languages
English (en)
Inventor
Toshiyuki Funabe
舟部 敏行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59047128A priority Critical patent/JPS60193074A/ja
Publication of JPS60193074A publication Critical patent/JPS60193074A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 失檄豆1 本発明は日本語解析装置、より具体的には、翻訳機械、
ワードプロセッサ、オフコン、パソコンなどの処理シス
テムに適用される日本語解析装置に関する。
1x且遣 従来、たとえば機械翻訳などにおける日本語解析では、
動詞を中心とした解析(格文法)が主であった。この解
析方法では、日本語に固有の言いまわしや慣用語句が消
えてしまうか、あるいは解析後にこれらを処理するかし
かなかった。したがって、処理速度が遅くなり、しかも
曖昧さが多かった。
旦−一の 本発明はこのような従来技術の欠点を解消し、日本語に
固有の言いまわしを正しく解析でき、しかも処理速度が
速く曖昧さの少ない日本語解析装置を提供することを目
的とする。
l−遣 本発明の構成について以下、実施例に基づし1て説明す
る。
第1図を参照すると、本発明による日本語解析装置の実
施例は、印字出力装置としてのプリンタ10、文字を可
視表示するCRTなどのディスプレイ12、およびカナ
などにより日本語文を人力できるキーボード14を有し
、これらが制御装置20に接続されている。
制御装置20は処理システムで実現され、ディスプレイ
12の表示画面制御を含む本日本語解析装置各部の制御
を行なう。制御装置20にはシステムメモリが設けられ
ている。システムメモリは、本日本語解析装置による処
理結果を一時蓄積したり、他のプログラムやデータの記
憶領域として使用される。
制御装置20で制御され、本日本語解析装置本来の解析
動作を実行するのが、形態素解析装置24、キーワード
解析装置26および構文解析装置30である。これらの
装置24.28および30は、制御装置20の処理シス
テムに含まれてもよく、またはこれと別個の処理システ
ムで実現してもよい。
形態素解析装置24には、単語相互間の接続を規定する
接続表や単語辞書が記憶されている磁気ディスクなどの
ファイル記憶装置40が接続されている。単語辞書40
は、第2図に示すように語の表記、属性およびキーワー
ドの可否などが単語ごとに記述されている。属性は、語
の品詞、意味、その他の情報を示す。キーワードの可否
の欄のrlJはキーワードであることを示し、「0」は
キニワードでないことを示す。キーワードとしては、述
語、慣用句、呼応関係にある語などが有利に利用される
形1ル素解析装置24は、たとえばカナ漢字混在文の形
で入力された日本語入力文を、ファイル40を索引して
単語単位に分解し、各部の品詞を分析する装置である。
キーワード解析装置26には、キーワード辞書を蓄積し
たファイル記憶装置44が接続され、後者は、第3図に
示すような蓄積データフォーマットでキーワードに対応
してデータが蓄積されている。前条件はキーワードの前
方にある語句の条件を示し、後条件はキーワードの後方
にある語句の条ヂ1;を示す。キーワード解析装F!2
Bは、このキーワード辞書44を索引して入力文のキー
ワードを解析する装置である。本装置では、入力日本語
文の構文解析において文の骨格となる語(キーワード)
を中心に解析を行なう。
構文解析装置30には、解析文法を記述する文法辞書が
記憶されているファイル記憶装置42が接続されている
。構文解析装置30は、この構文辞書42を参照して入
力文の文法構造を解析する装置である。
これらの袋間により解析された結果のデータは、制御装
置20内のメモリに一時的に蓄積され、制御装置20の
制御により適宜ディスプレイ12に表示され、また出力
装置10から出力される。
本装置の動作を説明する。キーボード14から、たとえ
ば[彼はめったにいたずらする子供を怒らない。」なる
文を入力したとする。この入力文は制御装置20により
保持され、またディスプレイ12に可視表示される。こ
れとともに形IE素解析装置24は、この入力文を形態
素解析する。これは単語辞書40を使用し、従来と同様
の方法で行なってよい。その解析結果は第4図に示すよ
うになる。
第4図において、Nは名詞、WAは提示助詞、Fは副詞
、■は動詞、RTは連形形、fyは連用形、SYは終止
形、−は否定を示す。
この結果はキーワード解析装置26に転送され、キーワ
ード解析装置2Bは、この結果のキーワード可否をチェ
ックして「l」の立っている語「めったに」を抽出する
。そこで、この「めったに」を使用してキーワード辞書
44を検索する。この語[めったにJを規定するキーワ
ード辞書44の部分は、第3A図に示すようになってい
る。この辞書記述は次のことを意味する。すなわち、「
めったに」は前条件として何がきてもよく、後条件とし
ては動詞の否定がくることを規定している。なお評価値
は結果の結果が複数得られた場合に使用される。
このようにして索出されたキーワード辞書情報を基に、
キーワード゛解析装置26は「めったに」以降の語を調
べる。この例では語句「怒らない」がこの条件を満足し
ているので、これによって「めったに」と「怒らないJ
の係り受け関係を確定させる。
この例では、他の語句でキーワード可否が「1」になっ
ているものがないので、この持点で以上のキーワード解
析結果がキーワード解析装優26から構文解析装置30
に転送される。構文解析装430は残りの語について構
文解析を実行する。
ところで単語辞書40およびキーワード辞書44は、前
述の第2図および第3図にそれぞれ示すデータ構成をと
らず、それぞれ第5図および第6図に示すデータ構成を
とってもよい。第5図のアドレスの欄は、キーワード辞
書44へのアドレスを規定し、その欄の「−」はその語
がキーワードでないことを示している。
このように構成した場合の動作は、前述とほぼ同じであ
るが、異なる点は、形態素解析装置24でこのような単
語辞書40を参照しで形態素を解析した結果にすでにキ
ーワード辞書44へのアドレスが含まれていることであ
る。したがって、文字情報でキーワード辞;l’44が
検索されるのではなく、キーワード辞書44のアドレス
で直接その項目の記憶位置にアクセスすることができる
このように本発明によれば、入力日本語文の構文解析に
おいて文の骨格となる語(キーワード)を中心に解析を
行なっている。キーワードとしては、述語、慣用句、呼
応関係にある語などが利用され、これらがキーワード辞
書として格納されている。
幼−一工 本発明によれば、日本語に固有の言いまわしを正しく解
析できる。しかも文の骨格をまず確定させるので処理速
度が速く、曖昧さも減少する。
【図面の簡単な説明】
第1図は本発明による日本語解析装置の実施例を示すブ
ロック図、 第2図、第3図、第3A図、第4図、第5図および第6
図は、第1図に示す実施例の動作を説明するための説明
図である。 どF ) 台 12、、、ディスプレイ 14、、、キーボード 20、、、制御装置 24、、、形1i:粛解析装置 2B、、、キーワード解析装置 30、、、構文解析装置 40、、、単語辞書 42、、、文法辞書 44、、、キーワード辞書 特j出願人 株式会社リコー 図面の浄書(内容に変更なし) 第1図 0 第2図 第3図 第3A図 第4図 第5図 第6図 手続補正書 1、事件の表示 昭和59年特許願第47128号 2、発明の名称 11木、:/i解析装置 3、補正をする渚 事件との関係 特許出願人 住 所 東京都大田区中馬込1丁目3番6号名 称 (
f174) 株式会社 リ コ −4、代理人 住所〒105 東京都港区虎ノ門l−13−4 (1)図面 1通 6、補正の内容 出願時提出した図面を別紙のとおり正式図面(浄書内容
に変更なし)と差し替える。 7、添付書類の目録 (1)正式図面 1通

Claims (1)

  1. 【特許請求の範囲】 日本語の入力文を入力する入力手段と、前記入力文に含
    まれる形態素を解析する形態素解析手段と、 日本語文においてキーワードになり得る語か否かを規定
    する情報が含まれた単語辞書を有し、該単語辞書を索引
    して前記形態素に解析された入力文のキーワードを解析
    するキーワード解析手段と、 日本語の構文を解析する構文解析文法を有し、前記キー
    ワード解析された入力文の構文を該文法によって解析す
    る構文解析手段と、 前記入力手段、形態素解析手段、キーワード解析手段、
    および構文解析手段を制御して日本語の解析を行なわせ
    る制御手段とを含むことを特徴とする日本語解析装置。
JP59047128A 1984-03-14 1984-03-14 日本語解析装置 Pending JPS60193074A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59047128A JPS60193074A (ja) 1984-03-14 1984-03-14 日本語解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59047128A JPS60193074A (ja) 1984-03-14 1984-03-14 日本語解析装置

Publications (1)

Publication Number Publication Date
JPS60193074A true JPS60193074A (ja) 1985-10-01

Family

ID=12766502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59047128A Pending JPS60193074A (ja) 1984-03-14 1984-03-14 日本語解析装置

Country Status (1)

Country Link
JP (1) JPS60193074A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62209659A (ja) * 1986-03-10 1987-09-14 Sharp Corp 日本語文章校正装置
JPS62232078A (ja) * 1986-04-01 1987-10-12 Nec Corp 文脈推定方式
JPS6385973A (ja) * 1986-09-30 1988-04-16 Nippon Telegr & Teleph Corp <Ntt> 自然言語自動翻訳方式
WO1992003796A1 (fr) * 1990-08-20 1992-03-05 Kabushiki Kaisha Csk Systeme d'analyse syntaxique du japonais

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62209659A (ja) * 1986-03-10 1987-09-14 Sharp Corp 日本語文章校正装置
JPH061468B2 (ja) * 1986-03-10 1994-01-05 シャープ株式会社 日本語文章校正装置
JPS62232078A (ja) * 1986-04-01 1987-10-12 Nec Corp 文脈推定方式
JPS6385973A (ja) * 1986-09-30 1988-04-16 Nippon Telegr & Teleph Corp <Ntt> 自然言語自動翻訳方式
WO1992003796A1 (fr) * 1990-08-20 1992-03-05 Kabushiki Kaisha Csk Systeme d'analyse syntaxique du japonais

Similar Documents

Publication Publication Date Title
Frank Modern English: A practical reference guide.
JP3220560B2 (ja) 機械翻訳装置
Trujillo Translation engines: techniques for machine translation
JPS63223962A (ja) 翻訳装置
JPH0293866A (ja) 要約生成方法および要約生成装置
EP0357344B1 (en) Computer assisted language translating machine
JPS60193074A (ja) 日本語解析装置
JPH0344343B2 (ja)
JP3136973B2 (ja) 言語解析システムおよび方法
Petrovčič et al. The New Chinese Corpus of Literary Texts Litchi
JP2915225B2 (ja) 文書作成装置
JP3233800B2 (ja) 機械翻訳装置
JPH0746359B2 (ja) 日本語文章処理方式
JP2839419B2 (ja) イディオム登録機能を持つ機械翻訳装置
JP2819766B2 (ja) 外国語電子辞書検索方式
JP2752025B2 (ja) 機械翻訳装置
JP3132563B2 (ja) 文書作成支援装置
JPH05216922A (ja) 辞書編集装置
Gdaniec et al. Constituent shifts in the logos English-German system
JPH01207868A (ja) 日本語文章処理方式
Garvin et al. 10. The Participle in Modern Hebrew—A Study in Automatic Ambiguity Resolution
JPH0340067A (ja) 文章検索方式
JP2000207397A (ja) 言語解析システムおよび方法
JPH0744566A (ja) 抄録作成装置
JPH0398157A (ja) 不適切表現チェック方式