JPH0414136A - 自然言語変換装置 - Google Patents

自然言語変換装置

Info

Publication number
JPH0414136A
JPH0414136A JP2117151A JP11715190A JPH0414136A JP H0414136 A JPH0414136 A JP H0414136A JP 2117151 A JP2117151 A JP 2117151A JP 11715190 A JP11715190 A JP 11715190A JP H0414136 A JPH0414136 A JP H0414136A
Authority
JP
Japan
Prior art keywords
character strings
heading
sentence
natural language
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2117151A
Other languages
English (en)
Inventor
Satoshi Shirai
白井 諭
Akio Yokoo
昭男 横尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2117151A priority Critical patent/JPH0414136A/ja
Publication of JPH0414136A publication Critical patent/JPH0414136A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Devices For Executing Special Programs (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は、新聞や雑誌などの記事の見出しく断片的な
自然言語情報)からその記事を示す自然言語の文章を自
動的に生成する自然言語変換装置に関するものである。
「従来の技術」 例えばデータベース・サービスのために、新聞や雑誌の
各記事について人間がその文章を読み、人手により要約
を作っている。この要約の作成を自動的に行うことがで
きれば頗る便利である。新聞や雑誌の記事の見出しはそ
の記事の内容を示しているから、この見出しからその記
事の内容を自動的に作成することが考えられる。また、
自動翻訳装置などの言語処理装置において、記事の見出
しの翻訳などにその見出しを自然言語の文章とするとよ
い翻訳をすることができる場合がある。
従来において、例えば交通機関の座席予約装置で、予め
決められたキーワードを入力すると、そのキーワードを
含む、予め決められた文章を出力するものがある。つま
り、キーワードをいれるべき部分を空けた雛形となる文
を用意し、その部分にキーワードを入力していくことに
より文章を完成させるような文章生成装置が知られてい
る。
「発明が解決しようとする課題」 この従来の装置では、見出しのように複数のキーワード
とその相互関係を明示するための機能語とが組み合わさ
ったようなものは直接入力することができなかった。つ
まり、従来の技術を用いて記事の見出しからその記事を
示す自然言語の文章を生成することはできない。
「課題を解決するための手段」 二の発明による自然言語変換装置は、記事の見出しを1
記事分読み込む見出し入力装置と、入力された新聞や難
詰の見出しに含まれる特定条件の文字列とその他の文字
列とを抽出する見出し解析処理部と、抽出された特定条
件の文字列と、文字列の順序とに応じてこれら抽出され
た文字列と適切な文字列とを組み合わせて文章を生成す
る文章生成処理部と、その生成された文章を出力する文
章出力装置とを有し、記事の見出しを自動的に自然言語
の文章に変換するように構成されている。
文章の生成は、例えば抽出された特定条件の文字列およ
び文字列の順序、つまり文字列の形式に関する条件と、
その条件に応じた文章の生成のパターンとから成るルー
ルテーブルを用いて文章生成処理部で文章を生成する。
このようにして見出しに含まれるキーワード以外の情報
を生成文に反映させることが可能となる。また、ルール
テーブルによる文章生成のため、対称とする見出しのパ
ターンの範囲を容易に拡張できる。
さらに、入力された見出しを単語解析処理部で解析して
、見出し解析処理部へ供給することにより、見出しから
キーワードと機能語とを正しく認識することができ、複
雑な見出しであっても適切な文章に変換することができ
る。
「実施例」 以下、この発明の一実施例について図面を参照して説明
する。
第1図はこの発明を適用した自然言語変換装置全体の基
本プロンク図を示したものである。第2図(a)に示す
二つのまとまり(ブロック)から成る記事見出しを、第
2図い)に示すような自然言語文に自動変換する場合に
ついて、この発明の実施例の動作を説明する。
第2図(a)に示した二つのまとまりから成る記事見出
しを見出し入力装置1で人力し、自然言語変換制御装置
2へ転送する。
自然言語変換制御装置2では、この例では単語解析処理
部3が組み込まれている場合で入力された見出しは、単
語解析処理部3で第3図に示すように単語属性が付与さ
れた単語に分割されて見出し解析処理部4へ渡される。
見出し解析処理部4は単語分割された見出しから特定の
条件の文字列と、その他の文字列とを抽出する。この例
では、この文字列の抽出にルールテーブル7を用いた場
合で、ルールテーブル7は例えば第4図(a)に示すよ
うに、見出しの形式に関する条件と、文章の生成パター
ンとを示すテーブルであって、見出しの形式に関する条
件としては、見出しのまとまり(ブロック)ごとに、そ
の構成文字列の順と、その各文字列が特定の条件のもの
か、そうでないものかを示している。第4図(a)にお
いて「任意の文字列(−XI)Jとは、−個以上の単語
を合成してできた文字列をXiと命名する文字列抽出指
定を示し、「文字列: “などパ」は−個以上の単語を
合成してできた文字列゛など°゛となるという条件指定
を示し、「(す変名詞>(−X2)Jはす変名詞という
単語属性を持つ単語を表す条件指定とその文字列をX2
と命名する文字列抽出指定の並記を示す。
見出し解析処理部4は入力された見出しがルールテーブ
ルの見出しの形式に関する条件と合うものを捜す。その
捜し方としては、見出しのまとまり(ブロック)の数が
一致するか否か、見出しのまとまりごとに条件指定とし
て示された部分が出現順通りにすべて合うか否かを検査
し、両方を満たす場合に、そのルールが適用可能である
と判定し、文字列抽出指定に従って文字列を取り出す。
この例では、ルール11と入力された見出しとを比較す
ると、見出しのまとまりの数が2であり、その第1のま
とまりには特定条件の文字列「“など゛」と「(す変名
詞)」として[検針」を含み、その出現順も一致してお
り、また第2のまとまりには特定条件の文字列「(会社
名)」として「N××」と、特定条件文字列「“Jと、
「(地域名)」として「首都圏」と、特定条件文字列「
°“にも子会社°゛」とを含み、出現順も一致している
ので、適用可能なルールとしてルール11を選択すると
ともに、見出しから文字列をXlとして“ガス・水道”
をx2として“検針”をX3として“N×X”をXiと
して“首都圏”をそれぞれ抽出する。
文章生成処理部5は、見出し解析処理部4が選んだルー
ルに対するルールテーブル7の文章の生成パターンの指
定に従って、見出し解析処理部4が抽出した文字列と、
パターンに指定された文字列(適切な文字列)とをその
順に合成して文章を生成し、文章出力装置6から出力す
る。第2図(a)の見出しに対し、第2囲い)の自然言
語の文章が出力される。
自然言語変換制御装置2において単語解析処理部3を省
略することもできる。この場合は、入力された記事見出
しは直接、見出し解析処理部4へ渡される。この場合、
見出し解析処理部4が参照する。ルールテーブル7とし
ては例えば第4図(b)に示すルールテーブルを用いる
。このルールテーブルにおいて、「任意の文字列(−X
i)Jは見出しから一文字以上の文字列を抽出してXl
と命名する文字列抽出指定を示し、F文字列:°など”
」は見出しに“など”という文字列が含まれているとい
う条件指定を示し、「文字列: “検針/発売”(−X
2)Jは見出しに“検針パまたは“発売°。
という文字列が含まれているという条件指定と、その文
字列を×2と命名する文字列抽出指定の並記を示す。こ
の場合も第2図(a)の見出しが入力された場合に、ル
ール21と比較し、見出しのまとまりの数が2であるこ
と、特定条件の文字列「など」、「検針」 rNXX」
 r圏にも子会社」が含まれ、しかもその順に出現して
いることから、ルール21を通用し、文字列X1として
「ガス・水道」を、X2として「検針」を、X3として
「首部」をそれぞれ抽出し、ルール21に対する文章の
生成パターンに従って文章を生成出力する。しかしなが
ら、第4図(a)のルールテーブルとの比較から明らか
なようにルールテーブルを細かく記述しておく必要があ
る。
ルールテーブル7は自然言語変換装置2に対し、内部に
設けてもよいが、外部に外付けとする場合は複数のもの
を交換して使用したり、変更・修正を容易に行うことが
できる。
「発明の効果」 以上説明したように、この発明によると、記事の見出し
から文章を容易に生成することができ、また、この処理
はルールテーブルによって制御できるので、装置の製作
および保持を簡易化することができる。単語解析処理部
を設ける場合は、見出しからキーワードと機能語とを正
しく認識することができ、文字列の誤抽出発生頻度を低
く抑えることができ、複雑な見出しでも適切な文章に変
換でき、かつルールテーブルも比較的簡単になる。
【図面の簡単な説明】
第1図はこの発明を適用した自然言語変換装置の例を示
す基本ブロック図、第2図は記事見出しと生成される自
然言語文の例を示す図、第3図は単語解析処理部による
属性が付与された単語に分割された例を示す図、第4図
はルールテーブルの構成例を示す図である。 特許出願人  日本電信電話株式会社

Claims (3)

    【特許請求の範囲】
  1. (1)新聞や雑誌などの記事の見出しを1記事分(1〜
    数個)読み込む見出し入力装置と、 その読み込まれた見出しに含まれる特定条件の文字列と
    その他の文字列を抽出する見出し解析処理部と、 その抽出された特定条件の文字列と、文字列の順序とに
    応じてこれら抽出された文字列と、適切な文字列とを組
    み合わせて文章を生成する文章生成処理部と、 その生成した文章を出力する文章出力装置とを有し、 上記記事の見出しを自動的に自然言語の文章に変換する
    ことを特徴とする自然言語変換装置。
  2. (2)上記文章生成処理部における文章の生成に用いら
    れる、上記特定条件の文字列と文字列の順序とにより決
    まる、抽出された文字列の形式に関する条件と、その条
    件に応じた文章の生成パターンとから成るルールテーブ
    ルを具備することを特徴とする請求項1記載の自然言語
    変換装置。
  3. (3)上記読み込まれた見出しを単語解析し、その単語
    解析された見出しを上記見出し解析処理部へ供給する単
    語解析処理部を具備することを特徴とする請求項1記載
    の自然言語変換装置。
JP2117151A 1990-05-07 1990-05-07 自然言語変換装置 Pending JPH0414136A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2117151A JPH0414136A (ja) 1990-05-07 1990-05-07 自然言語変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2117151A JPH0414136A (ja) 1990-05-07 1990-05-07 自然言語変換装置

Publications (1)

Publication Number Publication Date
JPH0414136A true JPH0414136A (ja) 1992-01-20

Family

ID=14704723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2117151A Pending JPH0414136A (ja) 1990-05-07 1990-05-07 自然言語変換装置

Country Status (1)

Country Link
JP (1) JPH0414136A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2008018501A1 (ja) * 2006-08-10 2010-01-07 日本曹達株式会社 農薬組成物

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2008018501A1 (ja) * 2006-08-10 2010-01-07 日本曹達株式会社 農薬組成物
JP5009916B2 (ja) * 2006-08-10 2012-08-29 日本曹達株式会社 農薬組成物

Similar Documents

Publication Publication Date Title
US6167370A (en) Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
JP2002541590A5 (ja)
US20040064305A1 (en) System, method, and program product for question answering
US6249786B1 (en) Data-conversion method
KR20030094632A (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
Littell et al. Multi-source transformer for Kazakh-Russian-English neural machine translation
JPH06325073A (ja) 特殊共起処理方法およびその特殊共起処理方法を用いた装置
CN111291197A (zh) 基于新词发现算法的知识库构建***
JPH0414136A (ja) 自然言語変換装置
Rajitha et al. Sinhala and english document alignment using statistical machine translation
Dras Representing paraphrases using synchronous TAGs
JP2010152420A (ja) 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置
JP3919732B2 (ja) 機械翻訳装置及び機械翻訳プログラム
Samuel et al. Multi-Source Transformer for Kazakh-Russian-English Neural Machine Translation
Tsai et al. Auto-Generation of NVEF knowledge in Chinese
Utka Towards the Development of Language Analysis Tools for the Written Latgalian
JPH03164834A (ja) プログラミング言語間相互変換方式
Erjavec et al. jaSlo, a Japanese-Slovene learners’ dictionary: methods for dictionary enhancement
JPH05250413A (ja) テキストデータ検索装置
JPH04263364A (ja) 自然言語自動翻訳方法
JP2608384B2 (ja) 機械翻訳装置及びその方法
JPH0650503B2 (ja) 情報抽出装置
Segert et al. A Computer Program for Analysis of Words According to Their Meaning (Conceptual analysis of Latin equivalents for the comparative dictionary of Semitic languages)
JPH07192011A (ja) 多言語要約生成装置
JPS6386071A (ja) 自然言語翻訳方式