JP2638187B2 - 文章要約装置 - Google Patents

文章要約装置

Info

Publication number
JP2638187B2
JP2638187B2 JP1057016A JP5701689A JP2638187B2 JP 2638187 B2 JP2638187 B2 JP 2638187B2 JP 1057016 A JP1057016 A JP 1057016A JP 5701689 A JP5701689 A JP 5701689A JP 2638187 B2 JP2638187 B2 JP 2638187B2
Authority
JP
Japan
Prior art keywords
sentence
unit
selection
input
selection criterion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1057016A
Other languages
English (en)
Other versions
JPH02297157A (ja
Inventor
浩幸 新納
信一 重永
弘義 石橋
貴雄 福重
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP1057016A priority Critical patent/JP2638187B2/ja
Publication of JPH02297157A publication Critical patent/JPH02297157A/ja
Application granted granted Critical
Publication of JP2638187B2 publication Critical patent/JP2638187B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、文書検索などにおいて大量の文書から所望
の文章の内容を迅速に把握する手段としてその文章の要
約文を得る文章要約装置に関する。
従来の技術 従来の文章要約の方法としては、予め一定のフレーム
を用意しておきそのスロットを埋めていく方法、ストー
リ性のある文章を対象として物語文法という文章レベル
の規則を適用して物語の核になる文章を抽出する方法
や、文章を論理的に展開されるものに限定し、文間の連
接関係の解析を行い文章の構造を二分木で表現して個々
の連接関係に付与された重みから二分木を走査して要約
文を得る方法などがあった。
発明が解決しようとする課題 文書検索などに用いる文章要約では、個々の文章の内
容に拘わらず利用者の望む情報を迅速かつ容易に抽出す
ることが必須要件である。そのためには、文解析や要約
文生成の負担を軽くして高速な処理を実現すると同時
に、利用者の要求に応じて要約文の質及び量が制御でき
る必要がある。
従来のフレームによる方法では、広範囲の文章に対処
するには記述内容に応じたフレームを多数用意する必要
があり実用的ではなかった。また、物語文法や文間の連
接関係による方法は高度の意味解析を必要とするため文
解析の負担が大きく高速処理には向いていなかった。
本発明は上記課題を解決するためのもので、第1に文
解析や要約文生成の負担が少なく、かつ、個々の文章の
記述内容に依らず広範囲の文章に適用できる文章要約装
置を提供することを目的とする。
また、第2に利用者の要求に応じて要約文の質及び量
を制御できる文章要約装置を提供することを目的とする
ものである。
課題を解決するための手段 上記目的を達成するために、本願発明の文章要約装置
は第1に、文章と当該文章の書かれた意図・目的によっ
て分類された文章のタイプとを入力する入力部と、前記
入力部により入力された文章の各文の構文解析を行う文
解析部と、文章のタイプ毎に要約文を構成する文形態を
指定した文形態選択基準と、語彙情報,構文情報,連接
関係の情報の少なくとも一つを用いて記述された文の文
形態を判定する判定基準とからなる選択基準を格納した
選択基準データベースと、前記入力部から入力された文
章から要約を構成する文を選択する要約文選択部と、選
択された文を表示する要約文表示部とを備え、前記要約
文選択部が、前記文解析部の構文解析結果に対し、前記
入力部から入力された当該文章のタイプに対応する文形
態選択基準と、当該文形態選択基準により指定された文
形態を判定する判定基準とを参照し、該当する入力文が
要約を構成する文であるか否かを判定することにより要
約を構成する文を選択する構成となっている。
第2に、第1の手段において、選択基準データベース
に格納された選択基準が重要度を備え、要約文選択部が
前記重要度に基づき要約を構成する文を選択する構成と
なっている。
作用 上記構成における作用は次のようになる。種々の文章
においては、その文章の性質、即ち、文章の具体的な内
容とは無関係に、文章の書かれた意図、目的等によって
特別ないい回しや構文構造をもっている。したがって、
これらの特別な要素を予め選択基準として設定してお
き、入力文章を構文解析して得られた情報をこの選択基
準と照合比較して重要と思われるものを抽出選択するこ
とにより、個々の文章の具体的記述内容の如何にかかわ
らず広範囲の文章を高速に処理して要約文を得ることが
できる。
また、第2の手段において要約文選択部が選択基準の
重要度に基づき要約を達成する文を選択することによ
り、利用者の要求に合わせ要約文の質や量を調整するこ
とが可能である。
実 施 例 以下、本発明の実施例を図面により説明する。
第1図は、本発明の実施例の文書要約装置の概念図で
ある。要約される文章は英語の文章とする。入力装置1
より入力された文章は、文解析装置2によって構文意味
解析が施され入力文章の各文の内容を表す内部表現に変
換される。要約文選択装置3は、入力文章と共に利用者
により指定された文章の性質を示す文章のタイプを受け
取り、そのタイプに対応した選択基準を選択基準データ
ベース4から得る。
選択基準データベース4に格納される選択基準は次の
ようにして定められる。各種の文章、たとえば主張や問
題提起などの著者のある種の態度を表す文の形態には、
特別な語句やいい回しが使用されていたり、特別の構文
構造を持っていたりする。また、依頼では著者の要求を
述べた文構造を有している。これらは特別な語彙情報、
構文情報あるいは文間の連接関係の情報などとして表わ
すことが可能である。選択基準データベース4には、こ
れら、『主張』や『問題提起』、『依頼』等の文章の性
質、即ち、文章の具体的な内容とは無関係に、文章の書
かれた意図、目的等によって分類される文章のタイプご
と、どのような形態の文が重要であるか、また、その他
にどのような形態の文を選択すれば要約文が得られるか
が記述されている。それらの文の形態を判定する判定基
準となるものを、上記のような語彙情報や構文情報や文
間の連接関係の情報などの形で記述する。それらの文の
形態や判定情報には重要度を付加しておく。
選択基準に付加される重要度を用いて全ての文に対す
る重要度を算出することにより要約文の量や質に対応す
るレベル値に従って重要度がある値以上の文を選択する
ことが可能になり、必要に応じて要約文の量や質を制御
することができる。詳細は後述する。
要約文選択装置3では、選択基準データベース4から
の選択基準と文解析装置2から得られた入力文章の各文
の内部表現を照合することにより重要と思われる文を選
択する。要約文の質や量のレベルは既定値として与えら
れてあり、このレベル値も考慮して選択される文は決定
される。既定のレベルを変更することによって要約文の
質や量を制御し利用者の目的に合った要約文を得ること
ができる。
第2図は、第1図の選択基準データベース4の内部構
成である。文章の性質ごとにどのような形態の文を選択
するかを記述した文形態選択基準部7と、文の形態ごと
にその形態であることを判定するための情報を記述した
判定情報部8からなっている。データベースを文形態選
択基準部7と判定情報部8とに分けることにより、いく
つかの文章の性質に対して選択すべき文の形態が重複す
る場合には判定基準を共有し重複記述を避けることがで
きる。
第3図は、第2図の文形態選択基準部7の内部構成で
ある。文章の性質ごとに、その文章から要約を得るため
に必要と思われる主張や問題提起といった文の形態が記
述されている。それらの文の形態の各々にはこの文章の
性質を考慮した重要度a,b,c,………が与えられている。
同じ文の形態であっても要求している文章の性質によっ
て重要度の値は異なっている。
例えば、社説や論説などのように著者の主張を捕らえ
ることが重要であるような文章は文書のタイプとして
『主張』に、著者の読み手に対する要求を捕らえること
が重要な文章は文章のタイプとして『依頼』に分類され
る。
そして、文章のタイプ、即ち、文章の性質が『主張』
である場合には、主張や結論を述べている文や、その主
張や結論の元になった問題提起を述べている文や、その
主張や結論の根拠を述べている文などを選択することに
より要約文が得られると考える。その際、問題提起や根
拠を述べている文は主張や結論を述べている文の補足的
な役割になるので、重要度の値を低く設定する。
第4図は、第2図の判定情報部8の内部構成図であ
る。文の形態ごとにその文の形態であることを判定する
ための語彙的情報や構文的情報や文間の連接関係の情報
が記述されている。また、それら各々の情報にも重要度
s,t,………が付加されている。これらの各情報の少なく
とも1つが選択に用いられる。
例えば、主張を表す文の形態の場合、語彙的情報とし
ては、「should」や「must」などの主張を表す助動詞や
「We hope」などの言い回しの出現情報を用いる。構文
的情報としては、主張を表す強調構文などの情報を用い
る。文間の連接関係情報としては、語彙情報や構文的情
報により主張を表すと認められた文に、「and」や「bu
t」などの接続詞で繋がれた文などの情報を用いる。重
要度としては、例えば、強調構文である文は、「shoul
d」の出現する文よりも強い主張を表していると考え
て、重要度の値を高く設定する。連接関係情報の重要度
は要約文選択部2によりその連接関係となった文の重要
度を考慮して動的に値が付けられる。
第5図は、第1図の要約文選択装置3の処理の概念図
を表したものである。選択基準抽出部9では、選択基準
データベース4の文形態選択基準部7から入力文章の性
質に応じた要約文を得るための文の形態の情報と、選択
基準データベース4の判定情報部8からそれらの文の形
態を判定するための情報を取り出す。重要度算出部10で
はそれらの選択情報を文解析装置2から得られた各文の
内部表現に照合する。ある文が判定情報に合致した場合
には、その文の形態の重要度や判定情報に使用された情
報の重要度を考慮してその文の重要度を決定する。連接
関係情報に合致して選択された文の重要度は、その連接
関係となったもとの文の重要度から算出し、複数の判定
基準を満たす文には各々の判定基準に対応した重要度の
最大値より高い値を与える。どの判定情報にも合致しな
い文は重要度を最低値にし、入力文章の全ての文に対し
て何らかの重要度を与える。レベル別選択部11は、入力
装置1より要約文の質や量に対応するレベル値を知る。
このとき、レベル値の入力がない場合は、既定値が用い
られる。このレベル値に従って、重要度がある値以上の
文を選択する。レベル値に対応する重要度の範囲は選択
すべき要約文の質や量と重要度の値の分布から求められ
る。例えば、レベル値1が、量に対する要求「要約文を
全文の2分の1にする」に対応するものとすると、重要
度の値の分布から選択分の量が全文の2分の1になるよ
うな重要度の値を求め、その値以上の文を要約文として
選択する。なお、レベル値に対応する重要度の範囲を予
め設定しておくこともできるが、その場合には全部の文
が選択されたり、逆にまったく選択されなかったりする
ことが起こりうるので注意が必要である。
第1図にもどり、このようにして要約文選択装置3で
選択された要約文は出力装置6に供給され、入力文章上
に色分けとか太字化などのハイライト表示をして表示す
る。このハイライト表示によりいわゆる斜め読みをサポ
ートすることができる。
なお、利用者の要求に応じて要約文生成装置5では、
文解析装置2による文の内部表現から、選択された文に
対応する日本語訳を生成し出力装置6により同一画面上
に表示する。
発明の効果 以上のように、本発明は入力文章の各文の構文意味解
析の結果を所定の選択基準と照合して重要と思われる文
を選択する文章要約方法および装置で、選択基準は、文
章の性質が同じであれば個々の文章の記述内容に依らな
いので広範囲の文章に適用できる。また、浅い文解析で
も判定できる基準なので文解析の負担が少なく、要約文
も選択のみで生成できるための処理負担が少ない。した
がって高速の処理が可能である。
さらに、要約文を選択する際に入力文章全文に重要度
与えることにより選択文の追加や削除が高速に行なえ、
対話的に要約文の質や量の調整ができる。また、選択基
準の情報として語彙に関する情報だけを用いれば、構文
解析の処理を行なわず更に高速な処理も可能になる。
【図面の簡単な説明】
第1図は本発明の実施例の文章要約装置のブロック図、
第2図は選択基準データベースの内部構成図、第3図は
選択基準データベースの文形態選択基準部の内部構成
図、第4図は選択基準データベースの判定情報部の内部
構成図、第5図は要約文選択装置の処理の概念図であ
る。 1……入力装置、2……文解析装置、3……要約文選択
装置、4……選択基準データベース、5……要約文生成
装置、6……出力装置、7……文形態選択基準部、8…
…判定情報部、9……選択基準抽出部、10……重要度算
出部、11……レベル選択部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 福重 貴雄 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (56)参考文献 特開 昭61−100861(JP,A) 特開 昭63−298563(JP,A) 情報処理学会研究報告,Vol.87, No.68,P.63.6.1〜63.6. 8,1987 情報処理学会研究報告,Vol.87, No.84,P.85〜91,1987

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】文章と当該文章の書かれた意図・目的によ
    って分類された文章のタイプとを入力する入力部と、 前記入力部により入力された文章の各文の構文解析を行
    う文解析部と、 文章のタイプ毎に要約文を構成する文形態を指定した文
    形態選択基準と、語彙情報,構文情報,連接関係の情報
    の少なくとも一つを用いて記述された、文の文形態を判
    定する判定基準とからなる選択基準を格納した選択基準
    データベースと、 前記入力部から入力された文章から要約を構成する文を
    選択する要約文選択部と、 選択された文を表示する要約文表示部とを備え、 前記要約文選択部が、前記文解析部の構文解析結果に対
    し、前記入力部から入力された当該文章のタイプに対応
    する文形態選択基準と、当該文形態選択基準により指定
    された文形態を判定する判定基準とを参照し、該当する
    入力文が要約を構成する文であるか否かを判定すること
    により要約を構成する文を選択することを特徴とする文
    書要約装置。
  2. 【請求項2】選択基準データベースに格納された選択基
    準が重要度を備え、要約文選択部が前記重要度に基づき
    要約を構成する文を選択することを特徴とする請求項1
    記載の文書要約装置。
  3. 【請求項3】請求項1記載の構成に加え、要約文選択部
    により選択された文を他言語に翻訳する手段を備え、要
    約文表示部が翻訳された文を表示することを特徴とする
    請求項1記載の文書要約装置。
JP1057016A 1989-03-09 1989-03-09 文章要約装置 Expired - Lifetime JP2638187B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1057016A JP2638187B2 (ja) 1989-03-09 1989-03-09 文章要約装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1057016A JP2638187B2 (ja) 1989-03-09 1989-03-09 文章要約装置

Publications (2)

Publication Number Publication Date
JPH02297157A JPH02297157A (ja) 1990-12-07
JP2638187B2 true JP2638187B2 (ja) 1997-08-06

Family

ID=13043639

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1057016A Expired - Lifetime JP2638187B2 (ja) 1989-03-09 1989-03-09 文章要約装置

Country Status (1)

Country Link
JP (1) JP2638187B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3691844B2 (ja) * 1990-05-21 2005-09-07 株式会社東芝 文書処理方法
JP3358100B2 (ja) * 1995-04-17 2002-12-16 日本電信電話株式会社 日本語質問メッセージ解析方法及び装置
JP2002073644A (ja) * 2000-08-28 2002-03-12 Suuri Giken:Kk 重要文抽出処理装置、重要文抽出処理方法、および重要文抽出処理プログラムを格納したコンピュータ読み取り可能な記憶媒体
JP2009151798A (ja) * 2009-01-19 2009-07-09 Sony Corp 画像処理装置および方法
JP5979706B2 (ja) * 2012-03-27 2016-08-31 株式会社 ドキュメントハウス 製品マニュアル評価システム、その評価方法および品質評価サーバ
WO2020234929A1 (ja) * 2019-05-17 2020-11-26 株式会社アイエクセス 要約作成方法、要約作成システム、及び要約作成プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61100861A (ja) * 1984-10-23 1986-05-19 Toshiba Corp 文書編集装置
JP2766261B2 (ja) * 1987-05-29 1998-06-18 株式会社東芝 文章要約システム
JPS6450161A (en) * 1987-08-20 1989-02-27 Matsushita Electric Ind Co Ltd Document processor

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
情報処理学会研究報告,Vol.87,No.68,P.63.6.1〜63.6.8,1987
情報処理学会研究報告,Vol.87,No.84,P.85〜91,1987

Also Published As

Publication number Publication date
JPH02297157A (ja) 1990-12-07

Similar Documents

Publication Publication Date Title
JP2638187B2 (ja) 文章要約装置
JPH0344764A (ja) 機械翻訳装置
JPH0576067B2 (ja)
JPS61260366A (ja) 学習機能付機械翻訳システム
JPH0561902A (ja) 機械翻訳システム
JPH08190562A (ja) 機械翻訳装置
JP2715419B2 (ja) 翻訳装置
JPH0635964A (ja) 機械翻訳装置
JPH06236399A (ja) 翻訳機能付きワードプロセッサ
JPH0561906A (ja) 言語変換方式
JPH09185629A (ja) 機械翻訳方法
JPH09134358A (ja) 機械翻訳装置
JP3253311B2 (ja) 言語処理装置および言語処理方法
JPH03164975A (ja) 機械翻訳方法及び機械翻訳装置
JP3233800B2 (ja) 機械翻訳装置
JPH05225232A (ja) テキスト自動前編集装置
JP3033858B2 (ja) 同意文生成装置
JP2730308B2 (ja) 自然言語解析方式
JPH03225468A (ja) 機械翻訳装置
JPH04153878A (ja) 機械翻訳装置における前編集支援処理装置
JPH05216922A (ja) 辞書編集装置
JPH04130577A (ja) 自然言語処理装置
JPH04119467A (ja) 自然言語翻訳方法
JPH01321553A (ja) 文体変換機能付き日本語処理方法
JPH03212767A (ja) 自然言語生成方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080425

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090425

Year of fee payment: 12

EXPY Cancellation because of completion of term