JPH0944497A - タイトル文作成装置 - Google Patents

タイトル文作成装置

Info

Publication number
JPH0944497A
JPH0944497A JP7193426A JP19342695A JPH0944497A JP H0944497 A JPH0944497 A JP H0944497A JP 7193426 A JP7193426 A JP 7193426A JP 19342695 A JP19342695 A JP 19342695A JP H0944497 A JPH0944497 A JP H0944497A
Authority
JP
Japan
Prior art keywords
sentence
adopted
title
word
predicate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7193426A
Other languages
English (en)
Inventor
Tamotsu Iwabuchi
保 岩渕
Koichiro Tsuda
好一郎 津田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maruzen KK
Original Assignee
Maruzen KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maruzen KK filed Critical Maruzen KK
Priority to JP7193426A priority Critical patent/JPH0944497A/ja
Publication of JPH0944497A publication Critical patent/JPH0944497A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 新聞記事データベースのタイトル文作成を省
力化する。 【解決手段】 新聞記事中からタイトル文作成のための
候補文を抽出し、その候補文から、タイトル文に必要な
主語、述語を抽出し、タイトル文に必要な字数に圧縮し
てタイトル文を作成する。主語、述語の位置が離れてい
る場合には、その間で採用可能な語句も抽出し、タイト
ル文に必要な字数に圧縮してタイトル文を作成する。 【効果】 自動的にデータベース用のタイトル文が作成
できる。またデータベースへの登録が早くなり、利用者
の便を図ることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、新聞記事データベ
ースシステムに提供されるタイトル文を記事本文から自
動作成する装置に関する。
【0002】
【従来の技術】このような新聞記事データベースでは、
タイトル文の字数には制限があり(40字以内)、その
字数以内で、記事本文中よりタイトル文に必要な情報を
抽出して作成する必要がある。すなわち、誰が、誰と、
どこで、なにを、どうしたという情報があるタイトル文
を作成する必要がある。
【0003】従来は、これらのデータベースシステム用
のタイトル文の作成は、専門家による人手作業で行って
いた。専門家は、記事に付されている見出しを参考にし
て本文を参照しながらタイトル文を作成している。
【0004】
【発明が解決しようとする課題】新聞記事の見出しは、
往々にして読者に本文を読ませることを使命にしている
ので、本文に忠実な内容ではない。また、人手を介する
場合はタイトル文を作成する専門家の個性がタイトル文
に反映する。データベースシステムでは、タイトル文
は、利用者にとって必要情報の判定をするための最も重
要な項目である。したがって、データベース情報として
のタイトル文は、本文に忠実で、しかも標準化(一定の
品質をもつ)文であることが要請される。
【0005】また、新聞記事データベースは、毎日発生
する多量の記事を、より短い日時でデータベース化しな
いと本来の使命を失ってしまう。このため、一定時間以
内にタイトル文を作成してデータベースへ登録する必要
がある。このような作業を人手で行うには、データベー
ス作成のために専門家を多数養成しなければならない
し、また、作業者は毎日時間に追いかけられながら、同
一の作業をしなくてはならないという苦痛を伴う。
【0006】本発明は、このような課題を解決するもの
で、タイトル文を記事から自動的に作成し、速やかにデ
ータベースに提供して新聞記事としての速報性を維持す
ることを目的とする。また、タイトル文を自動的に作成
することで、省力化を図り、人手によるタイトル文作成
にともなうばらつきを防止することを目的とする。
【0007】
【課題を解決するための手段】本発明は、原記事の本文
の先頭からタイトル文作成に適合する候補原文を文単位
で抽出する候補文抽出手段と、抽出した候補原文からタ
イトル文に必要な主語を表す語句および述語を表す語句
を発見して抽出する主語および述語抽出手段と、抽出し
た語句でタイトル文として適合するか否かを判断する判
定手段と、この判定手段でタイトル文として適合すると
判断された文をタイトル文に必要な字数に圧縮する圧縮
手段とを含み、前記判定手段は、抽出した主語および述
語との間にタイトル文として採用可能な語句があるか否
かを判断する手段を含むことを特徴とする。
【0008】なお、前記判定手段で主語および述語の間
にタイトル文として採用可能な語句があると判断された
場合に、主語および述語との間に存在する文の目的語ま
たは補語を示す第一のWHAT採用語句があるか否かを
検索する第一のWHAT発見手段を備え、前記判定手段
は、この第一のWHAT発見手段で発見した第一のWH
AT採用語句と主語との間にタイトル文として採用可能
な語句があるか否かを判断する手段を含むことが好まし
い。
【0009】また、前記判定手段で第一のWHAT採用
語句と主語との間にタイトル文として採用可能な語句が
あると判断された場合に、主語と第一のWHAT採用語
句との間に文の目的語または補語を表す第二のWHAT
採用語句があるか否かを検索する第二のWHAT発見手
段を含むことが好ましい。
【0010】主語および述語発見手段は、候補原文中の
主語を表す語の後につく語彙の主語採用詞を発見して主
語を抽出し、候補原文中の述語を表す語の前につく語彙
の述語採用詞を発見して述語を抽出する手段を含むこと
が好ましい。
【0011】主語および述語発見手段の前段に、採用し
た候補原文中からタイトル文に不要な語句または記号を
削除する前処理手段を含むことが好ましい。
【0012】まず、ここで、本明細書で使用する語句に
ついて説明する。
【0013】まず、本明細書で、文とは、文頭から句点
(。)で区切られて完結する一つのまとまった意味を終
わりまで表した一続きの文字列をいう。また、採用可能
語句(主語としてのWHO採用語句、述語採用語句、第
一WHAT採用語句、第二WHAT採用語句等)は、タ
イトル文に採用可能となる語句をいう。採用可能語句
は、次のものである。 1.漢字、カタカナ文字(符号の「ー」(長音符号)と
「・」(中黒)とを含む)、英文字、数詞で構成される
2文字以上の文字列。 2.1.の採用語句で挟まれた符号の「、」、「・」、
「−」(長い中棒)、「〜」、「&」も採用語句を構成
する語とし、採用語句+左記符号+採用語句を一連の採
用語句として一括採用する。例.中国・大連 3.符号の「」(鍵かっこ)も採用語句に含まれる。
例.「ヤマゼン」ブランド 4.クォーテーションマーク(“ ”)で囲まれた語句
は、その符号も含めて採用語句とする。例“くせ”
(これは、平仮名は1.の条件により採用可能語句に入
らないがクォーテーションマークで囲まれた場合には採
用可能語句になることを示している。) 5.送り仮名テーブル(日本新聞協会発行の新聞用語集
に準拠したもの)も採用可能語句になる。例.明らか 本発明では、まず、原記事を先頭から文単位で読み込
み、記事本文の主題を述べている文を発見してタイトル
文を作成するための候補原文を抽出する。記事は、文章
のはじめの方で、いわゆる5W1Hが述べられる逆三角
形の文章構造をしているので、文の最初から候補原文が
ないかを発見するステップを行う。この候補文抽出手段
は、タイトル文候補としては不適格である文を除外する
とともに、文中に主語採用詞および述語採用詞があるか
否かでタイトル候補文として採用してよいか否かを判定
する。
【0014】次に、採用した候補原文から、不要な記号
等を削除、あるいは特定の語について略語に変換する前
処理を行う。
【0015】この前処理を行った候補原文から、主語を
表す語句につく語彙である主語採用詞の直前の採用可能
語句を主語採用詞とともに切り出してタイトル文の主語
として採用し、必要な置換を行う。また、候補原文から
述語を表す語句につく語彙である述語採用詞の後の採用
語句または特定の述語(例えば“を設立”、“を実施”
等)を述語採用詞とともに述語として採用し、必要な置
換を行う。
【0016】採用した主語の採用可能語句と述語の採用
可能語句とでタイトル文として記述してよいか否かを判
定し、もしタイトル文として他の採用可能語句がある場
合には、さらに、必要な採用可能語句を取得するステッ
プを行い、よい場合には、タイトル文として必要な字数
に圧縮する圧縮手順を経てタイトル文を作成する。
【0017】主語および述語との間に採用可能語句があ
る場合には、第一WHAT発見手段を経て、さらに採用
可能語句があるか否かを発見する第二WHAT発見手段
を経てタイトル文として採用可能語句があるか否かを判
定する。
【0018】主語および述語採用可能語句以外に発見し
た採用可能語句がある場合にも、タイトル文として必要
な字数に文字数を圧縮してタイトル文を作成する。
【0019】なお、新聞記事中には、タイトル文を自動
的には記述できない記事、例えば連載記事や座談記事な
どがあり、このような特殊な記事は、従来どおり手動
(人手)によりタイトル文を作成する。
【0020】本発明は、一部の限られた新聞記事を除
き、このような手順を行って自動的に新聞記事のタイト
ル文を作成できるので、タイトル文作成の省力化を図る
ことができる。また、作業者の作業効率を高めることが
できる。さらに、タイトル文を短時間で作成できるた
め、新聞記事データベースに短時間で、ニュース性のあ
る記事を提供することができる。
【0021】
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて説明する。図1は、本発明の一つの実施の形
態を説明する図である。
【0022】この本発明を例示する一実施の形態は、タ
イトル文を作成する原記事中から記事の主題を記述して
いる候補原文を発見して抽出する候補原文発見部11
と、抽出された候補原文にタイトル文を作成するに必要
な前処理を行う前処理部12と、候補原文から文の主語
を抽出するWHO発見部13と、候補原文から文の述語
を抽出する述語発見部14と、主語および述語以外に採
用可能語句があった場合に、文の目的語あるいは補語を
示すような採用可能語句を抽出する第1段階WHAT・
WHERE発見部15と、第1段階WHAT・WHER
E発見部15で抽出した採用可能語句以外の採用可能語
句を抽出する第2段階WHAT・WHERE発見部16
と、WHO発見部13および述語発見部14の抽出した
主語および述語のタイトル文、第1段階WHAT・WH
ERE発見部15で抽出した採用可能語句を含むタイト
ル文、第2段階WHAT・WHERE発見部16で抽出
した採用可能語句を含むタイトル文のそれぞれがタイト
ル文として採用してよいか否かを判定するWRITE条
件判定部17と、WRITE条件判定部17で採用可能
とした文が40文字を越えるときに、この文を40文字
以内に文字数圧縮処理を行う40文字圧縮部18とを備
える。
【0023】なお、ステップとして、述語発見部14か
ら、一度WRITE条件判定部17に行って、タイトル
文としての適合性を判定し(主語と述語との間に採用可
能語句があるか否かを判定する)、適合する場合は、文
字数が40文字以内のときはそのままタイトル文を出力
し、40文字を越えるときは、40文字圧縮部18で文
字数圧縮処理を行う。タイトル文として適合しない場合
は、第1段階WHAT・WHERE発見部15へ行き、
第1段階WHAT・WHERE発見処理を行う。第1段
階WHAT・WHERE発見部15の処理後は、またW
RITE条件判定部17へ行って、タイトル文との適合
性を判定し、40文字以内のときはそのままタイトル文
を出力し、40文字を越えるときは40文字圧縮部18
で文字数圧縮処理を行う。タイトル文として適合しない
場合は、第2段階WHAT・WHERE発見部16へ行
き第2段階WHAT・WHERE発見処理を行う。その
結果をまたWRITE条件判定部17で判定し、40文
字以内のときは、タイトル文を出力し、40文字を越え
るときは40文字圧縮部18で文字数圧縮処理を行う。
【0024】以下、それぞれ各部の構成および動作を説
明する。
【0025】図2は、候補原文発見部11での動作を示
すフローチャートである。この候補原文発見部11は、
原記事の先頭から文単位で記事を読み込んで、記事本文
の主題を述べている文を発見してタイトル文作成の候補
原文を抽出するためのものである。新聞記事は、文章の
はじめの方で、いわゆる5W1Hが述べられている逆三
角形の文章構造をしている。このため、候補原文発見部
11では、先頭文より、タイトル文となる候補原文を発
見する処理を行う。
【0026】まず、原記事の先頭から文単位で読み込む
(S21)。次に、文の先頭が“「”(鍵かっこ)から
始まるか否かを判定して、その場合には次の文に行く
(S22)。これは、“「”は話し言葉から始まる文で
あり、タイトル文候補としては不適格であり、除外する
ためである。次に、文中にWHO採用詞があるか否かを
判断する(S23)。WHO採用詞がない場合は、主語
がないので次の文に対する処理を行うためステップS2
1へいく。
【0027】このWHO採用詞は、“は”、“が”“ら
は”であり、主語を表現する語彙として主語を表現する
語の後についている語句である。
【0028】そして、文内のWHO採用詞がある場合
に、このWHO採用詞の後ろに述語採用詞があるか否か
を判断する(S24)。述語採用詞がないときは、主語
はあるが述語がないので、次の文にいくためステップS
21へいく。
【0029】述語採用詞は、“を”、“に”、“で”、
“が”、“から”、“について”、“として”、“する
と”、“と”、“相次いで”、“することを”、“へ”
であり、述語を表現する語彙として述語となる語の前に
ついている語句である。
【0030】さらに、文内でWHO採用詞の後ろの文字
数が、8文字以内であるか否かを判断する(S25)。
これは、WHO採用詞の後に述語含みの文字数が少ない
ので文の主題を述べている文ではないとして候補原文か
ら外すためである。
【0031】このような判断ステップを経て、タイトル
文作成の候補原文を確定して候補原文を取得する。
【0032】次に、取得した候補原文からタイトル文を
作成するに際して、あらかじめ実行する前処理を図3を
参照して説明する。これは、候補原文から不要な語句、
記号を削除すること、特定の語句を略語に置き換えるこ
となどの処理をタイトル文作成処理に先立って行うもの
である。
【0033】まず、候補原文内の文字列と略語辞書との
マッチングを行い、略語に置換する(S31)。これ
は、例えば、日立製作所を“日立”に、住友特殊金属を
“住特金”の略語に置き換えるものである。次に、候補
原文内の“(写真)”、“=写真”、“=写真(上)”
等の写真の文字を含む漢字、“=”、“()”で構成さ
れる文字列を削除して文を詰める(S32)。さらに、
候補文内の“()”内は、かっこも含め削除して文字を
詰める(S33)。また、“「」”内は、次の条件の文
字種のときにのみ残し、他は鍵かっこを含め削除して文
字を詰める(S34)。
【0034】1.全て漢字、 2.漢字と平仮名、 3.漢字とカタカナ、 4.漢字と英字、 5.全てカタカナ、 6.英字とカタカナ、 7.“装置”が含まれているとき このような前処理を終了した候補原文からWHO発見部
13でWHO(主語)を抽出する。図4を参照してその
動作を説明する。
【0035】日本語文は、その先頭部分に主語を含む主
部がくる。したがって、候補原文の先頭文字より後部に
向かって後述する処理を行い、主語もしくは主部を発見
し、タイトル文に向けに整形して採用する。この採用さ
れた語句をWHO採用語句という。
【0036】なおここで、修飾詞は、“の”、“と”、
“な”、“や”、“との”、“への”、“から”、“な
ど”をいう。ただし、“など”は、第2段階WHAT・
WHERE発見部での処理のときのみ使用する。また、
企業・団体抽出名詞とは、“社長”、“会長”、“頭
取”、“理事長”、“所長”、“首脳”の語をいう。
【0037】まず、WHO発見部の処理は、WHO採用
詞(前出の“は”、“が”“らは”)の直前の採用可能
語句をWHO採用詞とともに切り出し、WHO採用
詞“、”(読点)に置換し、タイトル文の主語として採
用する。なお、この語句の直前が、“と”、“や”のと
き、その直前の採用可能語句も共に採用する(S4
1)。例001.候補原文 「松下電器と松下電子は十
二日、中国・上海市に」を、採用語句 「松下電器と松
下電子、」にする。
【0038】次に、WHO採用語句の前方に“など”が
あると、先頭文字からWHO採用語句までを採用する
(S42)。例002.候補原文「熊本地区の機械、金
属など異機種の製造5社は」を、採用語句「熊本地区の
機械、金属など異機種の製造5社、」にする。
【0039】WHO採用語句が“”(クォーテーション
マーク)で囲まれているとき、マーク付きで採用する
(S43)。例003.候補原文「一ドル=九十円台の
“二ケタ円高”が定着しつつある状況で」を、採用語句
「“二ケタ円高”」とする。
【0040】WHO採用語句の直前に“による”、“に
おける”があるとき、その直前の採用可能語句も採用す
る。また、直前採用語句の直前に修飾詞があるとき、そ
の直前の採用可能語句も採用する(S44)。例00
4.候補原文「ロスアンゼルスで開かれていた日本、米
国、EU、カナダの通商閣僚による四極通商会合は十一
日午前、」を、採用語句「日本、米国、EU、カナダの
通商閣僚による四極通商会合、」とする。
【0041】WHO採用語句の後尾が、企業・団体抽出
名詞である場合、先頭文字から該当語句まで採用する。
また、WHO採用語句が“両者”、“両社”であるとき
も先頭文字から採用する。なお、“各社”でその直前が
“の”であるとき、その直前の採用可能語句も共に採用
する(S45)。例005.候補原文「経団連の豊田章
一郎会長は二十一日の定例会見で、」を採用語句「経団
連の豊田章一郎会長、」とする。
【0042】WHO採用語句が「」(鍵かっこ)で囲ま
れているとき、鍵かっこを外して採用する。その直前に
修飾詞があるとき、その直前の採用可能語句も採用する
(S46)。例006.候補原文 「日本と韓国の円滑
な技術移転を促すための「日韓テクノマート」が十三日
から四日間の日程で」を採用語句 「日韓テクノマー
ト」とする。また、例007.「秋田県内三港のマリー
ナを一括管理・運営する第三セクターの「マリーナ秋
田」が、十月に設立」を採用語句 「第三セクタのマリ
ーナ秋田、」にする。
【0043】WHO採用語句の後尾に、“教授ら”、
“教授”があり、その語句の直前に修飾詞があるとき、
WHO採用語句を不採用とし、修飾詞の直前の採用可能
語句をWHO採用語句とする(S47)。例008.候
補原文 「小山高専の黒須茂教授らは、山武ハネウェル
と共同で」を、採用語句 「小山高専、」とする。
【0044】WHO採用語句の直前に、修飾詞があり、
その直前が“()”(かっこ)で、かっこ内に企業・団
体名抽出名詞があるとき、かっこの直前の採用可能語句
も共に採用する(S48)。例009.候補原文 「花
正(東京都江戸川区平井六の五十四の一、社長小野弘
氏)の低価格ワインが小売各社の間で」を、採用語句
「花正の低価格ワイン、」とする。
【0045】WHO採用語句の直前、及び前部に複数の
“の”があり、その前後が採用可能語句のとき、2個ま
での“の”に付加する採用可能語句を共に採用する(S
49)。例010.候補原文 「渋谷の代官山の再開発
事業が大詰めを迎えている」を、採用語句 「渋谷の代
官山の再開発事業、」とする。
【0046】WHO採用語句+採用可能語句、または、
WHO採用語句+採用可能語句+“の”+採用可能語句
の直後に、“と”、“と共同で”、“と共同出資で”、
“と合弁で”、“と提携して”、“に向け”、“で”、
“から”があるとき、該当する全てを採用する。ただ
し、“から”は、その直前の採用可能語句に数詞が入る
ときは棄却する(S50)。これは、このような場合
に、主語として採用すべきものは2語以上あり、両者を
採用するためである。例011.候補原文 「新日鉄
は、三井物産と共同でフィンランドの製鉄会社であるフ
ンディア社から」を、採用語句 「新日鉄、三井物産と
共同で」とする。例012.候補原文 「ノリタケは米
国の洋食器メーカ、オネイダ社と提携し、米国で販売す
る」を、採用語句 「ノリタケ、米国の洋食器メーカオ
ネイダ社と提携、」とする。例013.候補原文 「松
下電池は携帯電話機用の充電器で、業界で初めて」を、
採用語句「松下電池、携帯電話機用の充電器で、」とす
る。例014.候補原文 「大林組はシンガポール航空
から新本社ビルの」を、採用語句 「大林組、シンガポ
ール航空から」とする。
【0047】最後に、WHO採用詞と、“、”(読点)
に挟まれた採用可能語句に数詞+“年”、“月”、
“日”が含まれるとき、その採用可能語句を削除する
(S51)。例015.候補原文 「ロスアンゼルスで
開かれていた、日本、米国、EU、カナダの通商閣僚に
よる四極通商会合は十一日午前、」を、採用語句 「日
本、米国、EU、カナダの通商閣僚による四極通商会
合、」とする。
【0048】このようなWHO発見部13によるWHO
採用語句の抽出処理の後に、候補原文から述語を述語発
見部14により抽出する。この処理を図5を参照して説
明する。日本語文は、述語および述語を含む述部が文末
にくる。したがって、候補原文の末尾より文頭に向けて
遡り、以下に述べる処理を行って、述語もしくは述部を
発見し、タイトル文向けに整形して採用する。採用され
た語句を述語採用語句という。
【0049】まず、候補原文の文頭よりチェックし、
“を設立”、“を実施”、“を設備”、“を開発”、
“を開設”、“を値上げ”、“に諮問”の語句があれ
ば、それ以降の文字列を無視し、述語として採用する。
以後の述語抽出処理は行わず、WRITE条件判定部へ
行く(S61)。これは、特定の述語については無条件
で述語として採用するものであり、この特定の述語の後
は、記事の明細部分に入り、タイトル文として不要なも
のであるため、無視する。例016.候補原文 「米の
有力パソコン・ソフトウエアハウスであるシマンテック
社は100%出資の日本法人であるシマンテックを設
立、日本市場に対する本格的な営業活動を開始した。」
を、採用語句 「シマンテック社、100%出資の日本
法人であるシマンテックを設立」とする。
【0050】次に、候補原文の末尾より遡り、述語採用
詞があり、その直後に採用可能語句があれば、共に採用
する。もし、述語採用詞の直後に採用可能語句がなけれ
ば、後部に向かってチェックを行い、採用可能語句があ
れば、そこまでの文字列を採用する。衝突する採用語句
がないときは、“。”(句点)までの文字列を句点を除
き採用する(S62)。例017.候補原文 「生保業
界は中小・中堅や地方の企業への株式投資を積極化して
いる。」を、採用語句 「生保業界、中小・中堅や地方
の企業への株式投資を積極化」とする。
【0051】次に述語採用語句に数詞を含む“年”、
“月”、“日”があればそれを削除する(S63)。例
018.候補原文 「オムロンソフトは、ワープロ文書
中にCADの図やイメージを取り込む機能を搭載したU
NIXWS用日本語ソフトを二一日発売する。」を、採
用語句 「オムロンソフト、ワープロ文書中にCADの
図やイメージを取り込む機能を搭載したUNIXWS用
日本語ソフトを発売」とする。
【0052】述語採用語句決定後、再度文を遡り、述語
テーブルとマッチング処理し、述語テーブル内の語句が
あれば、それを述語採用語句とし、初回の述語採用語句
を却下する(S64)。例019.候補原文 「サンデ
ンは一二日、九五年二月から米国でカーエアコン用スク
ロールコンプレッサーの一貫生産を開始すると正式発表
した。」を、採用語句 「サンデン、米国でカーエアコ
ン用スクロールコンプレッサーの一貫生産を開始」とす
る。これは、「開始」のみを述語テーブルに入れてお
き、それ以下の語句を削除してタイトル文に不要な語句
を除くためである。
【0053】このような述語抽出処理を終了すると、W
RITE条件判定部17へいく。
【0054】WRITE条件判定部17では、タイトル
文としてWRITEしてよいか否かを判定するものであ
るが、述語発見部14での出力であるWHO採用語句+
述語採用語句、第1段階WHAT・WHERE発見部1
5での出力であるWHO採用語句+第1段階WHAT・
WHERE採用語句+述語採用語句、第2段階WHAT
・WHERE発見部16での出力であるWHO採用語句
+第2段階WHAT・WHERE採用語句+第1段階W
HATE・WHERE採用語句+述語採用語句、につい
て判定を行う。なお、第2段階WHAT・WHERE採
用語句は複数である場合も含む。これらWRITE条件
判定部17が処理対象とする文字列をタイトル候補文と
いう。
【0055】WRITE条件判定部17の処理のうち、
述語発見部14の出力に対するWRITE条件判定につ
いて図8に基づいて説明する。
【0056】まず、候補原文で述語採用語句の直前がW
HO採用語句であるかを判断する(S111)。YES
の場合は、タイトル候補文が40文字以内であるかを判
断し(S112)、40文字以内であるときは、タイト
ル文として採用し、次の文(記事)を処理するため候補
原文発見部11へいく(S113)。例020.候補原
文 「パプキンは、宮城県下から撤退する。」を、タイ
トル文 「パプキン、宮城県下から撤退」とする。ステ
ップS112でタイトル候補文が40文字を越えたとき
は、40文字圧縮部18へいく。また、ステップS11
1で候補原文で述語採用語句の直前がWHO採用語句で
ない場合は、他の情報をとるため、第1段階WHAT・
WHERE発見部15へいく(S115)。
【0057】WRITE条件判定部17で、タイトル文
の条件に適合しないと判定された場合に、WHAT・W
HERE発見部でのWHAT・WHERE発見処理に移
る。この処理は、タイトル文内にある目的語、補語等を
採用するためのものである。WHAT・WHERE発見
部は、第1段階WHAT・WHERE発見部15、第2
段階WHAT・WHERE発見部16にその論理が分か
れている。日本語文は、文の重要な性質を表す語の順位
で文末から遡って配置されている。したがって、述語採
用語句から遡って、WHAT・WHEREを発見してタ
イトル文向けに整形して採用するように動作する。
【0058】WRITE条件判定部17のステップS1
11の判断で述語採用語句の直前にWHO採用語句がな
いときは、第1WHAT・WHERE発見部15での第
1段階WHAT・WHERE発見処理を行う。この第1
段階WHAT・WHERE発見部15の処理動作を図6
を参照して説明する。
【0059】まず、候補原文を述語採用詞から遡り、そ
の直前の採用可能語句を採用する(S71)。例02
1.候補原文 「米の有力パソコン・ソフトハウスであ
るシマンテック社は100%出資の日本法人であるシマ
ンテックを設立、日本市場に対する本格的な営業活動を
開始した。」を、採用語句 「シマンテック社、100
%出資の日本法人であるシマンテックを設立」とする。
この場合「を設立」の直前の「シマンテック」が第1W
HAT・WHERE採用語句である。
【0060】次に、第1WHAT・WHERE採用語句
(以下第1WHAT採用語句という)の直前に、修飾詞
があるとき、その直前の採用語句も共に採用する。ま
た、採用語句の直前にさらに修飾詞があるときは、順次
採用しながら遡る(S72)。ただし、“から”の直前
の採用可能語句が数詞含みであるときは不採用とする。
例022.候補原文 「生保業界は中小・中堅や地方の
企業への株式投資を積極化している。」を、採用語句
「生保業界、中小・中堅や地方の株式投資を積極化」と
する。ここで「中小・中堅や地方の株式投資」が第1W
HAT採用語句である。
【0061】次にステップS73では、次のような処理
を行う。まず、採用可能語句+「XXX」(鍵かっこ付
き語句)+述語採用詞のとき、鍵かっこの前の採用可能
語句を採用する。例023.候補原文 「森精機はOA
機器に使用されるアルミロールの表面を切削加工だけで
面祖度〇.二Sの高精度に仕上げる専用加工機「SFL
−10/600」を開発した。」を、採用語句 「森精
機、OA機器に使用されるアルミロールの表面を切削加
工だけで面祖度〇.二Sの高精度に仕上げる専用加工機
を開発」とする。ここで、鍵かっこ直前の「専用加工
機」が第1WHAT採用語句である。また、採用可能語
句ではない単語+鍵かっこ付き語句+述語採用詞のと
き、述語採用詞を“、”(読点)に置換する。例02
4.候補原文「花園工具は、プリント配線板のリード線
の切りくずをエアで吸引する「リードクリーナー」を発
売した。」を、採用語句 「花園工具、プリント配線板
のリード線の切りくずをエアで吸引する、発売」とす
る。ここで、発売の直前の「を」が「、」に置換されて
いる。ただし、採用可能語句でない単語+鍵かっこ付き
語句+述語採用語句で、述語が“を設立”、“を設
置”、“を実施”、“を開発”、“を完成”、“に署
名”、“を策定”のとき、鍵かっこ内を鍵かっこ付きで
採用する。例025.候補原文 「素材センターは、鋳
造・鍛造などに国内素形材産業で増加している海外調達
や海外展開の支援策として同センター内に「海外相談
室」を設置した。」を、採用語句 「素材センター、鋳
造・鍛造などに国内素形材産業で増加している海外調達
や海外展開の支援策として同センター内に「海外相談
室」を設置」とする。ここで、述語採用語句が「を設
置」であるため、「海外相談室」を鍵かっこ付きで第1
WHAT採用語句として採用する。なお、採用可能語句
でない単語+鍵かっこ付き語句+修飾詞+第1WHAT
採用語句のとき、鍵かっこ内を鍵かっこ付きで修飾詞、
第1WHAT採用語句をともに採用する。例026.候
補原文 「黒東第三発電所は、通産が九四年度から新設
した「グッド・デザイン施設」の認定を受けた」を、採
用語句 「黒東第三発電所、通産が九四年度から新設し
た「グッド・デザイン施設」の認定を受けた」とする。
【0062】なお、数詞と年、月、日、または、円を含
む採用可能語句+述語採用詞のとき、不採用にして遡る
(S74)。例027.候補原文 「NECホームエレ
は、画面サイズが業界標準で最も大きい九.五インチの
液晶テレビ「NEXTV」を十月一日に発売する。」
を、採用語句 「NECホームエレは、画面サイズが業
界標準で最も大きい九.五インチの液晶テレビを発売」
とする。
【0063】これらの第1段階WHAT・WHERE発
見処理が終了すると、WRITE条件判定部17の第1
段階WHAT・WHERE発見部でのWRITE条件判
定処理へ行く(S75)。
【0064】ここで、図9を参照してWRITE条件判
定処理部17での第1段階WHAT・WHERE発見部
15の出力に対するWRITE条件判定処理を説明す
る。
【0065】まず、候補原文で第1WHAT採用語句の
直前がWHO採用語句であるかを判断する(S12
1)。YESの場合は、タイトル候補文が40文字以内
であるかを判断し(S122)、40文字以内であると
きは、タイトル文として採用し、次の文を処理するため
候補原文発見部11へいく(S123)。例028.候
補原文 「NECは独自の無機レジスト形成法を開発
し、走査型電子線露光で世界最小の5ナノメートルのパ
ターン形成に成功した。」を、タイトル文 「NEC、
独自の無機レジスト形成法を開発」とする。ステップS
122でタイトル候補文が40文字を越えたときは、4
0文字圧縮部18へいく。また、ステップS121で候
補原文で第1WHAT採用語句の直前がWHO採用語句
でない場合は、第2段階WHAT・WHERE発見部1
6へいく(S125)。
【0066】WRITE条件判定部17のステップS1
21の判断で第1WHAT採用語句の直前にWHO採用
語句がないときは、第2段階WHAT・WHERE発見
部16での第2段階WHAT・WHERE発見処理を行
う。この第2段階WHAT・WHERE発見部16の処
理動作を図7を参照して説明する。
【0067】第2段階WHAT・WHERE発見部17
の処理は、候補原文で第1WHAT採用語句に引続き、
文頭に向かって遡り、以下の動作を行って第2段階WH
AT・WHEREを発見し、タイトル文向けに整形して
採用する。ここで、第2段階WHAT・WHERE発見
部での採用語句を第2WHAT採用語句という。また、
第2WHAT・WHERE発見のための語句を第2WH
AT採用詞という。この第2WHAT採用詞は、
“を”、“などを”、“などと”、“は”、“で”、
“である”、“では”、“でも”、“でのみ”、“でき
る”、“でできる”、“に”、“による”、“におけ
る”、“について”、“も”、“が”、“へ”、“へ
の”、“として”の語句である。
【0068】まず、候補原文を第1WHAT採用語句か
ら遡り、第2WHAT採用詞があれば、その前後の採用
可能語句を採用する。または、WRITE条件判定部1
7からのときは、第2WHAT採用詞があれば、その前
後の採用可能語句を採用する。直後が、漢字1文字もし
くは平仮名のときは、続く採用可能語句または読点まで
採用する。採用可能語句の採用のとき、その直後が平仮
名のときは、読点を付与する。直前が数詞のみの場合、
不採用とし、第2WHAT採用詞は読点に置換する(以
上S81)。例029.候補原文 「健康食品メーカー
の玄米酵母は、東京で外食・小売り分野に進出した。」
を、採用語句 「玄米酵母、東京で外食・小売り分野に
進出」とする。ここで“で”が第2WHAT採用詞であ
り“東京で”が第1WHAT採用語句の“外食・小売り
分野”の直前にあることで第2WHAT採用語句として
採用する。例030.候補原文 「フランスベットは輸
送コストの削減、ユーザーサービスの強化を図るため物
流の拠点倉庫を統廃合する。」を、採用語句「フランス
ベット、輸送コストの削減、ユーザーサービスの強化を
図るため物流の拠点倉庫を統廃合」とする。ここで、
“強化を図るため”の“を”が第2WHAT採用詞であ
り、前後の語句を含めて採用する。例031.候補原文
「シークエント、コンピューターズ・ジャパンは、マ
イクロソフトのディトナに対応する「WinServe
r」の520と3500を年内に出荷する。」を、採用
語句 「シークエント、コンピューターズ・ジャパン、
マイクロソフトのディトナに対応、年内に出荷」とす
る。“3500を”の“を”を読点として数詞を不採用
としている。
【0069】次にステップS82に進み、まず、第2W
HAT採用語句の直前に、修飾詞があるとき、その直前
の採用可能語句も共に採用する。また、採用語句の直前
に修飾詞があるときは順次採用しながら遡る。ただし、
直前の採用可能語句が数詞含みであるときは不採用とす
る。また、第2WHAT採用語句の直後に、修飾詞の
“の”、“から”があれば、その直後の採点可能語句も
採用する。直後が漢字1文字もしくは平仮名のとき、続
く採用可能語句または読点まで採用する。採用可能語句
の採用時にその直後が平仮名のときは、読点を付与す
る。例032.候補原文 「フランスベッドは輸送コス
トの削減、ユーザーサービスの強化を図るため物流の拠
点倉庫を統廃合する。」を、採用語句 「フランスベッ
ド、輸送コストの削減、ユーザーサービスの強化を図る
ため物流の拠点倉庫を統廃合」とする。ここで、“ユー
ザーサービスの”の“の”が第2WHAT採用語句の直
前の修飾詞であり、その直前の“ユーザーサービス”を
第2WHAT採用語句とともに採用する。例033.候
補原文 「森精機はOA機器に使用されるアルミロール
の表面を切削加工だけで面祖度〇.二Sの高精度に仕上
げる専用加工機「SFL−10/600」を開発し
た。」を、採用語句 「森精機、OA機器に使用される
アルミロールの表面を切削加工だけで高精度に仕上げる
専用加工機を開発した」とする。ここで第2WHAT採
用語句の直前の修飾詞“の”の直前の“面祖度〇.二
S”は数詞含みであるので、削除する。例034.候補
原文 「ディスカウントストアの栄ショッピングセンタ
ーは、ビールをケースのまま販売できる自動販売機「ロ
ボット自販機」を開発、九五年夏をめどに全国のDS向
けに販売する。」を、採用語句 「栄ショッピングセン
ター、ビールをケースのまま販売できる自動販売機を開
発」とする。“をケースのまま販売”が第2WHAT採
用語句となる。
【0070】次にステップS83に進む。ここでは、採
用可能語句+「XXX」(鍵かっこ付き語句)+第2W
HAT採用詞のとき、鍵かっこの前の採用語句を採用す
る。例035.候補原文 「通信販売会社の二光は、既
存の主力カタログ「シーズニング」を商品カテゴリー別
に三分割し、それぞれの顧客に配布した。」を、採用語
句 「二光、既存の主力カタログを商品カテゴリー別に
三分割、顧客に配布」とする。ここで、第2WHAT採
用詞“を”の前の鍵かっこの前の“主力カタログ”を第
2WHAT採用語句として採用する。また、“の”、読
点、第2WHAT採用詞+鍵かっこ付き語句+第2WH
AT採用詞のとき、鍵かっこ内を鍵かっこ付きで採用す
る。それ以外は不採用とし、第2WHAT採用詞を読点
に置換する。例036.候補原文 「松下電器はパソコ
ンと接続してデスクトップのミーティングから多人数の
会議まで対応できるテレビ会議システム用の「電子ミー
ティングユニット」を十一月二五日から発売する。」
を、採用語句 「松下電器、テレビ会議システム用の
「電子ミーティングユニット」を、発売」とする。ここ
で、鍵かっこの直前が“の”であるため、鍵かっこ内を
含めて“テレビ会議システム用の”を第2WHAT採用
語句とする。ただし、採用可能語句ではない単語+鍵か
っこ付き語句+第2WHAT採用語句で、述語採用語句
が、“を設立”、“を設置”、“を実施”、“を開発”
のとき、鍵かっこ内を鍵かっこ付きで採用する。例03
7.候補原文 「郵政省は一二日、マルチメディア振興
に向けた本格推進組織として一四日に発足させる「情報
通信基盤整備推進連絡会議」に、幹事会と三部会を設置
する方針を固めた。」を、採用語句 「郵政省、一四日
に発足、「情報通信基盤整備推進連絡会議」に、幹事会
と三部会を設置」とする。また、採用可能語句+鍵かっ
こ付き語句+修飾詞+第2WHAT採用語句のとき、鍵
かっこの前の採用可能語句を採用する。なお、採用可能
語句ではない単語+鍵かっこ付き語句+修飾詞+第2W
HAT採用語句のとき、鍵かっこ内をはずして採用する
(以上ステップS83)。
【0071】このステップS83を終了すると、WRI
TE条件判定部17へいく。
【0072】ここで、図10を参照してWRITE条件
判定処理部17での第2段階WHAT・WHERE発見
部16の出力に対するWRITE条件判定処理を説明す
る。
【0073】まず、候補原文で第2WHAT採用語句の
直前がWHO採用語句であるか、または最終採用語句か
ら遡るも第2WHAT採用詞がないかを判断する(S1
31)。YESの場合は、タイトル候補文が40文字以
内であるかを判断し(S132)、40文字以内である
ときは、タイトル文として採用し、次の文を処理するた
め候補原文発見部11へいく(S133)。例038.
候補原文 「生保業界は中小・中堅や地方の企業への株
式投資を積極化している。」を、タイトル文「生保業
界、中小・中堅の企業への株式投資を積極化」とする。
例039.候補原文 「大成建設は全社挙げてファシリ
ティー・マネジメント事業を推進、展開する。」を、タ
イトル文 「大成建設、ファシリティー・マネジメント
事業を推進」とする。ステップS132でタイトル候補
文が40文字を越えたときは、40文字圧縮部18へい
く(ステップS134)。また、ステップS131で候
補原文で第2WHAT採用語句の直前がWHO採用語句
でないか、または最終採用語句から遡るも第2WHAT
採用詞があるときは、ステップS135で、タイトル候
補文が40文字を越えているか否かを判断し、越えてい
る場合には、40文字圧縮部18へいく(S136)。
また、タイトル候補文が40文字を越えていないとき
は、再度、第2段階WHAT・WHERE発見部16へ
いく(S137)。
【0074】WRITE条件判定部17で、タイトル候
補文が40字を越えた場合、40文字圧縮部で40文字
以内にするように文整形を行う。以下、図11および図
12を参照してその動作を説明する。
【0075】ここで、以下の40文字圧縮処理で用いる
「一連の採用語句」とは、例えば“関税機能と保税倉庫
機能を備えた”のように、修飾採用詞により採用された
採用語句(従の採用語句)も含めたときの語句をいう。
【0076】図11は、述語発見部14および第1段階
WHAT・WHERE発見部15の出力に対する40文
字圧縮処理の動作を示すものである。
【0077】まず、タイトル候補文中に、次の単語が存
在していたときは読点に変換する。“について”、“と
して”、“すると”、“相次いで”、“することを”、
“などを”、“などと”、“である”、“でのみ”、
“できる”、“でできる”、“による”、“におけ
る”、“について”。この読点の置換で40文字以内に
なるか否かを判断して40文字以内になったときはタイ
トル文として採用し、次の文を処理するため候補原文発
見部11へいく(S141)。
【0078】40文字以内にならないとき、タイトル候
補文中に発出の“の”の採用語句を“の”とともに削除
し、文を詰める。この処理で40文字以内になったか判
断し、40文字以内であると、タイトル文として採用す
る(S142、S143)。これにより、ふたつの
“の”があった場合、前の方の“の”の採用語句を削除
することになる。このステップS142によっても40
文字以内にならないときは、ステップS143へいき、
タイトル候補文の後ろに“(手修正)”と付加してタイ
トル文として出力し、これを手修正扱いとして、候補原
文発見部11へいく。例040.候補原文 「古河機械
金属はバケット容量が2.5、3.0、3.8立方メー
トルの大型ホイールローダー3機種を開発、16日から
発売する。」を、タイトル文 「古河金属、大型ホイー
ルローダー3機種を開発」とする。
【0079】次に図12は、第2段階WHAT・WHE
RE発見部16の出力に対する40文字圧縮処理の動作
を示すものである。
【0080】まず、タイトル候補文中に、採用語句+
“の”+採用語句+“の”・・・のような“の”による
繋がりがあるとき、先頭の“の”による採用語句を
“の”と共に削除して文を詰める。これにより40文字
以内になればタイトル文として採用し、後、候補原文発
見部11へ行く(S151)。40文字以内にならない
ときは次のステップS152へいく。例041.候補原
文 「NECは表示画面の輝度を従来の2倍に高めた1
2インチサイズのTFT方式の液晶表示装置を開発、9
5年2月からサンプル出荷する。」のタイトル候補文
は、「NEC、表示画面の輝度を従来の2倍に高めた1
2インチサイズのTFT方式の液晶表示装置を開発」
(45文字)で、40文字オーバーであるので、ステッ
プS151の処理により、「12インチサイズの」を削
除し、タイトル文 「NEC、表示画面の輝度を従来の
2倍に高めたTFT方式の液晶表示装置を開発」(36
文字)にする。
【0081】次にステップS152では、タイトル候補
文中に、一連の採用語句+“向け”があるとき、これを
削除する。また、一連の採用語句+“向けを”+一連の
採用語句+“に”のとき、すべてを削除する。これによ
り40文字以内になればタイトル文として採用する(S
158)。また、40文字以内にならないときは次のス
テップS153へいく。例042.候補原文 「松下電
器と松下電子は12日、中国・上海市に現地企業と合弁
で家庭用VTR向け半導体の製造・販売会社を設立する
と発表した。」のタイトル候補文は、「松下電器と松下
電子、中国・上海市に現地企業と合弁で家庭用VTR向
け半導体の製造・販売会社を設立」(47文字)であ
り、「家庭用VTR向け」を削除し、タイトル文「松下
電器と松下電子、中国・上海市に現地企業と合弁で半導
体の製造・販売会社を設立」(39文字)とする。例0
43.候補原文 「新日鉄、NKKなど高炉大手会社は
94年度3四半期積み鋼材の輸出価格を東南アジア向け
を主体に値上げする。」のタイトル候補文は、「新日
鉄、NKKなど高炉大手会社、94年度3四半期積み鋼
材の輸出価格を東南アジア向けを主体に値上げ」(48
文字)であり、「東南アジア向けを主体に」を削除し、
タイトル文「新日鉄、NKKなど高炉大手会社、94年
度3四半期積み鋼材の輸出価格を値上げ」(37文字)
とする。
【0082】次にステップS153では、タイトル候補
文中に、一連の採用語句+“などを”+採用語句がある
とき、すべてを削除する。また、一連の採用語句+“な
ど”+採用語句があるとき、一連の採用語句+“など”
までを削除する。この処理により40文字以内となれば
タイトル文として採用する(S158)。また、40文
字以内にならないときは次のステップS154へいく。
例044.候補原文「NTTは12日、簡易型携帯電話
PHSの事業化に向け、10月下旬をめどに設立する企
画・調査などを行う準備会社9社の概要を発表した。」
のタイトル候補文は、「NTT、PHSの事業化に向
け、10月下旬をめどに設立、企画・調査などを行う準
備会社9社の概要を発表」(49字)であり、「企画・
調査などを行う」を削除し、タイトル文「NTT、PH
Sの事業化に向け、10月下旬をめどに設立、準備会社
9社の概要を発表」(39字)とする。例045.候補
原文 「三菱自工は20日、「シャリオ」にグリルガー
ド付きフロントバンパーなどRV関連装置を装着した特
装車「シャリオロード」を発売したと発表した。」のタ
イトル候補文は、「三菱自工、「シャリオ」にグリルガ
ード付きフロントバンパーなどRV関連装置を装着、特
装車を発売」(46字)であり、「グリルガード付きフ
ロントバンパーなど」を削除し、タイトル文「三菱自
工、「シャリオ」にRV関連装置を装着、特装車を発
売」(28文字)とする。
【0083】次に、ステップS154では、タイトル候
補文中の“(数詞)カ国”、“(数詞)社”,“の(数
詞)社”の直前が、採用語句+読点で複数存在すると
き、先頭の採用語句に、“など”を付与して他を削除す
る。この処理により40文字以内となればタイトル文と
して採用する(S158)。また40文字以内にならな
いときは次のステップS155へいく。例046.候補
原文 「太平洋交流センターは94年度中に中国、ロシ
ア、ベトナム3カ国の帰国研修生による同窓会を組織す
る。」のタイトル候補文は、「太平洋交流センター、9
4年度中に中国、ロシア、ベトナム3カ国の帰国研修生
による同窓会を組織」(45文字)であり、「中国、ロ
シア、ベトナム」を「中国など」に置換し、タイトル文
「太平洋交流センター、94年度中に中国など3カ国の
帰国研修生による同窓会を組織」(38文字)とする。
【0084】次に、ステップS155では、タイトル候
補文中に、一連の採用語句+“備えた”があるとき、す
べてを削除する。この処理により40文字以内となれば
タイトル文として採用する(S158)。また40文字
以内とならないときは次のステップS156へいく。例
047.候補原文 「日通は滋賀県栗東町の栗東支店内
に税関機能と保税倉庫機能とを備えた内陸物流基地であ
るインランドデポを開設、運用を開始した。」のタイト
ル候補文は、「日通、滋賀県栗東町の栗東支店内に税関
機能と保税倉庫機能とを備えた内陸物流基地であるイン
ランドデポを開設」(50文字)であり、「税関機能と
保税倉庫機能とを備えた」を削除してタイトル文「日
通、滋賀県栗東町の栗東支店内に内陸物流基地であるイ
ンランドデポを開設」(35文字)とする。
【0085】次に、ステップS156では、候補原文
に、“期決算”があるときには、「WHO採用語句+読
点+“(数詞)年”+“(数詞)月”期決算見通し”+
句点+第1WHAT採用語句+述語採用語句」のパター
ンで出力する。この処理により40文字以内となればタ
イトル文として採用する。また40文字以内とならない
ときは次のステップS157へいく。これは決算発表等
の定型的な文章は、定型的なタイトル文に変換する例で
ある。例048.候補原文 「松屋は、19日、95年
2月期決算予想で当初見込みの経常利益3億5千万円を
5億8千万円へ、当期利益も1億5千万円から2億7千
万円へとそれぞれ上方修正すると発表した。」のタイト
ル候補文は、「松屋、当初見込みの経常利益3億5千万
円を5億8千万円、当期利益も1億5千万円から2億7
千万、上方修正すると発表」であり、タイトル文は、
「松屋、95年2月期決算見通し。上方修正すると発
表」とする。
【0086】最後にステップS157では、最終の第2
段階WHAT採用語句を採用することで、40字オーバ
ーとなっているので、その語句を不採用とする。例.候
補原文 「シンオウは、ネットワーク部門強化の一環と
して米国アポジー社のUNIX機向けコンパイラーソフ
ト「アポジー・スパーク・コンパイラーズ」の販売を開
始した。」のタイトル候補文は、「シンオウ、ネットワ
ーク部門強化の一環として米国アポジー社のUNIX機
向けコンパイラーソフトの販売を開始」であり、40文
字オーバーであるので、第2段階WHAT採用語句の
「ネットワーク部門強化の一環として」を不採用とし、
タイトル文は、「シンオウ、米国アポジー社のUNIX
機向けコンパイラーソフトの販売を開始」に圧縮する。
【0087】
【発明の効果】本発明はこのような処理を行うことで、
自動的にタイトル文を作成できるため、省力化を図るこ
とができる効果がある。また、短時間で処理ができるよ
うになったため、短時間で記事データベースをユーザに
提供できる効果がある。
【図面の簡単な説明】
【図1】本発明実施例のタイトル文作成装置の構成例を
示す図。
【図2】候補原文発見部の動作を説明するフローチャー
ト。
【図3】前処理部の動作を説明するフローチャート。
【図4】WHO発見部の動作を説明するフローチャー
ト。
【図5】述語発見部の動作を説明するフローチャート。
【図6】第1段階WHAT・WHERE発見部の動作を
説明するフローチャート。
【図7】第2段階WHAT・WHERE発見部の動作を
説明するフローチャート。
【図8】WRITE条件判定部の動作を説明するフロー
チャート。
【図9】WRITE条件判定部の動作を説明するフロー
チャート。
【図10】WRITE条件判定部の動作を説明するフロ
ーチャート。
【図11】40文字圧縮部の動作を説明するフローチャ
ート。
【図12】40文字圧縮部の動作を説明するフローチャ
ート。
【符号の説明】
11 候補原文発見部 12 前処理部 13 WHO発見部 14 述語発見部 15 第1段階WHAT・WHERE発見部 16 第2段階WHAT・WHERE発見部 17 WRITE条件判定部 18 40文字圧縮部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 原記事の本文の先頭からタイトル文作成
    に適合する候補原文を文単位で抽出する候補文抽出手段
    (11)と、 抽出した候補原文からタイトル文に必要な主語を表す語
    句および述語を表す語句を発見して抽出する主語および
    述語抽出手段(13、14)と、 抽出した語句でタイトル文として適合するか否かを判断
    する判定手段(17)と、 この判定手段でタイトル文として適合すると判断された
    文をタイトル文に必要な字数に圧縮する圧縮手段(1
    8)とを含み、 前記判定手段は、抽出した主語および述語との間にタイ
    トル文として採用可能な語句があるか否かを判断する手
    段を含むことを特徴とするタイトル文作成装置。
  2. 【請求項2】 前記判定手段で主語および述語の間にタ
    イトル文として採用可能な語句があると判断された場合
    に、主語および述語との間に存在する文の目的語または
    補語を示す第一のWHAT採用語句があるか否かを検索
    する第一のWHAT発見手段(15)を備え、 前記判定手段は、この第一のWHAT発見手段で発見し
    た第一のWHAT採用語句と主語との間にタイトル文と
    して採用可能な語句があるか否かを判断する手段を含む
    請求項1記載のタイトル文作成装置。
  3. 【請求項3】 前記判定手段で第一のWHAT採用語句
    と主語との間にタイトル文として採用可能な語句がある
    と判断された場合に、主語と第一のWHAT採用語句と
    の間に文の目的語または補語を表す第二のWHAT採用
    語句があるか否かを検索する第二のWHAT発見手段
    (16)を含む請求項2記載のタイトル文作成装置。
  4. 【請求項4】 主語および述語発見手段は、候補原文中
    の主語を表す語の後につく語彙の主語採用詞を発見して
    主語を抽出し、候補原文中の述語を表す語の前につく語
    彙の述語採用詞を発見して述語を抽出する手段を含む請
    求項1ないし3のいずれか記載のタイトル文作成装置。
  5. 【請求項5】 主語および述語発見手段の前段に、採用
    した候補原文中からタイトル文に不要な語句または記号
    を削除する前処理手段を含む請求項1記載のタイトル文
    作成装置。
JP7193426A 1995-07-28 1995-07-28 タイトル文作成装置 Pending JPH0944497A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7193426A JPH0944497A (ja) 1995-07-28 1995-07-28 タイトル文作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7193426A JPH0944497A (ja) 1995-07-28 1995-07-28 タイトル文作成装置

Publications (1)

Publication Number Publication Date
JPH0944497A true JPH0944497A (ja) 1997-02-14

Family

ID=16307780

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7193426A Pending JPH0944497A (ja) 1995-07-28 1995-07-28 タイトル文作成装置

Country Status (1)

Country Link
JP (1) JPH0944497A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000112966A (ja) * 1998-10-02 2000-04-21 Nippon Telegr & Teleph Corp <Ntt> ヘッドライン生成装置およびヘッドライン生成処理方法および当該方法を記述したプログラムを記録した記録媒体
JP2000339250A (ja) * 1999-05-25 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> 対話メッセージ生成方法、その装置、そのプログラムを記録した媒体
JP2001147937A (ja) * 1999-11-22 2001-05-29 Toshiba Corp 業務支援システム
JP2003076688A (ja) * 2001-08-30 2003-03-14 Just Syst Corp 文末表現簡略化装置、文末表現簡略化方法、及び文末表現簡略化プログラム
WO2005078604A1 (ja) * 2004-02-13 2005-08-25 Hitachi, Ltd. 文字表示方法
JP2005258676A (ja) * 2004-03-10 2005-09-22 Seiko Epson Corp 文書出力装置及びその制御方法
JP2019057266A (ja) * 2017-09-20 2019-04-11 ヤフー株式会社 生成装置、学習装置、生成方法、学習方法、生成プログラム、学習プログラム、及びモデル
CN111353070A (zh) * 2020-02-18 2020-06-30 北京百度网讯科技有限公司 视频标题的处理方法、装置、电子设备及可读存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000112966A (ja) * 1998-10-02 2000-04-21 Nippon Telegr & Teleph Corp <Ntt> ヘッドライン生成装置およびヘッドライン生成処理方法および当該方法を記述したプログラムを記録した記録媒体
JP2000339250A (ja) * 1999-05-25 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> 対話メッセージ生成方法、その装置、そのプログラムを記録した媒体
JP2001147937A (ja) * 1999-11-22 2001-05-29 Toshiba Corp 業務支援システム
JP2003076688A (ja) * 2001-08-30 2003-03-14 Just Syst Corp 文末表現簡略化装置、文末表現簡略化方法、及び文末表現簡略化プログラム
WO2005078604A1 (ja) * 2004-02-13 2005-08-25 Hitachi, Ltd. 文字表示方法
KR100865825B1 (ko) * 2004-02-13 2008-10-28 가부시키가이샤 히타치세이사쿠쇼 문자 표시 방법 및 정보 단말기
JP2005258676A (ja) * 2004-03-10 2005-09-22 Seiko Epson Corp 文書出力装置及びその制御方法
JP4572321B2 (ja) * 2004-03-10 2010-11-04 セイコーエプソン株式会社 文書出力装置及びその制御方法
JP2019057266A (ja) * 2017-09-20 2019-04-11 ヤフー株式会社 生成装置、学習装置、生成方法、学習方法、生成プログラム、学習プログラム、及びモデル
CN111353070A (zh) * 2020-02-18 2020-06-30 北京百度网讯科技有限公司 视频标题的处理方法、装置、电子设备及可读存储介质
CN111353070B (zh) * 2020-02-18 2023-08-18 北京百度网讯科技有限公司 视频标题的处理方法、装置、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
Prasad et al. The penn discourse treebank 2.0 annotation manual
CN110210952B (zh) 一种评标方法及装置
US7356541B1 (en) Processing business data using user-configured keys
Metters et al. History of offshoring knowledge services
US6947911B1 (en) Method for making contract and system for processing contract
JP2001522100A5 (ja)
CN112434501B (zh) 工单智能生成的方法、装置、电子设备及介质
CN102332133A (zh) 一种应用电子标签的虚拟物品交易方法及***
US11960842B2 (en) Methods and apparatus for natural language understanding in conversational systems using machine learning processes
JPH0944497A (ja) タイトル文作成装置
CN114549241A (zh) 合同审查方法、装置、***与计算机可读存储介质
JP2003091694A (ja) 摘要を処理する方法
CN108830610A (zh) 一种基于网络销售的合同自动生成方法、社交软件
CN1641704A (zh) 带有可视对话的自助服务终端、自助服务***及使用方法
Zhou et al. China's advertising and the export marketing learning curve: the first decade
CN2718685Y (zh) 带有可视对话的自助服务终端及自助服务***
WO2004027668A1 (ja) 不動産共同購入マッチングシステム
WO2021169094A1 (zh) 一种交易平台的商品交易方法和***
Najjar Designing e-commerce user interfaces
CN108959241A (zh) 一种基于对话记录的合同自动生成方法、社交软件
US7546304B1 (en) Configuring keys for use in processing business data
TWM590719U (zh) 基於自然語言處理的智能對話管理系統
Roberts Coming out of Covid
Uchihira Stage gate analysis in business-academia collaborative project
CN111818118B (zh) 一种基于ciwn-ii的互联网交易平台不确定性评价滤波***