JP2000298669A - Device and method for preparing document and computer readable recording medium with program making computer execute method recorded thereon - Google Patents

Device and method for preparing document and computer readable recording medium with program making computer execute method recorded thereon

Info

Publication number
JP2000298669A
JP2000298669A JP11104407A JP10440799A JP2000298669A JP 2000298669 A JP2000298669 A JP 2000298669A JP 11104407 A JP11104407 A JP 11104407A JP 10440799 A JP10440799 A JP 10440799A JP 2000298669 A JP2000298669 A JP 2000298669A
Authority
JP
Japan
Prior art keywords
document
index word
phrase
word
word list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11104407A
Other languages
Japanese (ja)
Other versions
JP2000298669A5 (en
Inventor
Naoyuki Nomura
直之 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP11104407A priority Critical patent/JP2000298669A/en
Publication of JP2000298669A publication Critical patent/JP2000298669A/en
Publication of JP2000298669A5 publication Critical patent/JP2000298669A5/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To prepare an index term list reflecting the interest and concern of a user or a user group calculating the significance of a word and a phrase appearing in a document while reflecting the interest and concern of the user or the user group. SOLUTION: This device is provided with a document storing part 200 storing documents, an extracting part 201 extracting a word and a phrase from the stored document, a processing contents storing part 202 storing the contents of processing performed to the stored document, a calculating part 203 calculating the significance of the word or phrase extracted by the means 201 on the basis of the contents of processing stored in the part 202, a preparing part 204 preparing an index term list on the basis of the word and phrase extracted by the part 201 and the significance calculated by the part 203 and an outputting part 207 outputting the index term list prepared by the part 204.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文書作成装置、文
書作成方法、およびその方法をコンピュータに実行させ
るプログラムを記録したコンピュータ読み取り可能な記
録媒体に関する。
[0001] 1. Field of the Invention [0002] The present invention relates to a document creation device, a document creation method, and a computer-readable recording medium on which a program for causing a computer to execute the method is recorded.

【0002】[0002]

【従来の技術】文書または文書群から、文書中で頻繁に
使用されている語や文書が扱っている話題を端的に表す
語等(以下「索引語」という)を抜き出して、利用者の
閲覧に供することが従来からおこなわれている。典型的
な例として、利用者にキーワードを入力させ、多数の文
書の中からそのキーワードを含む文書のみを検索して出
力するシステムにおいて、キーワード入力時の参考とな
るように、検索対象の文書群中に含まれるキーワードの
一覧を表示するものが提案されている。
2. Description of the Related Art From a document or a group of documents, words frequently used in the document or words or the like that express a topic handled by the document (hereinafter, referred to as "index words") are extracted and viewed by a user. Has been used in the past. As a typical example, in a system in which a user inputs a keyword, and only a document including the keyword is searched and output from a large number of documents, a document group to be searched is used as a reference when inputting the keyword. One that displays a list of keywords contained therein has been proposed.

【0003】また、文書に記述されている内容はそこに
出現する語から推定できることが多いため、文書要約に
代わる簡易な方法として、当該文書中の主要な語を一覧
表示することもある。あるいは複数の文書作成者の間
や、新規文書と既存文書との間で用語を統一するため
に、文書作成途中に他文書における使用語一覧を表示す
るものが提案されている。
Further, since the contents described in a document can often be estimated from words appearing in the document, a list of main words in the document may be displayed as a simple method instead of the document summarization. Alternatively, in order to unify terms between a plurality of document creators or between a new document and an existing document, a method of displaying a list of terms used in another document during document creation has been proposed.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、従来技
術においては、利用者の閲覧に供される索引語リストは
ある文書または文書群について一種類のみである。すな
わち、どの利用者に対しても、ある一定の基準(たとえ
ば、文書中での出現頻度)によって重要であると判断さ
れた語や語句のみが提示されるが、何が重要であって何
が重要でないかは利用者によって異なるため、一般的な
基準をもちいるのみでは、その利用者にとっては不要な
語があったり、逆に必要な語がなかったりするという問
題点があった。
However, in the prior art, there is only one type of index word list for a certain document or a group of documents to be browsed by a user. That is, for each user, only words or phrases that are determined to be important according to a certain standard (for example, the frequency of occurrence in a document) are presented, but what is important and what is not. The importance is different depending on the user, and there is a problem in that simply using a general criterion may result in unnecessary words for the user or no necessary words.

【0005】たとえば、文書データベースに新聞記事が
蓄積されており、当該データベースについて作成された
索引語リストに「スポーツ」「政治」および「臓器移
植」の語があげられていたとしても、通常スポーツ関連
の記事しか読まない利用者にとっては「政治」「臓器移
植」の語は不要であり、かえってこれらの語があること
によって、索引語リストから適切な語を探し出すのが困
難になるという問題点があった。
For example, even if newspaper articles are accumulated in a document database and the terms "sports", "politics" and "organ transplantation" are listed in the index word list created for the database, it is usually related to sports. For users who only read the article, the words "politics" and "organ transplantation" are unnecessary, and the fact that these words make it difficult to find an appropriate word from the index word list is a problem. there were.

【0006】反対に、情報通信関連の記事に関心のある
利用者にとっては、「情報」の語が必要であるにもかか
わらず、「情報」は出現頻度が著しく高いあるいは出現
傾向に特徴がみられない等の理由で、索引語リストには
現れない(索引語としては不適当とされる)等といった
問題点があった。
[0006] Conversely, for users who are interested in articles related to information and communication, despite the need for the word "information", "information" has a remarkably high frequency of occurrence or is characterized by a tendency to appear. For example, there is a problem that it does not appear in the index word list (it is regarded as inappropriate as an index word).

【0007】本発明は上述した従来技術による問題点を
解決するため、文書中に出現する語または語句の重要度
を、利用者または利用者のグループの興味や関心を反映
して算出することにより、利用者または利用者のグルー
プの興味や関心を反映した索引語リストを提供すること
が可能な文書作成装置、文書作成方法、およびその方法
をコンピュータに実行させるプログラムを記録したコン
ピュータ読み取り可能な記録媒体を提供することを目的
とする。
The present invention solves the above-mentioned problems of the prior art by calculating the importance of a word or phrase appearing in a document by reflecting the interest or interest of a user or a group of users. , Document creation method capable of providing an index word list reflecting the interests and interests of a user or a group of users, and a computer-readable recording recording a program for causing a computer to execute the method The purpose is to provide a medium.

【0008】[0008]

【課題を解決するための手段】上述した課題を解決し、
目的を達成するため、請求項1の発明に係る文書作成装
置は、文書を記憶する文書記憶手段と、前記文書記憶手
段により記憶された文書から語または語句を抽出する抽
出手段と、前記文書記憶手段により記憶された文書に対
しておこなわれた処理の内容を記憶する処理内容記憶手
段と、前記処理内容記憶手段により記憶された処理の内
容にもとづいて前記抽出手段により抽出された語または
語句の重要度を算出する算出手段と、前記抽出手段によ
り抽出された語または語句および前記算出手段により算
出された重要度にもとづいて索引語リストを作成する作
成手段と、を備えたことを特徴とする。
Means for Solving the Problems The above-mentioned problems are solved,
In order to achieve the above object, a document creating apparatus according to the present invention comprises: a document storage unit for storing a document; an extraction unit for extracting a word or a phrase from a document stored by the document storage unit; Processing content storage means for storing the content of the processing performed on the document stored by the means; and a word or phrase extracted by the extraction means based on the processing content stored by the processing content storage means. Calculating means for calculating the importance, and generating means for generating an index word list based on the word or phrase extracted by the extracting means and the importance calculated by the calculating means. .

【0009】この請求項1に記載の発明によれば、文書
中に出現する語または語句の重要度が、利用者または利
用者グループの興味や関心を反映して算出される。
According to the first aspect of the present invention, the importance of a word or phrase appearing in a document is calculated by reflecting the interest or interest of a user or a group of users.

【0010】また、請求項2に記載の発明に係る文書作
成装置は、請求項1に記載の発明において、前記作成手
段により作成された複数の索引語リストのうちいずれか
の索引語リストを選択する選択手段を備えたことを特徴
とする。
According to a second aspect of the present invention, in the document creating apparatus according to the first aspect of the present invention, any one of the plurality of index word lists created by the creating means is selected. A selection means for selecting

【0011】この請求項2に記載の発明によれば、複数
の索引語リストのうち所望の索引語リストだけが選択さ
れる。
According to the second aspect of the present invention, only a desired index word list is selected from the plurality of index word lists.

【0012】また、請求項3に記載の発明に係る文書作
成装置は、請求項1または2に記載の発明において、前
記作成手段により作成された索引語リストまたは前記選
択手段により選択された索引語リストを出力する出力手
段を備えたことを特徴とする。
According to a third aspect of the present invention, in the document creation apparatus according to the first or second aspect, the index word list created by the creation means or the index word selected by the selection means is selected. An output unit for outputting a list is provided.

【0013】この請求項3に記載の発明によれば、作成
された索引語リストまたは選択された索引語リストが出
力される。
According to the third aspect of the present invention, the created index word list or the selected index word list is output.

【0014】また、請求項4に記載の発明に係る文書作
成装置は、請求項3に記載の発明において、さらに、前
記文書記憶手段により記憶された文書中の語または語句
に対する処理の内容を記憶する第二の処理内容記憶手段
を備え、前記出力手段が、前記第二の処理内容記憶手段
により記憶された処理の内容にもとづいて前記作成手段
により作成された索引語リストを出力することを特徴と
する。
According to a fourth aspect of the present invention, in the document creating apparatus according to the third aspect of the present invention, further, the contents of a process for a word or a phrase in a document stored by the document storage unit are stored. And a second processing content storage means for outputting the index word list created by the creation means based on the content of the processing stored by the second processing content storage means. And

【0015】この請求項4に記載の発明によれば、なん
らかの処理がおこなわれた語や語句は索引語リストにお
いて他の語や語句と区別して出力される。
According to the fourth aspect of the present invention, a word or phrase on which some processing has been performed is output in the index word list while being distinguished from other words and phrases.

【0016】また、請求項5に記載の発明に係る文書作
成方法は、文書から語または語句を抽出する抽出工程
と、前記文書に対しておこなわれた処理の内容を記憶す
る処理内容記憶工程と、前記処理内容記憶工程により記
憶された処理の内容にもとづいて前記抽出工程により抽
出された語または語句の重要度を算出する算出工程と、
前記抽出工程により抽出された語または語句および前記
算出工程により算出された重要度にもとづいて索引語リ
ストを作成する作成工程と、備えたことを特徴とする。
According to a fifth aspect of the present invention, there is provided a document creating method, comprising: an extracting step of extracting a word or a phrase from a document; and a processing content storing step of storing the content of processing performed on the document. A calculation step of calculating the importance of the word or phrase extracted by the extraction step based on the processing content stored by the processing content storage step;
A creation step of creating an index word list based on the words or phrases extracted in the extraction step and the importance calculated in the calculation step.

【0017】この請求項5の発明によれば、文書中に出
現する語または語句の重要度が、利用者または利用者グ
ループの興味や関心を反映して算出される。
According to the fifth aspect of the present invention, the importance of a word or phrase appearing in a document is calculated by reflecting the interest or interest of a user or a group of users.

【0018】また、請求項6に記載の発明に係る文書作
成方法は、請求項5に記載の発明において、前記作成工
程により作成された複数の索引語リストのうちいずれか
の索引語リストを選択する選択工程を含んだことを特徴
とする。
According to a sixth aspect of the present invention, in the document creation method according to the fifth aspect, any one of the plurality of index word lists created in the creating step is selected. And a selecting step of performing the selection.

【0019】この請求項6に記載の発明によれば、複数
の索引語リストのうち所望の索引語リストだけが選択さ
れる。
According to the present invention, only a desired index word list is selected from the plurality of index word lists.

【0020】また、請求項7に記載の発明に係る文書作
成方法は、請求項5または6に記載の発明のおいて、前
記作成工程により作成された索引語リストまたは前記選
択工程により選択された索引語リストを出力する出力工
程を含んだことを特徴とする。
According to a seventh aspect of the present invention, there is provided the document creation method according to the fifth or sixth aspect, wherein the index word list created in the creation step or the index word list selected in the selection step is used. An output step of outputting an index term list is included.

【0021】この請求項7に記載の発明によれば、作成
された索引語リストまたは選択された索引語リストが出
力される。
According to the present invention, the created index word list or the selected index word list is output.

【0022】また、請求項8に記載の発明に係る文書作
成方法は、請求項7に記載の発明において、さらに、文
書中の語または語句に対する処理の内容を記憶する第二
の処理内容記憶工程を含み、前記出力工程は、前記第二
の処理内容記憶工程により記憶された処理の内容にもと
づいて前記作成工程により作成された索引語リストを出
力することを特徴とする。
According to a eighth aspect of the present invention, there is provided the document creation method according to the seventh aspect, further comprising a second processing content storing step of storing the content of processing for a word or phrase in the document. Wherein the output step outputs the index word list created in the creation step based on the content of the process stored in the second process content storage step.

【0023】この請求項8に記載の発明によれば、なん
らかの処理がおこなわれた語や語句は索引語リストにお
いて他の語や語句と区別して出力される。
According to the eighth aspect of the present invention, a word or phrase on which some processing has been performed is output in the index word list while being distinguished from other words and phrases.

【0024】また、請求項9の発明に係る記録媒体は、
請求項5〜8に記載された方法をコンピュータに実行さ
せるプログラムを記録したため、これによって、請求項
5〜8の処理をコンピュータに実行させることが可能と
なる。
Further, a recording medium according to the invention of claim 9 is:
Since the program for causing a computer to execute the method according to any one of claims 5 to 8 is recorded, the computer can execute the processes according to claims 5 to 8.

【0025】[0025]

【発明の実施の形態】以下に添付図面を参照して、この
発明に係る文書作成装置、文書作成方法、およびその方
法をコンピュータに実行させるプログラムを記録したコ
ンピュータ読み取り可能な記録媒体の好適な実施の形態
を詳細に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Preferred embodiments of a document creation apparatus, a document creation method, and a computer-readable recording medium storing a program for causing a computer to execute the method according to the present invention are described below with reference to the accompanying drawings. Will be described in detail.

【0026】(実施の形態1)まず、本発明の実施の形
態1による文書作成装置の構成について説明する。図1
は実施の形態1による文書作成装置のハードウェア構成
を示すブロック図である。
(Embodiment 1) First, the configuration of a document creating apparatus according to Embodiment 1 of the present invention will be described. FIG.
FIG. 2 is a block diagram showing a hardware configuration of the document creation device according to the first embodiment.

【0027】図1において、101はシステム全体を制
御するCPUを、102はブートプログラム等を記憶し
たROMを、103はCPU101のワークエリアとし
て使用されるRAMを、104はCPU101の制御に
したがってHD(ハードディスク)105に対するデー
タのリード/ライトを制御するHDD(ハードディスク
・ドライブ)を、105はHDD104の制御で書き込
まれたデータを記憶するHDを、それぞれ示している。
In FIG. 1, 101 is a CPU for controlling the whole system, 102 is a ROM storing a boot program and the like, 103 is a RAM used as a work area of the CPU 101, and 104 is an HD ( A hard disk drive (HDD) 105 controls the reading / writing of data from / to a hard disk 105, and an HD 105 stores data written under the control of the HDD 104.

【0028】また、106はCPU101の制御にした
がってFD(フロッピーディスク)107に対するデー
タのリード/ライトを制御するFDD(フロッピーディ
スク・ドライブ)を、107はFDD106の制御で書
き込まれたデータを記憶する着脱自在の記憶媒体である
FDを、108は、文書、画像、機能情報等のデータに
関するウインドウを表示するディスプレイを、それぞれ
示している。
Reference numeral 106 denotes an FDD (floppy disk drive) for controlling reading / writing of data from / to an FD (floppy disk) 107 under the control of the CPU 101, and reference numeral 107 denotes a detachable disk for storing data written under the control of the FDD 106. FD, which is a flexible storage medium, and 108, a display for displaying a window relating to data such as documents, images, and function information.

【0029】また、109は通信回線110を介してネ
ットワークNETに接続され、そのネットワークNET
と内部のインターフェイスを司るインターフェイス(I
/F)を、111は文字、数値、各種指示等の入力のた
めのキーを備えたキーボードを、112はカーソルの移
動や範囲選択、あるいはウインドウの移動やサイズの変
更等をおこなうマウスを、それぞれ示している。
Reference numeral 109 denotes a network NET connected via a communication line 110, and the network NET
And the interface that controls the internal interface (I
/ F), 111 is a keyboard having keys for inputting characters, numerical values, various instructions, etc. 112 is a mouse for moving a cursor, selecting a range, moving a window, changing a size, etc. Is shown.

【0030】また、113は画像を光学的に読み取るス
キャナを、114はウインドウに表示された内容等を印
刷するプリンタを、115は、着脱可能な記録媒体であ
るCD−ROMを、116は、CD−ROM115に対
するデータのリードを制御するCD−ROMドライブ
を、それぞれ示している。また、各部はバス100によ
り接続されている。
Reference numeral 113 denotes a scanner for optically reading an image; 114, a printer for printing the contents displayed in a window; 115, a CD-ROM as a removable recording medium; and 116, a CD-ROM. -CD-ROM drives for controlling the reading of data from the ROM 115 are shown. Each unit is connected by a bus 100.

【0031】図2は実施の形態1による文書作成装置の
機能的構成を示す機能ブロック図である。図2におい
て、文書作成装置は、文書記憶部200と、抽出部20
1と、処理内容記憶部202と、算出部203と、作成
部204と、索引語リスト記憶部205、出力部207
とを含む構成である。
FIG. 2 is a functional block diagram showing a functional configuration of the document creation device according to the first embodiment. In FIG. 2, the document creation device includes a document storage unit 200 and an extraction unit 20.
1, a processing content storage unit 202, a calculation unit 203, a creation unit 204, an index word list storage unit 205, and an output unit 207.
This is a configuration including

【0032】文書記憶部200は、索引語リストの作成
対象となる一または複数の文書(本文および属性等の本
文の付随的情報を含む)を記憶する。索引語リストの作
成対象となる文書は、図示を省略するが、文書入力部、
たとえば、キーボード111とうにより入力・作成され
た文書でもよく、また、ネットワークを介して入力され
た文書でもよく、また、スキャナ113により読み込ま
れた文書であってもよい。
The document storage unit 200 stores one or a plurality of documents (including text and accompanying information of text such as attributes) for which an index word list is to be created. Documents for which an index term list is to be created are not shown, but a document input unit,
For example, the document may be a document input and created by the keyboard 111, a document input via a network, or a document read by the scanner 113.

【0033】また、抽出部201は、文書記憶部200
に記憶された文書から語または語句を抽出する。なお、
語または語句の抽出には、形態素解析等、自然言語処理
技術をもちいるので、その詳細な内容の説明は省略す
る。
Further, the extraction unit 201 is provided in the document storage unit 200
Extract words or phrases from documents stored in. In addition,
Since the extraction of a word or phrase uses a natural language processing technique such as morphological analysis, a detailed description thereof will be omitted.

【0034】処理内容記憶部202は、文書記憶部20
0に記憶された文書に対しておこなわれた処理の内容を
記憶する。ある利用者にとって、どの語や語句が重要で
あり(したがって、索引語リストに収録すべきであり)
どの語や語句が重要でないかは、本来主観的な問題であ
って、客観的な基準により判断することが困難な場合が
ある。
The processing content storage unit 202 includes the document storage unit 20
The contents of the processing performed on the document stored in “0” are stored. Which words or phrases are important to a user (and therefore should be included in the index term list)
Which words or phrases are not important is a subjective matter in nature, and it may be difficult to judge based on objective criteria.

【0035】このような場合であっても、一般に利用者
がなんらかの処理をおこなった文書は、当該利用者にと
って興味・関心のある話題を扱った文書である可能性が
高く、そこに出現する語や語句も、当該利用者にとって
重要である可能性が高いと考えられる。
Even in such a case, in general, a document processed by a user by a user is likely to be a document dealing with a topic of interest / interest for the user. And terms are also likely to be important to the user.

【0036】上記前提のもとに、語の重要度を当該語の
出現する文書の重要度から推定し、また文書の重要度
を、当該文書に対しておこなわれた処理の内容から推定
することで、語の重要度という主観的な数値を文書に対
しておこなわれた処理の内容という客観的な事実から近
似的に求めるものである。
Under the above premise, the importance of the word is estimated from the importance of the document in which the word appears, and the importance of the document is estimated from the contents of the processing performed on the document. Thus, the subjective numerical value of the word importance is approximately determined from the objective fact of the processing performed on the document.

【0037】処理内容記憶部202に記憶される処理の
内容としては、具体的にはたとえば下記のようなものが
ある。 (1)処理の主体と客体 処理の主体、すなわち、どの利用者により、処理の客
体、すなわち、どの文書に対しておこなわれた処理であ
るか、に関するものである。
The contents of the processing stored in the processing content storage unit 202 include, for example, the following. (1) Subject of Processing and Object The subject of processing, that is, the object of processing by which user, that is, which document is being processed is related to the processing.

【0038】(2)処理の種別 文書が閲覧されたのであるか、編集されたのであるか、
等である。一般に、単に閲覧されただけの文書よりも、
たとえば文書中に下線やメモ書きが付加されたり、ある
いは当該文書が重要であることを示すなんらかの記号が
付与されたり(マーキング)した文書のほうが、文書の
利用者(処理の主体)にとって重要度が高いと判断す
る。
(2) Processing Type Whether the document has been viewed or edited,
And so on. In general, rather than just reading a document,
For example, a document with underlines or memos added in the document, or with some sign indicating that the document is important (marked) is more important to the user of the document (the subject of processing). Judge as high.

【0039】(3)処理の回数または間隔 通常、頻繁に閲覧されたり編集されたりされる文書は処
理の主体にとって重要度が高いと判断する。また、処理
回数は多くないが処理時期が短期間に集中している、あ
るいは急に処理回数が増えてきた等、処理の間隔に特徴
のある文書も重要度が高い可能性があると判断する。
(3) Number of Processes or Intervals Usually, documents that are frequently browsed or edited are judged to have high importance for the subject of processing. In addition, it is judged that a document that has a characteristic in the processing interval, such as the processing time is concentrated in a short period of time but the processing time is concentrated in a short period of time, or the processing frequency is suddenly increased, may have high importance. .

【0040】(4)処理の履歴 ある文書について、どの利用者によるどのような処理が
どのような順序でおこなわれたかにより、当該文書の重
要度を判断する。たとえば、ある部門の担当者が閲覧し
た後に別のある部門の担当者が閲覧した文書は、ある特
定の問題に関連する文書であって重要度が高いと判断す
る。
(4) History of Processing The importance of a certain document is determined based on which user performed what processing and in what order. For example, a document viewed by a person in a certain department and then viewed by a person in another certain department is a document related to a specific problem, and is determined to have a high degree of importance.

【0041】文書の重要度、あるいはそこに出現する語
や語句の重要度は、上記のような諸項目を総合的・網羅
的に評価して決定する。なお、すべての項目について評
価をおこなってもよく、また、装置の処理能力や処理時
間を考慮して、所定の項目のみを判断の対象とするよう
に設定してもよい。
The importance of a document or the importance of a word or phrase appearing in the document is determined by comprehensively and comprehensively evaluating the above items. In addition, all items may be evaluated, or only predetermined items may be set to be determined in consideration of the processing capability and processing time of the apparatus.

【0042】すなわち、処理の種別としては、文書の読
み込み(ファイルのオープン)のみとして、どの利用者
(処理の主体)により、どの文書(処理の客体)が、何
回読み込まれた(処理の回数)かをそれぞれに対応づけ
て記憶するようにしてもよい。
That is, as for the type of processing, as to only reading of a document (opening of a file), which user (subject of processing) has read which document (object of processing) and how many times (number of times of processing) ) May be stored in association with each other.

【0043】なお、実施の形態1では文書記憶部200
とは別に処理内容記憶部202を設けているが、文書の
属性の一つとして当該文書に対しておこなわれた処理内
容を保持するようにすれば、文書記憶部200と処理内
容記憶部202とは一体化させることができる。
In the first embodiment, the document storage unit 200
A processing content storage unit 202 is provided separately from the above. However, if the processing content performed on the document is held as one of the attributes of the document, the document storage unit 200 and the processing content storage unit 202 Can be integrated.

【0044】算出部203は、前記処理内容記憶部20
2に記憶された処理の内容にもとづいて、前記抽出部2
01により抽出された語または語句の重要度を算出す
る。まず、文書中から抽出された語または語句の重要度
を、所定の基準をもちいて算出する。
The calculation section 203 is provided with the processing content storage section 20.
2 based on the content of the processing stored in the extraction unit 2
The importance of the word or phrase extracted by 01 is calculated. First, the importance of a word or phrase extracted from a document is calculated using a predetermined criterion.

【0045】その基準としては、たとえば文書中でのそ
の語の出現回数をもちいることができる。すなわち、出
現回数が多いほど重要度が高いと判断することができ
る。また、同義語や類義語、または部分一致する語等の
出現回数を0.5回等所定の重みつけをしてその語の出
現回数に加算する等をおこなってもよい。
As the criterion, for example, the number of appearances of the word in the document can be used. That is, it can be determined that the greater the number of appearances, the higher the importance. Alternatively, the number of appearances of synonyms, synonyms, words that partially match, or the like may be weighted by a predetermined value, such as 0.5, and added to the number of appearances of the word.

【0046】また、たとえば、TF×IDF法等をもち
いて、他の文書中での出現頻度と比較して、その文書中
での出現頻度が特に高い語の評価値を高くするようにし
てもよい。出現回数でなくその対数値をもちいるように
してもよい。また、上記基準のいずれをもちいるかをチ
ェックボックス等により利用者が任意に選択できるよう
にしてもよい。
Further, for example, by using the TF × IDF method or the like, the evaluation value of a word having a particularly high appearance frequency in another document may be increased as compared with the appearance frequency in another document. Good. The logarithmic value may be used instead of the number of appearances. Further, the user may be allowed to arbitrarily select which of the above criteria is used by using a check box or the like.

【0047】また、索引となる語または語句は、あらか
じめ用意された索引語辞書や不要語辞書等により決定す
るようにしてもよい。すなわち、索引作成対象の文書中
から形態素解析等により切り出された候補語または語句
のうち、索引語辞書に登録されているもの、あるいは不
要語辞書に登録されていないものを索引の見出し語とす
ることができる。
The word or phrase used as an index may be determined by using an index word dictionary or unnecessary word dictionary prepared in advance. That is, among candidate words or phrases cut out from a document to be indexed by morphological analysis or the like, those registered in the index word dictionary or those not registered in the unnecessary word dictionary are set as index headwords. be able to.

【0048】また、この決定方法では対象文書の分野や
性質に沿った索引が作成できない場合には、切り出され
た候補語の対象文書中での重要度を評価して、その評価
値が一定のしきい値を越えたもののみを索引の見出し語
として採用するようにしてもよい。
If it is not possible to create an index along the field or nature of the target document by this determination method, the importance of the extracted candidate words in the target document is evaluated, and the evaluation value is fixed. Only those exceeding the threshold may be adopted as index headwords.

【0049】図3は、実施の形態1による文書作成装置
の語または語句の重要度算出のために使用する行列の一
例である。図3において、(a)は上記のようにして求
められた、語または語句の客観的な重要度を保持する行
列Gaの一例である。行列Gaは語または語句を行に、
当該語または語句の出現する文書を列にとってなる行列
であり、行列の各要素値は、ある文書に出現するある語
または語句の客観的な重要度を示している。
FIG. 3 is an example of a matrix used for calculating the importance of a word or phrase in the document creation device according to the first embodiment. In FIG. 3, (a) is an example of a matrix Ga that holds the objective importance of a word or phrase obtained as described above. The matrix Ga has words or phrases in rows,
It is a matrix in which documents in which the word or phrase appears appear as columns, and each element value of the matrix indicates the objective importance of a word or phrase appearing in a document.

【0050】つぎに、算出部203は、処理内容記憶部
202に記憶されている処理の内容にもとづいて、利用
者にとっての文書の主観的な重要度を保持する行列Gb
を作成する。図3(b)は、文書に対しておこなわれた
処理の内容を保持する行列Gbの一例である。行列Gb
は文書を行に、利用者を列にとってなる行列であり、行
列の各要素値は、直接的にはある文書がある利用者によ
って読み込まれた回数を示しているが、間接的には、あ
る利用者にとってのある文書の重要度を示している。
Next, the calculation unit 203 calculates a matrix Gb that holds the subjective importance of the document to the user based on the processing content stored in the processing content storage unit 202.
Create FIG. 3B is an example of a matrix Gb that holds the content of the processing performed on the document. Matrix Gb
Is a matrix with documents as rows and users as columns, and each element value of the matrix directly indicates the number of times a document has been read by a user, but indirectly, Indicates the importance of a document to the user.

【0051】Ga・Gbを計算することにより、ある利
用者にとっての、ある語または語句の主観的な重要度を
保持する行列が得られるが、さらに実施の形態1におい
ては、利用者の他の利用者に対する相対的な重要度につ
いても考慮するようにしている。
By calculating Ga · Gb, a matrix that holds the subjective importance of a certain word or phrase to a certain user is obtained. The relative importance to the user is also taken into account.

【0052】すなわち同じ1回の読み込みでも、部長で
ある利用者甲により読み込まれた場合は1.5回、新人
である利用者乙により読み込まれた場合は0.8回等
と、主体の重要度によって処理の回数すなわち行列Gb
の要素値を補正するようにしている。図3(c)に、行
列Gbの要素値を利用者の相対的な重要度にもとづいて
補正するための行列Gcの一例を示す。この行列Gcは
あらかじめ用意されたものをもちいる。
That is, even if the same reading is performed once, when the reading is performed by the user, the manager, 1.5 times, and when the reading is performed by the new user, the reading is 0.8 times. The number of processes depending on the degree, that is, the matrix Gb
Is corrected. FIG. 3C shows an example of the matrix Gc for correcting the element values of the matrix Gb based on the relative importance of the user. The matrix Gc is prepared in advance.

【0053】上記のようにして求められた行列Ga、G
bおよびGcから、下記計算式により、GP(Group Pe
rsonalized)行列を求める。 GP=Ga・Gb・Gc
The matrices Ga, G obtained as described above
b and Gc, the GP (Group Pe)
rsonalized) matrix. GP = Ga ・ Gb ・ Gc

【0054】上記GP行列は、文書から抽出された語ま
たは語句を行に、文書に対する利用者を列にとってなっ
ており、行列の各要素値は、ある利用者にとってのある
語または語句の主観的な重要度に、当該利用者の他の利
用者に対する相対的な重要度を加味して求められた値と
なっている。上記GP行列の一例を図4(a)に示す。
図4は、実施の形態1による文書作成装置の語または語
句の重要度算出のために使用するGP行列の一例であ
る。
In the GP matrix, the words or phrases extracted from the document are arranged in rows, and the users of the documents are listed in columns. Each element value of the matrix is a subjective value of a certain word or phrase for a certain user. The value is obtained in consideration of the relative importance of the user with respect to other users in addition to the important importance. FIG. 4A shows an example of the GP matrix.
FIG. 4 is an example of a GP matrix used for calculating the importance of a word or phrase in the document creation device according to the first embodiment.

【0055】そして算出部203は、上記GP行列の各
行の要素値の総和を求め、その総和を要素数で割ること
により平均値を求め、さらにその平均値を文書の処理回
数の総数で割ることにより、最終的に図4(b)に例示
するGPベクトルを取得する。
The calculating unit 203 calculates the sum of the element values of each row of the GP matrix, divides the sum by the number of elements to obtain an average value, and further divides the average value by the total number of document processing times. As a result, the GP vector illustrated in FIG. 4B is finally obtained.

【0056】GPベクトルの各要素値は、ある語または
語句の、ある利用者のグループにとっての主観的な重要
度を示している。なお、平均値をさらに文書の総処理回
数で割るのは、処理回数が増えるにしたがって行列Gb
の各要素値、または、GP行列の各要素値が無限に増大
してゆくのを防ぐためである。
Each element value of the GP vector indicates the subjective importance of a certain word or phrase to a certain group of users. The average value is further divided by the total number of processing of the document because the matrix Gb
This is to prevent each element value of or of the GP matrix from increasing indefinitely.

【0057】つぎに作成部204は、前記抽出部201
により抽出された語または語句の中から、前記算出部2
03により算出された重要度が一定のしきい値を越えた
語または語句を抜き出して、索引語リストを作成する。
このしきい値はあらかじめ用意されたものをもちいる。
また、抜き出す語の概数を決めておいて、索引語の総数
がその数となるように自動的にしきい値を変更するよう
にしてもよい。
Next, the creating unit 204 is configured to
Calculating unit 2 from the words or phrases extracted by
Words or phrases whose importance calculated in step S03 exceeds a certain threshold are extracted to create an index word list.
This threshold value is prepared in advance.
Alternatively, the approximate number of words to be extracted may be determined, and the threshold value may be automatically changed so that the total number of index words becomes the number.

【0058】索引語リスト記憶部205は、作成部20
4により作成された索引語リストを記憶する。索引語リ
ストには任意の名称を付与することができる。なお、索
引語リストの作成日時や作成者等を、索引語リストの属
性としてあわせて索引語リスト記憶部204に記憶する
ようにしてもよい。
The index word list storage unit 205 includes the creation unit 20
4 is stored. An arbitrary name can be given to the index word list. The date and time of creation of the index word list, the creator, and the like may be stored in the index word list storage unit 204 together with the attributes of the index word list.

【0059】ここで、従来技術により作成される索引語
リストと本発明により作成される索引語リストとが、具
体的にどのように異なってくるかを図3の例をもちいて
説明する。図3(b)を見ると、利用者甲・乙・丙とも
に文書Cの閲覧頻度が高く、図3(a)を見ると、文書
C中では「スポーツ」の語の重要度が高いことから、利
用者甲・乙・丙からなるグループは、スポーツに関する
文書について興味・関心を持っていることが推測され
る。
Here, how the index word list created by the prior art and the index word list created by the present invention are specifically different from each other will be described with reference to the example of FIG. Referring to FIG. 3B, the frequency of browsing the document C is high for both users A, B, and Hei. In FIG. 3A, the word “sports” is highly important in the document C. It is presumed that the group consisting of users A, B and Hei has interest in sports documents.

【0060】通常は、たとえば単純に行列Gaの各行の
要素値の平均をとって(この値は、文書群全体の中での
ある語または語句の客観的な重要度を示していると考え
られる)、この値が一定のしきい値以上(たとえば1.
5以上)であるものを索引語とするため、図3の例では
「スポーツ」「政治」「臓器移植」の三つが索引語とさ
れることになる。
Normally, for example, simply averaging the element values of each row of the matrix Ga (this value is considered to indicate the objective importance of a word or phrase in the entire document group) ), This value is above a certain threshold (for example, 1.
5) are used as index words, so in the example of FIG. 3, three words of “sports”, “politics”, and “organ transplant” are used as index words.

【0061】これに対して、GPベクトルの要素値が一
定のしきい値以上(たとえば1.5以上)であるものを
索引語とすることで、同じ例で索引語とされるのは「ス
ポーツ」の一語のみである。このように、利用者または
そのグループの興味や関心にあわせた索引語リストを作
成することが可能である。
On the other hand, if an element whose GP vector element value is equal to or more than a predetermined threshold value (for example, 1.5 or more) is used as an index word, the same example is used as an index word in “sports”. Is only one word. In this way, it is possible to create an index word list according to the interests or interests of the user or the group.

【0062】入力部206は、文書記憶部200に文書
を格納し、あるいは索引語リストを作成、出力または記
憶すべき旨の利用者からの指示を入力する。指示の入力
はキーボードやマウス等をもちいておこなってもよく、
あるいはネットワークを介して他の文書作成装置、文書
検索装置等の除法処理装置からおこなうものであっても
よい。
The input unit 206 stores a document in the document storage unit 200 or inputs an instruction from a user to create, output, or store an index word list. Instructions may be input using a keyboard, mouse, etc.
Alternatively, the processing may be performed from a removal processing device such as another document creation device or a document search device via a network.

【0063】また、出力部207は、作成部204によ
り作成された索引語リストをディスプレイに108より
表示、またはプリンタ114により印刷したり、あるい
はネットワークを介して他の装置に転送したりする。こ
れにより、作成された検索ゴリストの有効活用を図るこ
とができる。なお、作成部204には、図示を省略する
が、索引語リストを選択する選択機能を備えるようにし
てもよい。それにより、選択した索引語リストのみを出
力する。
The output unit 207 displays the index word list created by the creating unit 204 on the display 108, prints it out with the printer 114, or transfers it to another device via a network. As a result, the created search goal list can be effectively used. Although not shown, the creation unit 204 may include a selection function of selecting an index word list. Thereby, only the selected index word list is output.

【0064】なお、索引語リストの作成を指示する際に
は、どの文書について、またどの利用者にとっての索引
語リストを作成するのかをあわせて指定する(前記算出
部203は、ここで指定された文書を行列Gaの列項目
とし、利用者を行列Gbの列項目として、GPベクトル
を算出する)。
When instructing the creation of the index word list, the user also designates which document and for which user the index word list is to be created (the calculation unit 203 is designated here). The GP vector is calculated using the document as a column item of the matrix Ga and the user as a column item of the matrix Gb).

【0065】これにより、任意の文書について、任意の
利用者の観点からみた索引語リストを作成することがで
きる。ただし、特段の指定がなければ、文書記憶部20
0に記憶されているすべての文書、および当該指示を入
力した利用者が属するグループのすべての利用者が指定
されたものとみなしてもよい。このようにしておくこと
で、利用者は特段の操作なしに、自己の興味や関心に沿
った索引語リストを作成することができる。
As a result, it is possible to create an index word list for an arbitrary document from the viewpoint of an arbitrary user. However, unless otherwise specified, the document storage unit 20
All the documents stored in “0” and all the users of the group to which the user who has input the instruction belongs may be regarded as being designated. By doing so, the user can create an index word list according to his or her interests without any special operation.

【0066】また、索引語リストの出力を指示する際に
は、どの索引語リストを出力するのか、またどこに対し
て出力するのかをあわせて指定する。索引語リストの出
力を指示するための画面の一例を図5に示す。図5は、
実施の形態1による文書作成装置の索引語リストの出力
を指示するための画面の一例である。
When instructing to output an index word list, the user also designates which index word list is to be output and to which output. FIG. 5 shows an example of a screen for instructing the output of the index word list. FIG.
6 is an example of a screen for instructing the document creation device according to Embodiment 1 to output an index word list.

【0067】図5において、501は索引語リストの一
覧を表示するためのウィンドウ、また502は選択され
ている索引語リストの内容を表示するためのウィンドウ
である。選択されている索引語リストは反転表示され
る。別の索引語リストを選択するには、所望の索引語リ
ストの上でマウス112をもちいてクリックするか、あ
るいはトグル・スイッチ503の上でマウス112をも
ちいてクリックすることにより、選択されている索引語
リストの直前、または直後の索引語リストを順次選択し
てゆくことができる。
In FIG. 5, reference numeral 501 denotes a window for displaying a list of index word lists, and 502 denotes a window for displaying the contents of the selected index word list. The selected index word list is highlighted. To select another index word list, the mouse 112 is clicked on the desired index word list, or the mouse 112 is clicked on the toggle switch 503 and selected. The index word list immediately before or immediately after the index word list can be sequentially selected.

【0068】また印刷ボタン504が押下されたとき
は、選択されている索引語リストの内容をプリンタに出
力する。送信ボタン505が押下されたときは、選択さ
れている索引語リストの内容をe−Mail等の電子メ
ールとして送信する。なお電子メールの宛先は、別途宛
先設定のための画面を表示して利用者に指定させてもよ
いが、たとえば当該索引語リストの作成時に指定された
利用者(すなわち、前記行列Gbの列項目となった利用
者)等、当該索引語リストに関係のある利用者を自動的
に設定するようにしてもよい。
When the print button 504 is pressed, the contents of the selected index word list are output to the printer. When the send button 505 is pressed, the contents of the selected index word list are sent as e-mail such as e-mail. The destination of the e-mail may be separately designated by the user by displaying a screen for setting the destination. For example, the user designated at the time of creating the index word list (that is, the column item of the matrix Gb) The user related to the index word list may be automatically set.

【0069】なお、索引語リストの出力指示が索引語リ
スト作成指示の直後になされたときは、図4の画面を表
示せず、そのまま直前に作成された索引語リストを画面
表示するようにしてもよい。
When the index word list output instruction is given immediately after the index word list creation instruction, the screen of FIG. 4 is not displayed, and the index word list created immediately before is displayed on the screen. Is also good.

【0070】なお、文書記憶部200、抽出部201、
処理内容記憶部202、算出部203、作成部204、
索引語リスト記憶部205、入力部206および出力部
207の全部または一部は、それぞれROM102、R
AM103またはハードディスク105、フロッピーデ
ィスク107、CD−ROM115等の記録媒体に記録
されたプログラムに記載された命令にしたがってCPU
101等が命令処理を実行することにより、各部の機能
を実現するものである。
The document storage unit 200, the extraction unit 201,
Processing content storage unit 202, calculation unit 203, creation unit 204,
All or a part of the index word list storage unit 205, the input unit 206, and the output unit 207 are
CPU 103 according to instructions written in a program recorded on a recording medium such as AM 103 or hard disk 105, floppy disk 107, CD-ROM 115, etc.
The function of each unit is realized by executing instruction processing by 101 and the like.

【0071】つぎに、実施の形態1による文書作成装置
の動作の内容について説明する。図6は、実施の形態1
による文書作成装置の一連の動作の手順を示すフローチ
ャートである。
Next, the operation of the document creating apparatus according to the first embodiment will be described. FIG. 6 shows the first embodiment.
Is a flowchart showing a procedure of a series of operations of the document creation device according to the first embodiment.

【0072】図6のフローチャートにおいて、まず、ス
テップS601において利用者からの指示を待ち、指示
があったときは、ステップS602においてそれが索引
語リストを作成すべき旨の指示であるかどうかを判定
し、索引語リストを作成すべき旨の指示であるとき(ス
テップS602肯定)はステップS603に移行し、索
引語リストを作成すべき旨の指示でないとき(ステップ
S602否定)はステップS606に移行する。
In the flowchart of FIG. 6, first, in step S601, an instruction from the user is waited. If there is an instruction, it is determined in step S602 whether the instruction is an instruction to create an index word list. If it is an instruction to create an index word list (Yes at Step S602), the process proceeds to Step S603, and if it is not an instruction to create an index word list (No at Step S602), the process proceeds to Step S606. .

【0073】ステップS603において、索引語リスト
の作成対象となる文書から語または語句を抽出する。ス
テップS604において、ステップS603で抽出され
た語または語句の重要度を算出する。そしてステップS
605において、ステップS604で算出された重要度
にもとづいて索引語リストを作成した後、処理を終了す
る。
In step S603, words or phrases are extracted from the document for which the index word list is to be created. In step S604, the importance of the word or phrase extracted in step S603 is calculated. And step S
In step 605, an index term list is created based on the importance calculated in step S604, and the process ends.

【0074】ステップS606において、ステップS6
01で入力された利用者からの指示が、索引語リストを
出力すべき旨の指示であるかどうかを判定する。索引語
リストを出力すべき旨の指示であるとき(ステップS6
06肯定)は、ステップS607において索引語リスト
を出力した後、処理を終了する。索引語リストを出力す
べき旨の指示でないとき(ステップS606否定)は、
ステップS608に移行する。
In step S606, step S6
It is determined whether or not the instruction input by the user at 01 is an instruction to output the index word list. When the instruction is to output the index word list (step S6)
(06 affirmative): After outputting the index word list in step S607, the process ends. When it is not an instruction to output the index word list (No at Step S606),
The process moves to step S608.

【0075】ステップS608において、ステップS6
01で入力された利用者からの指示が、索引語リストを
記憶すべき旨の指示であるかどうかを判定する。索引語
リストを記憶すべき旨の指示であるとき(ステップS6
08肯定)は、ステップS609において索引語リスト
を記憶した後、処理を終了する。索引語リストを記憶す
べき旨の指示でないとき(ステップS609否定)は、
何もせずに処理を終了する。
In step S608, step S6
It is determined whether or not the instruction from the user input at 01 is an instruction to store the index word list. When the instruction is to store the index word list (step S6)
08 is affirmative), the process ends after storing the index word list in step S609. If it is not an instruction to store the index word list (No at Step S609),
The process ends without doing anything.

【0076】以上説明したように、実施の形態1によれ
ば、文書中に出現する語または語句の重要度が利用者ま
たは利用者のグループの興味や関心を反映して算出され
るため、利用者または利用者のグループの興味や関心を
反映した索引語リストを提供することが可能である。ま
た、複数の索引語リストの中から、利用者が所望する任
意の索引語リストを提供することが可能である。
As described above, according to the first embodiment, the importance of a word or phrase appearing in a document is calculated by reflecting the interest or interest of a user or a group of users. It is possible to provide an index word list reflecting the interests and interests of a group of users or users. Further, it is possible to provide an arbitrary index word list desired by the user from a plurality of index word lists.

【0077】(実施の形態2)さて、上述した実施の形
態1では、文書中に出現する語または語句の重要度が利
用者または利用者のグループの興味や関心を反映して算
出して、算出結果にもとづいて索引語リストを出力する
ようにしたが、以下に説明する実施の形態2のように、
さらに、文書に対して処理がおこなわれた語や語句は索
引語リストにおいて他の語や語句と区別して出力するよ
うにしてもよい。なお、この発明の実施の形態2による
文書作成装置のハードウエア構成については、図1に示
した実施の形態1と同様であるので、その説明を省略す
る。
Second Embodiment In the first embodiment, the importance of a word or phrase appearing in a document is calculated by reflecting the interest or interest of a user or a group of users. Although the index term list is output based on the calculation result, as in the second embodiment described below,
Furthermore, the words and phrases processed on the document may be output in the index word list while being distinguished from other words and phrases. Note that the hardware configuration of the document creation device according to the second embodiment of the present invention is the same as that of the first embodiment shown in FIG. 1, and a description thereof will be omitted.

【0078】まず、本発明の実施の形態2による文書作
成装置の構成について説明する。図6は実施の形態2に
よる文書作成装置の機能的構成を示す機能ブロック図で
ある。図6において、文書記憶部700、抽出部70
1、算出部703、作成部704、索引語リスト記憶部
705および入力部706は、それぞれ実施の形態1の
文書記憶部200、抽出部201、算出部203、作成
部204、索引語リスト記憶部205および入力部20
6と同様の構成であるので詳細な説明を省略する。
First, the configuration of the document creation device according to the second embodiment of the present invention will be described. FIG. 6 is a functional block diagram showing a functional configuration of the document creation device according to the second embodiment. In FIG. 6, a document storage unit 700 and an extraction unit 70
1. The calculation unit 703, the creation unit 704, the index word list storage unit 705, and the input unit 706 are respectively the document storage unit 200, the extraction unit 201, the calculation unit 203, the creation unit 204, and the index word list storage unit of the first embodiment. 205 and input unit 20
6, the detailed description is omitted.

【0079】なお、文書記憶部700、抽出部701、
処理内容記憶部702(第一の処理内容記憶部702
a、第二の処理内容記憶部702b)、算出部703、
作成部704、索引語リスト記憶部275、入力部70
6および出力部707の全部または一部は、それぞれR
OM102、RAM103またはハードディスク10
5、フロッピーディスク107、CD−ROM115等
の記録媒体に記録されたプログラムに記載された命令に
したがってCPU101等が命令処理を実行することに
より、各部の機能を実現するものである。
The document storage unit 700, the extraction unit 701,
Processing content storage unit 702 (first processing content storage unit 702
a, a second processing content storage unit 702b), a calculation unit 703,
Creation unit 704, index word list storage unit 275, input unit 70
6 and the output unit 707 are all or partially R
OM 102, RAM 103 or hard disk 10
5. The function of each unit is realized by the CPU 101 or the like executing the instruction processing according to the instruction described in the program recorded on the recording medium such as the floppy disk 107 and the CD-ROM 115.

【0080】実施の形態2による処理内容記憶部702
は、文書記憶部700に記憶された文書に対しておこな
われた処理の内容を記憶する第一の処理内容記憶部70
2aと、文書記憶部700に記憶された文書中の語また
は語句に対する処理の内容を記憶する第二の処理内容記
憶部702bとから構成される。第一の処理内容記憶部
702aは、実施の形態1の処理内容記憶部202と同
様であるので詳細な説明を省略する。
Processing content storage unit 702 according to the second embodiment
Is a first processing content storage unit 70 that stores the content of the processing performed on the document stored in the document storage unit 700.
2a, and a second processing content storage unit 702b that stores the content of processing for words or phrases in the document stored in the document storage unit 700. The first processing content storage unit 702a is the same as the processing content storage unit 202 according to the first embodiment, and a detailed description thereof will be omitted.

【0081】第二の処理内容記憶部702bは、文書記
憶部700に記憶された文書中の語または語句に対し
て、たとえば下線やメモ書きが付加された、あるいはク
リップボードにコピーされた等、その語が重要であるこ
とを示唆するなんらかの処理がおこなわれたときに、当
該処理の内容を記憶する。
The second processing content storage unit 702b stores, for example, a word or phrase in the document stored in the document storage unit 700, such as an underline or a memo, or a copy to the clipboard. When any processing indicating that the word is important is performed, the contents of the processing are stored.

【0082】具体的な処理の内容として、実施の形態2
においては、処理の種別はクリップボードへのコピーの
みとし、どの利用者により(処理の主体)、どの語や語
句が(処理の客体)コピーされたかを対応づけて記憶す
るようにしている。なお処理対象となった語や語句は、
コピーされた文章から、形態素解析等の自然言語処理技
術をもちいて抽出する。
The specific processing contents are described in the second embodiment.
In, the type of processing is only copying to the clipboard, and which user (subject of processing) and which word or phrase (object of processing) was copied is stored in association with each other. The words and phrases that were processed are
From the copied text, extraction is performed using natural language processing technology such as morphological analysis.

【0083】出力部707は、索引語リストの出力時に
前記第二の処理内容記憶部702bを参照して、出力す
る索引語リストに含まれ、かつその索引語リストの作成
時に指定された利用者(すなわち、前記行列Gbの列項
目となった利用者)によって処理された語や語句があれ
ば、その出力形態を他の語や語句とは異ならせて区別可
能な状態で出力する。たとえば、当該索引語の表示色を
変えたり、また当該索引語にアンダーラインを引いたり
することで、区別可能な状態として出力することができ
る。
The output unit 707 refers to the second processing content storage unit 702b when outputting the index word list, and refers to the user included in the index word list to be output and designated at the time of creating the index word list. If there is a word or phrase processed by the user (that is, a user who has become a column item of the matrix Gb), the output form is different from other words or phrases and output in a distinguishable state. For example, by changing the display color of the index word or by underlining the index word, the index word can be output as a distinguishable state.

【0084】以上説明したように、実施の形態2によれ
ば、文書に対して処理がおこなわれた語や語句は索引語
リストにおいて他の語や語句と区別して出力されるた
め、重要度のとくに高い語や語句を索引語リスト中で容
易に識別することが可能である。
As described above, according to the second embodiment, the words or phrases processed on the document are output in the index word list while being distinguished from other words or phrases. Particularly high words and phrases can be easily identified in the index word list.

【0085】なお、実施の形態1または2で説明した文
書作成装置において、上記各種要因を各々取り込んだ複
数種類の表示を切り替えられるスイッチ(ボタン)を提
供するマルチ・ビュー機能を合わせて搭載してもよい。
このマルチ・ビュー機能は各ビューのスキーマ、たとえ
ば、日付、著者者、タイトル等のタブ部分をマウス11
2等をもちいてクリックすることにより切替動作をさせ
るようなグラフィカル・ユーザー・インターフェイスを
複合した動作を組み合わせることにより実現する。
In the document creation apparatus described in the first or second embodiment, a multi-view function for providing a switch (button) for switching between a plurality of types of displays, each of which incorporates the above various factors, is provided. Is also good.
This multi-view function allows the user to copy the schema of each view, for example, tabs such as date, author, title, etc.
This is realized by combining operations that combine a graphical user interface, such as performing a switching operation by clicking with 2 or the like.

【0086】また、実施の形態1または2で説明した文
書作成方法は、あらかじめ用意されたプログラムをパー
ソナルコンピュータやワークステーション等のコンピュ
ータで実行することにより実現される。このプログラム
は、ハードディスク、フロッピーディスク、CD−RO
M、MO、DVD等のコンピュータで読み取り可能な記
録媒体に記録され、コンピュータによって記録媒体から
読み出されることによって実行される。またこのプログ
ラムは、上記記録媒体を介して、インターネット等のネ
ットワークを介して配布することができる。
The document creation method described in the first or second embodiment is realized by executing a prepared program on a computer such as a personal computer or a workstation. This program is for hard disk, floppy disk, CD-RO
The program is recorded on a computer-readable recording medium such as M, MO, and DVD, and is executed by being read from the recording medium by the computer. This program can be distributed via the recording medium and a network such as the Internet.

【0087】[0087]

【発明の効果】以上説明したように、請求項1に記載の
発明によれば、文書記憶手段が文書を記憶し、抽出手段
が前記文書記憶手段により記憶された文書から語または
語句を抽出し、処理内容記憶手段が前記文書記憶手段に
より記憶された文書に対しておこなわれた処理の内容を
記憶し、算出手段が前記処理内容記憶手段により記憶さ
れた処理の内容にもとづいて前記抽出手段により抽出さ
れた語または語句の重要度を算出し、作成手段が前記抽
出手段により抽出された語または語句および前記算出手
段により算出された重要度にもとづいて索引語リストを
作成するため、文書中に出現する語または語句の重要度
が、利用者または利用者グループの興味や関心を反映し
て算出され、これによって、利用者または利用者のグル
ープの興味や関心を反映した索引語リストを作成するこ
とが可能な文書作成装置が得られるという効果を有す
る。
As described above, according to the first aspect of the present invention, the document storage means stores a document, and the extraction means extracts a word or phrase from the document stored by the document storage means. A processing content storing means for storing the content of the processing performed on the document stored by the document storing means, and a calculating means for storing the processing content by the extracting means based on the processing content stored by the processing content storing means. To calculate the importance of the extracted word or phrase, and to generate an index word list based on the word or phrase extracted by the extraction means and the importance calculated by the calculation means, The importance of the appearing word or phrase is calculated to reflect the interests or interests of the user or group of users, and thus the interests or interests of the user or group of users Reflecting the index word document creation device capable of creating a list having an effect that can be obtained.

【0088】また、請求項2に記載の発明によれば、請
求項1に記載の発明において、前記選択手段が、前記作
成手段により作成された複数の索引語リストのうちいず
れかの索引語リストを選択するため、複数の索引語リス
トのうち所望の索引語リストだけが選択され、これによ
って、利用者または利用者のグループの興味や関心を反
映した索引語リストを提供することが可能な文書作成装
置が得られるという効果を有する。
According to a second aspect of the present invention, in the first aspect of the present invention, the selecting means selects one of the plurality of index word lists created by the creating means. In order to select a document, only a desired index term list is selected from the plurality of index term lists, thereby providing an index term list reflecting the interests and interests of the user or the group of users. This has the effect that a creation device can be obtained.

【0089】また、請求項3に記載の発明によれば、請
求項1または2に記載の発明において、出力手段が、前
記作成手段により作成された索引語リストまたは前記選
択手段により選択された索引語リストを出力するため、
利用者または利用者のグループの興味や関心を反映した
作成された索引語リストを活用することが可能な文書作
成装置が得られるという効果を有する。
According to a third aspect of the present invention, in the first or second aspect of the invention, the output unit includes the index word list created by the creation unit or the index selected by the selection unit. To output a word list,
This has the effect of providing a document creation device capable of utilizing the created index word list reflecting the interests and interests of the user or the group of users.

【0090】また、請求項4に記載の発明によれば、請
求項3に記載の発明において、さらに、第二の処理内容
記憶手段が、前記文書記憶手段により記憶された文書中
の語または語句に対する処理の内容を記憶し、前記出力
手段が、前記第二の処理内容記憶手段により記憶された
処理の内容にもとづいて前記作成手段により作成された
索引語リストを出力するため、なんらかの処理がおこな
われた語や語句は索引語リストにおいて他の語や語句と
区別して出力され、重要度のとくに高い語や語句を索引
語リスト中で容易に識別することができ、これによっ
て、利用者または利用者のグループの興味や関心を反映
した索引語リストを活用することが可能な文書作成装置
が得られるという効果を有する。
According to a fourth aspect of the present invention, in the third aspect of the present invention, the second processing content storage means further comprises a word or phrase in the document stored by the document storage means. The output means outputs the index word list created by the creation means based on the content of the process stored by the second processing content storage means, so that some processing is performed. The words and phrases that are output are distinguished from other words and phrases in the index word list, and words or phrases with particularly high importance can be easily identified in the index word list. This is advantageous in that a document creation device capable of utilizing an index word list reflecting the interests and interests of a group of persons is obtained.

【0091】また、請求項5の発明によれば、抽出工程
が、文書から語または語句を抽出し、処理内容記憶工程
が、前記文書に対しておこなわれた処理の内容を記憶
し、算出工程が、前記処理内容記憶工程により記憶され
た処理の内容にもとづいて前記抽出工程により抽出され
た語または語句の重要度を算出し、作成工程が、前記抽
出工程により抽出された語または語句および前記算出工
程により算出された重要度にもとづいて索引語リストを
作成するため、文書中に出現する語または語句の重要度
が利用者または利用者グループの興味や関心を反映して
算出され、これによって、利用者または利用者のグルー
プの興味や関心を反映した索引語リストを作成すること
が可能な文書作成方法が得られるという効果を有する。
According to the fifth aspect of the present invention, the extracting step extracts a word or a phrase from the document, and the processing content storing step stores the content of the processing performed on the document, and calculates Calculates the importance of the word or phrase extracted by the extraction process based on the content of the process stored by the process content storage process, and the creation process includes the word or phrase extracted by the extraction process and the In order to create an index word list based on the importance calculated in the calculation process, the importance of the word or phrase appearing in the document is calculated reflecting the interest or interest of the user or user group, thereby This has the effect that a document creation method capable of creating an index word list reflecting the interests or interests of a user or a group of users can be obtained.

【0092】また、請求項6に記載の発明によれば、請
求項5に記載の発明において、前記選択工程が、前記作
成工程により作成された複数の索引語リストのうちいず
れかの索引語リストを選択するため、複数の索引語リス
トのうち所望の索引語リストだけが選択され、これによ
って、利用者または利用者のグループの興味や関心を反
映した索引語リストを提供することが可能な文書作成方
法が得られるという効果を有する。
[0092] According to the invention described in claim 6, in the invention described in claim 5, the selecting step includes selecting one of the plurality of index word lists created in the creating step. In order to select a document, only a desired index term list is selected from the plurality of index term lists, thereby providing an index term list reflecting the interests and interests of the user or the group of users. This has the effect that a creation method can be obtained.

【0093】また、請求項7に記載の発明によれば、請
求項5または6に記載の発明において、出力工程が、前
記作成工程により作成された索引語リストまたは前記選
択工程により選択された索引語リストを出力するため、
利用者または利用者のグループの興味や関心を反映した
作成された索引語リストを活用することが可能な文書作
成方法が得られるという効果を有する。
[0093] According to the invention described in claim 7, in the invention described in claim 5 or 6, the output step is performed by the index word list created in the creation step or the index selected in the selection step. To output a word list,
This has the effect of providing a document creation method that can utilize the created index word list reflecting the interests or interests of the user or the group of users.

【0094】また、請求項8に記載の発明によれば、請
求項7に記載の発明において、さらに、第二の処理内容
記憶工程が、前記文書記憶工程により記憶された文書中
の語または語句に対する処理の内容を記憶し、前記出力
工程が、前記第二の処理内容記憶工程により記憶された
処理の内容にもとづいて前記作成工程により作成された
索引語リストを出力するため、なんらかの処理がおこな
われた語や語句は索引語リストにおいて他の語や語句と
区別して出力され、重要度のとくに高い語や語句を索引
語リスト中で容易に識別することができ、これによっ
て、利用者または利用者のグループの興味や関心を反映
した索引語リストを活用することが可能な文書作成方法
が得られるという効果を有する。
According to the invention described in claim 8, in the invention described in claim 7, the second processing content storing step further includes the step of storing words or phrases in the document stored by the document storing step. Some processing is performed because the output process outputs the index word list created in the creation process based on the content of the process stored in the second process content storage process. The words and phrases that are output are distinguished from other words and phrases in the index word list, and words or phrases with particularly high importance can be easily identified in the index word list. This is advantageous in that a document creation method capable of utilizing an index word list reflecting the interests and interests of a group of persons is obtained.

【0095】また、請求項9の発明に係る記録媒体は、
請求項5〜8に記載された方法をコンピュータに実行さ
せるプログラムを記録したため、これによって、請求項
5〜8の処理をコンピュータに実行させることが可能と
なるという効果を有する。
The recording medium according to the ninth aspect of the present invention
Since a program for causing a computer to execute the method according to any one of claims 5 to 8 is recorded, this has an effect that the processing according to claims 5 to 8 can be executed by a computer.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態1による文書作成装置のハ
ードウェア構成を示す説明図である。
FIG. 1 is an explanatory diagram illustrating a hardware configuration of a document creation device according to a first embodiment of the present invention.

【図2】実施の形態1による文書作成装置の機能的構成
を示すブロック図である。
FIG. 2 is a block diagram showing a functional configuration of the document creation device according to the first embodiment.

【図3】実施の形態1による文書作成装置の語または語
句の重要度算出のために使用する行列の一例である。
FIG. 3 is an example of a matrix used for calculating the importance of a word or phrase in the document creation device according to the first embodiment.

【図4】実施の形態1による文書作成装置の語または語
句の重要度算出のために使用するGP行列の一例であ
る。
FIG. 4 is an example of a GP matrix used for calculating the importance of a word or phrase in the document creation device according to the first embodiment.

【図5】実施の形態1による文書作成装置の索引語リス
トの出力を指示するための画面の一例である。
FIG. 5 is an example of a screen for instructing output of an index word list of the document creation device according to the first embodiment.

【図6】実施の形態1による文書作成装置の一連の動作
の手順を示すフローチャートである。
FIG. 6 is a flowchart showing a sequence of a series of operations of the document creation device according to the first embodiment.

【図7】実施の形態2による文書作成装置の機能的構成
を示すブロック図である。
FIG. 7 is a block diagram showing a functional configuration of a document creation device according to a second embodiment.

【符号の説明】[Explanation of symbols]

100 バス 101 CPU 102 ROM 103 RAM 104 HDD 105 HD 106 FDD 107 FD 108 ディスプレイ 109 I/F 110 通信回線 111 キーボード 112 マウス 113 スキャナ 114 プリンタ 115 CD−ROM 116 CD−ROMドライブ 200、700 文書記憶部 201、701 抽出部 202、702 処理内容記憶部 203、703 算出部 204、704 作成部 205、705 索引語リスト記憶部 206、706 入力部 207、707 出力部 702a 第一の処理内容記憶部 702b 第二の処理内容記憶部 100 Bus 101 CPU 102 ROM 103 RAM 104 HDD 105 HD 106 FDD 107 FD 108 Display 109 I / F 110 Communication line 111 Keyboard 112 Mouse 113 Scanner 114 Printer 115 CD-ROM 116 CD-ROM drive 200, 700 Document storage unit 201, 701 extraction unit 202, 702 processing content storage unit 203, 703 calculation unit 204, 704 creation unit 205, 705 index word list storage unit 206, 706 input unit 207, 707 output unit 702a first processing content storage unit 702b second Processing content storage

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 文書を記憶する文書記憶手段と、 前記文書記憶手段により記憶された文書から語または語
句を抽出する抽出手段と、 前記文書記憶手段により記憶された文書に対しておこな
われた処理の内容を記憶する処理内容記憶手段と、 前記処理内容記憶手段により記憶された処理の内容にも
とづいて前記抽出手段により抽出された語または語句の
重要度を算出する算出手段と、 前記抽出手段により抽出された語または語句および前記
算出手段により算出された重要度にもとづいて索引語リ
ストを作成する作成手段と、 前記作成手段により作成された索引語リストを出力する
出力手段と、を備えたことを特徴とする文書作成装置。
1. A document storage unit for storing a document, an extraction unit for extracting a word or a phrase from the document stored by the document storage unit, and a process performed on the document stored by the document storage unit Processing content storage means for storing the contents of the above, calculation means for calculating the importance of the word or phrase extracted by the extraction means based on the processing content stored by the processing content storage means, Creating means for creating an index word list based on the extracted word or phrase and the importance calculated by the calculating means; and output means for outputting the index word list created by the creating means. A document creation device characterized by the following.
【請求項2】 前記作成手段により作成された複数の索
引語リストのうちいずれかの索引語リストを選択する選
択手段を備えたことを特徴とする請求項1に記載の文書
作成装置。
2. The document creation apparatus according to claim 1, further comprising a selection unit that selects any one of the plurality of index word lists created by the creation unit.
【請求項3】 前記作成手段により作成された索引語リ
ストまたは前記選択手段により選択された索引語リスト
を出力する出力手段を備えたことを特徴とする請求項1
または2に記載の文書作成装置。
3. An output means for outputting the index word list created by said creating means or the index word list selected by said selecting means.
Or the document creation device according to 2.
【請求項4】 さらに、前記文書記憶手段により記憶さ
れた文書中の語または語句に対する処理の内容を記憶す
る第二の処理内容記憶手段を備え、 前記出力手段は、前記第二の処理内容記憶手段により記
憶された処理の内容にもとづいて前記作成手段により作
成された索引語リストを出力することを特徴とする請求
項3のいずれか一つに記載の文書作成装置。
4. The apparatus according to claim 1, further comprising: a second processing content storage unit configured to store a processing content for a word or a phrase in the document stored by the document storage unit, wherein the output unit stores the second processing content storage. 4. The document creation device according to claim 3, wherein the index word list created by the creation unit is output based on the contents of the processing stored by the unit.
【請求項5】 文書から語または語句を抽出する抽出工
程と、 前記文書に対しておこなわれた処理の内容を記憶する処
理内容記憶工程と、 前記処理内容記憶工程により記憶された処理の内容にも
とづいて前記抽出工程により抽出された語または語句の
重要度を算出する算出工程と、 前記抽出工程により抽出された語または語句および前記
算出工程により算出された重要度にもとづいて索引語リ
ストを作成する作成工程と、を備えたことを特徴とする
文書作成方法。
5. A process for extracting a word or phrase from a document, a process content storing process for storing the content of a process performed on the document, and a process content stored in the process content storing process. A calculating step for calculating the importance of the word or phrase extracted in the extracting step based on the extracted word or phrase; and creating an index word list based on the word or phrase extracted in the extracting step and the importance calculated in the calculating step. A document creation method, comprising:
【請求項6】 前記作成工程により作成された複数の索
引語リストのうちいずれかの索引語リストを選択する選
択工程を含んだことを特徴とする請求項5に記載の文書
作成方法。
6. The document creating method according to claim 5, further comprising a selecting step of selecting any one of the plurality of index word lists created in the creating step.
【請求項7】 前記作成工程により作成された索引語リ
ストまたは前記選択工程により選択された索引語リスト
を出力する出力工程を含んだことを特徴とする請求項5
または6に記載の文書作成方法。
7. An output step of outputting the index word list created in the creating step or the index word list selected in the selecting step.
Or the document creation method according to 6.
【請求項8】 さらに、文書中の語または語句に対する
処理の内容を記憶する第二の処理内容記憶工程を含み、 前記出力工程は、前記第二の処理内容記憶工程により記
憶された処理の内容にもとづいて前記作成工程により作
成された索引語リストを出力することを特徴とする請求
項7のいずれか一つに記載の文書作成方法。
8. The method further includes a second processing content storing step of storing a processing content for a word or a phrase in a document, wherein the output step includes a processing content stored by the second processing content storing step. 8. The document creation method according to claim 7, wherein the index word list created in the creation step is output based on the list.
【請求項9】 前記請求項5〜8のいずれか一つに記載
された方法をコンピュータに実行させるプログラムを記
録したことを特徴とするコンピュータ読み取り可能な記
録媒体。
9. A computer-readable recording medium on which a program for causing a computer to execute the method according to claim 5 is recorded.
JP11104407A 1999-04-12 1999-04-12 Device and method for preparing document and computer readable recording medium with program making computer execute method recorded thereon Pending JP2000298669A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11104407A JP2000298669A (en) 1999-04-12 1999-04-12 Device and method for preparing document and computer readable recording medium with program making computer execute method recorded thereon

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11104407A JP2000298669A (en) 1999-04-12 1999-04-12 Device and method for preparing document and computer readable recording medium with program making computer execute method recorded thereon

Publications (2)

Publication Number Publication Date
JP2000298669A true JP2000298669A (en) 2000-10-24
JP2000298669A5 JP2000298669A5 (en) 2006-06-08

Family

ID=14379870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11104407A Pending JP2000298669A (en) 1999-04-12 1999-04-12 Device and method for preparing document and computer readable recording medium with program making computer execute method recorded thereon

Country Status (1)

Country Link
JP (1) JP2000298669A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163417A (en) * 2000-11-24 2002-06-07 Just Syst Corp Data analyzing device and storage medium stored with program for data analysis
JP2002269143A (en) * 2001-03-13 2002-09-20 Nec Corp System, method and program for filtering information
JP2009187485A (en) * 2008-02-08 2009-08-20 Canon Inc Document managing method, document management apparatus, information processing apparatus, and document management system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163417A (en) * 2000-11-24 2002-06-07 Just Syst Corp Data analyzing device and storage medium stored with program for data analysis
JP4614526B2 (en) * 2000-11-24 2011-01-19 株式会社ジャストシステム Data analysis apparatus and storage medium storing data analysis program
JP2002269143A (en) * 2001-03-13 2002-09-20 Nec Corp System, method and program for filtering information
JP2009187485A (en) * 2008-02-08 2009-08-20 Canon Inc Document managing method, document management apparatus, information processing apparatus, and document management system

Similar Documents

Publication Publication Date Title
US8407232B2 (en) Document search system
US7783644B1 (en) Query-independent entity importance in books
CN101061478B (en) Method and system for identifying web document
US7930647B2 (en) System and method for selecting pictures for presentation with text content
TWI336850B (en) System and method for text searching using weighted keywords
US20130151508A1 (en) Content-based automatic input protocol selection
US20090030891A1 (en) Method and apparatus for extraction of textual content from hypertext web documents
JPH0877155A (en) Information processor and information processing method
US8983965B2 (en) Document rating calculation system, document rating calculation method and program
JP2004157981A (en) Device for expressing summary
US20050010593A1 (en) System and method for performing predictive file storage management
US20050160086A1 (en) Information extraction apparatus and method
WO2011040025A1 (en) Method for setting metadata, system for setting metadata, and program
JP2000148748A (en) Japanese syllbary-to-chinese character conversion and image retrieval and display system
JP2006004298A (en) Document processing apparatus, documents processing method, and document processing program
JP4904920B2 (en) Template document creation program, template document creation method, and template document creation device
JP3583631B2 (en) Information mining method, information mining device, and computer-readable recording medium recording information mining program
JP4719921B2 (en) Data display device and data display program
JP2000298669A (en) Device and method for preparing document and computer readable recording medium with program making computer execute method recorded thereon
JP2001101199A (en) Document processor
JP2004157965A (en) Search support device and method, program and recording medium
JP4952079B2 (en) Image processing apparatus, method, and program
JP4426893B2 (en) Document search method, document search program, and document search apparatus for executing the same
JP2004145626A (en) Documents classification support device and computer program
JPH09311805A (en) Document processing method and device therefor

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060327

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060327

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090407

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090901