JP4453440B2 - Visual information classification method and apparatus, program, and storage medium recording visual information classification program - Google Patents

Visual information classification method and apparatus, program, and storage medium recording visual information classification program Download PDF

Info

Publication number
JP4453440B2
JP4453440B2 JP2004148236A JP2004148236A JP4453440B2 JP 4453440 B2 JP4453440 B2 JP 4453440B2 JP 2004148236 A JP2004148236 A JP 2004148236A JP 2004148236 A JP2004148236 A JP 2004148236A JP 4453440 B2 JP4453440 B2 JP 4453440B2
Authority
JP
Japan
Prior art keywords
content
keyword
classification
concept
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004148236A
Other languages
Japanese (ja)
Other versions
JP2005332080A (en
Inventor
佳代 池田
伸治 安部
吉秀 佐藤
雅且 大久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004148236A priority Critical patent/JP4453440B2/en
Publication of JP2005332080A publication Critical patent/JP2005332080A/en
Application granted granted Critical
Publication of JP4453440B2 publication Critical patent/JP4453440B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、視覚的情報分類方法及び装置及びプログラム及び視覚的情報分類プログラムを記録した記憶媒体に係り、特に、予め特徴的な単語で表された分類カテゴリ情報(単語情報)が付与された大量の情報において、その情報に付与されたキーワードを、各々の情報間の内容的類似性によって、その情報を視覚的に分類する視覚的情報分類方法及び装置及びプログラム及び視覚的情報分類プログラムを記録した記憶媒体に関する。   The present invention relates to a visual information classification method and apparatus, a program, and a storage medium on which a visual information classification program is recorded, and in particular, a large amount to which classification category information (word information) represented in advance by characteristic words is assigned. In this information, a visual information classification method, apparatus and program, and a visual information classification program for visually classifying the keyword assigned to the information according to the content similarity between each information were recorded. The present invention relates to a storage medium.

詳しくは、ユーザが大量の情報をその構造を概観または観察しながら、少しずつ情報要求を明確化し、興味ある情報に到達できるようにするためのブラウジングインタフェースに適用するのに有効な技術に関する。   More specifically, the present invention relates to a technique effective for applying to a browsing interface for allowing a user to clarify information requests little by little and reach interesting information while overviewing or observing the structure of a large amount of information.

近年では、電子化された情報の分類方法についてさまざまな方法が行われている。その中で代表的なものはディレクトリ形式のリスト表示であるが、情報が大量になると単なるディレクトリ形式の分類では階層構造が深くならざるを得なくなり、ユーザにとって使い勝手が悪いものとなってしまう。また、階層構造を深くしない場合でも、ディレクトリの最下層に多量の情報が属することとなり、リスト形式表示では、欲しい情報を探しにくいという欠点がある。その上、その分類方法がユーザの感覚と合っていない場合は、欲しい情報に辿り着きにくくなってしまう。   In recent years, various methods for classifying computerized information have been performed. A typical example is a directory-type list display. However, if the amount of information is large, the hierarchical structure must be deepened by simply classifying the directory format, which makes it unusable for the user. Even when the hierarchical structure is not deepened, a large amount of information belongs to the lowest layer of the directory, and there is a drawback that it is difficult to search for desired information in the list format display. In addition, if the classification method does not match the user's feeling, it becomes difficult to reach the desired information.

そこで、扱う情報が大量にある場合は、その情報を視覚的に分類配置し、ユーザに見える形で提供するコンテンツナビゲーションの方法が提供されている。   Therefore, when there is a large amount of information to be handled, a content navigation method is provided in which the information is visually classified and arranged and provided in a form visible to the user.

従来、大量のコンテンツを2次元上に視覚的に分類する配置技術が提案されている(例えば、非特許文献1参照)。この技術は、コンテンツがテキスト文書である場合を対象として、テキスト文書からのキーワード、並びに、キーワードの文書中の出現頻度を抽出して、キーワードベクトル(概念ベクトル)を生成し、これに多次元尺度法を適用してコンテンツの2次元配置及びそれを用いたブラウジングインタフェースを実現している。   Conventionally, an arrangement technique for visually classifying a large amount of content in two dimensions has been proposed (see, for example, Non-Patent Document 1). In this technology, for the case where the content is a text document, a keyword from the text document and the appearance frequency of the keyword in the document are extracted to generate a keyword vector (concept vector). The method is applied to realize a two-dimensional arrangement of content and a browsing interface using it.

また、ここで扱う概念ベクトルとしては、概要説明文からの概念ベクトル(事前に定められた語彙に関する重みベクトルとして与えられる)の算出方法とその概念ベクトルを集めた概念ベース(概念ベクトルの集まりで辞書のようなもの)の作成方法がある(例えば、非特許文献2参照)。   The concept vectors used here include a method for calculating a concept vector (given as a weight vector for a predetermined vocabulary) from a summary description, and a concept base (collection of concept vectors as a collection of concept vectors). (See Non-Patent Document 2, for example).

また、概念ベース(概念ベクトルの集まりで辞書のようなもの)に分類カテゴリの代表語が入力されると、その代表語から連想される語彙や説明文から概念ベクトルを算出するという方法がある(例えば、非特許文献3参照)。   In addition, when a representative word of a classification category is input to a concept base (a collection of concept vectors such as a dictionary), there is a method of calculating a concept vector from a vocabulary or an explanation sentence associated with the representative word ( For example, refer nonpatent literature 3).

また、概念ベース(概念ベクトルの集まりで辞書のようなもの)を基に多次元尺度法を用いて、予め決められた特徴的な単語で表された分類カテゴリの単語情報を基準マップと呼ばれる2次元マップ上に落とし込み、そのマップの上にコンテンツを配置するという方法が提案されている。この場合、コンテンツには予め付与された分類カテゴリと概要説明文などのテキストもしくは、キーワード(語彙)などのメタ情報があり、そのメタ情報と概念ベースや基準マップとの類似性すなわち、距離を算出し、コンテンツの概念ベクトルを計算し、多次元尺度法を用いて2次元平面上にコンテンツを分類配置することが行われる(例えば、非特許文献4参照)。   In addition, word information of classification categories represented by predetermined characteristic words using a multidimensional scaling method based on a concept base (a collection of concept vectors like a dictionary) is called a reference map 2 A method has been proposed in which content is placed on a three-dimensional map and placed on the map. In this case, the content has pre-assigned classification categories and texts such as summary descriptions, or meta information such as keywords (vocabulary), and the similarity between the meta information and the concept base or reference map, that is, the distance is calculated. Then, a concept vector of the content is calculated, and the content is classified and arranged on a two-dimensional plane using a multidimensional scaling method (see, for example, Non-Patent Document 4).

ある情報にメタ情報が付与されている場合、これをその情報の検索に利用することは効果的である。例えば、その情報をウェブページとした場合、ウェブページの検索では、多くのポータルサイトなどが提供している、各々のウェブページに付与されているメタ情報を利用したディレクトリサービスを用いることで、目的のウェブページを効率的に絞り込むということができる。   When meta information is given to certain information, it is effective to use it for searching for the information. For example, when the information is a web page, a search for a web page can be performed by using a directory service using meta information provided by each portal page provided by many portal sites. It can be said that the web page is effectively narrowed down.

図11に概念マップの概要を説明するための図を、図12に従来の技術の概要を示す。   FIG. 11 is a diagram for explaining the outline of the concept map, and FIG. 12 shows the outline of the conventional technique.

予め決められた特徴的な単語で表された分類カテゴリの単語情報によって分類されたコンテンツを、同様の分類カテゴリによって分類された大量の語彙情報(概念ベクトル)によって作られた概念ベース(概念ベクトルの集まりで辞書のようなもの)で作られた図11に示すような概念マップに、コンテンツの持つキーワード(語彙)を基に分類配置しようとする時、コンテンツに付与されたキーワード(概念ベースに含まれる語彙)、もしくは、コンテンツに付与されたメタ情報を分析することによりその特徴を表すキーワードを抽出した後、従来の方法では、図12に示すように、コンテンツを配置する際に、コンテンツに付属するメタ情報等にキーワードがどのくらい出現しているかという、出現頻度を算出し、キーワードに重みを付けるか、もしくは、キーワードの全てを同一の価値として扱い、概念ベース上に当てはまるそれらのキーワードの重心等にコンテンツを配置する。
James A. Wise, et. Al. Visualizing the non-visual: Spatial analysis and interaction with information from text documents Proc. Of IEEE Information Visualization ’95, pp. 51-58(1995) 熊本睦他、「概念ベースの情報検索への適用−概念ベースを用いた検索の特徴評価」、信学技報、AI98-63(1999) 笠原要他、「国語辞書を利用した日常語の類似性判別、情処論、Vol, 138,No7, pp. 1272-1283, (1997) 藤田悦郎他、「分類情報と言語情報の統合利用に基づくコンテンツ空間の可視化」、DEWS2003 1-P-03(2003,Mar.) http://www.ieice.org/iss/de/DEWS/proc/2003/program.html#1st-1-P
Content classified by word information of a classification category represented by a predetermined characteristic word is a concept base (concept vector of concept vector) created by a large amount of vocabulary information (concept vector) classified by a similar classification category. When a concept map as shown in FIG. 11 created by a collection of things such as a dictionary is to be classified and arranged based on the keywords (vocabulary) of the content, the keywords (contained in the concept base) In the conventional method, as shown in FIG. 12, when the content is arranged, it is attached to the content. Calculate how often the keyword appears in the meta information, etc. Luke, or treats all keywords as the same value, placing the content on the center of gravity or the like of those keywords that apply to the concepts base.
James A. Wise, et. Al. Visualizing the non-visual: Spatial analysis and interaction with information from text documents Proc. Of IEEE Information Visualization '95, pp. 51-58 (1995) Kumamoto, et al., "Application to concept-based information retrieval--feature evaluation of concept-based retrieval", IEICE Technical Report, AI 98-63 (1999) Kasahara Kaname et al., "Difference of everyday words using Japanese language dictionary, emotion theory, Vol, 138, No7, pp. 1272-1283, (1997) Goro Fujita et al. “Visualization of content space based on integrated use of classification information and linguistic information”, DEWS2003 1-P-03 (2003, Mar.) http://www.ieice.org/iss/de/DEWS/proc /2003/program.html#1st-1-P

上記の図12に示すような従来の方法の中で、単にコンテンツを表すキーワードの重心にコンテンツを配置するような方法では、コンテンツが属する分類カテゴリに関係なく、他の分類カテゴリに属するキーワードもそのコンテンツを表すキーワードとして、同等のものとして扱われていた。よって、キーワードがコンテンツの属さないカテゴリを持つとき、そのカテゴリ情報のほうへ必要以上に引っ張られて配置されることとなり、コンテンツの特色をゆがめてしまっていた。   In the conventional method as shown in FIG. 12 above, in the method in which the content is simply placed at the center of gravity of the keyword representing the content, the keywords belonging to other classification categories are also included regardless of the classification category to which the content belongs. It was treated as an equivalent keyword for content. Therefore, when the keyword has a category to which the content does not belong, the keyword information is pulled more than necessary and arranged, which distorts the feature of the content.

また、出現頻度に応じて、キーワードに重みを付ける方法では、別々の分類カテゴリに属する複数のコンテンツを配置する際、それらが、同じ出現頻度を持つキーワードを持っていた場合、概念マップ上でほぼ同じ位置に配置されてしまうことになり、コンテンツを特徴付ける分類カテゴリの意図を反映できず、コンテンツの相違を表現することが困難である。   In addition, in the method of weighting keywords according to the appearance frequency, when arranging a plurality of contents belonging to different classification categories, if they have keywords having the same appearance frequency, they are almost displayed on the concept map. It will be arranged at the same position, the intention of the classification category that characterizes the content cannot be reflected, and it is difficult to express the difference in the content.

本発明は、上記の点に鑑みなされたもので、コンテンツに付属するキーワードについて、分類カテゴリ情報を基に算出する重みを設け、キーワードに優先順位を付けることで、よりコンテンツの特色を表すことが可能な視覚的分類方法及び装置及びプログラムを提供することを目的とする。   The present invention has been made in view of the above points, and for a keyword attached to content, a weight to be calculated based on classification category information is provided, and a priority is given to the keyword, so that the characteristics of the content can be expressed more. An object is to provide a possible visual classification method and apparatus and program.

図1は、本発明の原理を説明するための図である。   FIG. 1 is a diagram for explaining the principle of the present invention.

本発明(請求項1)は、キーワードに付与された分類カテゴリ、および概念ベクトルを利用して、内容に基づく分類カテゴリと内容を表すキーワードを有するコンテンツを視覚的にキーワードと分類カテゴリが配置された概念マップ上に分類配置する視覚的情報分類方法であって、
コンテンツが持つキーワードそれぞれについて、コンテンツ自身が属する分類カテゴリの重心Giと、当該キーワードが属する分類カテゴリの重心Gjとの距離に応じ、その距離が近いほど1となり、その距離が遠いほど0となる重み率を算出し(ステップ2)、
コンテンツが持つキーワードそれぞれに対し、当該キーワードに付与された概念ベクトルに重み率を掛けて、全てのキーワードの重心を取ることで、コンテンツの配置座標を算出し、座標配置データベースに出力し(ステップ3)、
算出された配置座標を概念マップ上に表現する(ステップ3)。
The present invention (Claim 1) uses a classification category assigned to a keyword and a concept vector, and a keyword and a classification category are visually arranged in a content having a classification category based on the content and a keyword representing the content . A visual information classification method for classifying and arranging on a concept map,
For each keyword possessed by the content, a weight that becomes 1 as the distance decreases and 0 as the distance increases, according to the distance between the centroid Gi of the classification category to which the content itself belongs and the centroid Gj of the classification category to which the keyword belongs. Calculate the rate (step 2),
For each keyword of the content, the concept vector assigned to the keyword is multiplied by a weighting rate, and the center of gravity of all keywords is taken to calculate the content placement coordinates and output them to the coordinate placement database (step 3). ),
The calculated arrangement coordinates are expressed on the concept map (step 3).

図2は、本発明の原理構成図である。   FIG. 2 is a principle configuration diagram of the present invention.

本発明(請求項2)は、キーワードに付与された分類カテゴリ、及び概念ベクトルを利用して、内容に基づく分類カテゴリと内容を表すキーワードを有するコンテンツを視覚的にキーワードと分類カテゴリが配置された概念マップ上に分類配置する視覚的情報分類装置であって、
コンテンツが持つキーワードそれぞれについて、コンテンツ自身が属する分類カテゴリの重心Giと、当該キーワードが属する分類カテゴリの重心Gjとの距離に応じ、その距離が近いほど1となり、その距離が遠いほど0となる重み率を算出する重み率算出手段300と、
コンテンツが持つキーワードそれぞれに対し、当該キーワードに付与された概念ベクトルに重み率算出手段で算出した重み率を掛けて、全てのキーワードの重心をとることで、コンテンツの配置座標を算出し、座標配置データベース23に出力する配置座標算出手段310と、
算出された配置座標を概念マップ上に表現する手段11と、を有する。

The present invention (Claim 2) uses a classification category assigned to a keyword and a concept vector, and a keyword and a classification category are visually arranged in a content having a classification category based on the content and a keyword representing the content . A visual information classification device for classifying and arranging on a concept map,
For each keyword possessed by the content, a weight that becomes 1 as the distance decreases and 0 as the distance increases, according to the distance between the centroid Gi of the classification category to which the content itself belongs and the centroid Gj of the classification category to which the keyword belongs. A weight rate calculating means 300 for calculating a rate;
For each keyword of the content, multiply the concept vector assigned to the keyword by the weighting rate calculated by the weighting rate calculation means and take the center of gravity of all the keywords to calculate the content placement coordinates and coordinate placement Arrangement coordinate calculation means 310 for outputting to the database 23;
Means 11 for expressing the calculated arrangement coordinates on a concept map.

本発明(請求項3)は、請求項2に記載の視覚的情報分類装置を構成する各手段としてコンピュータを機能させるための視覚的情報分類プログラムである。 The present invention (Claim 3) is a visual information classification program for causing a computer to function as each means constituting the visual information classification apparatus according to claim 2 .

本発明(請求項4)は、請求項3に記載の視覚的情報分類プログラムを記録したコンピュータ読み取り可能な記録媒体である。 The present invention (Claim 4) is a computer-readable recording medium on which the visual information classification program according to Claim 3 is recorded .

上述のように、本発明によれば、予め分類カテゴリ情報を持つようなコンテンツ配置に対して、コンテンツが属する分類カテゴリからの距離に応じて、コンテンツに付属するキーワードに優先度(重み)を設けることで、たとえキーワードの重心をとったとしても、よりコンテンツの特徴を表すキーワードに寄った配置となる。   As described above, according to the present invention, priority (weight) is assigned to a keyword attached to a content according to the distance from the classification category to which the content belongs for content arrangement having classification category information in advance. As a result, even if the center of gravity of the keyword is taken, the layout is closer to the keyword representing the feature of the content.

また、コンテンツの特色を表すキーワードがコンテンツの配置算出に、より影響を与えることとなるため、従来の方法よりもコンテンツの特徴が現れやすくなる。   In addition, since the keyword representing the content color has a greater influence on the content arrangement calculation, the content feature is more likely to appear than in the conventional method.

そして、同じキーワードを持つコンテンツであっても、そのキーワードの優先度に応じて、配置位置が異なるようになる。   And even if the content has the same keyword, the arrangement position differs depending on the priority of the keyword.

以上のように、従来の技術よりも、より視覚的にコンテンツの特徴の現れる配置を行うことができる。   As described above, it is possible to perform an arrangement in which content features appear more visually than in the prior art.

以下、図面と共に本発明の実施の形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

最初に本発明の概要を説明する。   First, the outline of the present invention will be described.

図3は、本発明の概要を説明するための図である。   FIG. 3 is a diagram for explaining the outline of the present invention.

本発明は、予め決められた特徴的な単語で表された分類カテゴリの単語情報によって分類されたコンテンツを、同様の分類カテゴリによって分類された大量の語彙情報(概念ベクトル)によって作られた概念ベース(概念ベクトルの集まりで辞書のようなもの)で作られた概念マップ上に、コンテンツの持つキーワード(語彙)を基に分類配置するものである。このとき、コンテンツが属する分類カテゴリからの距離に応じてコンテンツに属するキーワードに重みを設け、キーワードの重心をとった場合に、当該コンテンツの特徴を表すキーワードに寄った配置となるようにする。 The present invention is based on a concept base created by using a large amount of vocabulary information (concept vectors) classified by the same classification category for content classified by classification category word information represented by predetermined characteristic words. On the concept map created by (a collection of concept vectors, like a dictionary), it is classified and arranged based on the keywords (vocabulary) possessed by the content. At this time, the weight is provided on keywords that belong to the content in accordance with the distance from the classification category which contents belong, when taking the center of gravity of the keywords, so that the arrangement closer to the keyword that represents the characteristics of the content.

前述の図2に従って本発明の視覚的分類装置の構成の概要を説明する。   The outline of the configuration of the visual classification device of the present invention will be described with reference to FIG.

視覚的分類装置は、キーワード重み率算出手段300、コンテンツ座標算出手段310、コンテンツDB20,メタ情報DB21,概念ベクトルDB22,配置座標DB23から構成される。   The visual classification device includes a keyword weight ratio calculation unit 300, a content coordinate calculation unit 310, a content DB 20, a meta information DB 21, a concept vector DB 22, and an arrangement coordinate DB 23.

キーワード重み率算出手段300は、概念マップ上のコンテンツ登録要求により、未配置のコンテンツが与えられる場合に、その未配置コンテンツの持つメタ情報(キーワードと分類カテゴリ情報)をコンテンツDB20から取得し、概念マップの持つ分類カテゴリ情報とキーワード(語彙)情報(キーワードとそれに付随する概念ベクトル)、分類カテゴリとキーワード(語彙)との関係情報をメタ情報DB21と概念ベクトルDB22とから取得する。   The keyword weight ratio calculation means 300 acquires meta information (keyword and classification category information) possessed by the non-arranged content from the content DB 20 when an unarranged content is given by a content registration request on the concept map. The classification category information and keyword (vocabulary) information (keyword and associated concept vector) possessed by the map, and the relationship information between the classification category and keyword (vocabulary) are acquired from the meta information DB 21 and the concept vector DB 22.

コンテンツが属する分類カテゴリとコンテンツが持つキーワードが概念マップ上で属する分類カテゴリとを比較し、同一カテゴリ内であれば、重み率を1とし、異なるカテゴリであれば、概念マップ上におけるコンテンツが属するカテゴリからキーワードが属するカテゴリまでの距離に応じて重み率を算出する。この距離が遠いほど重み率の値は小さくなり、近いほど1に近くなる。   The classification category to which the content belongs and the classification category to which the keyword of the content belongs on the concept map are compared. If the category is within the same category, the weighting factor is 1, and if the category is different, the category to which the content on the concept map belongs The weight ratio is calculated according to the distance from the category to which the keyword belongs. The farther this distance is, the smaller the weight ratio value is, and the closer the distance is, the closer it is to 1.

コンテンツ座標算出手段310は、概念ベクトルDB22から、コンテンツが持つキーワードそれぞれに対するベクトル(概念ベクトル)を取得し、キーワード重み率算出手段300で算出した重み率をそれぞれのキーワードベクトル(概念ベクトル)にかけ、それぞれの値すべての重心をとることで、コンテンツの配置座標を算出する。このようにして算出されたコンテンツ配置座標を配置座標DB23に格納する。   The content coordinate calculation unit 310 acquires a vector (concept vector) for each keyword of the content from the concept vector DB 22, applies the weight rate calculated by the keyword weight rate calculation unit 300 to each keyword vector (concept vector), and By taking the center of gravity of all the values, the arrangement coordinates of the content are calculated. The content arrangement coordinates calculated in this way are stored in the arrangement coordinate DB 23.

次に、上記の構成における動作の概要を前述の図1に従って説明する。   Next, an outline of the operation in the above configuration will be described with reference to FIG.

ステップ1) キーワード重み算出手段300において、概念マップ上へのコンテンツ登録要求が発行されると、コンテンツデータベース20からコンテンツのキーワードと分類カテゴリ情報を、メタ情報データベース21から該概念マップの持つ分類カテゴリ情報を、概念ベクトルデータベース22から、分類カテゴリとキーワード(語彙)の関係情報とキーワード(語彙)のベクトル情報をそれぞれ取得する。   Step 1) When the keyword weight calculating means 300 issues a content registration request on the concept map, the content keyword and classification category information from the content database 20 and the classification category information of the concept map from the meta information database 21 From the concept vector database 22, the category category, keyword (vocabulary) relationship information, and keyword (vocabulary) vector information are respectively acquired.

ステップ2) キーワード重み算出手段300において、コンテンツが属する分類カテゴリとコンテンツが持つキーワードが概念マップ上で属する分類カテゴリとを比較し、同一カテゴリ内であれば、重み率を1とし、異なるカテゴリであれば、概念マップ上におけるコンテンツが属するカテゴリからキーワードが属するカテゴリまでの距離に応じて重み率を算出する。この距離が遠いほど重み率の値は小さくなり、近いほど1に近くなる。   Step 2) In the keyword weight calculation means 300, the classification category to which the content belongs and the classification category to which the keyword of the content belongs on the concept map are compared. For example, the weight ratio is calculated according to the distance from the category to which the content belongs on the concept map to the category to which the keyword belongs. The farther this distance is, the smaller the weight ratio value is, and the closer the distance is, the closer it is to 1.

ステップ3) コンテンツ座標算出手段310において、コンテンツが持つキーワードそれぞれに対し、概念マップ上で当てはまるキーワードベクトル(概念ベクトル)に、ステップで算出した重み率を掛けて、全てのキーワードの重心をとることで、コンテンツの配置座標を算出し、配置座標データベース23に出力する。 Step 3) In the content coordinate calculation means 310, for each keyword possessed by the content, the keyword vector (concept vector) applied on the concept map is multiplied by the weight ratio calculated in step 2 to obtain the centroid of all keywords. Then, the arrangement coordinates of the content are calculated and output to the arrangement coordinate database 23.

次に、本発明の一実施の形態を詳細に説明する。   Next, an embodiment of the present invention will be described in detail.

本発明の一実施の形態では、多次元または、2次元上にキーワードが配置された概念マップ上にメタ情報を持つようなコンテンツを配置するために、コンテンツ座標を求める。   In one embodiment of the present invention, content coordinates are obtained in order to arrange content having meta information on a concept map in which keywords are arranged in multi-dimension or two-dimension.

図4は、本発明の一実施の形態における視覚的情報分類装置の具体的な構成を示す。   FIG. 4 shows a specific configuration of the visual information classification device according to the embodiment of the present invention.

同図に示す視覚的情報分類装置は、コンピュータ10とこのコンピュータ10にネットワーク40を介して接続されるコンテンツデータベース(コンテンツDB)20,メタ情報データベース(メタ情報DB)21,概念ベクトルデータベース(概念ベクトルDB)22,及び、配置座標データベース(配置座標DB)23から構成されている。   The visual information classification apparatus shown in FIG. 1 includes a computer 10 and a content database (content DB) 20, a meta information database (meta information DB) 21 connected to the computer 10 via a network 40, a concept vector database (concept vector). DB) 22 and an arrangement coordinate database (arrangement coordinate DB) 23.

コンピュータ10は、RAM,ROM、磁気ディスク等からなるメモリ、CPU、ディスプレイによる表示部11、及びマウスやキーボードなどからなる指示入力部12から構成されており、CPUが実行するソフトウェアプログラムによって実現されるキーワード重み率算出処理部300と、コンテンツ座標算出部310を備えている。   The computer 10 includes a memory such as a RAM, a ROM, and a magnetic disk, a CPU, a display unit 11 using a display, and an instruction input unit 12 such as a mouse and a keyboard, and is realized by a software program executed by the CPU. A keyword weight ratio calculation processing unit 300 and a content coordinate calculation unit 310 are provided.

コンテンツDB20には、配置対象となるコンテンツと、その内容を表すテキスト(概要説明文等)やキーワード、コンテンツが所属するカテゴリ情報などのメタ情報が格納されている。   The content DB 20 stores content to be arranged, meta information such as text (summary explanation etc.) representing the content, keywords, and category information to which the content belongs.

メタ情報DB21には、分類カテゴリ情報が格納されている。   The meta information DB 21 stores classification category information.

この分類カテゴリの情報は、事前に与えられており、コンテンツ毎に付与される。本実施の形態では、分類カテゴリ情報は、深さN(Nは正の整数)の階層構造を有しているものとする。   Information of this classification category is given in advance and is given for each content. In the present embodiment, it is assumed that the classification category information has a hierarchical structure having a depth N (N is a positive integer).

図5に、本発明の一実施の形態におけるコンテンツを分類するための分類カテゴリの体系例を示す。この分類カテゴリ体系に従う場合、メタ情報DB21に、このカテゴリ情報が格納されている。また、コンテンツDB20に格納されている、各コンテンツには、図5に示すLij(i,j=1〜4)のいずれかの適切な分類カテゴリが事前に割り当てられており、その情報は、コンテンツのメタ情報として、コンテンツDB20にも格納されている。なお、図5における一階層目のカテゴリ及び二階層目のカテゴリに記載されている例えば、L11の数字部分は、上記のi,jに対応する添え字である。 FIG. 5 shows an example of a classification category system for classifying content according to an embodiment of the present invention. When this classification category system is followed, this category information is stored in the meta information DB 21. Each content stored in the content DB 20 is pre-assigned any appropriate classification category of L ij (i, j = 1 to 4) shown in FIG. It is also stored in the content DB 20 as content meta information. Note that, for example, the numerical portion of L11 described in the first and second layer categories in FIG. 5 is a subscript corresponding to the above i and j.

概念ベクトルDB22には、利用するサービスや分野に合わせて、指定された分類カテゴリによって分類されたキーワード(語彙)が、キーワードベクトル(概念ベクトル)として格納されている。また、その分類カテゴリとキーワード(語彙)の関係情報も格納されている。キーワードベクトル(概念ベクトル)は、分類カテゴリに適する情報源の内容的類似性(TF/IDF等により算出されるキーワードの出現頻度等を利用)を基に算出される多次元または、2次元の概念ベクトルである。このベクトルは、すべて統一された次元数を持つ実数値ベクトルとして表される。この時、分類カテゴリ情報もベクトル化されて格納している場合もある。   In the concept vector DB 22, keywords (vocabulary) classified by a designated classification category in accordance with the service or field to be used are stored as keyword vectors (concept vectors). In addition, the relationship information between the classification category and the keyword (vocabulary) is also stored. The keyword vector (concept vector) is a multi-dimensional or two-dimensional concept calculated based on the content similarity of information sources suitable for the classification category (using keyword appearance frequency calculated by TF / IDF or the like). Is a vector. This vector is represented as a real-valued vector with a uniform number of dimensions. At this time, the classification category information may also be vectorized and stored.

この算出方法については、前述の非特許文献2,3,4のような方法でもよい。また、予め指定された分類カテゴリに合わせて、Webページなどの外部情報を収集し、その情報から語彙を切り出し、その語彙をすべての対象文章における出現頻度によって算出した概念ベクトルを集めて概念ベースを作成するという方法でもよい。   This calculation method may be a method as described in Non-Patent Documents 2, 3, and 4 described above. In addition, external information such as web pages is collected in accordance with the classification category specified in advance, the vocabulary is cut out from the information, and the concept vectors calculated based on the appearance frequency of all the vocabulary are collected to obtain the concept base. It may be a method of creating.

この概念ベクトルとメタ情報DB21に格納されている分類カテゴリ情報を用いると概念マップとして利用することができる。概念マップは、コンテンツを配置するための地図であり、例えば、分類カテゴリやキーワード(語彙)の概念ベクトルが図6のように配置されている。なお、図6における「L1」「L21」「K111」などの数字部分は、L,Lij,Kijyそれぞれに対応する添え字である。 If this concept vector and classification category information stored in the meta information DB 21 are used, it can be used as a concept map. The concept map is a map for arranging contents. For example, concept vectors of classification categories and keywords (vocabulary) are arranged as shown in FIG. In FIG. 6, numerals such as “L1”, “L21”, and “K111” are subscripts corresponding to L i , L ij , and K ijy, respectively.

コンテンツの持つメタ情報(分類カテゴリ情報とキーワード)と概念マップの情報(分類カテゴリ情報とキーワード(語彙))との距離を両者の情報の一致度合に応じて、概念マップ上におけるコンテンツの配置座標を算出する。   The distance between the meta information (category category information and keywords) of the content and the concept map information (category category information and keywords (vocabulary)) is determined according to the degree of coincidence of the two information, and the content arrangement coordinates on the concept map calculate.

配置座標DB23には、以降に説明する処理によって、各々のコンテンツの配置座標が格納される。この座標においても概念ベクトルと同様の次元数を持つが、多次元である場合は、コンテンツ表現方法に合わせて、多次元尺度構成法等によって2次元もしくは3次元のベクトルとすることも可能である。   In the arrangement coordinate DB 23, arrangement coordinates of each content are stored by processing described below. This coordinate also has the same number of dimensions as the concept vector, but if it is multidimensional, it can be converted into a two-dimensional or three-dimensional vector by a multidimensional scaling method or the like according to the content expression method. .

キーワード重み率算出処理部300と、コンテンツ座標算出処理部310は、このように構成される視覚的情報分類システムのもとで、以降に説明する処理を実行することで本発明を実現するよう動作する。   The keyword weight ratio calculation processing unit 300 and the content coordinate calculation processing unit 310 operate so as to realize the present invention by executing the processing described below under the visual information classification system configured as described above. To do.

以下にそのコンテンツの配置座標の算出方法を説明する。   A method for calculating the arrangement coordinates of the content will be described below.

[1]キーワード重み率算出処理部300の処理:
図7に、本発明の一実施の形態におけるキーワード重み算出処理のフローチャートを示す。
[1] Processing of keyword weight ratio calculation processing unit 300:
FIG. 7 shows a flowchart of keyword weight calculation processing in one embodiment of the present invention.

次のような方法により、キーワードK(t>0)にかかる重み率W(K)を求める。 The weighting ratio W (K t ) applied to the keyword K t (t> 0) is obtained by the following method.

概念マップ上へのコンテンツ登録要求により、未配置のコンテンツが与えられる場合に、その未配置コンテンツの持つメタ情報(キーワードと分類カテゴリ情報)をコンテンツDB20から取得し(ステップ701)、概念マップの持つ分類カテゴリ情報とキーワード(語彙)情報(キーワードとそれに付随する概念ベクトル)、分類カテゴリとキーワード(語彙)との関係情報をメタ情報DB21と概念ベクトルDB22とから取得する(ステップ702)。   When unplaced content is given by a content registration request on the concept map, meta information (keyword and classification category information) possessed by the unplaced content is acquired from the content DB 20 (step 701), and the concept map has it. Classification category information and keyword (vocabulary) information (keywords and accompanying concept vectors) and relationship information between classification categories and keywords (vocabulary) are acquired from the meta information DB 21 and the concept vector DB 22 (step 702).

次に、両者から集めた分類カテゴリ情報とキーワード情報とを照合し、共通するキーワード情報のベクトルを取得する(ステップ703)。   Next, the classification category information collected from both and the keyword information are collated to obtain a common keyword information vector (step 703).

この際、キーワードK(t>0)がコンテンツの内容を表す概要説明文等のテキストd中に多用され、ある閾値回数を超えて出現するような場合は、そのコンテンツにおいてのみ、テキストdの特色を表すにはふさわしくないキーワードとしてKをキーワード算出対象としないといように指定することもできる。 At this time, when the keyword K t (t> 0) is frequently used in the text d such as the outline explanation representing the content of the content and appears more than a certain threshold number of times, only the content of the text d It is also possible to specify that K t is not a keyword calculation target as a keyword that is not suitable for representing a spot color.

また、登録したいコンテンツの内容を表す概要説明文等に出現するキーワードの出現頻度を求め、その出現頻度に応じて、重みを加減することも可能である(ステップ705)。例えば、対象とする概要説明文等のテキストdを形態素解析し、その中に出現するキーワードKに対する重みW(K,d)は、
W(K,d)=(dの中でのKの生起数)/(dのキーワードの出現総数)
といった式で算出できる。
It is also possible to obtain the appearance frequency of a keyword appearing in an outline explanation that represents the content to be registered, and to add or subtract the weight according to the appearance frequency (step 705). For example, morphological analysis is performed on the text d such as the target outline explanation, and the weight W (K t , d) for the keyword K t appearing therein is
W (K t , d) = (Number of occurrences of K t in d) / (Total number of occurrences of keyword d)
It can be calculated by the following formula.

ここでのdのキーワード出現総数とは、例えば、キーワード「イチロー」という言葉が3回出現し、別のキーワード「松井」が2回出現した場合は、『5』となる。このとき、キーワード「イチロー」の生起数は、『3』となる。   Here, the total number of occurrences of keyword d is, for example, “5” when the word “ICHIRO” appears three times and another keyword “Matsui” appears twice. At this time, the number of occurrences of the keyword “Ichiro” is “3”.

このような事前処理を行った後、決定されたキーワードそれぞれに対し、以下に示す分類カテゴリに応じたキーワードの重み率算出処理を行う。上記、事前処理を行わない場合は、W(K、d)=1となる。コンテンツの内容を表す概要説明文等のテキストd中に出現するキーワードKに対する重み率W(K)は、以下の2通りの場合に分けられて決定される。 After performing such pre-processing, keyword weight ratio calculation processing corresponding to the classification category shown below is performed for each determined keyword. When the pre-processing is not performed, W (K t , d) = 1. The weighting ratio W (K t ) for the keyword K t appearing in the text d such as the outline explanatory text representing the contents is determined in the following two cases.

・コンテンツの属する分類カテゴリに含まれるキーワード(ステップ706)。   A keyword included in the classification category to which the content belongs (step 706).

W(K)=W(K,d)
・コンテンツの属さない分類カテゴリに含まれるキーワード(ステップ707)。
W (K t ) = W (K t , d)
A keyword included in a classification category to which no content belongs (step 707).

図8に、本発明の一実施の形態におけるキーワードの重み率算出のための変数の説明を示す。   FIG. 8 shows an explanation of variables for keyword weighting rate calculation according to an embodiment of the present invention.

ij:コンテンツが属するカテゴリの重心Gからキーワードが属するカテゴリの重心Gまでの距離(i,j≧1);
WD(K,Dij):上記で示した重心からの距離Dijを持つときのキーワードKが分類カテゴリに含まれない場合にかかる重み率;
LD:概念マップ上でカテゴリ重心同士が最も遠くなる組み合わせの距離としたとき、
W(K)=W(K,d)×WD(K、Dij
WD(K,Dij)=−(1/LD)×Dij+1 WD(K、Dij)≧0
として、Dij距離が遠くなるほど、キーワードにかかる重み率の値が小さくなるように決定する。
D ij : distance (i, j ≧ 1) from the center of gravity G i of the category to which the content belongs to the center of gravity G j of the category to which the keyword belongs;
WD (K t , D ij ): weighting rate applied when the keyword K t having the distance D ij from the center of gravity shown above is not included in the classification category;
LD: When the distance of the category centroids is the farthest on the concept map,
W (K t ) = W (K t , d) × WD (K t , D ij )
WD (K t , D ij ) = − (1 / LD) × D ij +1 WD (K t , D ij ) ≧ 0
As described above, the value of the weighting rate applied to the keyword is determined to be smaller as the D ij distance is longer.

ここで、重心同士の距離Dijがあまりに遠くになると、コンテンツの特色を表すのにふさわしくないキーワードである可能性があるため、
TD:キーワード算出対象範囲;
WP:計算対象範囲決定値 (0≦WP≦1)
としたとき、次のようにも設定することができる。
Here, if the distance D ij between the centers of gravity is too far, it may be a keyword that is not suitable for expressing the feature of the content.
TD: Keyword calculation target range;
WP: Calculation target range decision value (0 ≦ WP ≦ 1)
The following can be set as well.

WD(K,Dij)=−(1/TD)×Dij+1 D(K,Dij)≧0
TD=LD×WP
このとき、WPは、事前に設定されており、概念マップ上で最も遠くなるカテゴリ重心同士の距離LDを基準として、コンテンツの属するカテゴリからどの程度の距離範囲に含まれるカテゴリのキーワードを重み算出対象にするかを決定する値である。WP=0であれば、コンテンツが属するカテゴリ以外に含まれるキーワードは、重み算出対象外であり、WP=1であれば、概念マップ上のすべてのキーワードを算出対象とするように設定できる。
WD (K t , D ij ) = − (1 / TD) × D ij +1 D (K t , D ij ) ≧ 0
TD = LD × WP
At this time, the WP is set in advance, and based on the distance LD between the category centroids farthest on the concept map, the keyword of the category included in the distance range from the category to which the content belongs is weight calculation target. It is a value that determines whether or not. If WP = 0, keywords included outside the category to which the content belongs are not subject to weight calculation, and if WP = 1, all keywords on the concept map can be set as calculation targets.

以上のようにして全ての重み率を算出した後に、この値を正規化して以降の計算に用いることができる(ステップ708)。   After calculating all the weight ratios as described above, this value can be normalized and used for subsequent calculations (step 708).

W(K)=W(K,d)×{WD(K,Dij)/ΣWD(K,Dij)}
以上のようにして、コンテンツに付属するキーワード全てに対して、重み率を決定する。
W (K t ) = W (K t , d) × {WD (K t , D ij ) / ΣWD (K t , D ij )}
As described above, the weight ratio is determined for all keywords attached to the content.

[2]コンテンツ座標算出処理部310の処理:
コンテンツが持つ各キーワードにキーワード重み率算出処理部300で算出した重み率を掛け、すべてのキーワードの重心をとることで、コンテンツの配置座標を算出することができる。式で表すと以下のようになる。
[2] Processing of content coordinate calculation processing unit 310:
The placement coordinates of the content can be calculated by multiplying each keyword of the content by the weight rate calculated by the keyword weight rate calculation processing unit 300 and taking the center of gravity of all the keywords. This is expressed as follows.

VC:コンテンツのベクトル座標
VK:キーワードKのベクトル座標
VC=Σ(W(K)×VK
このようにして、算出されたコンテンツ配置座標は、配置座標DB23に格納される。
VC: vector coordinates of content VK t : vector coordinates of keyword K t VC = Σ (W (K t ) × VK t )
The content arrangement coordinates calculated in this way are stored in the arrangement coordinate DB 23.

以上のようにして、算出されたコンテンツ配置座標は、概念マップ上に表現され、コンテンツマップとして見ることができる。図9に、本発明の一実施の形態におけるコンテンツマップ(その1)を示し、図10に、本発明の一実施の形態におけるコンテンツマップ(その2)を示す。図9は、2次元表現であり、図10は、3次元表現である。また、この表示方法は、前述の非特許文献4のような表示方法を利用してもよい。   As described above, the calculated content arrangement coordinates are expressed on the concept map and can be viewed as a content map. FIG. 9 shows a content map (part 1) according to the embodiment of the present invention, and FIG. 10 shows a content map (part 2) according to the embodiment of the present invention. 9 is a two-dimensional representation, and FIG. 10 is a three-dimensional representation. Moreover, this display method may use a display method such as that described in Non-Patent Document 4 above.

これらのマップは、Webブラウザなどを利用してコンピュータのディスプレイ(表示部11)上に表示することや、印刷して表示することができる。また、このコンテンツの表示方法については、2次元や3次元等様々な表現方法に適用することができる。   These maps can be displayed on a computer display (display unit 11) using a Web browser or the like, or can be printed and displayed. The content display method can be applied to various representation methods such as two-dimensional and three-dimensional.

なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。   The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.

本発明は、ユーザが大量の情報をその構造を概観または観察しながら、興味ある情報に到達できるようにするためのブラウジングインタフェース技術に適用可能である。   The present invention can be applied to a browsing interface technology for allowing a user to reach a piece of information of interest while viewing or observing its structure.

本発明の原理を説明するための図である。It is a figure for demonstrating the principle of this invention. 本発明の原理構成図である。It is a principle block diagram of this invention. 本発明の概要を説明するための図である。It is a figure for demonstrating the outline | summary of this invention. 本発明の一実施の形態における視覚的情報分類装置の構成図である。It is a block diagram of the visual information classification device in one embodiment of the present invention. 本発明の一実施の形態におけるコンテンツを分類するための分類カテゴリの体系例である。It is a systematic example of the classification category for classifying the content in one embodiment of the present invention. 本発明の一実施の形態における概念マップの例である。It is an example of the conceptual map in one embodiment of this invention. 本発明の一実施の形態におけるキーワード重み率算出処理のフローチャートである。It is a flowchart of the keyword weight rate calculation process in one embodiment of the present invention. 本発明の一実施の形態におけるキーワードの重み率算出のための変数を説明するための図である。It is a figure for demonstrating the variable for the weighting factor calculation of the keyword in one embodiment of this invention. 本発明の一実施の形態におけるコンテンツマップ(その1)である。It is a content map (the 1) in one embodiment of the present invention. 本発明の一実施の形態におけるコンテンツマップ(その2)である。It is a content map (the 2) in one embodiment of the present invention. 概念マップの概要を説明するための図である。It is a figure for demonstrating the outline | summary of a concept map. 従来の技術の概要を説明するための図である。It is a figure for demonstrating the outline | summary of the prior art.

符号の説明Explanation of symbols

10 コンピュータ
11 表示部
12 指示入力部
20 コンテンツデータベース(DB)
21 メタ情報データベース(DB)
22 概念ベクトルデータベース(DB)
23 配置座標データベース(DB)
40 ネットワーク
300 重み算出手段、キーワード重み率算出処理部
310 配置座標算出手段、コンテンツ座標算出処理部
10 Computer 11 Display Unit 12 Instruction Input Unit 20 Content Database (DB)
21 Meta Information Database (DB)
22 Concept vector database (DB)
23 Placement coordinate database (DB)
40 network 300 weight calculation means , keyword weight ratio calculation processing section 310 arrangement coordinate calculation means , content coordinate calculation processing section

Claims (4)

キーワードに付与された分類カテゴリ、および概念ベクトルを利用して、内容に基づく分類カテゴリと内容を表すキーワードを有するコンテンツを視覚的にキーワードと分類カテゴリが配置された概念マップ上に分類配置する視覚的情報分類方法であって、
コンピュータが、
コンテンツが持つキーワードそれぞれについて、コンテンツ自身が属する分類カテゴリの重心Giと、当該キーワードが属する分類カテゴリの重心Gjとの距離に応じ、その距離が近いほど1となり、その距離が遠いほど0となる重み率を算出し、
前記コンテンツが持つキーワードそれぞれに対し、当該キーワードに付与された概念ベクトルに前記重み率を掛けて、全てのキーワードの重心を取ることで、コンテンツの配置座標を算出し、座標配置データベースに出力し、
算出された配置座標を概念マップ上に表現する
ことを特徴とする視覚的情報分類方法。
Visually categorizing and placing content with classification categories based on content and keywords representing the content on a conceptual map in which keywords and classification categories are placed , using classification categories assigned to keywords and concept vectors An information classification method,
Computer
For each keyword possessed by the content, a weight that becomes 1 as the distance decreases and 0 as the distance increases, according to the distance between the centroid Gi of the classification category to which the content itself belongs and the centroid Gj of the classification category to which the keyword belongs. Calculate the rate,
For each keyword of the content, multiply the concept vector assigned to the keyword by the weight ratio and take the centroid of all keywords to calculate the content placement coordinates and output to the coordinate placement database,
A visual information classification method characterized by expressing calculated arrangement coordinates on a concept map.
キーワードに付与された分類カテゴリ、及び概念ベクトルを利用して、内容に基づく分類カテゴリと内容を表すキーワードを有するコンテンツを視覚的にキーワードと分類カテゴリが配置された概念マップ上に分類配置する視覚的情報分類装置であって、
コンテンツが持つキーワードそれぞれについて、コンテンツ自身が属する分類カテゴリの重心Giと、当該キーワードが属する分類カテゴリの重心Gjとの距離に応じ、その距離が近いほど1となり、その距離が遠いほど0となる重み率を算出する重み率算出手段と、
前記コンテンツが持つキーワードそれぞれに対し、当該キーワードに付与された概念ベクトルに前記重み率算出手段で算出した前記重み率を掛けて、全てのキーワードの重心をとることで、コンテンツの配置座標を算出し、座標配置データベースに出力する配置座標算出手段と、
算出された配置座標を概念マップ上に表現する手段と、
を有することを特徴とする視覚的情報分類装置。
Visually categorizing and placing content having classification categories based on content and keywords representing content on a concept map in which keywords and classification categories are placed , using classification categories assigned to keywords and concept vectors An information classification device,
For each keyword possessed by the content, a weight that becomes 1 as the distance decreases and 0 as the distance increases, according to the distance between the centroid Gi of the classification category to which the content itself belongs and the centroid Gj of the classification category to which the keyword belongs. A weight rate calculating means for calculating a rate;
For each keyword of the content, the placement coordinates of the content are calculated by multiplying the concept vector assigned to the keyword by the weight rate calculated by the weight rate calculation means and taking the center of gravity of all keywords. , Arrangement coordinate calculation means for outputting to the coordinate arrangement database;
Means for expressing the calculated arrangement coordinates on a concept map;
A visual information classification device characterized by comprising:
請求項2に記載の視覚的情報分類装置を構成する各手段としてコンピュータを機能させるための視覚的情報分類プログラム。   The visual information classification program for functioning a computer as each means which comprises the visual information classification device of Claim 2. 請求項3に記載の視覚的情報分類プログラムを記録したコンピュータ読み取り可能な記録媒体。   A computer-readable recording medium on which the visual information classification program according to claim 3 is recorded.
JP2004148236A 2004-05-18 2004-05-18 Visual information classification method and apparatus, program, and storage medium recording visual information classification program Expired - Fee Related JP4453440B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004148236A JP4453440B2 (en) 2004-05-18 2004-05-18 Visual information classification method and apparatus, program, and storage medium recording visual information classification program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004148236A JP4453440B2 (en) 2004-05-18 2004-05-18 Visual information classification method and apparatus, program, and storage medium recording visual information classification program

Publications (2)

Publication Number Publication Date
JP2005332080A JP2005332080A (en) 2005-12-02
JP4453440B2 true JP4453440B2 (en) 2010-04-21

Family

ID=35486723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004148236A Expired - Fee Related JP4453440B2 (en) 2004-05-18 2004-05-18 Visual information classification method and apparatus, program, and storage medium recording visual information classification program

Country Status (1)

Country Link
JP (1) JP4453440B2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4986226B2 (en) * 2006-05-15 2012-07-25 データ・ケーキベーカ株式会社 Data processing method, data processing apparatus, and program
JP5134856B2 (en) * 2006-05-15 2013-01-30 データ・ケーキベーカ株式会社 Data processing method, data processing apparatus, and program
JP5277499B2 (en) * 2007-05-16 2013-08-28 株式会社アテロソフト Information retrieval device
JP4518165B2 (en) 2008-03-11 2010-08-04 富士ゼロックス株式会社 Related document presentation system and program
JP4518168B2 (en) 2008-03-21 2010-08-04 富士ゼロックス株式会社 Related document presentation system and program
JP5178347B2 (en) * 2008-06-25 2013-04-10 ヤフー株式会社 System, method, and program comprising feature word sorting device and classification device
JP4762376B2 (en) * 2011-04-13 2011-08-31 株式会社東芝 Display processing apparatus, display processing method, and program
JP5710539B2 (en) * 2012-04-18 2015-04-30 日本電信電話株式会社 Graph generation apparatus, method, and program

Also Published As

Publication number Publication date
JP2005332080A (en) 2005-12-02

Similar Documents

Publication Publication Date Title
JP3781696B2 (en) Image search method and search device
US6910037B2 (en) Method and apparatus for providing search results in response to an information search request
US8345042B2 (en) Mesh-based shape retrieval system
JP4972358B2 (en) Document search apparatus, document search method, document search program, and recording medium.
JP2003167914A (en) Multimedia information retrieving method, program, recording medium and system therefor
JP2003345811A (en) System and method for displaying document information, and document retrieving method
JP2006301920A (en) Document classification program, document classification method, and document classification apparatus
JP2016018286A (en) Action type discrimination system, action type discrimination method, and action type discrimination program
JP2011248596A (en) Searching system and searching method for picture-containing documents
JP4453440B2 (en) Visual information classification method and apparatus, program, and storage medium recording visual information classification program
JP6772478B2 (en) Information retrieval program and information retrieval device
JP5414334B2 (en) Pseudo-document search system and pseudo-document search method
CN110688559A (en) Retrieval method and device
JP6303669B2 (en) Document retrieval device, document retrieval system, document retrieval method, and program
JP2004086262A (en) Visual information classification method, visual information classification device, visual information classification program, and recording medium storing the program
Dinov et al. Natural language processing/text mining
JPH10111869A (en) Device and method for information classification
JP2005316897A (en) Visual classification method, device and program, and storage medium storing visual classification program
KR101078978B1 (en) System for grouping documents
JP2017208047A (en) Information search method, information search apparatus, and program
CN110633363A (en) Text entity recommendation method based on NLP and fuzzy multi-criterion decision
JP6976537B1 (en) Information retrieval device, information retrieval method and information retrieval program
JP2019211884A (en) Information search system
EP3109777A1 (en) Object classification device and program
US20230215207A1 (en) Geographic management of document content

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060720

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090623

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091006

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100112

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100125

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130212

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees