JP5310196B2 - Classification system revision support program, classification system revision support device, and classification system revision support method - Google Patents
Classification system revision support program, classification system revision support device, and classification system revision support method Download PDFInfo
- Publication number
- JP5310196B2 JP5310196B2 JP2009086389A JP2009086389A JP5310196B2 JP 5310196 B2 JP5310196 B2 JP 5310196B2 JP 2009086389 A JP2009086389 A JP 2009086389A JP 2009086389 A JP2009086389 A JP 2009086389A JP 5310196 B2 JP5310196 B2 JP 5310196B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- hypothesis
- field
- information
- viewpoint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は分類体系の改正作業を支援する分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法に関する。 The present invention relates to a classification system revision support program, a classification system revision support device, and a classification system revision support method that support revision work of a classification system.
情報通信技術の発達により、コンピュータを用いて膨大な量の文書情報に容易にアクセス可能となっている。このような膨大な文書情報の中から利用者が必要とする文書を見つけ出すのを容易にするために、予め文書情報を分類しておく技術がある。的確な分類体系の下で文書情報を予め分類しておけば、文書情報の利用者は、目的に応じた類型の文書情報の中から、必要な文書を比較的容易に見つけ出すことができる。このような文書情報の分類を有効活用している例としては、特許文献(公開特許公報、特許公報など)の分類体系がある。 With the development of information communication technology, a huge amount of document information can be easily accessed using a computer. There is a technique for classifying document information in advance in order to easily find a document required by a user from such a large amount of document information. If the document information is classified in advance under an accurate classification system, the user of the document information can find out a necessary document relatively easily from the types of document information according to the purpose. As an example of effectively utilizing such classification of document information, there is a classification system of patent documents (open patent gazette, patent gazette, etc.).
多くの国では、特許文献の分類体系として国際特許分類(IPC:International Patent Classification)が用いられている。各国で発行された特許文献には、IPCによる分類情報が付与されている。また、日本国で発行される特許文献には、IPCに加えて、FIやFタームといった複数の分類情報が付与されている。FIは、IPCをさらに展開したものである。Fタームは、日本国特許庁において開発された検索コード体系である。IPC、FI、Fタームといった分類体系は、日本国特許庁内部での特許審査のための先行技術調査や、企業での様々な技術調査に活用されている。 In many countries, the International Patent Classification (IPC) is used as a classification system for patent documents. Classification information by IPC is given to patent documents issued in each country. In addition to IPC, a plurality of classification information such as FI and F-term are given to patent documents issued in Japan. FI is a further development of IPC. F-term is a search code system developed by the Japan Patent Office. Classification systems such as IPC, FI, and F-term are utilized in prior art searches for patent examinations within the Japan Patent Office and various technical searches in companies.
これらの特許分類体系のうち特にFタームでは、各分野に固有の技術要素の細分類など多種多様な観点が設定されている。さらにFタームでは、観点の下に分類の観点に基づいて分類する際のカテゴリを示す数字が設定されている。観点とその観点に基づいて設定されたカテゴリは、分野ごとに設定される。 Among these patent classification systems, especially in the F term, various viewpoints such as fine classification of technical elements unique to each field are set. Further, in the F term, a number indicating a category for classification based on a classification viewpoint is set under the viewpoint. A viewpoint and a category set based on the viewpoint are set for each field.
ところでFタームによる分類では、異なる分野に対して、同じ観点でカテゴリが設定される場合がある。このとき、Aという分野と、Aとは別のBという分野とで同じ観点でカテゴリが細分化されているにもかかわらず、分野Aの下にだけ定義され、分野Bの下に定義されていないカテゴリが存在する場合がある。このように分類体系の一貫性や整合性が保たれていないと、Fタームを使って検索や分析を行うユーザの利便性が低下してしまう。 By the way, in the classification based on F-terms, categories may be set from the same viewpoint for different fields. At this time, although the category is subdivided from the same viewpoint in the field A and the field B different from A, it is defined only under the field A and defined under the field B. There may be no categories. If the consistency and consistency of the classification system is not maintained in this way, the convenience of the user who performs the search and analysis using the F term will be reduced.
ユーザの利便性を上げるように分類体系の見直しを支援する技術としては、例えばユーザの利用状況によって分類を評価する技術がある。この技術には、ユーザの参照頻度が高い情報を、さらにより多くのユーザの目に触れるように情報を分類する技術や、利用者のアクセス履歴を記録し、この記録したアクセス履歴に基づいて各分類の評価値を演算する技術がある。 As a technique for supporting the review of the classification system so as to improve the convenience for the user, for example, there is a technique for evaluating the classification according to the usage status of the user. In this technology, information that is frequently referenced by users is classified into information that can be seen by even more users, and access history of users is recorded, and each information is recorded based on this recorded access history. There is a technique for calculating an evaluation value of classification.
また、既にグループに分類されている情報を参考にして、新たに作成した分類構造に不足している情報を特定し、不足している情報を分類構造への追加候補としてユーザに提示する技術もある。 In addition, with reference to information that has already been classified into groups, there is also a technology that identifies information that is missing in the newly created classification structure and presents the missing information to the user as a candidate for addition to the classification structure. is there.
しかし、従来の分類体系の見直し技術では、同じ観点により共通のカテゴリを設定可能な複数の分野間で、カテゴリの一貫性を高めるような見直しをすることができない。同じ観点で分類するのであれば同じカテゴリを設定可能な複数の分野であるにもかかわらず、各分野で実際に設定されているカテゴリに違いがあると、複数の分野にまたがる検索や分析に必要以上に手間がかかってしまう。例えば、複数の分野にまたがる検索を行う場合に、分野ごとに個別の検索条件を設定する必要が生じる。しかも、分野ごとに検索条件が異なれば、検索結果を統計的に分析する場合、分野ごとの検索結果を対等に比較することができない。 However, in the conventional classification system review technology, it is not possible to perform a review that improves the consistency of categories among a plurality of fields in which a common category can be set from the same viewpoint. It is necessary for search and analysis across multiple fields if there are differences in the categories that are actually set in each field, even if the same category can be set in multiple fields if they are classified from the same viewpoint. More time is required. For example, when searching across multiple fields, it is necessary to set individual search conditions for each field. Moreover, if the search conditions are different for each field, when the search results are statistically analyzed, the search results for each field cannot be compared equally.
なお、観点が同じ場合、その観点で分類するときのカテゴリを全分野で共通にすれば、分類体系としての一貫性は保つことができる。ただし、観点が同一であっても、分野によっては不適切なカテゴリも存在する。そのため、特定の観点で分類するときのカテゴリを全分野で共通にすると、分野によってはほとんど使用されないカテゴリが多数発生してしまう。不必要に分類体系のカテゴリを増やすと、ユーザが情報を検索する際に適切なカテゴリを見つけ出し辛くなり、利便性が低下してしまう。 If the viewpoints are the same, the consistency as the classification system can be maintained if the categories for classification from the viewpoints are the same in all fields. However, even if the viewpoints are the same, some categories are inappropriate depending on the field. For this reason, if categories for classification from a specific point of view are made common in all fields, many categories that are rarely used depending on the field are generated. If the number of categories in the classification system is increased unnecessarily, it becomes difficult for the user to find an appropriate category when searching for information, and convenience is reduced.
このような問題点は、特許文献の分類に用いられるFタームに限らず、大量の情報を分類する場合の分類体系に同様に発生する。例えば、インターネットのサーチエンジンには、アクセス可能な文書をカテゴリ別に分類しておくディレクトリ型のサーチエンジンもある。このようなディレクトリ型のサーチエンジンにより情報検索サービスを行う場合にも、ユーザの利便性の向上のためには、各分野のカテゴリに統一性があることが重要である。 Such a problem occurs not only in the F-term used for classification of patent documents, but also in a classification system when a large amount of information is classified. For example, Internet search engines include directory search engines that classify accessible documents by category. Even when an information search service is performed using such a directory-type search engine, it is important that the categories in each field have uniformity in order to improve user convenience.
本発明はこのような点に鑑みてなされたものであり、全体での整合性を保ちつつも無駄のない分類体系となるように分類体系の改正を支援できる分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法を提供することを目的とする。 The present invention has been made in view of such points, and a classification system revision support program and classification system revision that can support revision of a classification system so as to be a wasteful classification system while maintaining overall consistency. An object is to provide a support device and a classification system revision support method.
上記課題を解決するために、以下の処理をコンピュータに実行させる分類体系改正支援プログラムが提供される。この分類体系改正支援プログラムに基づいて、コンピュータが複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系を示す分類体系情報を記憶する分類体系情報記憶手段を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出する。次に、コンピュータは、抽出された分野それぞれの共通の観点で設けられたカテゴリ同士を比較する。次にコンピュータは、抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、追加対象カテゴリを他の分野に対して追加するものとする仮説を定義する。次にコンピュータは、分類体系による分類対象となる情報が格納されたデータベースを参照し、仮説に従って追加対象カテゴリが追加された場合に、追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出する。さらにコンピュータは、検出された追加カテゴリ適合情報の量に基づいて仮説の適否を判定する。そしてコンピュータは、適切と判定された仮説を改正案として出力する。 In order to solve the above-described problems, a classification system revision support program that causes a computer to execute the following processing is provided. Based on this classification system revision support program, a computer stores classification system information indicating a classification system in which a viewpoint of classification is defined in each of a plurality of fields and a category for classification according to the defined viewpoint is provided. By referring to the system information storage means, at least two fields in which categories are provided from a common viewpoint are extracted. Next, the computer compares the categories provided from the common viewpoints of the extracted fields. Next, the computer defines a hypothesis that a category that exists only in some of the extracted fields is set as an addition target category and the additional target category is added to another field. Next, the computer refers to a database in which information to be classified by the classification system is stored, and detects additional category conforming information that belongs to the additional target category when the additional target category is added according to the hypothesis. Furthermore, the computer determines the suitability of the hypothesis based on the detected amount of additional category conformance information. Then, the computer outputs the hypothesis determined to be appropriate as a revised proposal.
異なる分野における共通の観点での分類カテゴリの統一案のうち、有用なカテゴリを追加する改正案のみをユーザに提示することができる。 Of the proposals for unifying classification categories from a common viewpoint in different fields, only the revision proposal for adding a useful category can be presented to the user.
以下、本実施の形態を図面を参照して説明する。
図1は、実施の形態の概要を示す図である。分類体系情報記憶手段1には、分類体系情報が予め記憶されている。分類体系情報には、複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系が示されている。
Hereinafter, the present embodiment will be described with reference to the drawings.
FIG. 1 is a diagram showing an outline of the embodiment. The classification system information storage means 1 stores classification system information in advance. The classification system information shows a classification system in which a viewpoint of classification is defined for each of a plurality of fields, and a category for classification according to the defined viewpoint is provided.
観点共通分野検索手段2は、分類体系情報記憶手段1を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出する。図1の例では、「目的・機能」という共通の観点を有する2つの分野3,4が抽出されている。 The viewpoint common field search means 2 refers to the classification system information storage means 1 and extracts at least two fields in which categories are provided from a common viewpoint. In the example of FIG. 1, two fields 3 and 4 having a common viewpoint of “purpose / function” are extracted.
仮説定義手段5は、抽出された分野3,4それぞれの共通の観点で設けられたカテゴリ同士を比較する。そして仮説定義手段5は、抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、追加対象カテゴリを他の分野に対して追加するものとする仮説を定義する。図1の例では、「操作性の向上」、「安全性の向上」といったカテゴリは2つの分野3,4両方に設けられているが、「植付精度の向上」というカテゴリは「田植機の接地部」という分野3にのみ存在する。そこで、仮説定義手段5は、「田植機の要素」の分野4における「目的・機能」の観点での分類に関して、「植付精度の向上」というカテゴリを追加するという仮説を定義する。 The hypothesis definition means 5 compares the categories provided from the common viewpoints of the extracted fields 3 and 4. Then, the hypothesis definition means 5 defines a hypothesis in which a category that exists only in a part of the extracted fields is set as an addition target category and the addition target category is added to another field. In the example of FIG. 1, categories such as “improvement of operability” and “improvement of safety” are provided in both of the two fields 3 and 4, but the category of “improving planting accuracy” It exists only in the field 3 called “grounding part”. Therefore, the hypothesis definition means 5 defines a hypothesis that a category of “improving planting accuracy” is added regarding the classification from the viewpoint of “purpose / function” in the field 4 of “elements of rice transplanter”.
仮説検証手段7は、分類体系による分類対象となる情報が格納されたデータベース6を参照し、仮説に従って追加対象カテゴリが追加された場合に、追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出する。図1の例であれば、データベース6に格納された情報の中から、「田植機の要素」に関する分野の情報であり、かつ「植付精度の向上」に関連する情報が検出される。さらに仮説検証手段7は、検出された追加カテゴリ適合情報の量に基づいて仮説の適否を判定する。例えば仮説検証手段7は、検出された追加カテゴリ適合情報の数が所定数以上であれば、仮説が適切であると判断する。そして仮説検証手段7は、適切と判定された仮説を改正案8として出力する。例えば、仮説検証手段7は、改正案8の内容をモニタに表示し、ユーザに提示する。
The
このようにして、分類体系の改正を考える際に、分類の観点が共通している複数の分野での分類のされ方を考慮して改正の候補を決めることができる。そのため、横断的に分類体系の整合性を保つような改正案をユーザに提示することができる。しかも仮説を検証することで、不必要なカテゴリについては追加提案がされない。その結果、異なる分野における共通の観点での分類カテゴリの統一案のうち、有用なカテゴリを追加する改正案のみをユーザに提示することができる。 In this way, when considering a revision of the classification system, candidates for revision can be determined in consideration of how classification is performed in a plurality of fields having a common viewpoint of classification. Therefore, it is possible to present to the user an amendment that maintains the consistency of the classification system across the cross. Moreover, by verifying the hypothesis, no additional proposals are made for unnecessary categories. As a result, it is possible to present to the user only a revised proposal for adding a useful category among unified proposals for classification categories from a common viewpoint in different fields.
このような分類体系の改正支援技術は、特許文献の分類体系の改正に有効に利用することができる。特許文献は、まず技術分野によって分類される。同じ技術分野の特許文献を、様々な観点で分類できる。このような分類体系としてFタームがある。 Such a classification system revision support technology can be used effectively for revision of a patent document classification system. Patent literature is first classified by technical field. Patent documents in the same technical field can be classified from various viewpoints. There is an F-term as such a classification system.
Fタームでは、技術分野ごとに、技術的な必然性や、発展方向の差により設定されるべきカテゴリが決められる。そこでFタームによる分類体系の改正案を、図1に示すようなシステムで提示するようにすれば、類似の分類が可能な分野ではカテゴリの整合性を保ち、かつ、改正を行う分野においての必要性の高さを評価して改正案を作成することができる。すなわち、全体での整合性を保ちつつも無駄のない改正案を作成できる。 In the F-term, categories to be set are determined for each technical field depending on technical necessity and differences in development direction. Therefore, if the proposed amendment of the classification system by F-term is presented by the system as shown in Fig. 1, the consistency of the category is maintained in the field where similar classification is possible, and it is necessary in the field to be revised. An amendment can be drafted by evaluating the high nature. In other words, it is possible to create a revision plan without waste while maintaining overall consistency.
そこで、特許文献の分類に用いられるFタームに関し、分野間のカテゴリの整合性を高めるための実施の形態について、以下に詳細に説明する。
[第1の実施の形態]
まずFタームについて具体的に説明する。Fタームは分野ごとに所定の観点で分類用のカテゴリが定義されている。
Therefore, an embodiment for enhancing the consistency of categories between fields regarding F terms used for classification of patent documents will be described in detail below.
[First Embodiment]
First, the F term will be described in detail. In the F term, categories for classification are defined for each field from a predetermined viewpoint.
図2は、田植機に関するFタームの例を示す図である。田植機に関する発明は、「田植機の要素」や「田植機の接地部」などの分野に細分化されている。各分野には、カテゴリコードが付与されている。「田植機の要素」のカテゴリコードは「2B062」である。「田植機の接地部」のカテゴリコードは「2B063」である。このカテゴリコードによって、検索対象の分野を一意に特定できる。 FIG. 2 is a diagram illustrating an example of an F term relating to a rice transplanter. Inventions related to rice transplanters are subdivided into fields such as “elements of rice transplanters” and “grounding parts of rice transplanters”. A category code is assigned to each field. The category code of “rice transplanter element” is “2B062”. The category code of “Resting part of rice transplanter” is “2B063”. The category code can uniquely identify the field to be searched.
各分野では、カテゴリ分けをするための観点が定義されている。図2の例では、2つのFタームリスト41,42が示されている。Fタームリスト41は、分野「田植機の要素」に関する特許文献を、「目的・機能」という観点で分類する際のカテゴリを示している。Fタームリスト42は、分野「田植機の接地部」に関する特許文献を、「目的・機能」という観点で分類する際のカテゴリを示している。このように異なる分野の特許文献であっても、同じ観点で分類することができる。 In each field, viewpoints for categorization are defined. In the example of FIG. 2, two F-term lists 41 and 42 are shown. The F-term list 41 indicates categories for classifying patent documents related to the field “elements of rice transplanters” from the viewpoint of “purpose / function”. The F-term list 42 indicates a category for classifying patent documents related to the field “grounding part of rice transplanter” in terms of “purpose / function”. Thus, even patent documents in different fields can be classified from the same viewpoint.
カテゴリは階層構造となっている。文字列の左の「・」の数が、階層の深さを示している。「・」が1つであれば、第1階層のカテゴリである。「・」が2つであれば、第2階層のカテゴリである。「・」が3つであれば、第3階層のカテゴリである。下位の階層のカテゴリは、そのカテゴリより上位階層のカテゴリに含まれるカテゴリである。Fタームリスト41,42では、下位階層のカテゴリが、対応する上位階層のカテゴリの直下に羅列されている。例えばFタームリスト41中の「操作性の向上」のカテゴリは、「移植機等の性能向上」のカテゴリに含まれている。 Categories have a hierarchical structure. The number of “•” on the left of the character string indicates the depth of the hierarchy. If there is only one “•”, it is the category of the first hierarchy. If there are two “•”, it is the category of the second hierarchy. If there are three “•”, it is a category of the third hierarchy. A category in a lower hierarchy is a category included in a category in an upper hierarchy than that category. In the F-term lists 41 and 42, the lower hierarchy categories are listed directly below the corresponding upper hierarchy categories. For example, the category of “improvement of operability” in the F-term list 41 is included in the category of “improvement of performance of transplanter and the like”.
また、各観点での分類のカテゴリには、「その他」というカテゴリが設けられている。「その他」のカテゴリには、設定されているカテゴリに含まれない特許文献が分類される。 In addition, a category “others” is provided as a category of classification from each viewpoint. In the “other” category, patent documents not included in the set category are classified.
このように「田植機の要素」(テーマコード「2B062」)の分野と「田植機の接地部」(テーマコード「2B063」)とにはどちらも「目的・機能」という観点が設定されている。そこで、「田植機の要素」と「田植機の接地部」とのそれぞれを「目的・機能」という観点で分類したときのFタームにおけるカテゴリを比較してみる。 In this way, the field of “rice transplanter element” (theme code “2B062”) and “landering part of rice transplanter” (theme code “2B063”) both have the viewpoint of “purpose / function”. . Therefore, compare the categories in the F-term when classifying the “rice transplanter element” and the “rice transplanter grounding part” in terms of “purpose / function”.
「田植機の要素」と「田植機の接地部」の「目的・機能」の観点でのカテゴリとして、「移植機等の性能・向上」が設定され、さらにその下に「操作性の向上」や「安全性の向上」といったカテゴリが設定されている。 “Performance / Improvement of transplanter etc.” is set as a category in terms of “Purpose / Function” of “Elementary Transplant Elements” and “Grounding Section of Rice Transplanter”, and further under that, “Improved operability” And categories such as “Improving safety” are set.
ここで、「田植機の接地部」に定義されている「植付精度の向上」というカテゴリは「田植機の要素」には設定されておらず、分野領域が近く、分類の観点が同じであっても分類体系として整合性が取れていない。しかも、「田植機の要素」に分類されている特許文献にも「植付精度」という言葉が使われているものもあり、「田植機の要素」の下にも「植付精度の向上」というカテゴリを設定する必要があるかもしれない。 Here, the category of “improving planting accuracy” defined in “grounding part of rice transplanter” is not set to “elements of rice transplanter”, the field area is close, and the viewpoint of classification is the same. Even if it exists, it is not consistent as a classification system. In addition, some patent documents classified as “elements of rice transplanter” also use the term “planting accuracy”, and “improvement of planting accuracy” under “elements of rice transplanter”. You may need to set a category.
図2に示したようなFタームにおいて、例えば田植機全般の特許文献について「植付精度の向上」を表すFタームで検索する場合を考える。この場合、「田植機の要素」と「田植機の接地部」の両方に関連の特許が存在したとしても、「田植機の接地部」の中では検索結果として特許文献を得ることができない。 In the F-term as shown in FIG. 2, for example, a case is considered in which patent documents for rice transplanters in general are searched with an F-term representing “improving planting accuracy”. In this case, even if there is a patent related to both “elements of rice transplanter” and “grounding part of rice transplanter”, patent documents cannot be obtained as search results in “grounding part of rice transplanter”.
このような、分野間でのカテゴリの不統一は、田植機以外においても生じている。
図3は、光源に関するFタームの例を示す図である。図3の例では、「光源」に関する観点を有する分野が3つ示されている。1つめの分野は、「光源の構成」(テーマコード「5D119」)の観点を有する「光学的記録再生4(ヘッド自体)」である。2つ目の分野は、「光源」(テーマコード「2F065」)の観点を有する「光学的手段による測長装置」である。3つ目の分野は、「光源」(テーマコード「2C362」)の観点を有する「レーザービームプリンタ」である。図3には、各分野の該当観点による分類のFタームリスト43〜45が示されている。
Such category inconsistencies between fields also occur outside of rice transplanters.
FIG. 3 is a diagram illustrating an example of an F term relating to a light source. In the example of FIG. 3, three fields having viewpoints related to “light source” are shown. The first field is “optical recording / reproducing 4 (head itself)” having a viewpoint of “configuration of light source” (theme code “5D119”). The second field is “length measuring device by optical means” having the viewpoint of “light source” (theme code “2F065”). The third field is a “laser beam printer” having a viewpoint of “light source” (theme code “2C362”). FIG. 3 shows F-term lists 43 to 45 classified according to the relevant viewpoints of each field.
図3に示したFタームリスト43〜45の光源の種類の分類される第2層のカテゴリを比較すると、「ガスレーザー」や「半導体レーザー」については共通する。しかし、その他のカテゴリは一致しない。 Comparing the categories of the second layer into which the types of light sources in the F-term lists 43 to 45 shown in FIG. 3 are classified, “gas laser” and “semiconductor laser” are common. However, other categories do not match.
ここで、分野「光学的記録再生4(ヘッド自体)」の観点「光源の構成」(テーマコード「5D119」)に含まれるカテゴリ「ランプ」に着目してみる。カテゴリ「ランプ」は、分野「光学的手段による測長装置」の観点「光源」(テーマコード「2F065」)には含まれていない。しかし、実際にテーマコード「2F065」に分類された特許文献をキーワード「ランプ」で検索すると、数百の特許文献がヒットする場合がある。この場合、分野「光学的手段による測長装置」の観点「光源」(テーマコード「2F065」)に「ランプ」というカテゴリを追加することが適切であると推定できる。 Here, attention is paid to the category “lamp” included in the viewpoint “configuration of the light source” (theme code “5D119”) in the field “optical recording / reproducing 4 (head itself)”. The category “lamp” is not included in the viewpoint “light source” (theme code “2F065”) of the field “optical measuring device by optical means”. However, if patent documents actually classified into the theme code “2F065” are searched with the keyword “lamp”, hundreds of patent documents may be hit. In this case, it can be estimated that it is appropriate to add the category “lamp” to the viewpoint “light source” (theme code “2F065”) of the field “optical measuring device by optical means”.
また、カテゴリ「ランプ」は、分野「レーザービームプリンタ」の観点「光源」(テーマコード「2C362」)には含まれていない。しかし、レーザービームプリンタに関する光源の技術で、レーザーに代えてランプが用いられることは想定しづらい。すると、分野「レーザービームプリンタ」の観点「光源」(テーマコード「2C362」)に「ランプ」というカテゴリを追加するのは不適切であることが推定できる。 The category “lamp” is not included in the viewpoint “light source” (theme code “2C362”) of the field “laser beam printer”. However, it is difficult to assume that lamps are used in place of lasers in the light source technology for laser beam printers. Then, it can be estimated that it is inappropriate to add the category “lamp” to the viewpoint “light source” (theme code “2C362”) in the field “laser beam printer”.
このように、異なる分野で共通の観点で分類されていても、カテゴリを統一することが適切な場合と、カテゴリを統一することが不適切な場合とが存在する。そこで、以下に、このようなFタームにおけるカテゴリの統一可能な観点の抽出と、カテゴリの統一の適否判断を自動的に行うことができる分類体系改正支援装置について詳細に説明する。 As described above, there are cases where it is appropriate to unify categories and cases where it is inappropriate to unify categories even if they are classified from a common viewpoint in different fields. Therefore, a classification system revision support device capable of automatically extracting a viewpoint that can unify categories in the F-term and determining whether or not to unify categories is described in detail below.
図4は、本実施の形態のシステム構成例を示す図である。分類体系改正支援装置100は、ネットワーク10を介して特許情報サーバ20や複数の端末装置31〜33に接続されている。特許情報サーバ20は、特許文献データベース(DB)21を有している。特許文献DB21には、各種特許文献がFタームで分類して格納されている。具体的には、各特許文献に対して、その特許文献が属するカテゴリを示すFタームが付与されている。1つの特許文献は複数のカテゴリに属することができる。そのため複数のカテゴリに属する特許文献には複数のFタームが付与されている。特許情報サーバ20は、端末装置31〜33を利用するユーザに対してFタームを用いた情報検索サービスを提供している。
FIG. 4 is a diagram illustrating a system configuration example of the present embodiment. The classification system revision support device 100 is connected to the patent information server 20 and the plurality of
分類体系改正支援装置100は、Fタームによる分類体系の改正支援を行うコンピュータである。具体的には、分類体系改正支援装置100は、Fタームの定義を利用して整合性を保つべき分野の対を検索する。次に、分類体系改正支援装置100は、得られた対に対してどのような改正を行うべきか仮説を立てる。最後に、分類体系改正支援装置100は、実際にFタームが付与されている特許文献の情報を利用して、検証を行うことによって、改正点を絞り込む。 The classification system revision support device 100 is a computer that supports revision of the classification system using F-terms. More specifically, the classification system revision support apparatus 100 searches for pairs of fields that should maintain consistency by using the definition of the F term. Next, the classification system revision support apparatus 100 makes a hypothesis as to what kind of revision should be performed on the obtained pair. Finally, the classification system revision support apparatus 100 narrows down the revision points by performing verification using the information of the patent document to which the F term is actually assigned.
例えば、ほぼ同様の観点とカテゴリが設定されているAとBという2つの分野があった場合、分類体系改正支援装置100は、分野Aに設定されているカテゴリは分野Bの下にも設定できると仮定する。分類体系改正支援装置100は、この仮定に基づくカテゴリ追加の適否を検証することで、改正案とすべきかどうかを判断する。 For example, when there are two fields A and B in which almost the same viewpoint and category are set, the classification system revision support apparatus 100 can set the category set in the field A also under the field B. Assume that The classification system revision support apparatus 100 determines whether or not the revision should be made by verifying the suitability of the category addition based on this assumption.
図5は、本実施の形態に用いる分類体系改正支援装置のハードウェア構成例を示す図である。分類体系改正支援装置100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス108を介してRAM(Random Access Memory)102と複数の周辺機器が接続されている。
FIG. 5 is a diagram illustrating a hardware configuration example of the classification system revision support device used in the present embodiment. The classification system revision support apparatus 100 is entirely controlled by a CPU (Central Processing Unit) 101. A RAM (Random Access Memory) 102 and a plurality of peripheral devices are connected to the
RAM102は、分類体系改正支援装置100の主記憶装置として使用される。RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。
The
バス108に接続されている周辺機器としては、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、光学ドライブ装置106、および通信インタフェース107がある。
Peripheral devices connected to the
HDD103は、内蔵したディスクに対して、磁気的にデータの書き込みおよび読み出しを行う。HDD103は、分類体系改正支援装置100の二次記憶装置として使用される。HDD103には、OSのプログラム、アプリケーションプログラム、および各種データが格納される。なお、二次記憶装置としては、フラッシュメモリなどの半導体記憶装置を使用することもできる。
The
グラフィック処理装置104には、モニタ11が接続されている。グラフィック処理装置104は、CPU101からの命令に従って、画像をモニタ11の画面に表示させる。モニタ11としては、CRT(Cathode Ray Tube)を用いた表示装置や液晶表示装置などがある。
A monitor 11 is connected to the
入力インタフェース105には、キーボード12とマウス13とが接続されている。入力インタフェース105は、キーボード12やマウス13から送られてくる信号をCPU101に送信する。なお、マウス13は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。
A keyboard 12 and a mouse 13 are connected to the
光学ドライブ装置106は、レーザー光などを利用して、光ディスク14に記録されたデータの読み取りを行う。光ディスク14は、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク14には、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。
The
通信インタフェース107は、ネットワーク10に接続されている。通信インタフェース107は、ネットワーク10を介して、特許情報サーバ20などの他のコンピュータとの間でデータの送受信を行う。
The
以上のようなハードウェア構成によって、本実施の形態の処理機能を実現することができる。なお図5には分類体系改正支援装置100のハードウェア構成例を示したが、特許情報サーバ20や端末装置31〜33も同様のハードウェアで実現することができる。
With the hardware configuration as described above, the processing functions of the present embodiment can be realized. Although FIG. 5 shows a hardware configuration example of the classification system revision support device 100, the patent information server 20 and the
図6は、分類体系改正支援装置の機能を示すブロック図である。分類体系改正支援装置100は、Fターム定義記憶部110、観点共通分野検索部120、修正候補記憶部130、比較結果記憶部140、仮説設定部150、仮説記憶部160、仮説検証部170、改正案記憶部180、および結果表示部190を有する。
FIG. 6 is a block diagram illustrating functions of the classification system revision support device. The classification system revision support apparatus 100 includes an F-term
Fターム定義記憶部110には、特許文献を分類するためのFタームの定義内容を記憶する記憶機能である。例えばHDD103の記憶領域の一部がFターム定義記憶部110として使用される。
The F-term
観点共通分野検索部120は、Fターム定義記憶部110を参照し、各分野のカテゴリ分けの観点に共通性がある2つの分野を検索する。そして観点共通分野検索部120は、検出された2つの分野を、整合性を検討すべ分野の対(整合性検討分野対)とする。この際、観点共通分野検索部120は、整合性検討分野対の一方を修正候補とした修正候補情報を、修正候補記憶部130に格納する。さらに観点共通分野検索部120は、整合性検討分野対における共通の観点で定義されたそれぞれの分野のカテゴリを比較する。観点共通分野検索部120は、カテゴリの比較結果を比較結果記憶部140に格納する。その後、観点共通分野検索部120は、カテゴリの比較完了を仮説設定部150に通知する。
The viewpoint common
修正候補記憶部130は、整合性検討分野対の一方で修正候補であることを示す修正候補情報の記憶機能である。例えば、RAM102の記憶領域の一部が修正候補記憶部130として使用される。
The correction
比較結果記憶部140は、整合性検討分野対のカテゴリ比較結果を記憶する記憶機能である。例えば、RAM102の記憶領域の一部が比較結果記憶部140として使用される。
The comparison
仮説設定部150は、観点共通分野検索部120によるカテゴリの比較完了通知を受け取ると、比較結果記憶部140を参照し、追加すべきカテゴリの仮説を定義する。具体的には、仮説設定部150は、異なる2つの分野それぞれで共通の観点で分類していながら、一方にのみ存在し他方に存在しないカテゴリを検出する。そして、仮説設定部150は、カテゴリが不足している分野に該当カテゴリを追加するという仮説を立てる。仮説設定部150は、仮説の内容を仮説記憶部160に格納する。その後、仮説設定部150は、仮説設定の完了を仮説検証部170に通知する。
When the
仮説検証部170は、仮説設定部150による仮説設定完了通知を受け取ると、仮説の正しさを検証する。具体的には、仮説検証部170は、特許文献DB内の文献を用いて、仮説によって作成されるカテゴリに分類されるべき文献の量が所定量以上の場合、仮説が正しいと判断する。仮説検証部170は、改正案記憶部180に改正案を格納する。
Upon receiving the hypothesis setting completion notification from the
改正案記憶部180は、改正案を記憶する記憶機能である。例えばRAM102やHDD103の記憶領域の一部が、改正案記憶部180として使用される。
結果表示部190は、改正案記憶部180に格納された改正案をモニタ11に表示する。
The revision
The
以上のような構成において、Fターム定義記憶部110には、予めFタームの定義情報が格納されている。
図7は、Fターム定義記憶部のデータ構造例を示す図である。Fターム定義記憶部110には、Fターム定義テーブル111が格納されている。Fターム定義テーブル111は、テーマコード、Fターム、観点、第一階層、第二階層、および第三階層の欄が設けられている。
In the configuration as described above, F-term
FIG. 7 is a diagram illustrating a data structure example of the F-term definition storage unit. The F term
テーマコードの欄には、分野の識別コード(テーマコード)が設定される。テーマコードの右に設定されたFターム、観点、第一階層、第二階層、および第三階層の各欄の情報が、該当テーマコードのFターム定義情報である。 A field identification code (theme code) is set in the theme code column. Information in each column of the F term, viewpoint, first layer, second layer, and third layer set to the right of the theme code is the F term definition information of the corresponding theme code.
Fタームの欄には、分類体系内で対応するカテゴリを一意に識別するための識別子(Fターム)が設定される。Fタームは、左から5文字がテーマコードである。テーマコードに続く2文字が、該当分野内での観点の識別コードである。観点の識別コードに続く2文字が、該当観点内でのカテゴリの識別コードである。 In the F-term column, an identifier (F-term) for uniquely identifying the corresponding category in the classification system is set. F-term is the theme code with 5 characters from the left. Two characters following the theme code are an identification code of a viewpoint within the corresponding field. Two characters following the viewpoint identification code are the category identification code within the corresponding viewpoint.
観点の欄には、Fタームで示されるカテゴリの分類時の観点が設定される。第一階層の欄には、Fタームで示されるカテゴリが属する第一階層の属性を示す文字列が設定される。第二階層の欄には、Fタームで示されるカテゴリが属する第二階層の属性を示す文字列が設定される。第三階層の欄には、Fタームで示されるカテゴリが属する第三階層の属性を示す文字列が設定される。なお、Fタームで示されるカテゴリが第一階層のカテゴリの場合、第二階層と第三階層との欄は空欄となる。同様にFタームで示されるカテゴリが第二階層の場合、第三階層の欄は空欄となる。 The viewpoint at the time of classification of the category indicated by the F term is set in the viewpoint column. In the column of the first hierarchy, a character string indicating the attribute of the first hierarchy to which the category indicated by the F term belongs is set. A character string indicating an attribute of the second hierarchy to which the category indicated by the F term belongs is set in the second hierarchy column. A character string indicating the attribute of the third hierarchy to which the category indicated by the F term belongs is set in the third hierarchy column. When the category indicated by the F term is the category of the first hierarchy, the columns of the second hierarchy and the third hierarchy are blank. Similarly, when the category indicated by the F term is the second hierarchy, the third hierarchy column is blank.
このようなFターム定義情報がFターム定義記憶部110に格納されている状態で、ユーザからの分類体系改正案作成指示に応じて、分類体系改正支援装置100が、分類体系改正案作成を行う。
In a state where such F-term definition information is stored in the F-term
図8は、分類体系改正案作成処理の手順を示すフローチャートである。以下、図8に示す処理をステップ番号に沿って説明する。
[ステップS11]まず観点共通分野検索部120は、Fタームの定義を利用して、同一観点を含む分野を検索する。観点共通分野検索部120は、検出された同一観点を含む2つの分野を、整合性を保つべき分野の対(整合性検討分野対)とする。
FIG. 8 is a flowchart showing a procedure of classification system revision proposal creation processing. In the following, the process illustrated in FIG. 8 will be described in order of step number.
[Step S11] First, the common
[ステップS12]次に、仮説設定部150が、ステップS11で得られた整合性検討分野対に対してどのような改正を行うべきかの仮説を立てる。
[ステップS13]最後に、仮説検証部170が、実際にFタームが付けられている公報の情報を利用して、検証を行うことによって、改正点を絞り込む。例えば、ほぼ同様の観点とカテゴリが設定されているAとBという2つの分野があった場合を考える。この場合、仮説検証部170は、もし分野Aにのみ設定されているカテゴリがあったとしたら、そのカテゴリを分野Bの下にも設定できると仮定する。仮説検証部170は、この仮定を検証することで、改正案とすべきかどうかを判断する。
[Step S12] Next, the
[Step S13] Finally, the
ここで、図7に示したFターム定義テーブル111に基づいて、分類体系改正案作成を行う場合を考える。まず、観点共通分野検索部120は、膨大な数のFターム定義情報について、同一の観点、同一のカテゴリが設定されている分野の対を発見する。
Here, a case where a classification system revision proposal is created based on the F-term definition table 111 shown in FIG. First, the viewpoint common
図9は、同一観点を含む分野発見処理により発見される整合性検討分野対の例を示す図である。図9では、観点の同一性とカテゴリの同一性とを比較するため、各分野51〜54の観点ごとのカテゴリを木構造で示している。例えば、テーマコード「2B062」の分野51では「目的・機能」という観点でカテゴリが生成されている。また、テーマコード「2B063」の分野54も「目的・機能」という観点でカテゴリが生成されている。
FIG. 9 is a diagram showing an example of consistency study field pairs discovered by field discovery processing including the same viewpoint. In FIG. 9, in order to compare the identity of viewpoints and the identity of categories, categories for each viewpoint in each
分野51の「目的・機能」という観点には「操作性の向上」や「安全性の向上」といったカテゴリが含まれる。また、分野54の「目的・機能」という観点にも、同様に「操作性の向上」や「安全性の向上」というカテゴリが含まれる。しかし、「植付精度の向上」というカテゴリは分野54にのみ存在し、分野51には存在しない。すなわち、分野51と分野54とでは同じ観点で分類を行っているが、該当観点で分類するためのカテゴリは部分的に一致しているのみである。そこで、観点共通分野検索部120は、分野51と分野54とのカテゴリの整合性を検証するための整合性検討分野対とする。
The viewpoint of “purpose / function” in the
整合性検討分野対が決定されると、仮説設定部150によるカテゴリ改正の仮説が立てられる。
図10は、仮説設定例を示す図である。仮説設定部150は、同一の観点、同一のカテゴリが設定されている分野51,54の対について、すべてのカテゴリの定義が一致するか否かを比較する。ここで、仮説設定部150は、一致しなかった一部のカテゴリについては、一致させるために、片方にだけ定義されているカテゴリを他方にも定義可能であるという仮説を設定する。
When the consistency examination field pair is determined, a hypothesis of category revision by the
FIG. 10 is a diagram illustrating a hypothesis setting example. The
図10の例では、「操作性の向上」や「安全性の向上」については、両分野51,54においてカテゴリの定義が一致している。ところが、「植付精度の向上」(Fターム「2B063AA08」)のカテゴリは、田植機の接地部(テーマコード「2B063」)の分野51にだけ設定されている。そこで「植付精度の向上」(Fターム「2B063AA08」)を、田植機の要素(テーマコード「2B062」)の分野54にも定義する必要があるという仮説を設定される。
In the example of FIG. 10, the definitions of categories in both
仮説が設定されると、仮説検証部170によって仮説の適否が検証される。
図11は、仮説の検証例を示す図である。仮説検証部170は、仮説設定部150によって設定された仮説について適否を検証する。図11の例では、仮説検証部170は、「植付精度の向上」というカテゴリを田植機の要素(テーマコード「2B062」)の分野にも定義が必要であるという仮説を検証する。
When the hypothesis is set, the
FIG. 11 is a diagram illustrating a hypothesis verification example. The
まず仮説検証部170は、特許文献DB21にアクセスし、田植機の接地部(テーマコード「2B063」)の分野において、「目的・機能」の観点(観点の識別コード「AA」)で分類された特許文献の集合(仮説元全体集合61)を取得する。次に仮説検証部170は、「植付精度の向上」(Fターム「2B063AA08」)のコードが付与されている特許文献の集合(仮説元対応カテゴリ集合62)からキーワードを抽出する。例えば「整地」「センサフロート」「田植え機」「感知フロート」・・・といったキーワードが抽出されたものとする。さらに仮説検証部170は、取得した特許文献のうち「植付精度の向上」(Fターム「2B063AA08」)が付与されていない特許文献の集合からキーワードを抽出する。例えば「整地」「フロート」「田植え機」「機体」・・・といったキーワードが抽出されたものとする。
First, the
なお、特許文献からキーワードを抽出する場合、例えば仮説検証部170は、特許文献の形態素解析を行い所定の品詞(名詞や動詞など)の文字列をキーワードとして抽出する。なお、特許文献DB21に予め特許文献ごとのキーワードリストが予め用意されている場合、仮説検証部170は、そのキーワードリストを使用することもできる。
When extracting a keyword from a patent document, for example, the
さらに仮説検証部170は、仮説元対応カテゴリ集合62から抽出したキーワードのうち、仮説元全体集合61内の仮説元対応カテゴリ集合62に属さない特許文献から抽出したキーワードに含まれないキーワードを抽出する。仮説検証部170は、抽出したキーワードを、仮説元対応カテゴリ集合62の特徴キーワードとする。例えば図11の例では、「センサフロート」「感知フロート」・・・といったキーワードが特徴キーワードとなる。
Further, the
その後、仮説検証部170は、特許文献DB21にアクセスし、田植機の要素(テーマコード「2B062」)の分野において、「目的・機能」の観点(観点の識別コード「AA」)で分類された特許文献の集合(仮説対象全体集合63)の検索を行う。この際、仮説検証部170は、仮説対象全体集合63のうち、「その他」のカテゴリに分類された特許文献に対する検索を行う。このときの検索キーワードは、仮説元対応カテゴリ集合62の特徴キーワードである。仮説検証部170は、検索によりヒットした特許文献の件数(ヒット件数M)を、予め設定された閾値Tと比較する。ヒット件数Mが閾値Tより大きければ、仮説が適切であると認定する。すなわち、田植機の要素(テーマコード「2B062」)の分野において、「目的・機能」の観点(観点の識別コード「AA」)での分類カテゴリとして、「植付精度の向上」を追加することが適切であると認定される。
Thereafter, the
このように、設定された仮説の検証を行うことで、「植付精度の向上」のように、新たに追加したカテゴリに属する特許文献が多数存在する場合、そのカテゴリの追加が適切であると認定される。 In this way, by verifying the set hypothesis, when there are many patent documents belonging to the newly added category, such as “improving planting accuracy”, the addition of the category is appropriate. Certified.
なお図2に示すように、田植機の要素(テーマコード「2B062」)の「目的・機能」の観点による「演算処理」のカテゴリは、田植機の接地部(テーマコード「2B063」)の「目的・機能」の観点によるカテゴリに含まれていない。しかし、田植機の接地部という分野において「演算処理」に関する発明は少ない。そのため、そのカテゴリを田植機の接地部に追加しても、追加したカテゴリに属する特許文献は少ない。その結果、検証によって、カテゴリの追加は不適切を判断される。このように、ある分野に特有のカテゴリが仮説元のカテゴリとなったとしても、同じカテゴリの他の分野への追加は検証によりは排除される。 As shown in FIG. 2, the category of “arithmetic processing” from the viewpoint of “purpose / function” of the rice transplanter element (theme code “2B062”) is “ Not included in the category of “purpose / function”. However, there are few inventions related to “arithmetic processing” in the field of the ground contact section of rice transplanters. Therefore, even if the category is added to the grounding part of the rice transplanter, there are few patent documents belonging to the added category. As a result, the addition of the category is judged inappropriate by the verification. As described above, even if a category peculiar to a certain field becomes a hypothesis-based category, addition of the same category to another field is excluded by verification.
なお、図9〜図11に示した例では1つの仮説に関してのみ示したが、実際にはFターム全体の分類体系から多数の仮説が設定され、個々の仮説について検証が行われる。それにより、大規模な分類体系の網羅的な改善を容易に行うことが可能となる。以下、分類体系全体を見直すための機能および処理をより詳細に説明する。 Although the example shown in FIGS. 9 to 11 shows only one hypothesis, actually, a large number of hypotheses are set from the classification system of the entire F term, and each hypothesis is verified. As a result, comprehensive improvement of a large-scale classification system can be easily performed. Hereinafter, functions and processing for reviewing the entire classification system will be described in more detail.
まず、観点共通分野検索部120の機能を詳細に説明する。
図12は、観点共通分野検索部の内部機能を示すブロック図である。観点共通分野検索部120は、観点切出部121、観点同一性判定部122、カテゴリ切出部123、およびカテゴリ比較部124を有する。
First, the function of the viewpoint common
FIG. 12 is a block diagram illustrating an internal function of the common viewpoint field search unit. The viewpoint common
観点切出部121は、Fターム定義記憶部110を参照し、各分野の観点を示す文字列を抽出する。
観点同一性判定部122は、観点切出部121が抽出した各分野の観点を示す文字列を、すべての分野の組み合わせいついて比較する。次に、観点同一性判定部122は、異なる分野間で、同一観点で分類している2つの分野の対(整合性検討分野対)を判定する。観点同一性判定部122は、整合性検討分野対を修正候補記憶部130に格納する。また、観点同一性判定部122は、整合性検討分野対の同一観点内での一致するカテゴリ数を計数する。そして、観点同一性判定部122は、整合性検討分野対ごとの一致するカテゴリ数を修正候補記憶部130に格納する。
The
The viewpoint
カテゴリ切出部123は、整合性検討分野対のそれぞれの分野に関し、同一観点により分類した各カテゴリの定義文を切り出す。
カテゴリ比較部124は、整合性検討分野対のそれぞれの分野のカテゴリの定義文を比較する。その際、カテゴリ比較部124は、比較結果を比較結果記憶部140に格納する。カテゴリ比較部124は、カテゴリの比較が完了すると、その旨を仮説設定部150に通知する。
The
The
次に、このような内部機能を有する観点共通分野検索部120における観点共通分野検索処理について詳細に説明する。
図13は、観点共通分野検索処理の手順を示すフローチャートの前半である。以下、図13に示す処理をステップ番号に沿って説明する。
Next, the viewpoint common field search processing in the viewpoint common
FIG. 13 is the first half of the flowchart showing the procedure of the viewpoint common field search processing. In the following, the process illustrated in FIG. 13 will be described in order of step number.
[ステップS21]観点切出部121は、Fターム定義記憶部110を参照し、Fターム定義テーブル111を取得する。
[ステップS22]観点切出部121は、変数「i」を1に初期化すると共に、変数「j」を1に初期化する。
[Step S <b> 21] The
[Step S22] The
[ステップS23]観点切出部121は、Fターム定義テーブル111のi番目のテーマコードを取得する。観点切出部121は、取得したテーマコードを変数「Ti」に設定する。変数「Ti」は、仮説を設定する際の参照元となる分野(基準分野)を示す。
[Step S <b> 23] The
[ステップS24]観点切出部121は、Fターム定義テーブル111のj番目のテーマコードを取得する。観点切出部121は、取得したテーマコードを変数「Tj」に設定する。変数「Tj」は、仮説を設定する際のカテゴリ追加対象となる分野(改正対象分野)を示す。
[Step S24] The
[ステップS25]観点切出部121は、現在の変数iと変数jとの値を比較し、値が異なる(i≠j)か否かを判断する。値が異なれば、処理がステップS27に進められる。値が等しければ、処理がステップS26に進められる。
[Step S25] The
[ステップS26]変数iと変数jとの値が等しい場合、観点切出部121は、変数jをインクリメントし、処理をステップS24に進める。このように、「j=i」のときは、同じテーマコードを比較することになってしまうので、比較処理をスキップしてjがインクリメントされる。
[Step S26] When the values of the variable i and the variable j are equal, the
[ステップS27]変数iと変数jとの値が等しくなければ、観点切出部121は、Fターム定義テーブル111上で変数「Ti」と変数「Tj」とのそれぞれで示される分野に対応するFターム定義情報を取得する。
[Step S27] If the values of the variable i and j are not equal, the
[ステップS28]観点切出部121は、取得したFターム定義情報から、変数「Ti」で示される分野の観点と、変数「Tj」で示される分野の観点とを抽出する。
[ステップS29]観点同一性判定部122は、変数「Ti」で示される分野の観点と、変数「Tj」で示される分野の観点とのうち、共通する観点を検出する。具体的には、観点を示す文字列が一致する場合に、共通する観点であると判断される。
[Step S28] The
[Step S29] The viewpoint
[ステップS30]観点同一性判定部122は、共通する観点の一致カテゴリ数をカウントする。具体的には、観点同一性判定部122は、共通する観点に関する各分野におけるカテゴリを比較し、定義内容が同一となるカテゴリの数を計数する。
[Step S30] The viewpoint
[ステップS31]観点同一性判定部122は、修正候補記憶部130内の修正候補テーブルに、一致する観点の情報を追加する。具体的には、観点同一性判定部122は、比較対象の2つの分野のテーマコード、一致する観点、および一致するカテゴリ数を、修正候補テーブルに追加する。なお、変数「Ti」で示されるテーマコードの観点と、変数「Tj」で示されるテーマコードの観点とで共通性が無い場合、修正候補テーブルへの情報の追加は行われない。その後、処理がステップS41(図15参照)に進められる。
[Step S <b> 31] The viewpoint
図14は、修正候補記憶部内の修正候補テーブルの例を示す図である。図14に示すように修正候補記憶部130には、修正候補テーブル131が設けられている。修正候補テーブル131には、テーマコードA、テーマコードB、一致する観点、一致するカテゴリの数、および優先度の欄が設定されている。各欄の横方向に並べられた情報が、1つの修正候補を示す情報となる。
FIG. 14 is a diagram illustrating an example of a correction candidate table in the correction candidate storage unit. As illustrated in FIG. 14, the correction
テーマコードAの欄には、仮説の参照元となる基準分野のテーマコードが設定される。具体的には、変数「Ti」に設定されているテーマコードが、テーマコードAの欄に設定される。テーマコードBの欄には、仮説によりテーマコードを追加する改正対象分野のテーマコードが設定される。具体的には、変数「Tj」に設定されているテーマコードが、テーマコードBの欄に設定される。テーマコードAに設定されたテーマコードの分野と、テーマコードBに設定されたテーマコードの分野との対が、整合性検討分野対となる。 In the theme code A column, the theme code of the reference field that is the reference source of the hypothesis is set. Specifically, the theme code set in the variable “Ti” is set in the field of the theme code A. In the field of the theme code B, the theme code of the amendment target field to which the theme code is added according to the hypothesis is set. Specifically, the theme code set in the variable “Tj” is set in the field of the theme code B. A pair of the theme code field set in the theme code A and the theme code field set in the theme code B is a consistency examination field pair.
一致する観点の欄には、テーマコードAに設定された分野とテーマコードBに設定された分野とで一致する観点が設定される。一致するカテゴリの数の欄には、一致する観点で分類するためのカテゴリの一致数が設定される。優先度の欄には、対応する整合性検討分野対の整合性を保つための優先度が設定される。なお、図13に示した処理の段階では、優先度の欄は空欄である。 In the matching viewpoint column, a viewpoint that matches the field set in the theme code A and the field set in the theme code B is set. In the column of the number of matching categories, the number of matching categories for classification from the viewpoint of matching is set. In the priority column, a priority for maintaining the consistency of the corresponding consistency examination field pair is set. Note that the priority column is blank at the stage of processing shown in FIG.
図15は、観点共通分野検索処理の手順を示すフローチャートの後半である。以下、図15に示す処理をステップ番号に沿って説明する。
[ステップS41]カテゴリ切出部123は、変数「Ti」で示される分野と、変数「Tj」で示される分野との一致する観点について、それぞれの分野で定義されているカテゴリの定義文を抽出する。
FIG. 15 is the second half of the flowchart showing the procedure of the viewpoint common field search processing. In the following, the process illustrated in FIG. 15 will be described in order of step number.
[Step S41] The
[ステップS42]カテゴリ比較部124は、ステップS41で抽出された定義文からキーワードを抽出する。この際、カテゴリ比較部124は、抽出したキーワードはカテゴリの同一性判定に使用するため、助詞や活用語尾などカテゴリの内容を特徴付けないような文字列は削除する。
[Step S42] The
[ステップS43]カテゴリ比較部124は、比較対象の2分野それぞれからカテゴリを1つずつ選択して得られるすべての組み合わせについて、選択された2つのカテゴリ間のキーワードを比較し、キーワードの一致・不一致を判定する。
[Step S43] The
[ステップS44]カテゴリ比較部124は、比較結果記憶部140内に現在処理対象となっている整合性検討分野対に対応する比較テーブルを作成し、その比較テーブルに比較結果を書き込む。具体的には、カテゴリ比較部124は、キーワードのすべてが一致していれば、一致を示す比較結果を書き込む。またカテゴリ比較部124は、一部のキーワードのみが一致していれば、部分一致を示す比較結果を書き込む。さらにカテゴリ比較部124は、一致するキーワードが存在しない場合、不一致を示す比較結果を書き込む。
[Step S44] The
[ステップS45]カテゴリ比較部124は、比較対象の2つの分野間で共通する観点の一致するカテゴリ数から優先度を算出する。この際、変数「Ti」と変数「Tj」とで示される2分野の共通の観点において一致するカテゴリの割合が大きいほど整合性が保たれるべきとして、優先度が高く設定される。例えば、カテゴリ比較部124は、以下のような式で優先度を計算する。
優先度=S/((Ai+Aj)/2) ・・・(1)
ここで、Sは、変数「Ti」と変数「Tj」とで示される2分野に共通の観点に関し、2つの分野にそれぞれ定義されているカテゴリの一致数である。Aiは、2分野に共通の観点に関し、変数「Ti」で示される分野において該当観点に定義されているカテゴリの総数である。Ajは、2分野に共通の観点に関し、変数「Tj」で示される分野において該当観点に定義されているカテゴリの総数である。
[Step S <b> 45] The
Priority = S / ((Ai + Aj) / 2) (1)
Here, S is the number of coincidence of categories respectively defined in the two fields with respect to the viewpoint common to the two fields indicated by the variable “Ti” and the variable “Tj”. Ai is the total number of categories defined in the corresponding viewpoint in the field indicated by the variable “Ti” regarding the viewpoint common to the two fields. Aj is the total number of categories defined in the corresponding viewpoint in the field indicated by the variable “Tj” with respect to the viewpoint common to the two fields.
例えば、図2に示すようなカテゴリが定義されていたとする。この場合、一致するカテゴリは、「移植機等の性能向上」「操作性の向上」「安全性の向上」「作業精度向上」「小型化・軽量化又は製造の合理化」の5つである。田植機の要素(2B062)の目的・機能の観点に設定されているカテゴリの総数は12カテゴリである。また、田植機の接地部(2B063)の目的・機能の観点に設定されているカテゴリは13カテゴリである。すると優先度は0.4となる。 For example, assume that a category as shown in FIG. 2 is defined. In this case, there are five matching categories: “Improved performance of transplanter etc.” “Improved operability” “Improved safety” “Improved work accuracy” “Reduced size / weight or rationalized manufacturing”. The total number of categories set for the purpose / function of the rice transplanter element (2B062) is 12 categories. Further, 13 categories are set from the viewpoint of the purpose / function of the grounding unit (2B063) of the rice transplanter. The priority is then 0.4.
優先度を算出したカテゴリ比較部124は、各整合性検討分野対の一致するカテゴリの数と優先度とを、修正候補テーブル131に書き込む。
なお、共通の観点に定義されているカテゴリが、比較対象の2分野で完全に一致している場合、優先度は「1」となる。この場合には、既に整合性が保たれていると言えるので、カテゴリ比較部124は、該当する整合性検討分野対を修正候補テーブル131から削除する。
The
Note that when the categories defined in the common viewpoint are completely the same in the two comparison target fields, the priority is “1”. In this case, since it can be said that the consistency is already maintained, the
[ステップS46]カテゴリ比較部124は、変数「j」が、Fターム定義テーブルに登録されているテーマコード数に等しいか否かを判断する。変数「j」がテーマコード数に達している場合、処理がステップS48に進められる。変数「j」がテーマコード数未満の場合、処理がステップS47に進められる。
[Step S46] The
[ステップS47]カテゴリ比較部124は、変数「j」がテーマコード数未満であれば、jをインクリメントして、処理をステップS24に進める。
[ステップS48]カテゴリ比較部124は、変数「j」がテーマコード数に達していれば、変数「i」が、Fターム定義テーブルに登録されているテーマコード数に等しいか否かを判断する。変数「i」がテーマコード数に達している場合、観点共通分野検索処理が終了する。変数「i」がテーマコード数未満の場合、処理がステップS49に進められる。
[Step S47] If the variable “j” is less than the number of theme codes, the
[Step S48] If the variable “j” has reached the number of theme codes, the
[ステップS49]カテゴリ比較部124は、変数「i」がテーマコード数未満の場合、iをインクリメントし、処理をステップS23に進める。
以上のようにして、共通する観点が設定されている整合性検討分野対を抽出することができる。そして、比較結果記憶部140には、整合性検討分野対ごとの比較テーブルが格納される。
[Step S49] If the variable “i” is less than the number of theme codes, the
As described above, it is possible to extract a consistency study field pair for which a common viewpoint is set. The comparison
図16は、比較結果記憶部内の比較テーブルの例を示す図である。比較結果記憶部140には、整合性検討分野対ごとの比較テーブル141,142,143,・・・が格納されている。例えば、比較テーブル141は、「田植機の接地部」の分野(テーマコード「2B063」)と「田植機の要素」の分野(テーマコード「2B062」)との整合性検討分野対に対応する。
FIG. 16 is a diagram illustrating an example of a comparison table in the comparison result storage unit. The comparison
比較テーブル141の作成処理は、表形式のデータ構造作成処理と、そのデータ構造に対する比較結果書き込み処理とに別れる。図16には、表形式のデータ構造作成後の比較テーブル141が示されている。 The creation process of the comparison table 141 is divided into a tabular data structure creation process and a comparison result writing process for the data structure. FIG. 16 shows a comparison table 141 after the creation of a tabular data structure.
カテゴリ比較部124は、表形式の比較テーブル141を作成する。具体的には、カテゴリ比較部124は、整合性検討分野対の一致する観点に関するテーマコードAの各カテゴリのFタームを、比較テーブル141の列ラベルとする。さらにカテゴリ比較部124は、列ラベルの下に、列ラベルに設定されたFタームに対応するカテゴリの定義を設定する。
The
また、カテゴリ比較部124は、整合性検討分野対の一致する観点に関するテーマコードBの各カテゴリのFタームを、比較テーブル141の行ラベルとする。さらにカテゴリ比較部124は、行ラベルの右に、行ラベルに設定されたFタームに対応するカテゴリの定義を設定する。
Further, the
テーマコードBのFタームが設定された最後行の下にが、行ラベルとして「集計」の文字が設定される。
このようにして作成された比較テーブル141のセルに対して、整合性検討分野対の一致する観点に設定されているカテゴリを比較した結果が書き込まれる。
Under the last line in which the F term of the theme code B is set, the characters “total” are set as the line label.
The result of comparing the categories set in the matching viewpoint of the consistency study field pairs is written in the cells of the comparison table 141 created in this way.
図17は、判定結果書き込み後の比較テーブルを示す図である。比較結果として、定義のキーワードが完全一致した場合には「○」、部分一致の場合には「△」、不一致の場合には「×」が書き込まれている。図17の例では、「操作性向上」、「安定性の向上」のカテゴリが完全一致している。また、基準分野(テーマコードA)の「走行性の向上」、「バランス及び安定性」は、改正対象分野(テーマコードB)の「走行性又は安定性の向上」と部分一致している。なお、比較結果を登録した時点では、「集計」欄は空白のままである。 FIG. 17 is a diagram illustrating the comparison table after the determination result is written. As a comparison result, “◯” is written when the definition keywords are completely matched, “Δ” is written when they are partially matched, and “X” is written when they are not matched. In the example of FIG. 17, “operability improvement” and “stability improvement” categories are completely the same. In addition, “improvement in running performance” and “balance and stability” in the reference field (theme code A) partially coincide with “improvement in running ability or stability” in the revision target field (theme code B). Note that when the comparison result is registered, the “total” column is left blank.
その後、カテゴリ比較部124により整合性検討分野対ごとの優先度が計算され、修正候補テーブル131に設定される。
図18は、優先度設定後の修正候補テーブルを示す図である。図18に示すように、各整合性検討分野対に対して優先度が設定される。優先度の値が高い程、整合性を保持する必要性が高いことを意味している。
Thereafter, the
FIG. 18 is a diagram illustrating a correction candidate table after priority setting. As shown in FIG. 18, a priority is set for each consistency study field pair. The higher the priority value, the higher the need to maintain consistency.
図17に示したような整合性検討分野対ごとの比較テーブル141,142,143,・・・と、図18に示したような修正候補テーブル131が作成されると、仮説設定部150による仮説設定処理が実行される。 When the comparison table 141, 142, 143,... For each consistency examination field pair as shown in FIG. 17 and the correction candidate table 131 as shown in FIG. Setting processing is executed.
図19は、仮説設定部の内部機能を示すブロック図である。仮説設定部150は、比較テーブル集計部151と仮説対象抽出部152とを有している。
比較テーブル集計部151は、比較結果記憶部140内の各比較テーブル141,142,143,・・・のカテゴリの一致/不一致に関する情報を集計する。その際、比較テーブル集計部151は、修正候補記憶部130内の修正候補テーブル131に設定されている優先度を参照し、優先度が高い整合性検討分野対から順に、対応する比較テーブルの集計を行う。
FIG. 19 is a block diagram illustrating the internal functions of the hypothesis setting unit. The
The comparison
仮説対象抽出部152は、集計結果に基づいて改正対象分野へ追加すべきカテゴリを判定し、仮説テーブルを作成する。仮説テーブルは、仮説記憶部160に格納される。
次に、仮説設定処理を詳細に説明する。
The hypothesis
Next, the hypothesis setting process will be described in detail.
図20は、仮説設定処理の手順を示すフローチャートである。以下、図20に示す処理をステップ番号に沿って説明する。
[ステップS51]比較テーブル集計部151は、優先度の高い順に修正候補テーブル131内のレコードをソートする。優先度が高い整合性検討分野対は、元々整合性が高い。既に高い整合性が得られていれば、少ない修正で、各分野のカテゴリを整合させることができる。そのため、優先度の高い候補を先に処理することとする。
FIG. 20 is a flowchart illustrating the procedure of hypothesis setting processing. In the following, the process illustrated in FIG. 20 will be described in order of step number.
[Step S51] The comparison
[ステップS52]比較テーブル集計部151は、修正候補テーブル131の最も優先度の高い整合性検討分野対を選択する。
[ステップS53]比較テーブル集計部151は、選択した整合性検討分野対に対応する比較テーブルを縦方向に集計する。縦方向に見て「○」がある場合には、該当する列のラベルに設定されている基準分野(「テーマコードA」で示される分野)のカテゴリと一致するカテゴリが、改正対象分野に既に存在していることになる。この場合、改正対象分野(「テーマコードB」で示される分野)に新たなカテゴリを追加する必要がない。そこで、比較テーブル集計部151は、縦方向で少なくとも1つ「○」があれば、該当する列の集計欄に、一致することを示す記号「○」を書き込む。
[Step S <b> 52] The comparison
[Step S53] The comparison
また、比較テーブルを縦方向に見てすべてが「×」の場合、改正対象分野に、基準分野にあるカテゴリと対応付くカテゴリがないことを意味している。この場合、分類体系の改正案として、改正対象分野の下に新たなカテゴリを作成することが仮説として成り立つ。そこで、比較テーブル集計部151は、縦方向ですべて「×」であれば、集計欄に追加対象カテゴリであることを示す記号「×」を書き込む。
Further, when all of the comparison tables in the vertical direction are “x”, it means that there is no category corresponding to the category in the reference field in the revision target field. In this case, the hypothesis is that a new category is created under the revision target field as a revision proposal for the classification system. Therefore, the comparison
さらに、縦方向に集計する際に「△」があった場合には、部分的に一致するカテゴリが存在する。本実施の形態では、部分的に一致するカテゴリについては、修正の対象とはしない。ただし、部分的に一致する場合、カテゴリの分割や統合という改正によって、より正確にカテゴリを整合させることもできる。そこで、比較テーブル集計部151は、縦方向にみて「○」が存在せず、少なくとも1つ「△」であれば、該当する列の集計欄に、分割や統合の対象カテゴリであることを示す記号「△」を書き込む。
Furthermore, when “Δ” is present when tallying in the vertical direction, there is a partially matching category. In the present embodiment, partially matching categories are not subject to correction. However, in the case of partial matching, the categories can be more accurately matched by amending the division or integration of categories. Therefore, the comparison
[ステップS54]仮説対象抽出部152は、比較テーブル集計部151による集計対象とされた比較テーブルの集計が完了すると、集計欄の未選択の集計結果を1つ選択する。
[Step S54] When the comparison
[ステップS55]仮説対象抽出部152は、集計結果が「×」か否かを判断する。集計結果が「×」であれば、処理がステップS56に進められる。集計結果が「×」以外であれば、処理がステップS57に進められる。
[Step S55] The hypothesis
[ステップS56]仮説対象抽出部152は、選択した集計結果が「×」であれば、その集計結果の列に設定されている基準分野のカテゴリを、改正対象分野に追加するものとする仮説を、仮説記憶部160内の仮説テーブルに登録する。このように、テーマコードに新しいカテゴリを作成する必要があるときだけ、仮説テーブルに新たな仮説が書き込まれる。
[Step S56] If the selected aggregation result is “x”, the hypothesis
[ステップS57]仮説対象抽出部152は、すべての集計結果を選択したか否かを判断する。すべての集計結果が選択されていれば、処理がステップS58に進められる。未選択の集計結果があれば、処理がステップS54に進められ、別の集計結果が選択される。
[Step S57] The hypothesis
[ステップS58]比較テーブル集計部151は、修正候補テーブル内のすべての整合性検討分野対を選択したか否かを判断する。すべての整合性検討分野対の選択が完了した場合、仮説設定処理が終了する。未選択の整合性検討分野対がある場合、処理がステップS52に進められ次の整合性検討分野対が選択される。
[Step S58] The comparison
このようにして、比較テーブルの集計を行い、集計結果に基づいて仮説設定部150により仮説が設定される。
図21は、集計された比較テーブルの例を示す図である。比較テーブル141は、列ごとにカテゴリ一致/不一致の判定結果が集計されている。本実施の形態では、集計結果が「×」のカテゴリを改正対象分野へ追加するものとして仮説が立てられる。立てられた仮説は、仮説テーブルに設定される。
In this way, the comparison table is aggregated, and a hypothesis is set by the
FIG. 21 is a diagram showing an example of the tabulated comparison table. In the comparison table 141, the category match / mismatch determination results are tabulated for each column. In the present embodiment, a hypothesis is established as adding a category of “×” as the total result to the revision target field. The established hypothesis is set in the hypothesis table.
図22は、仮説記憶部内の仮説テーブルのデータ構造例を示す図である。仮説記憶部160内の仮説テーブル161は、基準分野、改正対象分野、観点、仮説、および検証結果の欄が設けられている。
FIG. 22 is a diagram illustrating a data structure example of a hypothesis table in the hypothesis storage unit. The hypothesis table 161 in the
基準分野の欄には、仮説の基準分野のテーマコードが設定される。改正対象分野の欄には、仮説の改正対象分野のテーマコードが設定される。観点の欄には、整合性の保持対象となる観点が設定される。仮説の欄には、改正対象分野に対して行う分類体系の変更内容(仮説)が設定される。例えば、所定のカテゴリを追加することが、仮説として設定される。検証結果の欄には、仮説が適切か否かの検証結果が設定される。なお、仮説設定後、検証前の時点では、検証結果の欄は空欄である。 The theme code of the hypothetical reference field is set in the reference field column. The theme code of the revision target field of the hypothesis is set in the field of the revision target field. In the viewpoint column, a viewpoint to which consistency is to be maintained is set. In the hypothesis column, the change contents (hypotheses) of the classification system to be applied to the revision target field are set. For example, adding a predetermined category is set as a hypothesis. In the verification result column, a verification result indicating whether or not the hypothesis is appropriate is set. Note that the verification result column is blank after the hypothesis setting and before verification.
仮説設定処理が完了すると、仮説検証部170による仮説の検証が行われる。
図23は、仮説検証部の内部機能を示すブロック図である。仮説検証部170は、特徴キーワード抽出部171、特徴キーワード記憶部172、特許文献検索部173、および仮説判定部174を有している。
When the hypothesis setting process is completed, the
FIG. 23 is a block diagram illustrating an internal function of the hypothesis verification unit. The
特徴キーワード抽出部171は、仮説記憶部160内の仮説テーブル161に設定された仮説の基準分野に分類された特許文献を特許文献DB21から取得する。そして特徴キーワード抽出部171は、仮説によって追加対象となっているカテゴリに属する特許文献の特徴キーワードを抽出する。特徴キーワード抽出部171は、抽出した特徴キーワードを、特徴キーワード記憶部172に格納する。
The feature
特徴キーワード記憶部172は、特徴キーワードを記憶する記憶機能である。例えば、RAM102の記憶領域の一部が特徴キーワード記憶部172として使用される。
特許文献検索部173は、仮説によって追加対象となっているカテゴリに属する特許文献の特徴キーワードによって、特許文献DB21内で仮説の改正対象分野に分類されている特許文献の検索を行う。
The feature
The patent
仮説判定部174は、特許文献検索部173による検索結果に応じて、仮説の適否を判定する。仮説判定部174は、仮説が適切であると判定した場合、仮説の内容を改正案記憶部180に格納する。
The
次に、仮説検証処理の手順について詳細に説明する。
図24は、仮説検証処理の手順を示すフローチャートである。以下、図24に示す処理をステップ番号に沿って説明する。
Next, the procedure of the hypothesis verification process will be described in detail.
FIG. 24 is a flowchart showing the procedure of hypothesis verification processing. In the following, the process illustrated in FIG. 24 will be described in order of step number.
[ステップS61]特徴キーワード抽出部171は、仮説テーブル161内の未処理の仮説を1つ選択する。
[ステップS62]特徴キーワード抽出部171は、追加カテゴリの特徴キーワード抽出処理を行う。この処理の詳細は後述する(図25参照)。
[Step S61] The feature
[Step S62] The feature
[ステップS63]特許文献検索部173は、特許文献DB21の改正対象分野の整合性を図る観点で「その他」に分類された特許文献を、追加するカテゴリの特徴キーワードで検索する。このとき特徴キーワードが複数ある場合、各特徴キーワードの論理和(OR)検索が行われる。
[Step S63] The patent
[ステップS64]特許文献検索部173は、検索によるヒット件数を、変数Zに代入する。
[ステップS65]仮説判定部174は、変数Zに設定されたヒット件数が閾値以上か否かを判断する。ヒット件数が、予め設定された閾値以上であれば、処理がステップS66に進められる。ヒット件数が閾値未満であれば、処理がステップS67に進められる。
[Step S64] The patent
[Step S65] The
なお、閾値は、特許文献DB21に登録されている特許文献の数に応じて、変更するようにしてもよい。例えば、仮説判定部174において、検索対象として登録されている特許文献の総数に対するヒット率の閾値を予め定義しておく。そして、仮説判定部174では、ヒット件数が、特許文献の総数に閾値を乗算した値以上であれば、ヒット件数が閾値以上であると判定する。
The threshold may be changed according to the number of patent documents registered in the
[ステップS66]仮説判定部174は、ヒット件数が閾値以上であれば、選択した仮説の検証結果欄に、仮説が適切であることを示す記号「○」を設定する。その後、処理がステップS68に進められる。
[Step S66] If the number of hits is equal to or greater than the threshold, the
[ステップS67]仮説判定部174は、ヒット件数が閾値未満であれば、選択した仮説の検証結果欄に、仮説が不適切であることを示す記号「×」を設定する。
[ステップS68]特徴キーワード抽出部171は、すべての仮説を検証したか否かを判断する。すべての仮説の検証が終了した場合、処理がステップS69に進められる。未処理の仮説があれば、処理がステップS61に進められ次の仮説が選択される。
[Step S67] If the number of hits is less than the threshold, the
[Step S68] The feature
[ステップS69]仮説判定部174は、仮説テーブル161の検証結果欄が「○」になった仮説から改正対象分野、観点、仮説を抜き出し、改正案テーブルを生成する。生成された改正案テーブルは、改正案記憶部180に格納される。
[Step S69] The
次に、追加カテゴリの特徴キーワード抽出処理について詳細に説明する。
図25は、追加カテゴリの特徴キーワード抽出処理の手順を示すフローチャートである。以下、図25に示す処理をステップ番号に沿って説明する。
Next, the feature keyword extraction process of the additional category will be described in detail.
FIG. 25 is a flowchart showing a procedure of additional keyword feature keyword extraction processing. In the following, the process illustrated in FIG. 25 will be described in order of step number.
[ステップS71]特徴キーワード抽出部171は、特許文献DB21にアクセスする。そして、特徴キーワード抽出部171は、改正対象分野と共通の観点によって基準分野を分類したカテゴリのうち、改正対象分野に追加すると仮定したカテゴリ以外のカテゴリに分類された特許文献の集合からキーワードセットαを抽出する。キーワードセットαの抽出には、既存の技術として一般に知られている形態素解析技術や、複合語抽出技術、情報抽出技術を用いることができる。
[Step S71] The feature
[ステップS72]特徴キーワード抽出部171は、特許文献DB21にアクセスする。そして、特徴キーワード抽出部171は、改正対象分野と共通の観点によって基準分野を分類したカテゴリのうち、改正対象分野に追加すると仮定したカテゴリに分類された特許文献の集合からキーワードセットβを抽出する。
[Step S72] The characteristic
[ステップS73]特徴キーワード抽出部171は、キーワードセットαとキーワードセットβとを統計的に処理し、キーワードセットβに特徴的な特徴キーワードセットδを抽出する。統計量としてはカイ二乗値や、カルバック・ライブラー情報量などを用いることができる。
[Step S73] The feature
なお、特徴キーワードセットδのうち、基準分野全体と改正対象分野全体のうちのどちらか一方だけで重み(特徴を示す度合い)が大きくなるキーワードを除外することもできる。これにより、基準分野と改正対象分野でのそれぞれの分野に固有なキーワードによって誤った結果が出るのを防ぐことができる。 In the feature keyword set δ, it is also possible to exclude a keyword whose weight (degree of feature display) is large only in one of the entire reference field and the entire revision target field. As a result, it is possible to prevent an erroneous result from being produced by a keyword specific to each field in the reference field and the field to be revised.
ここで、カイ二乗値とカルバック・ライブラー情報量を用いた特徴キーワードセットδの抽出処理について詳細に説明する。
図26は、基準分野における特許文献の分類状況を示す図である。この例では、「分野A」が基準分野であるものとする。また、改正対象分野に追加するものと仮定されたカテゴリを、「カテゴリc」とする。「分野A」全体に属する特許文献数は「NA」である。
「カテゴリc」に属する特許文献数は「NC」である。
Here, the process of extracting the feature keyword set δ using the chi-square value and the amount of information of the cullback / librar is described in detail.
FIG. 26 is a diagram showing the classification status of patent documents in the reference field. In this example, it is assumed that “field A” is the reference field. Further, a category assumed to be added to the revision target field is “category c”. Patent Document Number belonging to the entire "field A" is "N A".
The number of patent documents belonging to “category c” is “N C ”.
ここで、キーワードKの重みを計算するものとする。その場合、「分野A」全体に対してキーワードKによる検索が行われる。これにより「分野A」全体におけるキーワードKを含む特許文献数KAが得られる。また、「カテゴリc」に属する特許文献に対してキーワードKによる検索が行われる。これにより「カテゴリc」に属する特許文献のうちキーワードKを含む特許文献数KCが得られる。 Here, the weight of the keyword K is calculated. In this case, a search using the keyword K is performed for the entire “field A”. As a result, the number of patent documents K A including the keyword K in the entire “field A” is obtained. In addition, a search using a keyword K is performed for patent documents belonging to “category c”. Thus, the number of patent documents K C including the keyword K among the patent documents belonging to “category c” is obtained.
この場合のカイ二乗値(χ2)の計算式は、以下の通りである。
χ2=(KC−E)2/E ・・・(2)
ここで、Eは分野A全体でのキーワードKの期待値である。このとき、キーワードKの期待値Eは以下のように計算することができる。
E=(KA×NC)/NA ・・・(3)
式(2)、式(3)によって得られるχ2の値が大きい程、キーワードKが、「カテゴリc」の特徴をより強く表していることとなる。
The calculation formula of the chi-square value (χ 2 ) in this case is as follows.
χ 2 = (K C −E) 2 / E (2)
Here, E is an expected value of the keyword K in the entire field A. At this time, the expected value E of the keyword K can be calculated as follows.
E = (K A × N C ) / N A (3)
The larger the value of χ 2 obtained by the equations (2) and (3), the stronger the keyword K represents the feature of “category c”.
また、図26に示した分類状況下で、カルバック・ライブラー情報量DKLは以下の式で計算できる。
DKL=P×log(P/Q) ・・・(4)
ここでPは、「カテゴリc」に含まれる特許文献の中で、キーワードKを含む確率である。また、Qは、「分野A」全体でのキーワードKを含む確率である。P,Qは、それぞれ以下の式で表される。
P=KC/NC ・・・(5)
Q=KA/NA ・・・(6)
式(4)〜式(6)によって得られるカルバック・ライブラー情報量DKLの値が大きい程、キーワードKが、「カテゴリc」の特徴をより強く表していることとなる。
Further, under the classification situation shown in FIG. 26, Kullback-Leibler divergence D KL can be calculated by the following equation.
D KL = P × log (P / Q) (4)
Here, P is the probability of including the keyword K among the patent documents included in the “category c”. Q is a probability of including the keyword K in the entire “field A”. P and Q are represented by the following equations, respectively.
P = K C / N C (5)
Q = K A / N A (6)
The larger the value of the Cullback / librar information amount D KL obtained by the equations (4) to (6), the stronger the keyword K represents the feature of the “category c”.
このように、カイ二乗値やカルバック・ライブラー情報量を用いて、任意のキーワードに関する重み(「カテゴリc」の特徴をどの程度強く表しているか)が計算できる。特徴キーワード抽出部171は、「カテゴリc」に属する特許文献から抽出したキーワードセットに含まれる各キーワードについて、重みを求める。そして、特徴キーワード抽出部171は、例えば重みが所定値よりきいキーワードの集合を、特徴キーワードセットδとする。
In this way, using the chi-square value and the Cullback / librar information amount, it is possible to calculate the weight related to an arbitrary keyword (how strongly the feature of “category c” is expressed). The feature
特徴キーワードセットδに含まれる各キーワードは、RAM102内に設けられた特徴キーワードテーブルに格納される。
図27は、特徴キーワードテーブルのデータ構造例を示す図である。特徴キーワード記憶部172には、特徴キーワードテーブル172aが格納されている。特徴キーワードテーブル172aには、Fターム、カテゴリ、および特徴キーワードの欄が設けられている。
Each keyword included in the feature keyword set δ is stored in a feature keyword table provided in the
FIG. 27 is a diagram illustrating an example of the data structure of the feature keyword table. The feature
Fタームの欄には、各カテゴリのFタームが設定される。カテゴリの欄には、カテゴリの定義内容が設定される。特徴キーワードの欄には、対応するカテゴリの特徴キーワードが設定される。 The F term of each category is set in the F term column. The category definition content is set in the category column. In the feature keyword column, the feature keyword of the corresponding category is set.
このような各カテゴリの特徴キーワードに基づいて仮説が検証され、仮説テーブル161の検証結果の欄に、仮説の適否が設定される。
図28は、仮説検証完了後の仮説テーブルの例を示す図である。図28の例では、テーマコード「2B062」の分野における「目的・機能」の観点における分類のカテゴリに「植付精度の向上」を追加する仮説に対し、適切である旨の記号「○」が設定されている。他方、テーマコード「2F065」の分野における「光源」の観点における分類のカテゴリに「ランプ」を追加する仮説に対し、不適切である旨の記号「×」が設定されている。
The hypothesis is verified based on the feature keyword of each category, and the suitability of the hypothesis is set in the verification result column of the hypothesis table 161.
FIG. 28 is a diagram illustrating an example of a hypothesis table after completion of hypothesis verification. In the example of FIG. 28, the symbol “○” indicating that it is appropriate for the hypothesis of adding “improving planting accuracy” to the category of classification in the field of “purpose / function” in the field of the theme code “2B062”. Is set. On the other hand, the symbol “x” indicating that the lamp is inappropriate is set for the hypothesis of adding “lamp” to the category of classification from the viewpoint of “light source” in the field of the theme code “2F065”.
このような検証結果が登録された仮説テーブル161から適切な仮説のみが抽出され、改正案記憶部180に改正案として格納される。
図29は、改正案記憶部のデータ構造例を示す図である。改正案記憶部180には、改正案を登録する改正案テーブル181が格納されている。改正案テーブル181は、テーマコード、観点、および改正案の欄が設けられている。
Only appropriate hypotheses are extracted from the hypothesis table 161 in which such verification results are registered, and stored in the revision
FIG. 29 is a diagram illustrating an example of the data structure of the revision plan storage unit. The revision
テーマコードの欄には、改正を行うべき分野のテーマコードが設定される。観点の欄には、カテゴリの追加対象となる観点が設定される。改正案の欄には、追加するカテゴリの定義内容が設定される。 The theme code of the field to be revised is set in the theme code column. In the viewpoint column, a viewpoint to which a category is added is set. The definition of the category to be added is set in the revision column.
以上のようにして、観点に基づく分類カテゴリの適切な改正案を作成することができる。改正案テーブル181に格納された改正案は、結果表示部190によって内容がモニタ11に表示される。ユーザはモニタ11に表示された改正案を参照し、Fタームの分類体系の改正に役立てることができる。
As described above, it is possible to create an appropriate revision proposal for the classification category based on the viewpoint. The content of the revision plan stored in the revision plan table 181 is displayed on the monitor 11 by the
しかも特許文献DB21に登録されている特許文献を用いて仮説を検証する。特許文献DB21はFタームによって既に膨大な量の特許文献が分類されているため、特許文献DB21を利用することで仮説の適否を正確に判定することができる。
In addition, the hypothesis is verified using the patent documents registered in the
[第2の実施の形態]
次に、第2の実施の形態について説明する。第2の実施の形態は、機械学習による分類器を用いて検証を行うものである。第2の実施の形態における処理機能は、仮説検証部の機能のみが第1の実施の形態と異なる。
[Second Embodiment]
Next, a second embodiment will be described. In the second embodiment, verification is performed using a classifier based on machine learning. The processing function in the second embodiment is different from the first embodiment only in the function of the hypothesis verification unit.
図30は、第2の実施の形態における仮説検証部の内部機能を示すブロック図である。第2の実施の形態における仮説検証部170aは、共通キーワード抽出部175、共通キーワード記憶部176、機械学習部177、分類部178、および仮説判定部179を有する。
FIG. 30 is a block diagram illustrating an internal function of the hypothesis verification unit according to the second embodiment. The
共通キーワード抽出部175は、特許文献DB21にアクセスし、仮説記憶部160に格納されている仮説の基準分野と改正対象分野との両方に出現するキーワードを抽出する。共通キーワード抽出部175は、抽出した共通キーワードの集合(共通キーワードセット)を共通キーワード記憶部176に格納する。
The common
共通キーワード記憶部176は、仮説ごとの共通キーワードセットを記憶する記憶機能である。例えば、RAM102の記憶領域の一部が共通キーワード記憶部176として使用される。
The common
機械学習部177は、基準分野に分類された特許文献を用いて、共通キーワードセットに基づいて機械学習を行い、追加対象となるカテゴリに関する分類器を生成する。
分類部178は、機械学習によって生成された分類器により、改正対象分野の検討対象観点における「その他」のカテゴリに属する特許文献を分類する。
The
The classifying
仮説判定部179は、機械学習によって新たに作成された分類器で、追加対象となるカテゴリに分類された特許文献の件数に基づいて、仮説の適否を判定する。
図31は、機械学習を用いた仮説検証処理の手順を示すフローチャートである。以下、図31に示す処理をステップ番号に沿って説明する。
The
FIG. 31 is a flowchart illustrating a procedure of hypothesis verification processing using machine learning. In the following, the process illustrated in FIG. 31 will be described in order of step number.
[ステップS81]共通キーワード抽出部175は、仮説テーブル161内の未処理の仮説を1つ選択する。
[ステップS82]共通キーワード抽出部175は、選択した仮説の基準分野と改正対象分野との両方に出現するキーワードを抽出し、共通キーワードセットγとする。生成された共通キーワードセットγは、共通キーワード記憶部176に格納される。
[Step S81] The common
[Step S82] The common
[ステップS83]機械学習部177は、共通キーワードセットγ内の各キーワードについて、機械学習によって重み付けを行う。具体的には、機械学習部177は、選択した仮説の基準分野において、改正対象分野への追加候補カテゴリに分類されている特許文献を正例とする。また機械学習部177は、選択した仮説の基準分野において、改正対象分野への追加対象となっているカテゴリ以外に分類されている特許文献を負例とする。機械学習部177は、キーワードが正例に多く含まれるほど、および負例に含まれないほど、そのキーワードの重みが大きくなるように、各キーワードの重みを計算する。キーワードごとの重みの情報が、追加するカテゴリに関する分類器となる。
[Step S83] The
[ステップS84]分類部178は、分類器を用い、選択された仮説の改正対象分野における検討対象観点での分類において「その他」に分類された特許文献が追加候補カテゴリに属するか否かを分類する。具体的には、分類部178は、分類対象の特許文献からキーワードを抽出し、分類器と照合する。分類器において高い値の重みが設定されているキーワードが、分類対象の特許文献から多く検出されるほど、その特許文献が追加候補カテゴリに属する可能性が高いと判定される。分類部178は、所定以上の可能性で追加候補カテゴリに含まれると判断した特許文献を、そのカテゴリに分類する。
[Step S84] The
[ステップS85]分類部178は、追加候補カテゴリに分類された特許文献の件数を、変数Zに代入する。
[ステップS86]仮説判定部179は、変数Zに設定された件数が閾値以上か否かを判断する。件数が予め設定された閾値以上であれば、処理がステップS87に進められる。件数が閾値未満であれば、処理がステップS88に進められる。
[Step S85] The
[Step S86] The
なお、閾値は、特許文献DB21に登録されている特許文献の数に応じて、変更するようにしてもよい。例えば、仮説判定部179において、分類対象として登録されている特許文献の総数に対する適合率の閾値を予め定義しておく。そして、仮説判定部174では、追加候補カテゴリに分類された件数が、特許文献の総数に閾値を乗算した値以上であれば、追加候補カテゴリに分類された件数が閾値以上であると判定する。
The threshold may be changed according to the number of patent documents registered in the
[ステップS87]仮説判定部179は、追加候補カテゴリに分類された件数が閾値以上であれば、選択した仮説の検証結果欄に、仮説が適切であることを示す記号「○」を設定する。その後、処理がステップS89に進められる。
[Step S87] If the number of cases classified into the additional candidate category is equal to or greater than the threshold, the
[ステップS88]仮説判定部179は、追加候補カテゴリに分類された件数が閾値未満であれば、選択した仮説の検証結果欄に、仮説が不適切であることを示す記号「×」を設定する。
[Step S88] If the number of cases classified into the additional candidate category is less than the threshold, the
[ステップS89]共通キーワード抽出部175は、すべての仮説を検証したか否かを判断する。すべての仮説の検証が終了した場合、処理がステップS90に進められる。未処理の仮説があれば、処理がステップS81に進められ次の仮説が選択される。
[Step S89] The common
[ステップS90]仮説判定部179は、仮説テーブル161の検証結果欄が「○」になった仮説から改正対象分野、観点、仮説を抜き出し、改正案テーブルを生成する。生成された改正案テーブルは、改正案記憶部180に格納される。
[Step S90] The
このようにして、機械学習を用いて、追加候補カテゴリに属する特許文献の数を予測することができる。機械学習を用いれば特許文献の分類を高度なレベルで適切に行うことが可能であり、仮説で設定された追加候補カテゴリの追加の適否判断もより適切に行うことができる。 In this way, the number of patent documents belonging to the additional candidate category can be predicted using machine learning. If machine learning is used, it is possible to appropriately classify patent documents at a high level, and it is also possible to more appropriately determine whether or not to add an additional candidate category set by a hypothesis.
[その他の応用例]
特徴キーワードの抽出技術について、以下のような変形が可能である。
特徴キーワードを、基準分野において非追加候補カテゴリと追加候補カテゴリとを区別するためのキーワードに限定する。そのために、特徴キーワード抽出部171では、非追加候補カテゴリに属する特許文献から抽出されたキーワードと、追加候補カテゴリに属する特許文献から抽出されたキーワードの差分のキーワードを、特徴キーワードとする。
[Other application examples]
The feature keyword extraction technique can be modified as follows.
The feature keyword is limited to a keyword for distinguishing the non-addition candidate category and the addition candidate category in the reference field. Therefore, in the feature
基準分野と改正対象分野とでのそれぞれの分野に固有なキーワードによって誤った結果が出るのを防ぐ。そのために、特徴キーワード抽出部171では、得られた特徴キーワードのうち、分野A全体での出現キーワードと分野B全体での出現キーワードとのうちのどちらか一方だけで重みが大きくなるキーワードは、追加候補カテゴリの特徴キーワードとしないものとする。
Prevent erroneous results from keywords that are unique to each of the standard and revised areas. For this purpose, the feature
分類の観点を反映するキーワードをより強調する。そのために特徴キーワード抽出部171では、得られた特徴キーワードのうち、改正対象分野の下での定義済みのカテゴリにはほとんど出現せず、改正対象分野の下の「その他」を表すカテゴリの中で一定以上ヒットした場合にのみ、特徴キーワードとして使用する。
Emphasize keywords that reflect the perspective of classification. Therefore, in the feature
上記実施の形態では、既に整合性が高い分野が優先的に整合性検討分野対となる。そこで、優先的に検討した改正案の改正案テーブルの上位に配置し、上位の改正案から順にユーザに提示することができる。これにより、ユーザは、優先的に改正を行うべき分類体系の箇所を知ることができる。 In the above-described embodiment, a field with high consistency is preferentially paired with a consistency examination field. Therefore, it is possible to place the revision plan on the revision plan that has been preferentially studied and present it to the user in order from the higher revision plan. Thereby, the user can know the location of the classification system which should be revised preferentially.
また、仮説を検証する際には、改正により新しいカテゴリが設定されたときにそのカテゴリに入ると予想される特許文献の件数を求めている。そこで、改正案テーブルをユーザに提示する際に、新たなカテゴリに含まれる件数を付加することができる。これにより、カテゴリの追加の要否をユーザが適切に判断できる。 Further, when the hypothesis is verified, the number of patent documents that are expected to be included in a new category when the revision is set is obtained. Therefore, when the revision plan table is presented to the user, the number of cases included in the new category can be added. Thereby, the user can appropriately determine whether or not a category needs to be added.
さらに、改正案で示されたカテゴリの追加の実行指示がユーザによって入力されたとき、特許文献DB21内の追加されるカテゴリに属する特許文献に、自動的に、新規のカテゴリの分類コードを付けることもできる。
In addition, when a user inputs an instruction to add a category indicated in the amendment, a new category classification code is automatically added to a patent document belonging to the added category in the
また、上記実施の形態では、特許文献の分類体系の改善に関して説明したが、観点によって情報を分類する各種分類体系に応用可能である。
図32は、調理のレシピに関する情報の分類体系の例を示す図である。図32に示す料理のレシピの分類体系は、「野菜のおかず」、「サラダ」、「パン」、「お菓子」といった料理種別によって分野が定義されている。そして、各分野において「材料」、「調理法」、「カロリー」といった観点でカテゴリが定義されている。図32に示した観点以外にも、「材料費」といった観点でカテゴリを定義することもできる。
Moreover, although the said embodiment demonstrated the improvement of the classification system of a patent document, it is applicable to the various classification systems which classify | categorize information according to a viewpoint.
FIG. 32 is a diagram illustrating an example of a classification system of information related to cooking recipes. In the cooking recipe classification system shown in FIG. 32, fields are defined according to cooking types such as “vegetable side dishes”, “salad”, “bread”, and “sweets”. In each field, categories are defined in terms of “material”, “cooking method”, and “calorie”. In addition to the viewpoint shown in FIG. 32, categories can also be defined from the viewpoint of “material cost”.
ここで、上記第1,第2の実施の形態に係る分類体系改正支援装置を用いれば、例えば、「お菓子」を基準分野とし、「野菜おかず」における観点「料理法」のカテゴリとして「なべ」を追加する仮説の設定および検証ができる。 Here, if the classification system revision support apparatus according to the first and second embodiments is used, for example, “confectionery” is set as the reference field, and “vegetables” as the category of “cooking” is “pan”. Can be set and verified.
図33は、ネットワークを介したオークションに関する出品情報の分類体系を示す図である。図33に示すオークションの出品情報の分類体系は、「エアコン」、「服」、「バッグ」、「パーソナルコンピュータ」といった商品種別によって分野が定義されている。そして、各分野において「メーカ」、「価格帯」、「CPU」といった観点でカテゴリが定義されている。図33に示した観点以外にも、「仕様」、「オークション終了までの日数」といった観点でカテゴリを定義することができる。 FIG. 33 is a diagram illustrating a classification system of exhibition information related to auctions via a network. In the auction exhibition information classification system shown in FIG. 33, fields are defined by product types such as “air conditioner”, “clothes”, “bag”, and “personal computer”. In each field, categories are defined in terms of “manufacturer”, “price range”, and “CPU”. In addition to the viewpoints shown in FIG. 33, categories can be defined from the viewpoints of “specifications” and “days until the end of the auction”.
ここで、上記第1,第2の実施の形態に係る分類体系改正支援装置を用いれば、例えば、「パソコン」を基準分野とし、「エアコン」における観点「メーカ」のカテゴリとして「N電」を追加する仮説の設定および検証ができる。 Here, if the classification system revision support device according to the first and second embodiments is used, for example, “PC” is set as a reference field, and “N Denki” is set as a category of “manufacturer” in “air conditioner”. You can set and verify additional hypotheses.
図32、図33に示した以外にも、例えばレストランに関する情報の分類体系や音楽に関する情報の分類体系に、上記実施の形態を適用可能である。レストランに関する情報の分類体系であれば、和食、中華、イタリアンといったジャンルで分野を分け、各分野において、地域、や価格帯といった観点のカテゴリを定義できる。そして、これらのカテゴリを上記実施の形態の機能により改善できる。音楽に関する情報の分類体系であれば、ポップス、クラシック、ジャズといった分野を、国、価格帯、歌手の性別、グループ構成とった観点でカテゴリを定義できる。そして、これらのカテゴリを上記実施の形態の機能により改善できる。 In addition to those shown in FIGS. 32 and 33, the above-described embodiment can be applied to, for example, a restaurant information classification system and music information classification system. If it is a classification system of information about restaurants, it is possible to divide fields by genres such as Japanese, Chinese and Italian, and to define categories in terms of areas and price ranges in each field. And these categories can be improved by the function of the said embodiment. If it is a classification system of information about music, categories such as pops, classical music and jazz can be defined from the viewpoint of country, price range, singer's gender and group composition. And these categories can be improved by the function of the said embodiment.
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、分類体系改正支援装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD、DVD−RAM、CD−ROM/RWなどがある。光磁気記録媒体には、MO(Magneto-Optical disc)などがある。 The above processing functions can be realized by a computer. In that case, a program describing the processing contents of the functions that the classification system revision support device should have is provided. By executing the program on a computer, the above processing functions are realized on the computer. The program describing the processing contents can be recorded on a computer-readable recording medium. Examples of the computer-readable recording medium include a magnetic storage device, an optical disk, a magneto-optical recording medium, and a semiconductor memory. Examples of the magnetic storage device include a hard disk device (HDD), a flexible disk (FD), and a magnetic tape. Optical discs include DVD, DVD-RAM, CD-ROM / RW, and the like. Magneto-optical recording media include MO (Magneto-Optical disc).
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。 When distributing the program, for example, a portable recording medium such as a DVD or a CD-ROM in which the program is recorded is sold. It is also possible to store the program in a storage device of a server computer and transfer the program from the server computer to another computer via a network.
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。 The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes processing according to the program. The computer can also read the program directly from the portable recording medium and execute processing according to the program. Further, each time the program is transferred from the server computer, the computer can sequentially execute processing according to the received program.
また、上記の処理機能の少なくとも一部を、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PDL(Programmable Logic Device)などの電子回路で実現することもできる。 In addition, at least a part of the above processing functions can be realized by an electronic circuit such as a DSP (Digital Signal Processor), an ASIC (Application Specific Integrated Circuit), or a PDL (Programmable Logic Device).
以上、実施の形態を例示したが、実施の形態で示した各部の構成は同様の機能を有する他のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。さらに、前述した実施の形態のうちの任意の2以上の構成(特徴)を組み合わせたものであってもよい。 As mentioned above, although embodiment was illustrated, the structure of each part shown by embodiment can be substituted by the other thing which has the same function. Moreover, other arbitrary structures and processes may be added. Further, any two or more configurations (features) of the above-described embodiments may be combined.
以上説明した実施の形態の主な技術的特徴は、以下の付記の通りである。
(付記1) コンピュータに、
複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系を示す分類体系情報を記憶する分類体系情報記憶手段を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出し、
抽出された分野それぞれの前記共通の観点で設けられたカテゴリ同士を比較し、
抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、前記追加対象カテゴリを他の分野に対して追加するものとする仮説を定義し、
前記分類体系による分類対象となる情報が格納されたデータベースを参照し、前記仮説に従って前記追加対象カテゴリが追加された場合に、前記追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出し、
検出された前記追加カテゴリ適合情報の量に基づいて前記仮説の適否を判定し、
適切と判定された前記仮説を改正案として出力する、
処理を実行させることを特徴とする分類体系改正支援プログラム。
The main technical features of the embodiment described above are as follows.
(Supplementary note 1)
Refers to a classification system information storage means for storing classification system information indicating a classification system in which a classification viewpoint is defined in each of a plurality of fields and a category for classification according to the defined viewpoint is provided. Extract at least two fields with categories,
Compare the categories established in the common viewpoint of each extracted field,
Define a hypothesis that a category that exists only in some of the extracted fields is an additional target category, and the additional target category is to be added to another field,
Referring to a database in which information to be classified by the classification system is stored, and when the additional target category is added according to the hypothesis, additional category conforming information that belongs to the additional target category is detected,
Determining the suitability of the hypothesis based on the amount of additional category conformance information detected;
Outputting the hypothesis determined to be appropriate as a revised draft,
Classification system revision support program characterized by having processing executed.
(付記2) 共通の観点でカテゴリが設けられている少なくとも2つの分野の組み合わせを複数抽出した場合、各分野の前記共通の観点で設けられているカテゴリのうち、定義が一致するカテゴリの数が多い組み合わせほど、仮説設定処理の優先度を高くすることを特徴とする付記1記載の分類体系改正支援プログラム。
(Supplementary Note 2) When a plurality of combinations of at least two fields in which categories are provided from a common viewpoint are extracted, the number of categories whose definitions match among the categories provided from the common viewpoints in each field The classification system revision support program according to
(付記3) 前記追加カテゴリ適合情報を検出する際には、前記コンピュータに、
抽出された分野のうち、前記共通の観点によるカテゴリとして前記追加対象カテゴリを既に有している分野を基準分野とすると共に、前記共通の観点によるカテゴリとして前記追加対象カテゴリを有していない分野を改正対象分野とし、前記データベース内の前記基準分野に属する情報を解析して前記追加対象カテゴリに属する情報の特徴を示す追加対象カテゴリ特徴情報を抽出し、前記データベース内の前記改正対象分野に属する各情報が前記追加対象カテゴリ特徴情報を有するか否かにより、前記改正対象分野に属する各情報が前記追加カテゴリ適合情報に該当するか否かを判定する、
処理を実行させることを特徴とする付記1記載の分類体系改正支援プログラム。
(Supplementary Note 3) When detecting the additional category conformance information,
Among the extracted fields, a field that already has the additional target category as a category according to the common viewpoint is set as a reference field, and a field that does not have the additional target category as a category according to the common viewpoint As the revision target field, the information belonging to the reference field in the database is analyzed to extract the additional target category feature information indicating the characteristics of the information belonging to the additional target category, and each of the revision target fields in the database It is determined whether each piece of information belonging to the revision target field corresponds to the additional category conforming information depending on whether the information includes the additional target category feature information.
The classification system revision support program according to
(付記4) 前記追加対象カテゴリ特徴情報を抽出する際には、前記コンピュータに、
前記データベース内の前記基準分野に属する情報のうち前記追加対象カテゴリに属する情報から得られるキーワードと、前記追加対象カテゴリに属さない情報から得られるキーワードとを比較して、前記追加対象カテゴリに属する情報の特徴を示す特徴キーワードを判定し、前記特徴キーワードを前記追加対象カテゴリ特徴情報とする、
処理を実行させることを特徴とする付記3記載の分類体系改正支援プログラム。
(Supplementary Note 4) When extracting the additional target category feature information,
Information that belongs to the additional target category by comparing a keyword obtained from information belonging to the additional target category among information belonging to the reference field in the database and a keyword obtained from information not belonging to the additional target category A feature keyword indicating a feature of the feature, and the feature keyword as the addition target category feature information,
The classification system revision support program according to appendix 3, wherein the processing is executed.
(付記5) 前記追加対象カテゴリ特徴情報を抽出する際には、前記コンピュータに、
前記データベース内の前記基準分野に属する情報のうち前記追加対象カテゴリに属する情報を正例、前記追加対象カテゴリに属さない情報を負例とした機械学習を行い、機械学習の結果得られる分類器を前記追加対象カテゴリ特徴情報とする、
処理を実行させることを特徴とする付記3記載の分類体系改正支援プログラム。
(Supplementary Note 5) When extracting the additional target category feature information,
A classifier obtained by performing machine learning using information belonging to the additional target category as a positive example and information not belonging to the additional target category as negative examples among information belonging to the reference field in the database, and obtained as a result of machine learning The additional target category feature information
The classification system revision support program according to appendix 3, wherein the processing is executed.
(付記6) 前記仮説を定義する場合、抽出された各分野の共通する観点で作成されたカテゴリを定義する文字列を解析して各カテゴリの特徴を示すキーワードを抽出し、一部の分野のカテゴリを定義する文字列から抽出されたキーワードが、他の分野のいずれのカテゴリからも抽出されていない場合、該当キーワードの抽出元となるカテゴリを、追加対象カテゴリとすることを特徴とする付記1記載の分対体系改正支援プログラム。
(Additional remark 6) When defining the said hypothesis, the character string which defines the category created from the common viewpoint of each extracted field is analyzed, the keyword which shows the characteristic of each category is extracted,
(付記7) 複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系を示す分類体系情報を記憶する分類体系情報記憶手段を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出する観点共通分野検索手段と、
抽出された分野それぞれの前記共通の観点で設けられたカテゴリ同士を比較し、抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、前記追加対象カテゴリを他の分野に対して追加するものとする仮説を定義する仮説定義手段と、
前記分類体系による分類対象となる情報が格納されたデータベースを参照し、前記仮説に従って前記追加対象カテゴリが追加された場合に、前記追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出し、検出された前記追加カテゴリ適合情報の量に基づいて前記仮説の適否を判定し、適切と判定された前記仮説を改正案として出力する仮説検証手段と、
を有することを特徴とする分類体系改正支援装置。
(Supplementary note 7) Refer to a classification system information storage unit that stores classification system information indicating a classification system in which a classification viewpoint is defined in each of a plurality of fields and a category for classification according to the defined viewpoint is provided, A viewpoint common field search means for extracting at least two fields having categories in a common viewpoint;
Compare the categories provided from the common viewpoint of each extracted field, and select categories that exist only in some of the extracted fields as additional target categories, and set the additional target categories as other fields. A hypothesis definition means for defining a hypothesis to be added to
Referring to a database in which information to be classified by the classification system is stored, when the additional target category is added according to the hypothesis, additional category conforming information belonging to the additional target category is detected and detected Hypothesis verification means for determining the suitability of the hypothesis based on the amount of the additional category conforming information that has been determined, and outputting the hypothesis determined to be appropriate as a revision plan;
A classification system revision support device characterized by comprising:
(付記8) コンピュータが、
複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系を示す分類体系情報を記憶する分類体系情報記憶手段を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出し、
抽出された分野それぞれの前記共通の観点で設けられたカテゴリ同士を比較し、
抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、前記追加対象カテゴリを他の分野に対して追加するものとする仮説を定義し、
前記分類体系による分類対象となる情報が格納されたデータベースを参照し、前記仮説に従って前記追加対象カテゴリが追加された場合に、前記追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出し、
検出された前記追加カテゴリ適合情報の量に基づいて前記仮説の適否を判定し、
適切と判定された前記仮説を改正案として出力する、
ことを特徴とする分類体系改正支援方法。
(Appendix 8) The computer
Refers to a classification system information storage means for storing classification system information indicating a classification system in which a classification viewpoint is defined in each of a plurality of fields and a category for classification according to the defined viewpoint is provided. Extract at least two fields with categories,
Compare the categories established in the common viewpoint of each extracted field,
Define a hypothesis that a category that exists only in some of the extracted fields is an additional target category, and the additional target category is to be added to another field,
Referring to a database in which information to be classified by the classification system is stored, and when the additional target category is added according to the hypothesis, additional category conforming information that belongs to the additional target category is detected,
Determining the suitability of the hypothesis based on the amount of additional category conformance information detected;
Outputting the hypothesis determined to be appropriate as a revised draft,
Classification system revision support method characterized by this.
1 分類体系情報記憶手段
2 観点共通分野検索手段
3,4 分野
5 仮説定義手段
6 データベース
7 仮説検証手段
8 改正案
1 Classification system information storage means 2 Perspective common field search means 3, 4
Claims (7)
複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系を示す分類体系情報を記憶する分類体系情報記憶手段を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出し、
抽出された分野それぞれの前記共通の観点で設けられたカテゴリ同士を比較し、
抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、前記追加対象カテゴリを他の分野に対して追加するものとする仮説を定義し、
前記分類体系による分類対象となる情報が格納されたデータベースを参照し、前記仮説に従って前記追加対象カテゴリが追加された場合に、前記追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出し、
検出された前記追加カテゴリ適合情報の量に基づいて前記仮説の適否を判定し、
適切と判定された前記仮説を改正案として出力する、
処理を実行させることを特徴とする分類体系改正支援プログラム。 On the computer,
Refers to a classification system information storage means for storing classification system information indicating a classification system in which a classification viewpoint is defined in each of a plurality of fields and a category for classification according to the defined viewpoint is provided. Extract at least two fields with categories,
Compare the categories established in the common viewpoint of each extracted field,
Define a hypothesis that a category that exists only in some of the extracted fields is an additional target category, and the additional target category is to be added to another field,
Referring to a database in which information to be classified by the classification system is stored, and when the additional target category is added according to the hypothesis, additional category conforming information that belongs to the additional target category is detected,
Determining the suitability of the hypothesis based on the amount of additional category conformance information detected;
Outputting the hypothesis determined to be appropriate as a revised draft,
Classification system revision support program characterized by having processing executed.
抽出された分野のうち、前記共通の観点によるカテゴリとして前記追加対象カテゴリを既に有している分野を基準分野とすると共に、前記共通の観点によるカテゴリとして前記追加対象カテゴリを有していない分野を改正対象分野とし、前記データベース内の前記基準分野に属する情報を解析して前記追加対象カテゴリに属する情報の特徴を示す追加対象カテゴリ特徴情報を抽出し、前記データベース内の前記改正対象分野に属する各情報が前記追加対象カテゴリ特徴情報を有するか否かにより、前記改正対象分野に属する各情報が前記追加カテゴリ適合情報に該当するか否かを判定する、
処理を実行させることを特徴とする請求項1記載の分類体系改正支援プログラム。 When detecting the additional category conformity information,
Among the extracted fields, a field that already has the additional target category as a category according to the common viewpoint is set as a reference field, and a field that does not have the additional target category as a category according to the common viewpoint As the revision target field, the information belonging to the reference field in the database is analyzed to extract the additional target category feature information indicating the characteristics of the information belonging to the additional target category, and each of the revision target fields in the database It is determined whether each piece of information belonging to the revision target field corresponds to the additional category conforming information depending on whether the information includes the additional target category feature information.
The classification system revision support program according to claim 1, wherein the program is executed.
前記データベース内の前記基準分野に属する情報のうち前記追加対象カテゴリに属する情報から得られるキーワードと、前記追加対象カテゴリに属さない情報から得られるキーワードとを比較して、前記追加対象カテゴリに属する情報の特徴を示す特徴キーワードを判定し、前記特徴キーワードを前記追加対象カテゴリ特徴情報とする、
処理を実行させることを特徴とする請求項3記載の分類体系改正支援プログラム。 When extracting the additional target category feature information, the computer,
Information that belongs to the additional target category by comparing a keyword obtained from information belonging to the additional target category among information belonging to the reference field in the database and a keyword obtained from information not belonging to the additional target category A feature keyword indicating a feature of the feature, and the feature keyword as the addition target category feature information,
4. The classification system revision support program according to claim 3, wherein the program is executed.
前記データベース内の前記基準分野に属する情報のうち前記追加対象カテゴリに属する情報を正例、前記追加対象カテゴリに属さない情報を負例とした機械学習を行い、機械学習の結果得られる分類器を前記追加対象カテゴリ特徴情報とする、
処理を実行させることを特徴とする請求項3記載の分類体系改正支援プログラム。 When extracting the additional target category feature information, the computer,
A classifier obtained by performing machine learning using information belonging to the additional target category as a positive example and information not belonging to the additional target category as negative examples among information belonging to the reference field in the database, and obtained as a result of machine learning The additional target category feature information
4. The classification system revision support program according to claim 3, wherein the program is executed.
抽出された分野それぞれの前記共通の観点で設けられたカテゴリ同士を比較し、抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、前記追加対象カテゴリを他の分野に対して追加するものとする仮説を定義する仮説定義手段と、
前記分類体系による分類対象となる情報が格納されたデータベースを参照し、前記仮説に従って前記追加対象カテゴリが追加された場合に、前記追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出し、検出された前記追加カテゴリ適合情報の量に基づいて前記仮説の適否を判定し、適切と判定された前記仮説を改正案として出力する仮説検証手段と、
を有することを特徴とする分類体系改正支援装置。 Refers to a classification system information storage means for storing classification system information indicating a classification system in which a classification viewpoint is defined in each of a plurality of fields and a category for classification according to the defined viewpoint is provided. A viewpoint common field search means for extracting at least two fields in which categories are provided;
Compare the categories provided from the common viewpoint of each extracted field, and select categories that exist only in some of the extracted fields as additional target categories, and set the additional target categories as other fields. A hypothesis definition means for defining a hypothesis to be added to
Referring to a database in which information to be classified by the classification system is stored, when the additional target category is added according to the hypothesis, additional category conforming information belonging to the additional target category is detected and detected Hypothesis verification means for determining the suitability of the hypothesis based on the amount of the additional category conforming information that has been determined, and outputting the hypothesis determined to be appropriate as a revision plan;
A classification system revision support device characterized by comprising:
複数の分野それぞれに分類の観点が定義され、定義された観点に沿った分類用のカテゴリが設けられた分類体系を示す分類体系情報を記憶する分類体系情報記憶手段を参照し、共通の観点でカテゴリが設けられている少なくとも2つの分野を抽出し、
抽出された分野それぞれの前記共通の観点で設けられたカテゴリ同士を比較し、
抽出された分野のうち一部の分野にのみ存在するカテゴリを追加対象カテゴリとし、前記追加対象カテゴリを他の分野に対して追加するものとする仮説を定義し、
前記分類体系による分類対象となる情報が格納されたデータベースを参照し、前記仮説に従って前記追加対象カテゴリが追加された場合に、前記追加対象カテゴリに属することとなる追加カテゴリ適合情報を検出し、
検出された前記追加カテゴリ適合情報の量に基づいて前記仮説の適否を判定し、
適切と判定された前記仮説を改正案として出力する、
ことを特徴とする分類体系改正支援方法。 Computer
Refers to a classification system information storage means for storing classification system information indicating a classification system in which a classification viewpoint is defined in each of a plurality of fields and a category for classification according to the defined viewpoint is provided. Extract at least two fields with categories,
Compare the categories established in the common viewpoint of each extracted field,
Define a hypothesis that a category that exists only in some of the extracted fields is an additional target category, and the additional target category is to be added to another field,
Referring to a database in which information to be classified by the classification system is stored, and when the additional target category is added according to the hypothesis, additional category conforming information that belongs to the additional target category is detected,
Determining the suitability of the hypothesis based on the amount of additional category conformance information detected;
Outputting the hypothesis determined to be appropriate as a revised draft,
Classification system revision support method characterized by this.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009086389A JP5310196B2 (en) | 2009-03-31 | 2009-03-31 | Classification system revision support program, classification system revision support device, and classification system revision support method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009086389A JP5310196B2 (en) | 2009-03-31 | 2009-03-31 | Classification system revision support program, classification system revision support device, and classification system revision support method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010238041A JP2010238041A (en) | 2010-10-21 |
JP5310196B2 true JP5310196B2 (en) | 2013-10-09 |
Family
ID=43092288
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009086389A Expired - Fee Related JP5310196B2 (en) | 2009-03-31 | 2009-03-31 | Classification system revision support program, classification system revision support device, and classification system revision support method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5310196B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5310328B2 (en) * | 2009-07-08 | 2013-10-09 | 富士通株式会社 | Classification system revision support program, classification system revision support device, and classification system revision support method |
US9477777B2 (en) * | 2013-03-15 | 2016-10-25 | Rakuten, Inc. | Method for analyzing and categorizing semi-structured data |
JP7092836B2 (en) * | 2020-09-15 | 2022-06-28 | 楽天グループ株式会社 | Proposal device for revision of patent classification, proposal method for revision of patent classification, and program |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4796865B2 (en) * | 2006-02-28 | 2011-10-19 | 株式会社日本総合研究所 | Classification correspondence method, classification correspondence system, and classification correspondence program |
-
2009
- 2009-03-31 JP JP2009086389A patent/JP5310196B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010238041A (en) | 2010-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9418144B2 (en) | Similar document detection and electronic discovery | |
US9317613B2 (en) | Large scale entity-specific resource classification | |
US9201931B2 (en) | Method for obtaining search suggestions from fuzzy score matching and population frequencies | |
US7769771B2 (en) | Searching a document using relevance feedback | |
KR101231560B1 (en) | Method and system for discovery and modification of data clusters and synonyms | |
JP5391633B2 (en) | Term recommendation to define the ontology space | |
US20120203584A1 (en) | System and method for identifying potential customers | |
Gao et al. | Emerging app issue identification from user feedback: Experience on wechat | |
JP5332477B2 (en) | Automatic generation of term hierarchy | |
US8019761B2 (en) | Recording medium storing a design support program, design support method, and design support apparatus | |
US9104968B2 (en) | Identifying categorized misplacement | |
JP5353173B2 (en) | Determining the concreteness of a document | |
US20140164302A1 (en) | Hybrid review synthesis | |
US20130110839A1 (en) | Constructing an analysis of a document | |
US20130060769A1 (en) | System and method for identifying social media interactions | |
US20140229476A1 (en) | System for Information Discovery & Organization | |
US10152478B2 (en) | Apparatus, system and method for string disambiguation and entity ranking | |
JP2009093651A (en) | Modeling topics using statistical distribution | |
US8560518B2 (en) | Method and apparatus for building sales tools by mining data from websites | |
US20100082628A1 (en) | Classifying A Data Item With Respect To A Hierarchy Of Categories | |
CN108681564A (en) | The determination method, apparatus and computer readable storage medium of keyword and answer | |
US20120117043A1 (en) | Measuring Duplication in Search Results | |
JP5310196B2 (en) | Classification system revision support program, classification system revision support device, and classification system revision support method | |
US20210271637A1 (en) | Creating descriptors for business analytics applications | |
JP2013174988A (en) | Similar document retrieval support apparatus and similar document retrieval support program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130617 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |