JP2013228933A - Patent search result evaluation device, patent search result evaluation method, and program - Google Patents

Patent search result evaluation device, patent search result evaluation method, and program Download PDF

Info

Publication number
JP2013228933A
JP2013228933A JP2012101298A JP2012101298A JP2013228933A JP 2013228933 A JP2013228933 A JP 2013228933A JP 2012101298 A JP2012101298 A JP 2012101298A JP 2012101298 A JP2012101298 A JP 2012101298A JP 2013228933 A JP2013228933 A JP 2013228933A
Authority
JP
Japan
Prior art keywords
search
evaluation
rule
result
rules
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012101298A
Other languages
Japanese (ja)
Other versions
JP5912813B2 (en
Inventor
Toshiya Tsuruhara
稔也 鶴原
Akihiro Azuma
明洋 東
Yoshifumi Suzuki
芳文 鈴木
Yukiko Nakamura
由紀子 中村
Misato Sakai
美里 酒井
Hidekazu Tanigawa
英和 谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IRD KK
Docomo Technology Inc
IRD KK
Original Assignee
IRD KK
Docomo Technology Inc
IRD KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IRD KK, Docomo Technology Inc, IRD KK filed Critical IRD KK
Priority to JP2012101298A priority Critical patent/JP5912813B2/en
Publication of JP2013228933A publication Critical patent/JP2013228933A/en
Application granted granted Critical
Publication of JP5912813B2 publication Critical patent/JP5912813B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To evaluate a patent search report appropriately.SOLUTION: A patent search result evaluation device 1 includes: a search formula evaluation part 107 for applying one or more search formulas to one or more patent search formula rules for patent search result information having one or more search formulas and screening information as to a result of screening of patents, determining a search rule which matches with one or more patent search formulas, and acquiring a first evaluation result corresponding to matched one or more search formula rules; a screening information evaluation part 108 for applying screening information to one or more screening rules, determining a screening rule which matches with screening information, and acquiring a second evaluation result corresponding to matched one or more screening rules; an evaluation constitution part 109 for constituting an evaluation of patent search result information by using the first evaluation result and the second evaluation result; and an evaluation output part 110 for outputting an evaluation of patent search result information; whereby a patent search report can be evaluated appropriately.

Description

本発明は、特許調査の結果を評価する特許調査結果評価装置等に関するものである。   The present invention relates to a patent search result evaluation apparatus for evaluating the result of a patent search.

従来の特許調査において、特許検索式を用いて特許公報を検索する装置等が開発されている(例えば、特許文献1参照)。また、特許調査の結果を管理する装置等が開発されている(例えば、特許文献2参照)。   In a conventional patent search, an apparatus for searching a patent publication using a patent search formula has been developed (see, for example, Patent Document 1). In addition, devices for managing the results of patent searches have been developed (see, for example, Patent Document 2).

特開平11−250090号公報Japanese Patent Laid-Open No. 11-250090 特開2007−242004号公報JP 2007-224004 A

しかしながら、従来の特許公報を検索する装置、及び特許調査の結果を管理する装置においては、特許調査を効率的に行うことができたとしても、その特許調査の結果が適切であるかどうかを評価できないという課題があった。   However, in the conventional device for searching patent gazettes and the device for managing the results of patent search, even if the patent search can be performed efficiently, it is evaluated whether the result of the patent search is appropriate. There was a problem that it was not possible.

本第一の発明の特許調査結果評価装置は、1以上の特許検索式と特許の選別の結果に関する選別情報とを有する特許調査結果情報を格納し得る特許調査結果情報格納部と、1以上の特許検索式が不適切であることを判断するためのルールである1以上の検索式ルールを格納し得る検索式ルール格納部と、調査対象の特許の選別作業の妥当性を判断するためのルールである1以上の選別ルールを格納し得る選別ルール格納部と、1以上の特許検索式を1以上の検索式ルールに適用し、1以上の特許検索式に合致する検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得する検索式評価部と、選別情報を1以上の選別ルールに適用し、選別情報に合致する選別ルールを決定し、合致する1以上の選別ルールに対応する第二の評価結果を取得する選別情報評価部と、第一の評価結果および第二の評価結果を用いて、特許調査結果情報の評価を構成する評価構成部と、特許調査結果情報の評価を出力する評価出力部とを具備する特許調査結果評価装置である。
かかる構成により、特許検索式と選別情報が適切か否かを評価できる。その結果、例えば、特許調査の妥当性を判断できる。また、例えば、特許調査結果情報を作成した調査者を評価できる。
The patent search result evaluation apparatus according to the first aspect of the present invention includes a patent search result information storage unit capable of storing patent search result information having one or more patent search formulas and selection information related to a result of patent selection, and one or more A search formula rule storage unit that can store one or more search formula rules, which are rules for determining whether a patent search formula is inappropriate, and a rule for determining the validity of a screening operation for a patent to be searched A screening rule storage that can store one or more screening rules, and one or more patent search formulas applied to the one or more search formula rules to determine a search formula rule that matches the one or more patent search formulas; A search expression evaluation unit that obtains a first evaluation result corresponding to one or more search expression rules that match, and applies selection information to one or more selection rules, determines a selection rule that matches the selection information, and matches For one or more sorting rules A selection information evaluation unit that obtains a second evaluation result, an evaluation configuration unit that constitutes an evaluation of the patent search result information using the first evaluation result and the second evaluation result, and an evaluation of the patent search result information It is the patent search result evaluation apparatus which comprises the evaluation output part which outputs.
With this configuration, it is possible to evaluate whether the patent search formula and the selection information are appropriate. As a result, for example, the validity of the patent search can be determined. Further, for example, the investigator who created the patent search result information can be evaluated.

また、本第二の発明の特許調査結果評価装置は、第一の発明に対して、特許調査結果情報は、特許調査の目的と特許調査の対象の特許書類の種類とを含み、検索式ルールは、特許調査の目的と特許書類の種類とを含むルールであり、検索式評価部は、特許調査結果情報に含まれる特許書類の種類と特許調査の目的とを、1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得する、特許調査結果評価装置である。
かかる構成により、特許調査の結果における、特許調査の目的と特許検索式に含まれる検索対象となる特許書類の種類との組み合わせが適切か否かを評価できる。その結果、例えば、ユーザは、特許書類の絞り込みの段階で、特許調査が適切であったかどうかを知ることができる。
The patent search result evaluation apparatus according to the second aspect of the present invention provides a search formula rule for the first invention, wherein the patent search result information includes the purpose of the patent search and the type of patent document subject to the patent search. Is a rule that includes the purpose of patent search and the type of patent document, and the search expression evaluation unit converts the type of patent document included in the patent search result information and the purpose of patent search into one or more search expression rules. It is a patent search result evaluation device that applies, determines one or more search formula rules that match, and acquires a first evaluation result corresponding to the one or more search formula rules that match.
With this configuration, it is possible to evaluate whether or not the combination of the purpose of the patent search and the type of patent document to be searched included in the patent search formula in the result of the patent search is appropriate. As a result, for example, the user can know whether the patent search is appropriate at the stage of narrowing down the patent documents.

また、本第三の発明の特許調査結果評価装置は、第一の発明に対して、特許調査結果情報は、検索対象の期間を含み、検索式ルールは、検索対象の期間を含むルールであり、検索式評価部は、特許調査結果情報に含まれる検索対象の期間を1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得する、特許調査結果評価装置である。
かかる構成により、特許調査の結果における、特許検索式に含まれる検索対象の期間が適切か否かを評価できる。その結果、例えば、ユーザは、特許書類の絞り込みの段階で特許調査が適切で、あったかどうかを知ることができる。
Further, in the patent search result evaluation device of the third invention, the patent search result information includes a search target period, and the search formula rule is a rule including a search target period, in contrast to the first invention. The search formula evaluation unit applies the search target period included in the patent search result information to one or more search formula rules, determines one or more search formula rules that match, and determines one or more search formula rules that match. It is a patent search result evaluation device for acquiring a corresponding first evaluation result.
With this configuration, it is possible to evaluate whether or not the search target period included in the patent search formula in the result of the patent search is appropriate. As a result, for example, the user can know whether or not the patent search was appropriate at the stage of narrowing down the patent documents.

また、本第四の発明の特許調査結果評価装置は、第一の発明に対して、特許調査結果情報は、特許分類と検索対象の期間とを含み、検索式ルールは、特許分類と検索対象の期間とを含むルールであり、検索式評価部は、特許調査結果情報に含まれる特許分類と検索対象の期間とを1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得する、特許調査結果評価装置である。
かかる構成により、特許調査の結果における、特許検索式に含まれる特許分類と検索対象の期間との組み合わせが適切か否かを評価できる。その結果、例えば、ユーザは、特許書類の絞り込みの段階で、特許調査が適切であったかどうかを知ることができる。
In addition, the patent search result evaluation apparatus according to the fourth aspect of the invention provides the patent search result information including a patent classification and a search period for the first invention, and the search formula rule includes the patent classification and the search target. The search expression evaluation unit applies the patent classification and the search target period included in the patent search result information to one or more search expression rules, and selects one or more search expression rules that match. It is a patent search result evaluation device that determines and acquires a first evaluation result corresponding to one or more search formula rules that match.
With this configuration, it is possible to evaluate whether or not the combination of the patent classification included in the patent search formula and the search target period in the patent search result is appropriate. As a result, for example, the user can know whether the patent search is appropriate at the stage of narrowing down the patent documents.

また、本第五の発明の特許調査結果評価装置は、第一の発明に対して、特許調査結果情報は、特許調査の目的と検索対象の期間とを含み、検索式ルールは、特許調査の目的と検索対象の期間とを含むルールであり、検索式評価部は、特許調査結果情報に含まれる検索対象の期間と特許調査の目的とを1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得する、特許調査結果評価装置である。
かかる構成により、特許調査の結果における、特許調査の目的と特許検索式に含まれる検索対象の期間との組み合わせが適切か否かを評価できる。その結果、例えば、ユーザは、特許書類の絞り込みの段階で、特許調査が適切であったかどうかを知ることができる。
The patent search result evaluation apparatus according to the fifth aspect of the invention provides the patent search result information including the purpose of the patent search and the period of the search target for the first invention. The search formula evaluation unit applies the search target period and the purpose of patent search included in the patent search result information to one or more search formula rules and matches the rules. It is a patent search result evaluation device that determines the above search formula rules and acquires a first evaluation result corresponding to one or more matching search formula rules.
With this configuration, it is possible to evaluate whether or not the combination of the purpose of the patent search and the search target period included in the patent search formula in the result of the patent search is appropriate. As a result, for example, the user can know whether the patent search is appropriate at the stage of narrowing down the patent documents.

また、本第六の発明の特許調査結果評価装置は、第一の発明に対して、特許調査結果情報は、検索フィールドを含み、検索式ルールは、検索フィールドを含むルールであり、検索式評価部は、特許調査結果情報に含まれる検索フィールドを1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得する、特許調査結果評価装置である。
かかる構成により、特許調査の結果における、特許検索式に含まれる検索フィールドが適切か否かを評価できる。その結果、例えば、ユーザは、特許書類の絞り込みの段階で特許調査が適切で、あったかどうかを知ることができる。
The patent search result evaluation apparatus according to the sixth aspect of the present invention is different from the first invention in that the patent search result information includes a search field, and the search expression rule includes a search field. The department applies the search field included in the patent search result information to one or more search formula rules, determines one or more search formula rules that match, and first evaluations corresponding to the one or more search formula rules that match It is a patent search result evaluation device that acquires results.
With this configuration, it is possible to evaluate whether or not the search field included in the patent search formula in the patent search result is appropriate. As a result, for example, the user can know whether or not the patent search was appropriate at the stage of narrowing down the patent documents.

また、本第七の発明の特許調査結果評価装置は、第一の発明に対して、特許調査結果情報は、特許調査の目的と検索フィールドとを含み、検索式ルールは、特許調査の目的と検索フィールドとを含むルールであり、検索式評価部は、特許調査結果情報に含まれる検索フィールドと特許調査の目的とを1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得する、特許調査結果評価装置である。
かかる構成により、特許調査の結果における、特許調査の目的と特許検索式に含まれる検索フィールドとの組み合わせが適切か否かを評価できる。その結果、例えば、ユーザは、特許書類の絞り込みの段階で、特許調査が適切であったかどうかを知ることができる。
In addition, the patent search result evaluation device of the seventh aspect of the invention provides the patent search result information including the purpose of the patent search and the search field, and the search formula rule includes the purpose of the patent search. The search expression evaluation unit applies the search field included in the patent search result information and the purpose of the patent search to one or more search expression rules, and selects one or more search expression rules that match. It is a patent search result evaluation device that determines and acquires a first evaluation result corresponding to one or more search formula rules that match.
With this configuration, it is possible to evaluate whether the combination of the purpose of the patent search and the search field included in the patent search formula in the result of the patent search is appropriate. As a result, for example, the user can know whether the patent search is appropriate at the stage of narrowing down the patent documents.

また、本第八の発明の特許調査結果評価装置は、第一の発明に対して、特許調査結果情報に含まれる特許検索式は、特許分類と用語とを含み、検索式ルールは、特許分類と用語とを含むルールであり、検索式評価部は、特許検索式に含まれる特許分類と用語とを、1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得する、特許調査結果評価装置である。
かかる構成により、特許調査の結果における、特許検索式に含まれる特許分類と用語との組み合わせが適切か否かを評価できる。その結果、例えば、ユーザは、特許書類の絞り込みの段階で、特許調査が適切であったかどうかを知ることができる。
The patent search result evaluation apparatus according to the eighth aspect of the present invention provides the patent search result included in the patent search result information includes a patent classification and a term, and the search expression rule includes a patent classification for the first invention. The search expression evaluation unit applies the patent classification and the term included in the patent search expression to one or more search expression rules, determines one or more search expression rules that match, It is a patent search result evaluation device that acquires a first evaluation result corresponding to one or more search formula rules that match.
With this configuration, it is possible to evaluate whether or not the combination of the patent classification and the term included in the patent search formula in the patent search result is appropriate. As a result, for example, the user can know whether the patent search is appropriate at the stage of narrowing down the patent documents.

また、本第九の発明の特許調査結果評価装置は、第一の発明に対して、特許調査結果情報に含まれる特許検索式は、1以上の用語を含み、検索式ルールは、特許書類の絞り込みの能力が低い1以上の用語を含むルールであり、検索式評価部は、特許検索式に含まれる1以上の用語を1以上の検索式ルールに適用し、1以上の各用語が絞り込みの能力が低いか否かを判断し、判断結果を用いて第一の評価結果を取得する、特許調査結果評価装置である。
かかる構成により、ユーザは、特許調査の結果における、特許検索式に含まれる用語の絞り込み能力が高いか低いかを評価できる。その結果、例えば、ユーザは、特許書類の絞り込みの段階で、特許調査が適切であったかどうかを知ることができる。
In addition, the patent search result evaluation device of the ninth aspect of the present invention provides the patent search expression included in the patent search result information includes one or more terms, and the search expression rule is the This is a rule that includes one or more terms that have a low filtering ability, and the search expression evaluation unit applies one or more terms included in the patent search expression to one or more search expression rules, and each of the one or more terms is narrowed down. It is a patent search result evaluation apparatus that determines whether or not the ability is low and acquires the first evaluation result using the determination result.
With this configuration, the user can evaluate whether the ability to narrow down the terms included in the patent search formula in the result of the patent search is high or low. As a result, for example, the user can know whether the patent search is appropriate at the stage of narrowing down the patent documents.

また、本第十の発明の特許調査結果評価装置は、第一の発明に対して、選別情報は、選別対象の特許件数と関連特許の件数とを含み、検索式ルールは、選別対象の特許件数と関連特許の件数とを用いたルールであり、検索式評価部は、選別情報に含まれる選別対象の特許件数と関連特許の件数とを、検索式ルールに適用し、第一の評価結果を取得する、特許調査結果評価装置である。
かかる構成により、ユーザは、特許調査の結果における、選別対象の特許書類の件数と関連特許の件数との割合が不釣り合いであるか否かを評価できる。その結果、例えば、ユーザは、特許書類の絞り込みの段階で、特許調査が適切であったかどうかを知ることができる。
Further, in the patent search result evaluation apparatus according to the tenth aspect of the present invention, with respect to the first invention, the selection information includes the number of patents to be selected and the number of related patents, and the search formula rule is the patent to be selected. The search formula evaluation unit applies the number of patents to be sorted and the number of related patents included in the sorting information to the search formula rule. It is a patent search result evaluation device that acquires
With this configuration, the user can evaluate whether or not the ratio between the number of patent documents to be selected and the number of related patents in the result of the patent search is disproportionate. As a result, for example, the user can know whether the patent search is appropriate at the stage of narrowing down the patent documents.

また、本第十一の発明の特許調査結果評価装置は、第一の発明に対して、特許調査結果情報は、2以上の特許検索式を有し、検索式ルールは、2以上の特許検索式を有するルールであり、検索式評価部は、特許調査結果情報が有する2以上の特許検索式を検索式ルールに適用し、選別対象の絞り込み方の妥当性を評価し、第一の評価結果を取得する、特許調査結果評価装置である。
かかる構成により、特許調査の結果における、検索式策定過程が適切か否かを評価できる。その結果、例えば、ユーザは、特許書類の絞り込みの段階で、特許調査が適切であったかどうかを知ることができる。
Further, the patent search result evaluation apparatus of the eleventh aspect of the invention has the patent search result information having two or more patent search formulas, and the search formula rule is two or more patent searches with respect to the first invention. The search formula evaluation unit applies two or more patent search formulas included in the patent search result information to the search formula rule, evaluates the validity of how to narrow down the selection target, and the first evaluation result It is a patent search result evaluation device that acquires
With this configuration, it is possible to evaluate whether or not the search formula formulation process is appropriate in the results of the patent search. As a result, for example, the user can know whether the patent search is appropriate at the stage of narrowing down the patent documents.

また、本第十二の発明の特許調査結果評価装置は、第十一の発明に対して、検索式評価部は、特許調査結果情報が有する2以上の特許検索式の中に、用語を含まず特許分類を含む特許検索式と、用語と特許分類とを含む特許検索式の両方が存在するか否かを判断し、両方存在しない場合、両方存在する場合と比較して、低い第一の評価結果を取得する、特許調査結果評価装置である。
かかる構成により、特許調査の結果における、検索式作成過程が適切か否かを評価できる。例えば、検索式の作成過程に、特許分類のみを組み合わせた分野を限定するための検索式を作成したかどうかを評価できる。その結果、例えば、ユーザは、特許書類の絞り込みの段階で、特許調査が適切であったかどうかを知ることができる。
Further, in the patent search result evaluation apparatus according to the twelfth aspect of the invention, in contrast to the eleventh invention, the search expression evaluation unit includes terms in two or more patent search expressions included in the patent search result information. First of all, it is determined whether or not both a patent search formula including a patent classification and a patent search formula including a term and a patent classification exist. It is a patent search result evaluation device for acquiring an evaluation result.
With this configuration, it is possible to evaluate whether or not the search formula creation process is appropriate in the results of the patent search. For example, it is possible to evaluate whether or not a search formula for limiting a field combining only patent classifications has been created in the search formula creation process. As a result, for example, the user can know whether the patent search is appropriate at the stage of narrowing down the patent documents.

また、本第十三の発明の特許調査結果評価装置は、第一の発明に対して、特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る関連特許書類格納部と、特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る非関連特許書類格納部とをさらに具備し、選別ルールは、非関連特許書類の中の関連特許書類に関するルールであり、選別情報評価部は、1以上の各関連特許書類から1以上の用語を取得し、1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、1以上の各非関連特許書類から1以上の用語を取得し、1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得する特徴ベクトル取得手段と、1以上の関連特許特徴ベクトルと1以上の非関連特許特徴ベクトルとを用いて、関連特許のクラスに属するべき非関連特許特徴ベクトルに対応する非関連特許書類を決定する判断手段と、判断手段が決定した1以上の関連特許書類を選別ルールに適用し、第二の評価結果を取得する選別評価結果取得手段とを具備する、特許調査結果評価装置である。
かかる構成により、非関連特許の特許書類の中から、関連特許書類を取得することができ、取得した関連特許書類を用いて選別情報を評価できる。これにより、例えば、ユーザは、特許書類の選別の段階で、特許調査が適切であったかどうかを知ることができる。
In addition, the patent search result evaluation apparatus according to the thirteenth invention receives one or more related patent documents, which are documents of related patents determined to be related to the first invention, as a result of sorting work in the patent search. A related patent document storage unit capable of storing; and an unrelated patent document storage unit capable of storing one or more unrelated patent documents, which are documents of unrelated patents determined to be unrelated as a result of screening in patent search. Further, the screening rule is a rule regarding related patent documents in unrelated patent documents, and the screening information evaluation unit obtains one or more terms from one or more related patent documents, and selects one or more terms. Using the related patent feature vector, which is a vector of each related patent document, for each related patent document, and acquiring one or more terms from each of one or more unrelated patent documents, and using one or more terms Unrelated patent documents Use the feature vector acquisition means for acquiring unrelated patent feature vectors, which are vectors, for each unrelated patent document, one or more related patent feature vectors, and one or more unrelated patent feature vectors. A determination means for determining an unrelated patent document corresponding to an unrelated patent feature vector to which the image belongs, and one or more related patent documents determined by the determination means are applied to the selection rule and a second evaluation result is obtained. A patent search result evaluation apparatus comprising an acquisition unit.
With this configuration, related patent documents can be acquired from non-related patent patent documents, and selection information can be evaluated using the acquired related patent documents. Thereby, for example, the user can know whether or not the patent search is appropriate at the stage of selecting the patent documents.

また、本第十四の発明の特許調査結果評価装置は、第一の発明に対して、特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る関連特許書類格納部と、特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る非関連特許書類格納部とをさらに具備し、選別ルールは、関連特許書類の中の非関連特許書類に関するルールであり、選別情報評価部は、1以上の各関連特許書類から1以上の用語を取得し、1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、1以上の各非関連特許書類から1以上の用語を取得し、1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得する特徴ベクトル取得手段と、1以上の関連特許特徴ベクトルと1以上の非関連特許特徴ベクトルとを用いて、非関連特許のクラスに属するべき関連特許特徴ベクトルに対応する関連特許書類を決定する判断手段と、判断手段が決定した1以上の非関連特許書類を選別ルールに適用し、第二の評価結果を取得する選別評価結果取得手段とを具備する、特許調査結果評価装置である。
かかる構成により、関連特許の特許書類の中から、非関連特許書類を取得することができ、取得した非関連特許書類を用いて選別情報を評価できる。これにより、例えば、ユーザは、特許書類の選別の段階で、特許調査が適切であったかどうかを知ることができる。
The device for evaluating a patent search result according to the fourteenth aspect of the present invention receives at least one related patent document that is a related patent document determined to be related to the first invention as a result of a screening operation in the patent search. A related patent document storage unit capable of storing; and an unrelated patent document storage unit capable of storing one or more unrelated patent documents, which are documents of unrelated patents determined to be unrelated as a result of screening in patent search. Further, the screening rule is a rule regarding unrelated patent documents in the related patent documents, and the screening information evaluation unit acquires one or more terms from one or more related patent documents, and selects one or more terms. Using the related patent feature vector, which is a vector of each related patent document, for each related patent document, and acquiring one or more terms from each of one or more unrelated patent documents, and using one or more terms Unrelated patent documents Class of unrelated patent using feature vector acquisition means for acquiring unrelated patent feature vector as vector for each unrelated patent document, one or more related patent feature vectors and one or more unrelated patent feature vectors A selection evaluation result for obtaining a second evaluation result by applying a determination means for determining a related patent document corresponding to a related patent feature vector to belong to and one or more unrelated patent documents determined by the determination means to the selection rule A patent search result evaluation apparatus comprising an acquisition unit.
With this configuration, it is possible to acquire an unrelated patent document from patent documents of related patents, and it is possible to evaluate selection information using the acquired unrelated patent documents. Thereby, for example, the user can know whether or not the patent search is appropriate at the stage of selecting the patent documents.

本発明による特許調査結果評価装置等によれば、特許調査の結果を適切に評価できる。   According to the patent search result evaluation apparatus or the like according to the present invention, the result of the patent search can be appropriately evaluated.

実施の形態1における特許調査結果評価装置を含むシステムの概念図Conceptual diagram of a system including a patent search result evaluation apparatus according to Embodiment 1 同実施の形態における特許調査結果評価装置のブロック図Block diagram of patent search result evaluation apparatus in the embodiment 同実施の形態における特許調査結果評価装置の動作を示すフローチャートThe flowchart which shows operation | movement of the patent search result evaluation apparatus in the embodiment 同実施の形態における検索式評価部の動作を示すフローチャートFlowchart showing the operation of the search expression evaluation unit in the same embodiment 同実施の形態における特徴ベクトル取得手段の動作を示すフローチャートThe flowchart which shows the operation | movement of the feature vector acquisition means in the embodiment 同実施の形態における判断手段の動作を示すフローチャートThe flowchart which shows the operation | movement of the judgment means in the embodiment 同実施の形態における選別評価結果取得手段の動作を示すフローチャートFlowchart showing the operation of the sorting evaluation result acquisition means in the same embodiment 同実施の形態における特許調査報告書の例を示す図Figure showing an example of a patent search report in the same embodiment 同実施の形態における検索式ルールの例を示す図The figure which shows the example of the search type | formula rule in the embodiment 同実施の形態における特許分類期間情報の例を示す図The figure which shows the example of the patent classification period information in the embodiment 同実施の形態における用語と特許分類の誤った組合せ情報の例を示す図The figure which shows the example of the incorrect combination information of the term and patent classification in the embodiment 同実施の形態における絞り込み能力の低い用語情報の例を示す図The figure which shows the example of term information with low narrowing-down capability in the embodiment 同実施の形態における選別ルールの例を示す図The figure which shows the example of the selection rule in the embodiment 同実施の形態における受付部が受け付ける情報を入力する画面の表示例を示す図The figure which shows the example of a display of the screen which inputs the information which the reception part in the embodiment receives 同実施の形態における各特許書類格納部に格納されている特許書類の例を示す図The figure which shows the example of the patent document stored in each patent document storage part in the embodiment 同実施の形態における各特許書類の特徴ベクトルの例を示す図The figure which shows the example of the feature vector of each patent document in the embodiment 同実施の形態における評価出力部が出力した情報を表示した画面の表示例を示す図The figure which shows the example of a display of the screen which displayed the information which the evaluation output part in the same embodiment output 上記実施の形態におけるコンピュータシステムの外観の一例を示す図The figure which shows an example of the external appearance of the computer system in the said embodiment 上記実施の形態におけるコンピュータシステムの構成の一例を示す図The figure which shows an example of a structure of the computer system in the said embodiment.

以下、特許調査結果評価装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。   Hereinafter, embodiments of a patent search result evaluation apparatus and the like will be described with reference to the drawings. In addition, since the component which attached | subjected the same code | symbol in embodiment performs the same operation | movement, description may be abbreviate | omitted again.

(実施の形態1)
本実施の形態において、特許調査結果情報に含まれている特許検索式と、その特許検索式を用いて取得した特許書類を関連特許と非関連特許とに人手で選別したが結果とが適切か否かを評価する特許調査結果評価装置1について説明する。
(Embodiment 1)
In the present embodiment, the patent search formula included in the patent search result information and the patent documents obtained using the patent search formula are manually sorted into related patents and non-related patents, but the results are appropriate. The patent search result evaluation apparatus 1 for evaluating whether or not will be described.

図1は、本実施の形態における特許調査結果評価装置1を含むシステムの概念図である。図1において、特許調査結果評価装置1と1または2以上のユーザ端末2とは、ネットワーク100を介して接続されている。ネットワーク100は、有線、または無線の通信回線であり、例えば、インターネットやイントラネット、LAN(Local Area Network)、公衆電話回線等である。また、ユーザ端末2は、ネットワーク100に接続可能な端末であれば何でも良い。例えば、ユーザ端末2は、デスクトップパソコン、ノートパソコン、スマートフォン、またはPDA等であっても良い。   FIG. 1 is a conceptual diagram of a system including a patent search result evaluation apparatus 1 in the present embodiment. In FIG. 1, a patent search result evaluation apparatus 1 and one or more user terminals 2 are connected via a network 100. The network 100 is a wired or wireless communication line, such as the Internet, an intranet, a LAN (Local Area Network), a public telephone line, or the like. The user terminal 2 may be any terminal that can be connected to the network 100. For example, the user terminal 2 may be a desktop personal computer, a notebook personal computer, a smartphone, or a PDA.

特許調査結果評価装置1は、受付部101、特許調査結果情報格納部102、関連特許書類格納部103、非関連特許書類格納部104、検索式ルール格納部105、選別ルール格納部106、検索式評価部107、選別情報評価部108、評価構成部109、および評価出力部110を備える。   The patent search result evaluation apparatus 1 includes a reception unit 101, a patent search result information storage unit 102, a related patent document storage unit 103, an unrelated patent document storage unit 104, a search formula rule storage unit 105, a selection rule storage unit 106, a search formula An evaluation unit 107, a selection information evaluation unit 108, an evaluation configuration unit 109, and an evaluation output unit 110 are provided.

また、選別情報評価部108は、特徴ベクトル取得手段21、判断手段22、および選別評価結果取得手段23を備える。   The selection information evaluation unit 108 includes a feature vector acquisition unit 21, a determination unit 22, and a selection evaluation result acquisition unit 23.

受付部101は、特許調査結果情報を受け付ける。特許調査結果情報とは、特許調査の結果をまとめた情報である。なお、特許調査とは、ある技術やある発明等に関連した文献を人手で調査することである。特許調査結果情報は、特許調査時に使用した特許検索式と、特許書類を選別した結果に関する選別情報とを有する。特許調査結果情報に含まれる特許検索式は、選別対象を取得するために用いた1の特許検索式であっても良く、選別情報を取得するための最終的な特許検索式以外にも、特許検索式を構築する過程に作成した2以上の特許検索式であっても良い。選別対象とは、特許検索式で検索して取得した結果であり、調査対象の発明の内容と関連するか否かを調べる対象の特許書類のことである。選別情報とは、選別対象に対して、調査対象の発明の内容と関連するか否かを判断した結果の情報である。特許調査結果情報に含まれる選別情報は、1または2以上の関連特許書類を特定する情報を少なくとも含む情報である。関連特許書類とは、人手で行った特許調査における選別作業の結果、調査対象の発明に関連すると判断された特許書類である。関連特許書類を特定する情報は、例えば、特許書類そのものであっても良く、特許書類を一意に特定する特許書類IDであっても良い。特許書類IDは、具体的には、出願番号であっても良く、公開番号であっても良く、登録番号等であっても良い。なお、選別情報は、非関連特許書類を特定する情報を含んでいても良い。非関連特許書類とは、特許調査における選別作業の結果、調査対象の発明に関連しないと判断された特許書類である。非関連特許書類を特定する情報については、上記の説明の関連特許書類を非関連特許書類に読み替えることで同様とする。また、選別情報は、選別対象の特許書類の件数と関連特許書類の件数とを含んでも良い。なお、特許調査結果情報は、特許調査の目的を含んでも良い。特許調査の目的とは、特許調査を行う目的である。特許調査の目的は、例えば、「先行技術調査」、「侵害予防調査」、「無効化資料調査」等である。先行技術調査は、特許出願前に先行技術が存在するか否かを調査することをいう。侵害予防調査は、商品やサービスを市場に出す前に他者特許を侵害しているか否かを調査することをいう。無効化資料調査は、他者の登録特許を無効にするために調査することをいう。また、特許調査結果情報は、上記以外にも、後述する特許調査の対象の特許書類の種類を含んでも良く、後述する検索対象の期間を含んでも良く、後述する特許分類を含んでも良く、後述する検索フィールドを含んでも良く、また上記2以上の組合せを含んでも良い。特許調査の対象の特許書類の種類と検索対象の期間と特許分類とは、通常、特許調査結果情報に含まれている検索式に含まれている情報である。特許調査結果情報は、例えば、特許を調査した結果を書類にまとめた特許調査報告書等のような書類であっても良く、特許調査の際に作成した作業ログのような情報であっても良い。   The accepting unit 101 accepts patent search result information. The patent search result information is information that summarizes the results of the patent search. The patent search is a manual search for documents related to a certain technology or invention. The patent search result information includes a patent search formula used at the time of patent search and selection information related to the result of selecting patent documents. The patent search formula included in the patent search result information may be the one of the patent search formulas used for acquiring the selection target, and in addition to the final patent search formula for acquiring the selection information, Two or more patent search formulas created in the process of building the search formula may be used. The selection object is a result obtained by searching with a patent search formula, and is a patent document to be examined whether or not it is related to the content of the invention to be searched. The sorting information is information obtained as a result of determining whether the sorting target is related to the contents of the investigation target invention. The selection information included in the patent search result information is information including at least information for specifying one or more related patent documents. A related patent document is a patent document that has been determined to be related to the invention to be searched as a result of a screening operation in a manual patent search. The information specifying the related patent document may be, for example, the patent document itself or a patent document ID that uniquely specifies the patent document. Specifically, the patent document ID may be an application number, a public number, or a registration number. The selection information may include information for specifying unrelated patent documents. An unrelated patent document is a patent document that has been determined not to be related to the invention to be searched as a result of the screening work in the patent search. The information for specifying unrelated patent documents is the same by replacing the related patent documents in the above description with unrelated patent documents. Further, the selection information may include the number of patent documents to be selected and the number of related patent documents. The patent search result information may include the purpose of the patent search. The purpose of patent search is the purpose of patent search. The purpose of the patent search is, for example, “prior art search”, “infringement prevention search”, “invalidation data search”, and the like. Prior art search refers to investigating whether prior art exists before filing a patent application. Infringement prevention investigation refers to investigating whether or not another person's patent is infringed before a product or service is put on the market. The invalidation document search is a search for invalidating the registered patent of another person. In addition to the above, the patent search result information may include the types of patent documents subject to patent search, which will be described later, may include a search target period, which will be described later, and may include patent classification, which will be described later. A search field may be included, or a combination of two or more of the above may be included. The type of patent document subject to patent search, the period of search target, and the patent classification are information included in a search expression normally included in the patent search result information. The patent search result information may be, for example, a document such as a patent search report that summarizes the results of a patent search, or information such as a work log created during a patent search. good.

特許検索式は、用語や特許分類等である要素を含み、データベース等に記憶されている特許書類を特定するために用いられる情報である。特許書類とは、特許庁に出願された特許等の出願書類等に関する情報である。特許検索式は、さらに2以上の要素を関係づけたり、要素を否定したりする論理演算子を含んでも良く、1または2以上の論理演算子と1または2以上の要素とを一つのブロックとして扱うための情報であるブロック区切り要素を含んでも良い。また、特許検索式は、特許調査の対象の特許書類の種類を含んでも良く、検索対象の期間を含んでも良く、検索フィールドを含んでも良い。特許書類の種類は、公開特許公報、特許公報、実用新案公開公報、実用新案登録公報、公表特許公報、公表実用新案公報、再公表特許公報、再公表実用新案公報等である。また、特許書類の発行国は、日本、米国、中国、欧州、韓国等、問わない。検索対象の期間は、検索対象の特許書類に付与される期日を含む期間である。例えば、検索対象の期間は、「1992.1.1〜2012.3.1」等である。検索対象の期間で指定する特許書類に付与される期日は、出願日であっても良く、公開日であっても良く、登録日等であっても良い。検索フィールドは、特許検索式中の用語を検索する対象である。例えば、「要約」、「特許請求の範囲」、「要約+特許請求の範囲」、または「全文」等である。なお、特許検索式のデータ構造、データ形式、および定義方法等は問わない。   The patent search formula is information used to specify patent documents stored in a database or the like, including elements such as terms and patent classifications. A patent document is information relating to an application document such as a patent filed with the JPO. The patent search expression may further include a logical operator that relates two or more elements or negates the element, and one or more logical operators and one or two or more elements are made into one block. You may include the block delimiter element which is the information for handling. Further, the patent search formula may include the type of patent document that is the subject of the patent search, may include the period of the search target, or may include a search field. The types of patent documents include published patent gazette, patent gazette, utility model published gazette, utility model registered gazette, published patent gazette, published utility model gazette, republished patent gazette, republished utility model gazette, and the like. The country of patent documents issuance is not limited to Japan, the United States, China, Europe, South Korea, etc. The period to be searched is a period including the date given to the patent document to be searched. For example, the search target period is “1992.1.1.1-2012.3.1”. The due date given to the patent document designated in the period to be searched may be the filing date, the publication date, the registration date, or the like. The search field is a target for searching for terms in the patent search formula. For example, “Summary”, “Claims”, “Summary + Claims”, or “Full text”. The data structure, data format, definition method, etc. of the patent search formula are not limited.

要素は、用語であっても良く、特許分類であっても良く、後述するブロック要素であっても良い。特許分類は、特許書類を分類し、検索時に利用可能な情報であれば何でも良い。例えば、特許分類は、IPC、FI、Fターム、USクラス、ECLA等のコードのいずれかであっても良く、または、上記コードの一部分であっても良い。コードの一部分とは、例えば、IPCであればセクション、クラス、サブクラス、またはメイングループ等であっても良い。また、コードの一部分は、例えば、Fタームであれば、テーマコード、またはテーマコードと観点等のことであっても良い。   The element may be a term, a patent classification, or a block element described later. The patent classification may be anything that classifies patent documents and can be used when searching. For example, the patent classification may be one of codes such as IPC, FI, F-term, US class, ECLA, or a part of the code. The part of the code may be, for example, a section, a class, a subclass, or a main group in the case of IPC. Further, a part of the code may be, for example, a theme code or a theme code and a viewpoint as long as it is F-term.

論理演算子は、例えばAND演算子であっても良く、OR演算子であっても良く、NOT演算子であっても良い。AND演算子とOR演算子とは、2以上の要素を関係づけたりする論理演算子である。例えば、AND演算子は、2つの要素の積集合を求める演算子である。OR演算子は、2つの要素の和集合を求める演算子である。例えば、NOT演算子は、要素を否定する演算子である。例えば、NOT演算子は、特定の要素の集合が含まない集合を求める演算子である。   The logical operator may be, for example, an AND operator, an OR operator, or a NOT operator. The AND operator and the OR operator are logical operators that relate two or more elements. For example, the AND operator is an operator for obtaining a product set of two elements. The OR operator is an operator for obtaining a union of two elements. For example, the NOT operator is an operator that negates an element. For example, the NOT operator is an operator for obtaining a set that does not include a set of specific elements.

ブロック区切り要素は、例えば、括弧であっても良く、グラフィカルユーザインタフェース上におけるテキストボックスであっても良い。ブロック区切り要素で区切られた領域をブロック要素とする。例えば、「(用語A OR 用語B) AND 用語C」の括弧で区切られた「(用語A OR 用語B)」は、ブロック要素であり、「(」と「)」とは、ブロック区切り要素である。   The block delimiter element may be, for example, parentheses or a text box on a graphical user interface. An area delimited by block delimiter elements is defined as a block element. For example, “(term A OR term B) AND (term B) AND (term C)” in parentheses is a block element, and “(” and “)” are block delimiters. is there.

なお、受付部101は、受け付けた特許調査結果情報を特許調査結果情報格納部102に格納する。また、受付部101は、受け付けた特許調査結果情報に含まれる関連特許書類を特定する情報を用いて関連特許書類格納部103に関連特許書類を格納する。なお、受付部101は、関連特許書類を特定する情報が、関連特許書類そのものであれば、そのまま関連特許書類格納部103に格納するようにしても良い。また、受付部101は、関連特許書類を特定する情報が特許書類IDであれば、特許書類IDをキーとして、図示しない特許書類格納部から特許書類を取得して、関連特許書類格納部103に格納しても良く、または図示しないネットワークを介して外部の特許書類検索装置などから特許書類IDに対応した特許書類を取得して、関連特許書類格納部103に格納しても良い。なお、図示しない特許書類格納部、および外部の特許書類検索装置は、1以上の特許書類を格納している。また、関連特許書類格納部103に格納する特許書類の言語やデータ形式等は問わない。また、受付部101は、非関連特許書類格納部104に非関連特許書類を格納する。受付部101が受け付けた特許調査結果情報に非関連特許書類を特定する情報が含まれている場合は、上記の説明の関連特許書類を非関連特許書類、および関連特許書類格納部103を非関連特許書類格納部104に読み替えることで同様とする。受付部101が受け付けた特許調査結果情報に非関連特許書類を特定する情報が含まれていない場合は、受付部101は、特許調査結果情報に含まれる特許検索式を用いて選別対象の特許書類を取得し、取得した特許書類から関連特許書類を除いた特許書類を非関連特許書類として非関連特許書類格納部104に格納しても良い。なお、選別対象の特許書類を取得する方法は、特許検索式を用いて、図示しない特許書類格納部から特許書類を取得する方法でも良く、図示しないネットワークを介して外部の特許書類検索装置などから取得する方法でも良い。   The accepting unit 101 stores the accepted patent search result information in the patent search result information storage unit 102. In addition, the reception unit 101 stores related patent documents in the related patent document storage unit 103 using information for specifying related patent documents included in the received patent search result information. If the information specifying the related patent document is the related patent document itself, the receiving unit 101 may store the information in the related patent document storage unit 103 as it is. If the information specifying the related patent document is a patent document ID, the reception unit 101 acquires the patent document from a patent document storage unit (not shown) using the patent document ID as a key, and stores it in the related patent document storage unit 103. It may be stored, or a patent document corresponding to the patent document ID may be acquired from an external patent document search device or the like via a network (not shown) and stored in the related patent document storage unit 103. Note that a patent document storage unit (not shown) and an external patent document search apparatus store one or more patent documents. Further, the language or data format of the patent document stored in the related patent document storage unit 103 does not matter. The receiving unit 101 also stores unrelated patent documents in the unrelated patent document storage unit 104. If the patent search result information received by the receiving unit 101 includes information for specifying an unrelated patent document, the related patent document in the above description is unrelated to the unrelated patent document and the related patent document storage unit 103 is unrelated. The same applies to the patent document storage unit 104. If the patent search result information received by the receiving unit 101 does not include information for specifying an unrelated patent document, the receiving unit 101 uses the patent search formula included in the patent search result information to select a patent document to be selected. And the patent document obtained by removing the related patent document from the acquired patent document may be stored in the unrelated patent document storage unit 104 as an unrelated patent document. In addition, the method of acquiring the patent document to be selected may be a method of acquiring a patent document from a patent document storage unit (not shown) using a patent search formula, or from an external patent document search device or the like via a network (not shown). The method to acquire may be used.

また、受付部101は、評価出力部110が出力した後述する評価結果に応じて修正された特許調査結果情報をも受け付けても良い。受付部101は、通常、ネットワーク100を介してユーザ端末2から送信された、特許調査結果情報を特定する情報を受け付けるが、キーボードやマウス、タッチパネル等の入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリ等の記録媒体から読み出された情報の受け付けであっても良い。   The accepting unit 101 may also accept patent search result information that has been corrected according to the later-described evaluation result output by the evaluation output unit 110. The accepting unit 101 usually accepts information specifying the patent search result information transmitted from the user terminal 2 via the network 100, but accepts information input from an input device such as a keyboard, mouse, touch panel, etc. Alternatively, it may be reception of information transmitted via a wireless communication line or reception of information read from a recording medium such as an optical disk, a magnetic disk, or a semiconductor memory.

特許調査結果情報格納部102には、1または2以上の特許検索式と特許の選別の結果に関する選別情報とを有する特許調査結果情報を格納し得る。ここで、格納とは、不揮発性の記録媒体による長期的な格納や、揮発性の記録媒体による一時的な格納も含む概念である。特許調査結果情報格納部102は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。特許調査結果情報格納部102に特許調査結果情報が格納される過程は問わない。通常、特許調査結果情報格納部102には、受付部101が受け付けた特許調査結果情報が格納されるが、例えば、記録媒体を介して特許調査結果情報が特許調査結果情報格納部102で格納されるようになっても良く、通信回線等を介して送信された特許調査結果情報が特許調査結果情報格納部102で格納されるようになっても良い。   The patent search result information storage unit 102 may store patent search result information having one or more patent search expressions and selection information related to the result of patent selection. Here, storage is a concept including long-term storage using a non-volatile recording medium and temporary storage using a volatile recording medium. The patent search result information storage unit 102 is preferably a non-volatile recording medium, but can also be realized by a volatile recording medium. The process in which the patent search result information is stored in the patent search result information storage unit 102 does not matter. Normally, the patent search result information storage unit 102 stores the patent search result information received by the reception unit 101. For example, the patent search result information storage unit 102 stores the patent search result information via a recording medium. The patent search result information transmitted via the communication line or the like may be stored in the patent search result information storage unit 102.

関連特許書類格納部103には、特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る。ここでの関連特許書類は、通常、特許調査における人手による選別作業の結果、関連すると判断された特許であるが、自動的に関連すると判断された特許書類でも良い。関連特許書類格納部103は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。関連特許書類格納部103に関連特許書類が格納される過程は問わない。通常、関連特許書類格納部103には、受付部101が取得した関連特許書類が格納されるが、例えば、記録媒体を介して関連特許書類が関連特許書類格納部103で格納されるようになっても良く、通信回線等を介して送信された関連特許書類が関連特許書類格納部103で格納されるようになっても良い。   The related patent document storage unit 103 can store one or more related patent documents, which are related patent documents that are determined to be related as a result of screening work in the patent search. The related patent document here is usually a patent that is determined to be related as a result of manual selection in a patent search, but may be a patent document that is automatically determined to be related. The related patent document storage unit 103 is preferably a non-volatile recording medium, but can also be realized by a volatile recording medium. The process for storing the related patent documents in the related patent document storage unit 103 is not limited. Normally, the related patent document storage unit 103 stores the related patent document acquired by the receiving unit 101. For example, the related patent document storage unit 103 stores the related patent document via a recording medium. Alternatively, the related patent documents transmitted via the communication line or the like may be stored in the related patent document storage unit 103.

非関連特許書類格納部104は、特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る。ここでの非関連特許書類は、通常、特許調査における人手による選別作業の結果、関連しないと判断された特許であるが、自動的に関連しないと判断された特許書類でも良い。非関連特許書類格納部104は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。非関連特許書類格納部104に非関連特許書類が格納される過程は問わない。通常、非関連特許書類格納部104には、受付部101が取得した非関連特許書類が格納されるが、例えば、記録媒体を介して非関連特許書類が非関連特許書類格納部104で格納されるようになっても良く、通信回線等を介して送信された非関連特許書類が非関連特許書類格納部104で格納されるようになっても良い。   The unrelated patent document storage unit 104 may store one or more unrelated patent documents that are documents of unrelated patents that are determined to be unrelated as a result of the screening work in the patent search. The unrelated patent document here is usually a patent that is determined not to be related as a result of manual selection work in the patent search, but may be a patent document that is automatically determined not to be related. The non-related patent document storage unit 104 is preferably a non-volatile recording medium, but can also be realized by a volatile recording medium. The process of storing unrelated patent documents in the unrelated patent document storage unit 104 does not matter. Normally, the unrelated patent document storage unit 104 stores unrelated patent documents acquired by the receiving unit 101. For example, the unrelated patent document storage unit 104 stores unrelated patent documents via a recording medium. The non-related patent documents transmitted via the communication line or the like may be stored in the non-related patent document storage unit 104.

検索式ルール格納部105には、1以上の特許検索式が不適切であることを判断するためのルールである1以上の検索式ルールを格納し得る。検索式ルールは、特許検索式に含まれ得る要素、特許調査の目的、検索フィールド、検索対象の期間、または上記の2以上の組み合わせが不適切であることを示すルールである。例えば、検索式ルールは、特許調査の目的と特許書類の種類とを含むルールであっても良く、検索対象の期間を含むルールであっても良く、特許分類と検索対象の期間とを含むルールであっても良く、特許調査の目的と検索対象の期間とを含むルールであっても良く、検索フィールドを含むルールであっても良く、特許調査の目的と検索フィールドとを含むルールであっても良く、特許分類と用語とを含むルールであっても良く、特許書類の絞り込みの能力が低い1または2以上の用語を含むルールであっても良く、選別対象の特許書類の件数と関連特許書類の件数とを用いたルールであっても良く、2以上の特許検索式を有するルールであっても良く、上記ルールが2以上組み合わされたルールであっても良い。絞り込みの能力が低い用語とは、多くの特許書類に出現し、特許書類を限定しにくい用語である。なお、絞り込みの能力が低い用語は、全ての分野において一定数以上の特許書類に出現する用語であっても良く、特定の分野においてのみ一定数以上の特許書類に出現する用語であっても良い。また、絞り込み能力の低い用語は、例えば、閾値よりも多くの特許書類に出現する用語であっても良く、閾値よりもIDF値が小さい用語であっても良い。なお、その閾値は、予め決められた値であっても良く、最も絞り込み能力の低い用語の出現する特許書類の件数に1より小さい数(例えば、0.9や0.8等)を掛けた値等であっても良く、最も絞り込み能力の低い用語のIDF値に1より大きい数(例えば、1.1や1.2等)を掛けた値等であっても良い。また、検索式ルール格納部105には、検索式ルールと対応付けて減点情報を格納し得るようにしても良い。減点情報は、検索式評価部107で特許検索式を評価する際に用いる情報であり詳細は後述する。なお、検索式ルールは、通常、特許検索式の内容が不適切であることを示すルールであるため、特許検索式の内容が適切であることを示すルールは、結果を反転させることで、不適切であることを示すルールとして使用しても良い。   The search formula rule storage unit 105 can store one or more search formula rules that are rules for determining that one or more patent search formulas are inappropriate. The search expression rule is a rule indicating that an element that can be included in the patent search expression, the purpose of the patent search, the search field, the search target period, or a combination of two or more of the above is inappropriate. For example, the search formula rule may be a rule that includes the purpose of patent search and the type of patent document, may be a rule that includes a search target period, or a rule that includes a patent classification and a search target period. It may be a rule including the purpose of the patent search and the search target period, may be a rule including the search field, or may be a rule including the purpose of the patent search and the search field. It may be a rule that includes patent classification and terms, or may include a rule that includes one or more terms that have a low ability to narrow down patent documents, and the number of patent documents to be selected and related patents. It may be a rule using the number of documents, a rule having two or more patent search expressions, or a rule in which two or more of the above rules are combined. A term with a low ability to narrow down is a term that appears in many patent documents and is difficult to limit patent documents. A term with a low ability to narrow down may be a term that appears in a certain number or more of patent documents in all fields, or a term that appears in a certain number or more of patent documents only in a specific field. . In addition, the term having a low narrowing ability may be, for example, a term that appears in more patent documents than the threshold, or a term having an IDF value smaller than the threshold. The threshold value may be a predetermined value, and the number of patent documents in which terms having the lowest narrowing ability appear is multiplied by a number smaller than 1 (for example, 0.9 or 0.8). It may be a value or the like, or may be a value obtained by multiplying the IDF value of a term having the lowest narrowing ability by a number larger than 1 (for example, 1.1 or 1.2). The search formula rule storage unit 105 may store deduction information in association with the search formula rule. The deduction information is information used when the search expression evaluation unit 107 evaluates the patent search expression, and details will be described later. Note that a search expression rule is usually a rule indicating that the content of a patent search expression is inappropriate. Therefore, a rule indicating that the content of a patent search expression is appropriate is not effective by inverting the result. It may be used as a rule indicating appropriateness.

以下、検索式ルール格納部105に格納され得る検索式ルールについて、例えば、(1)特許調査の目的と特許書類の種類とを含む検索式ルール、(2)検索対象の期間を含む検索式ルール、(3)特許分類と検索対象の期間とを含む検索式ルール、(4)特許調査の目的と検索対象の期間とを含む検索式ルール、(5)検索フィールドを含む検索式ルール、(6)特許調査の目的と検索フィールドとを含む検索式ルール、(7)特許分類と用語とを含む検索式ルール、(8)特許書類の絞り込みの能力が低い1以上の用語を含む検索式ルール、(9)選別対象の特許件数と関連特許の件数とを用いた検索式ルール、(10)2以上の特許検索式を有する検索式ルールがある。かかる検索式ルールについて、以下に詳細に説明する。   Hereinafter, with respect to the search formula rules that can be stored in the search formula rule storage unit 105, for example, (1) a search formula rule that includes the purpose of patent search and the type of patent document, and (2) a search formula rule that includes a search target period. (3) Search formula rule including patent classification and search target period, (4) Search formula rule including patent search purpose and search target period, (5) Search formula rule including search field, (6 ) A search expression rule including the purpose of the patent search and a search field; (7) a search expression rule including the patent classification and the term; and (8) a search expression rule including one or more terms having a low ability to narrow down patent documents. (9) There are search formula rules using the number of patents to be selected and the number of related patents, and (10) search formula rules having two or more patent search formulas. The search formula rule will be described in detail below.

(1)特許調査の目的と特許書類の種類とを含む検索式ルール
特許調査の目的と特許書類の種類とを含む検索式ルールは、例えば、特許調査の目的と検索対象の特許書類の種類との組合せが不適切であることを規定するルールであっても良い。その検索式ルールは、さらに具体的には、特許調査の目的が「侵害予防調査」である場合で、かつ検索対象の特許書類の種類に「公開特許公報」等の公開系の特許書類が含まれていた場合に不適切であるとする検索式ルール等である。なお、この具体例は、「侵害予防調査」は、侵害の可能性を調査することが目的であるため、公開系の特許書類を検索対象に含めることは不適切であると考えられることから導き出せるルールである。
(1) Search formula rule including the purpose of patent search and the type of patent document The search formula rule including the purpose of patent search and the type of patent document includes, for example, the purpose of patent search and the type of patent document to be searched. It may be a rule that stipulates that this combination is inappropriate. More specifically, the search formula rule includes a case where the purpose of the patent search is “infringement prevention search” and the type of patent documents to be searched includes open patent documents such as “public patent publication”. This is a search formula rule or the like that is inappropriate when it is displayed. In addition, this specific example can be derived from the fact that “infringement prevention investigation” is intended to investigate the possibility of infringement, so it is considered inappropriate to include public patent documents in the search subject. It is a rule.

(2)検索対象の期間を含む検索式ルール
検索対象の期間を含む検索式ルールは、例えば、検索対象の期間が不適切であることを規定するルールであっても良い。その検索式ルールは、さらに具体的には、検索対象の期間に未来の日付を含んだ期間を指定した場合に不適切であるとする検索式ルール等である。なお、この具体例は、検索対象の期間に未来の日付を指定しても、特許検索式に合致する特許書類がないため、不適切であると考えられることから導き出せるルールである。
(2) Search Formula Rule Including Search Target Period The search formula rule including the search target period may be, for example, a rule that specifies that the search target period is inappropriate. More specifically, the retrieval formula rule is a retrieval formula rule that is inappropriate when a period including a future date is designated as a period to be retrieved. This specific example is a rule that can be derived from the fact that even if a future date is specified for the period to be searched, there is no patent document that matches the patent search formula, so it is considered inappropriate.

(3)特許分類と検索対象の期間とを含む検索式ルール
特許分類と検索対象の期間とを含む検索式ルールは、例えば、特許分類と検索対象の期間との組合せが不適切であることを規定するルールであっても良い。その検索式ルールは、さらに具体的には、検索対象の期間が、特許検索式に含まれる特許分類の発行日以前のみ、または廃止日以降のみを指定した場合に不適切であるとする検索式ルール等である。なお、この具体例は、特許分類の発行日以前、または廃止日以降を指定しても、特許検索式に合致する特許書類がないため、不適切であると考えられることから導き出せるルールである。
(3) Search formula rule including patent classification and search target period The search formula rule including patent classification and search target period indicates that, for example, the combination of patent classification and search target period is inappropriate. It may be a rule that prescribes. More specifically, the search expression rule is a search expression that is inappropriate when the period to be searched is specified only before the issue date of the patent classification included in the patent search expression or only after the abolition date. Rules. Note that this specific example is a rule that can be derived from the fact that there is no patent document that matches the patent search formula even if the patent classification is issued before or after the date of issuance of the patent classification, and is considered inappropriate.

(4)特許調査の目的と検索対象の期間とを含む検索式ルール
特許調査の目的と検索対象の期間とを含む検索式ルールは、例えば、特許調査の目的と検索対象の期間との組合せが不適切であることを規定するルールであっても良い。その検索式ルールは、さらに具体的には、特許調査の目的が「侵害予防調査」である場合で、かつ検索対象の期間が特許権の存続期間が満了した特許書類を含めるように指定されていた場合に不適切であるとする検索式ルール等である。特許権の存続期間が満了した特許書類とは、例えば、出願後20年が経過した特許書類である。なお、この具体例は、「侵害予防調査」は、侵害の可能性を調査することが目的であるため、特許権の存続期間が満了した特許書類を検索対象の期間に指定するのは、不適切であると考えられることから導き出せるルールである。
(4) Search Expression Rule Including Patent Search Purpose and Search Target Period A search formula rule including a patent search purpose and a search target period includes, for example, a combination of a patent search purpose and a search target period. It may be a rule that prescribes inappropriateness. More specifically, the search rule is specified to include patent documents where the purpose of the patent search is “infringement prevention search” and the search period is the expiration of the patent right. This is a search formula rule that is inappropriate in the case of The patent document whose patent term has expired is, for example, a patent document that has passed 20 years after the application. In this specific example, the purpose of “infringement prevention investigation” is to investigate the possibility of infringement. Therefore, it is not possible to designate a patent document whose lifetime has expired as the period to be searched. It is a rule that can be derived from what is considered appropriate.

(5)検索フィールドを含む検索式ルール
検索フィールドを含む検索式ルールは、例えば、検索フィールドが不適切であることを規定するルールであっても良い。その検索式ルールは、さらに具体的には、検索フィールドが「発明の名称」のみであった場合に不適切であるとする検索式ルール等である。なお、この具体例は、「発明の名称」のみでは、検索の際に取りこぼしが発生するため、不適切であると考えられることから導き出せるルールである。
(5) Search Expression Rule Including Search Field The search expression rule including the search field may be, for example, a rule that specifies that the search field is inappropriate. More specifically, the search formula rule is a search formula rule that is inappropriate when the search field is “name of invention” only. Note that this specific example is a rule that can be derived from the fact that the “invention name” alone is considered inappropriate because a search is missed.

(6)特許調査の目的と検索フィールドとを含む検索式ルール
特許調査の目的と検索フィールドとを含む検索式ルールは、例えば、特許調査の目的と検索フィールドとの組合せが不適切であることを規定するルールであっても良い。その検索式ルールは、さらに具体的には、特許調査の目的が「無効化資料調査」である場合で、かつ検索フィールドに「要約」が指定されていた場合に不適切であるとする検索式ルール等である。なお、この具体例は、「無効化資料調査」において、可能な限り多くの資料を調査する必要があるため、「全文」に対して検索しないのは不適切であると考えられることから導き出せるルールである。
(6) Search Expression Rule Including Patent Search Purpose and Search Field The search expression rule including the purpose of patent search and the search field indicates that, for example, the combination of the purpose of the patent search and the search field is inappropriate. It may be a rule that prescribes. More specifically, the search formula rule is a search formula that is inappropriate when the purpose of the patent search is “invalidated material search” and “summary” is specified in the search field. Rules. Note that this specific example is a rule that can be derived from the fact that it is considered inappropriate to search for “full text” because it is necessary to investigate as many materials as possible in the “invalidation material survey”. It is.

(7)特許分類と用語とを含む検索式ルール
特許分類と用語とを含む検索式ルールは、例えば、特許分類と用語との組合せが不適切であることを規定するルールであっても良い。その検索式ルールは、さらに具体的には、特許分類が「IPC:G06F17/30」であり、用語に「データベース」が含まれている場合で、かつ特許分類と用語がAND演算子で関連づけられている場合に不適切であるとする検索式ルール等である。なお、この具体例は、「IPC:G06F17/30」が「情報検索,そのためのデータベース構造」を表す特許分類であるのに対し、「IPC:G06F17/30」の分野を象徴する用語である「データベース」で絞り込むことは、絞り込む分野が重複しているため、不適切であると考えられることから導き出せるルールである。
(7) Search Formula Rule Containing Patent Classification and Term The search formula rule including patent classification and term may be, for example, a rule that prescribes that the combination of patent classification and term is inappropriate. More specifically, the search rule is that the patent classification is “IPC: G06F17 / 30”, the term “database” is included in the term, and the patent classification and the term are related by the AND operator. This is a search formula rule or the like that is inappropriate. In this example, “IPC: G06F17 / 30” is a patent classification representing “information retrieval and database structure therefor”, whereas “IPC: G06F17 / 30” is a term that symbolizes the field “IPC: G06F17 / 30”. Narrowing down by “database” is a rule that can be derived from the fact that the fields to be narrowed down are considered inappropriate.

(8)特許書類の絞り込みの能力が低い1以上の用語を含む検索式ルール
特許書類の絞り込みの能力が低い1以上の用語を含む検索式ルールは、例えば、特許検索式に含まれる不適切であることを規定するルールであっても良い。さらに具体的には、その検索式ルールは、特許検索式に「装置」が含まれていた場合に不適切であるとする検索式ルール等である。なお、この具体例は、「装置」は、多くの特許書類に記載される用語であり、絞り込み能力が低いため、不適切であると考えられることから導き出せるルールである。また、かかる場合の検索式ルールは、例えば、用語の集合「装置,方法,・・・」、または分類と1以上の用語の組の集合(例えば、「G06F|情報,データ,・・・」)である。
(8) Retrieval rule rule including one or more terms having low ability to narrow down patent documents Retrieval rule rule including one or more terms having low ability to narrow down patent documents is, for example, inappropriate in a patent search expression. It may be a rule that prescribes certain things. More specifically, the retrieval formula rule is a retrieval formula rule that is inappropriate when “apparatus” is included in the patent retrieval formula. In this specific example, “apparatus” is a term described in many patent documents, and is a rule that can be derived from the fact that it is considered inappropriate because of its low narrowing ability. In such a case, the search formula rule is, for example, a set of terms “device, method,...” Or a set of classification and one or more terms (for example, “G06F | information, data,...”). ).

(9)選別対象の特許件数と関連特許の件数とを用いた検索式ルール
選別対象の特許書類の件数と関連特許の件数とを用いた検索式ルールは、例えば、選別対象の特許書類の件数と関連特許書類の件数の割合が不釣り合いであることを規定するルールであっても良い。その検索式ルールは、例えば、選別対象の特許書類の件数に対する関連特許書類の件数の割合が閾値以下である場合であっても良い。なお、閾値は、例えば、予め決められた値であっても良く、選別対象の特許書類の件数に応じて変動する値であっても良い。この検索式ルールは、さらに具体的には、選別対象の特許書類の件数が100件であるのに対し、関連特許の件数が1件のみといった場合に不適切であるとする検索式ルール等である。なお、この具体例は、関連特許の割合が閾値より少ないため、選別対象を取得した特許検索式が不適切であると考えられることから導き出せるルールである。
(9) Search formula rule using the number of patents to be sorted and the number of related patents The search formula rule using the number of patent documents to be sorted and the number of related patents is, for example, the number of patent documents to be sorted And a rule that stipulates that the ratio of the number of related patent documents is disproportionate. The search formula rule may be, for example, a case where the ratio of the number of related patent documents to the number of patent documents to be selected is equal to or less than a threshold value. The threshold value may be a predetermined value, for example, or may be a value that varies depending on the number of patent documents to be selected. More specifically, the search formula rule is a search formula rule that is inappropriate when the number of patent documents to be selected is 100, whereas the number of related patents is only one. is there. Note that this specific example is a rule that can be derived from the fact that the patent search formula that acquired the selection target is considered inappropriate because the ratio of related patents is less than the threshold.

(10)2以上の特許検索式を有する検索式ルール
2以上の特許検索式を有する検索式ルールは、例えば、不適切な特許検索式の作成過程を規定するルールであっても良い。その検索式ルールは、さらに具体的には、特許検索式に含まれている検索フィールドが「要約+請求項」から「要約」に変わっているのみで、特許検索式のその他要素が変わっていない場合に不適切であるとする検索式ルール等である。なお、この具体例は、単純に選別対象を減らすために検索フィールドを「要約+請求項」から「要約」に変更したと考えられるため、特許検索式が不適切であると考えられることから導き出せるルールである。また、この、検索式ルールは、特許調査結果情報が有する2以上の特許検索式の中に、用語を含まず特許分類を含む特許検索式と、用語と特許分類とを含む特許検索式の両方が存在するか否かを判断し、両方が存在しない場合に不適切であるとする検索式ルールなどでも良い。なお、この具体例は、複数の観点から特許検索式を作成していないと考えられるため、特許検索式が不十分であると考えられることから導き出せるルールである。
(10) Search Formula Rule Having Two or More Patent Search Formulas The search formula rule having two or more patent search formulas may be, for example, a rule that defines a process for creating an inappropriate patent search formula. More specifically, the search formula rule only changes the search field included in the patent search formula from “summary + claim” to “summary”, but does not change the other elements of the patent search formula. This is a search formula rule that is inappropriate in some cases. This specific example can be derived from the fact that the patent search formula is considered inappropriate because the search field is simply changed from “summary + claim” to “summary” in order to reduce the selection target. It is a rule. In addition, the search formula rule includes both a patent search formula including two or more patent search formulas included in the patent search result information and including a patent classification, and a patent search formula including a term and a patent classification. It is also possible to determine whether or not there is a search expression rule that is inappropriate when both do not exist. This specific example is a rule that can be derived from the fact that the patent search formula is considered insufficient because it is considered that the patent search formula is not created from a plurality of viewpoints.

なお、検索式ルール格納部105で格納されている検索式ルールには、そのルールを適用する際に参照するルールであるルール付加情報が含まれていても良い。ルール付加情報は、例えば、特許分類の発行と廃止とに関する情報であっても良く、用語と特許分類との不適切な組合せに関する情報であっても良く、絞り込み能力の低い用語に関する情報であっても良い。特許分類の発行と廃止とに関する情報とは、特許分類とその特許分類の発行日と廃止日とを対応付けた情報である。用語と特許分類との不適切な組合せに関する情報は、例えば、特定の特許分類とその特許分類の分野において絞り込み能力の低い用語とを対応付けた情報であっても良く、特定の特許分類とその特許分類を象徴する用語とを対応付けた情報であっても良い。絞り込み能力の低い用語に関する情報は、全ての分野において、絞り込み能力が低いと判断された用語の情報である。検索式ルール格納部105にルール付加情報が格納されている場合は、検索式評価部107は、ルール付加情報を参照して検索式ルールを適用しても良い。   Note that the search formula rule stored in the search formula rule storage unit 105 may include rule additional information that is a rule referred to when the rule is applied. The rule additional information may be, for example, information on issuance and abolition of patent classification, information on an inappropriate combination of a term and a patent classification, or information on a term with a low narrowing ability. Also good. The information related to the issuance and abolition of the patent classification is information in which the patent classification is associated with the issuance date and the abolition date of the patent classification. The information on an inappropriate combination of a term and a patent classification may be, for example, information that associates a specific patent classification with a term that has a low filtering ability in the field of the patent classification. The information may be associated with terms that symbolize patent classification. The information related to the term having a low narrowing ability is information on a term determined to have a low narrowing ability in all fields. When rule additional information is stored in the search formula rule storage unit 105, the search formula evaluation unit 107 may apply the search formula rule with reference to the rule additional information.

検索式ルールの定義方法は問わない。つまり、検索式ルールは、検索式ルールを表現する専用の言語(以下、ルール言語という)を用いて表現しても良く、汎用的な言語を用いて表現しても良い。また、検索式ルールは、公知の機械学習器(例えば、Support Vector Machine、ベイズ推定やニューラルネットワーク等)を用いて学習させた結果であっても良く、自然言語で記載されていても良い。ルール言語とは、変数や関数等を用いて、特許検索式等を表現できる言語である。例えば、ルール言語は、用語を変数に格納できる機能と、変数または定数の値に応じて処理を分岐できる機能と、文字列を操作する関数と、用語が絞り込み能力が低いか否かを判断する関数等とを備える言語であっても良い。検索式ルール格納部105は、1種類のみの検索式ルールが格納されても良く、2種類以上の検索式ルールが格納されても良い。   The method for defining the search expression rule is not limited. That is, the search expression rule may be expressed using a dedicated language (hereinafter referred to as rule language) for expressing the search expression rule, or may be expressed using a general-purpose language. The search formula rule may be a result of learning using a known machine learning device (for example, Support Vector Machine, Bayesian estimation, neural network, or the like), or may be described in a natural language. The rule language is a language that can express a patent search expression or the like using variables, functions, or the like. For example, the rule language determines whether a term can be stored in a variable, a function that can branch processing according to the value of a variable or constant, a function that operates on a character string, and whether a term has low filtering ability. It may be a language provided with functions and the like. The search formula rule storage unit 105 may store only one type of search formula rule, or may store two or more types of search formula rules.

また、検索式ルール格納部105には、判断結果メッセージを検索式ルールと関連付けた状態で格納し得るようにしても良い。判断結果メッセージとは、評価した理由をユーザに提示するメッセージである。例えば、判断結果メッセージは、「無効化資料調査は、公開系の公報のすべてを検索対象にするのが適切です。」等である。なお、判断結果メッセージには、変数等を用いて検索式評価部107で評価した結果の情報を含めても良い。   Further, the search formula rule storage unit 105 may store the determination result message in a state associated with the search formula rule. The determination result message is a message that presents the reason for evaluation to the user. For example, the determination result message is “It is appropriate to search all of the public gazettes in the invalidation material survey”. The determination result message may include information on the result of evaluation by the search expression evaluation unit 107 using variables or the like.

検索式ルール格納部105は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。検索式ルール格納部105に検索式ルールが格納される過程は問わない。例えば、記録媒体を介して検索式ルールが検索式ルール格納部105で格納されるようになっても良く、通信回線等を介して送信された検索式ルールが検索式ルール格納部105で格納されるようになっても良く、あるいは、入力デバイスを介して入力された検索式ルールが検索式ルール格納部105で格納されるようになっても良い。   The search expression rule storage unit 105 is preferably a non-volatile recording medium, but can also be realized by a volatile recording medium. The process of storing the search formula rule in the search formula rule storage unit 105 does not matter. For example, the search formula rule may be stored in the search formula rule storage unit 105 via a recording medium, and the search formula rule transmitted via a communication line or the like is stored in the search formula rule storage unit 105. Alternatively, the search formula rule input via the input device may be stored in the search formula rule storage unit 105.

選別ルール格納部106は、調査対象の特許の妥当性を判断するためのルールである1以上の選別ルールを格納し得る。選別ルール格納部106で格納する選別ルールは、非関連特許書類に誤って選別された関連特許書類に関するルールであっても良く、関連特許書類に誤って選別され非関連特許書類に関するルールであっても良い。また、選別ルール格納部106には、選別ルールと対応付けて減点情報を格納し得るようにしても良い。減点情報は、選別情報評価部108で選別情報を評価する際に用いる情報であり詳細は後述する。なお、選別ルールは、通常、選別結果が不適切であることを示すルールであるが、選別結果が適切であることを示すルールでも良い。以下、選別ルール格納部106に格納され得る検索式ルールについて、(1)非関連特許書類に選別された関連特許書類に関する選別ルール、(2)関連特許書類に選別された非関連特許書類に関する選別ルールのそれぞれについて詳細に説明する。   The selection rule storage unit 106 can store one or more selection rules that are rules for determining the validity of a patent to be searched. The selection rule stored in the selection rule storage unit 106 may be a rule related to a related patent document that is erroneously selected as an unrelated patent document, or a rule related to an unrelated patent document that is erroneously selected as a related patent document. Also good. Further, the screening rule storage unit 106 may store deduction information in association with the screening rule. The deduction information is information used when the sorting information evaluation unit 108 evaluates the sorting information, and details will be described later. The sorting rule is a rule that usually indicates that the sorting result is inappropriate, but may be a rule that indicates that the sorting result is appropriate. Hereinafter, with respect to the search formula rules that can be stored in the screening rule storage unit 106, (1) screening rules regarding related patent documents selected as unrelated patent documents, and (2) screening regarding unrelated patent documents selected as related patent documents. Each rule will be described in detail.

(1)非関連特許書類に選別された関連特許書類に関する選別ルール
本選別ルールは、例えば、調査対象の発明に関連する特許書類が、非関連特許書類として選別されていた際に不適切であることを規定するルールである。
(1) Selection rules for related patent documents selected as unrelated patent documents This selection rule is inappropriate when, for example, patent documents related to the subject invention are selected as unrelated patent documents. It is a rule that prescribes.

(2)関連特許書類に選別された非関連特許書類に関する選別ルール
本選別ルールは、例えば、調査対象の発明に関連しない特許書類が、関連特許書類として選別されていた際に不適切であることを規定するルールである。
(2) Selection rules for unrelated patent documents selected as related patent documents This selection rule is inappropriate when, for example, patent documents not related to the subject invention are selected as related patent documents. Is a rule that prescribes

なお、選別ルールの定義方法は問わない。つまり、選別ルールは、ルール言語を用いて表現しても良く、汎用的な言語を用いて表現しても良い。また、選別ルールは、公知の機械学習器(例えば、Support Vector Machine、ベイズ推定やニューラルネットワーク等)に選別情報と点数を学習させた結果であっても良く、自然言語で記載されていても良い。選別ルール格納部106は、1種類のみの選別ルールが格納されても良く、2種類以上の選別ルールが格納されても良い。   In addition, the definition method of a selection rule is not ask | required. That is, the selection rule may be expressed using a rule language, or may be expressed using a general-purpose language. The selection rule may be a result of having a known machine learner (for example, Support Vector Machine, Bayesian estimation, neural network, etc.) learn the selection information and score, or may be described in a natural language. . The sorting rule storage unit 106 may store only one type of sorting rule, or may store two or more types of sorting rules.

また、選別ルール格納部106には、判断結果メッセージを選別ルールと関連付けた状態で格納し得るようにしても良い。判断結果メッセージとは、判断した理由をユーザに提示するメッセージである。例えば、判断結果メッセージは、「5件の関連特許書類が非関連特許書類として判断されていました。」等である。なお、判断結果メッセージには、変数等を用いて判断手段22で判断した結果の情報を含めても良い。   Further, the selection rule storage unit 106 may store the determination result message in a state associated with the selection rule. The determination result message is a message that presents the determination reason to the user. For example, the determination result message is “5 related patent documents were determined as unrelated patent documents.” The determination result message may include information on the result determined by the determination unit 22 using a variable or the like.

選別ルール格納部106は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。選別ルール格納部106に選別ルールが格納される過程は問わない。例えば、記録媒体を介して選別ルールが選別ルール格納部106で格納されるようになっても良く、通信回線等を介して送信された検索式ルールが選別ルール格納部106で格納されるようになっても良く、あるいは、入力デバイスを介して入力された選別ルールが選別ルール格納部106で格納されるようになっても良い。   The sorting rule storage unit 106 is preferably a non-volatile recording medium, but can also be realized by a volatile recording medium. The process in which the sorting rules are stored in the sorting rule storage unit 106 does not matter. For example, the sorting rule may be stored in the sorting rule storage unit 106 via a recording medium, and the search rule rule transmitted via a communication line or the like may be stored in the sorting rule storage unit 106. Alternatively, the sorting rule input via the input device may be stored in the sorting rule storage unit 106.

検索式評価部107は、1または2以上の特許検索式を1または2以上の検索式ルールに適用し、1または2以上の特許検索式に合致する検索式ルールを決定する。そして、検索式評価部107は、決定した1または2以上の検索式ルールに対応する第一の評価結果を取得する。例えば、検索式評価部107は、特許調査結果情報に含まれる特許書類の種類と特許調査の目的とを、1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得しても良い。特許書類の種類は、特許検索式内の「特許書類の種類:」等の特許書類の種類に関する手がかりとなる情報を元に取得する。手がかりとは、タグであっても良く、「→」や「:」等の記号を含む文字列であっても良い。また、検索式評価部107は、特許調査結果情報に含まれる検索対象の期間を1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得しても良い。検索対象の期間は、例えば、特許検索式内の「特許書類の期間:」等の特許書類の期間に関する手がかりとなる情報を元に取得する。また、検索式評価部107は、特許調査結果情報に含まれる特許分類と検索対象の期間とを1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得しても良い。特許分類は、例えば、特許検索式内の「IPC:」や「FI:」等の特許分類の手がかりとなる情報を元に取得する。また、検索式評価部107は、特許調査結果情報に含まれる検索対象の期間と特許調査の目的とを1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得しても良い。また、検索式評価部107は、特許調査結果情報に含まれる検索フィールドを1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得しても良い。検索フィールドは、例えば、検索式内の「要約:」や「要約+請求項:」等の用語の検索対象となる情報を取得する。また、検索式評価部107は、特許調査結果情報に含まれる検索フィールドと特許調査の目的とを1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得しても良い。また、検索式評価部107は、特許検索式に含まれる特許分類と用語とを、1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得しても良い。また、検索式評価部107は、特許検索式に含まれる1以上の用語を1以上の検索式ルールに適用し、1以上の各用語が絞り込みの能力が低いか否かを判断し、判断結果を用いて第一の評価結果を取得しても良い。また、検索式評価部107は、選別情報に含まれる選別対象の特許件数と関連特許の件数とを、検索式ルールに適用し、第一の評価結果を取得しても良い。また、検索式評価部107は、特許調査結果情報が有する2以上の特許検索式を検索式ルールに適用し、選別対象の絞り込み方の妥当性を評価し、第一の評価結果を取得しても良い。また、検索式評価部107は、特許調査結果情報が有する2以上の特許検索式の中に、用語を含まず特許分類を含む特許検索式と、用語と特許分類とを含む特許検索式の両方が存在するか否かを判断し、両方存在しない場合、両方存在する場合と比較して、低い第一の評価結果を取得するようにしても良い。   The search expression evaluation unit 107 applies one or more patent search expressions to one or more search expression rules, and determines a search expression rule that matches one or more patent search expressions. Then, the search formula evaluation unit 107 acquires a first evaluation result corresponding to the determined one or two or more search formula rules. For example, the search formula evaluation unit 107 applies the type of patent document included in the patent search result information and the purpose of the patent search to one or more search formula rules, determines one or more search formula rules that match, You may acquire the 1st evaluation result corresponding to one or more search formula rules which correspond. The type of patent document is acquired based on information that is a clue regarding the type of patent document, such as “type of patent document:” in the patent search formula. The clue may be a tag or a character string including symbols such as “→” and “:”. The search formula evaluation unit 107 applies the search target period included in the patent search result information to one or more search formula rules, determines one or more search formula rules that match, and matches one or more search formulas. A first evaluation result corresponding to the rule may be acquired. The search target period is acquired based on information serving as a clue regarding the period of the patent document such as “patent document period:” in the patent search formula. In addition, the search formula evaluation unit 107 applies the patent classification and the search target period included in the patent search result information to one or more search formula rules, determines one or more search formula rules that match, and matches 1 You may acquire the 1st evaluation result corresponding to the above search formula rules. The patent classification is acquired based on information that is a clue to patent classification such as “IPC:” and “FI:” in the patent search formula. The search formula evaluation unit 107 applies the search target period and the purpose of patent search included in the patent search result information to one or more search formula rules, determines one or more search formula rules that match, You may acquire the 1st evaluation result corresponding to one or more retrieval formula rules to do. In addition, the search expression evaluation unit 107 applies the search field included in the patent search result information to one or more search expression rules, determines one or more search expression rules that match, and determines one or more search expression rules that match. A corresponding first evaluation result may be acquired. In the search field, for example, information to be searched for terms such as “summary:” and “summary + claim:” in the search formula is acquired. In addition, the search formula evaluation unit 107 applies the search field included in the patent search result information and the purpose of the patent search to one or more search formula rules, determines one or more search formula rules that match, and matches 1 You may acquire the 1st evaluation result corresponding to the above search formula rules. In addition, the search formula evaluation unit 107 applies the patent classification and terms included in the patent search formula to one or more search formula rules, determines one or more search formula rules that match, and searches for one or more matches. A first evaluation result corresponding to the expression rule may be acquired. In addition, the search expression evaluation unit 107 applies one or more terms included in the patent search expression to one or more search expression rules, determines whether or not each of the one or more terms has a low narrowing ability, and the determination result The first evaluation result may be acquired using. Further, the search formula evaluation unit 107 may acquire the first evaluation result by applying the number of patents to be sorted and the number of related patents included in the sort information to the search formula rule. Further, the search formula evaluation unit 107 applies two or more patent search formulas included in the patent search result information to the search formula rule, evaluates the validity of the narrowing down of the selection target, and acquires the first evaluation result. Also good. The search expression evaluation unit 107 includes both a patent search expression including a patent classification without including a term and a patent search expression including a term and a patent classification among two or more patent search expressions included in the patent search result information. If both are not present, a lower first evaluation result may be obtained than when both are present.

検索式ルールに適用するとは、例えば、特許検索式と特許調査の目的とが、検索式ルールに合致するかどうかを評価することである。なお、検索式ルールに適用する場合に、検索式ルールに対応したルール付加情報が検索式ルール格納部105に格納されていれば、ルール付加情報を参照して適用しても良い。   Applying to the search formula rule means, for example, evaluating whether the patent search formula and the purpose of the patent search match the search formula rule. When applied to a search formula rule, if rule additional information corresponding to the search formula rule is stored in the search formula rule storage unit 105, the rule additional information may be referred to and applied.

第一の評価結果は、検索式ルールに合致した件数であっても良く、検索式ルールごとに減点する方法を定めて、それを利用して算出されても良い。検索式ルールごとに減点する方法を定める場合には、例えば、第一の評価結果は、検索式ルール格納部105に、検索式ルールと対応付けて格納されている減点情報を用いて算出されても良い。減点情報は、例えば、点数であっても良く、割合であっても良い。具体的には、検索式評価部107は、減点情報が−3点の検索式ルール1件のみに合致した場合は、1と評価してもよく、−3点と評価しても良く、予め100点満点の持ち点があるとして、97点と評価しても良い。また、検索式評価分107は、減点情報が95%の検索式ルール1件のみに合致した場合は、予め100点満点の持ち点があるとして、95点と評価しても良い。また、検索式評価部107は、各検索式ルールとの合致状況によって減点する点数、または割合を増減させても良い。また、検索式評価部107は、検索式ルールに合致した件数に応じてさらに減点するルールを規定しても良い。例えば、検索式評価部107は、合致した検索式ルールの数が予め設定した閾値以上であれば、一定の点数、または一定の割合を第一の評価結果から減点しても良く、合致した検索式ルールの数に比例して大きくなる数値を第一の評価結果から減点しても良い。なお、第一の評価結果は、通常、数値であるが、検索式ルールに対応付けられた判断結果メッセージであっても良く、数値と判断結果メッセージの組合せであっても良い。判断結果メッセージを取得する場合で、かつ検索式ルール格納部105の判断結果メッセージに変数、または処理が含まれていた場合に、検索式評価部107が不適切であると判断した理由がわかるように取得しても良い。具体的には、検索式評価部107は、特許検索式含まれる検索対象の期間に未来の日付である「2100.01.01〜2200.01.01」が指定されていた場合に、未来の日付を不適切とする検索式ルールに判断結果メッセージ「未来の日付を含む期間である{[Period]}が指定されています。」が対応付けられていれば、「未来の日付を含む期間である2100.01.01〜2200.01.01が指定されています。」等として取得しても良い。この具体例では、{[Period]}の部分に検索対象の期間を代入するものとした。また、検索式評価部107は、通常、MPUやメモリ等から実現され得る。検索式評価部107の処理手順は、通常、ソフトウェアで実現され、そのソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The first evaluation result may be the number of cases that match the search formula rule, or may be calculated using a method for deducting points for each search formula rule. When determining a method for deducting points for each search expression rule, for example, the first evaluation result is calculated using the deduction information stored in the search expression rule storage unit 105 in association with the search expression rule. Also good. The deduction information may be, for example, a score or a ratio. Specifically, when the deduction information matches only one search expression rule with -3 points, the search expression evaluation unit 107 may evaluate it as 1, or may evaluate it as -3. If there is a score of 100 points, it may be evaluated as 97 points. In addition, if the deduction information matches only one search expression rule with 95%, the search expression evaluation portion 107 may be evaluated as 95 points because there is a score of 100 points in advance. In addition, the search formula evaluation unit 107 may increase or decrease the number of points or the percentage to be deducted depending on the matching condition with each search formula rule. In addition, the search expression evaluation unit 107 may define a rule for further deduction according to the number of cases that match the search expression rule. For example, if the number of matched search formula rules is equal to or greater than a preset threshold, the search formula evaluation unit 107 may deduct a fixed score or a fixed percentage from the first evaluation result, and the matched search A numerical value that increases in proportion to the number of expression rules may be subtracted from the first evaluation result. The first evaluation result is usually a numerical value, but may be a determination result message associated with the search expression rule, or a combination of a numerical value and a determination result message. When the determination result message is acquired and the determination result message in the search expression rule storage unit 105 includes a variable or a process, the reason why the search expression evaluation unit 107 determines that the determination result message is inappropriate can be understood. You may get to. Specifically, the search formula evaluation unit 107 determines that the future date “2100.01.01 to 2200.01.01” is specified in the search target period included in the patent search formula. If the judgment result message “{[Period]} is a period that includes a future date is specified.” Is associated with a search expression rule that makes the date inappropriate, “In a period that includes a future date, Some 2100.01.01 to 2200.01.01 are designated "or the like. In this specific example, the period to be searched is substituted into the {[Period]} portion. In addition, the search expression evaluation unit 107 can usually be realized by an MPU, a memory, or the like. The processing procedure of the search expression evaluation unit 107 is usually realized by software, and the software is recorded in a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

選別情報評価部108は、選別情報を1または2以上の選別ルールに適用し、選別情報に合致する選別ルールを決定する。そして、選別情報評価部108は、決定した1または2以上の選別ルールに対応する第二の評価結果を取得する。選別情報評価部108は、例えば、特徴ベクトル取得手段21と判断手段22と選別評価結果取得手段23とを備える。以下、特徴ベクトル取得手段21、判断手段22、および選別評価結果取得手段23について、詳しく説明する。   The sorting information evaluation unit 108 applies the sorting information to one or more sorting rules and determines a sorting rule that matches the sorting information. Then, the selection information evaluation unit 108 acquires a second evaluation result corresponding to the determined one or more selection rules. The selection information evaluation unit 108 includes, for example, a feature vector acquisition unit 21, a determination unit 22, and a selection evaluation result acquisition unit 23. Hereinafter, the feature vector acquisition unit 21, the determination unit 22, and the sorting evaluation result acquisition unit 23 will be described in detail.

特徴ベクトル取得手段21は、1または2以上の各関連特許書類から1または2以上の用語を取得し、当該1または2以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得する。なお、特徴ベクトル取得手段21は、通常、2以上の各関連特許書類から関連特許特徴ベクトルを取得する。   The feature vector acquisition means 21 acquires one or two or more terms from one or two or more related patent documents, and uses the one or two or more terms to obtain a related patent feature vector that is a vector of each related patent document. , Get for each related patent document. Note that the feature vector acquisition means 21 normally acquires related patent feature vectors from two or more related patent documents.

さらに、特徴ベクトル取得手段21は、1または2以上の各非関連特許書類から1または2以上の用語を取得し、当該1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得する。なお、特徴ベクトル取得手段21は、通常、2以上の各非関連特許書類から非関連特許特徴ベクトルを取得する。   Further, the feature vector acquisition means 21 acquires one or more terms from one or more unrelated patent documents, and uses the one or more terms as a vector of each unrelated patent document. A feature vector is obtained for each unrelated patent document. Note that the feature vector obtaining unit 21 usually obtains unrelated patent feature vectors from two or more unrelated patent documents.

特徴ベクトル取得手段21が関連特許書類から取得する用語は、例えば、あらかじめ決められた品詞(例えば、名詞等)であっても良く、予め決められた連続した品詞の用語群であっても良く、専門用語であっても良く、あるいは、その他の用語であっても良い。専門用語を取得する場合には、例えば、図示しない専門用語格納部に専門用語が格納されており、その専門用語が関連特許書類に含まれているかどうか判断することによって用語の取得が行われても良く、文書から専門用語を抽出するアルゴリズムを用いることによって用語の取得が行われても良い。後者の方法については、例えば、次の文献を参照されたい。大畑博一、中川裕志、「連接異なり語数による専門用語抽出」、情報処理学会研究報告、2000−NL−136、p.119−126。中川裕志、森辰則、湯本紘彰、「出現頻度と連接頻度に基づく専門用語抽出」、自然言語処理、Vol.10 No.1、p.27−45、2003年1月。なお、その用語の取得の際に、特徴ベクトル取得手段21は、TF値やTF−IDF値を重要度として利用し、重要度の低い用語を除いて取得しても良い。また、IDF値を算出する際に対象となる文書は、関連特許書類格納部103と非関連特許書類格納部104に格納されている全文書であっても良い。重要度の低い用語とは、重要度の値が閾値以下である用語であっても良く、重要度順に並べて上位から所定の個数の用語であっても良い。なお、閾値は、例えば、予め決められた値であっても良く、重要度の最大値に1より小さい数(例えば、0.9や0.8等)を掛けた値であっても良い。また、その所定の個数は、例えば、予め決められた個数であっても良く、特徴ベクトル取得手段21が取得した用語の総数に1より小さい値(例えば、0.01や0.001等)を掛けた個数であっても良い。また、特徴ベクトル取得手段21は、特許書類の少なくとも一部を含む文字列から用語を取得する。特許書類の少なくとも一部を含む文字列とは、例えば、特許書類に記載された全文であっても良く、見出しによって識別される文字列であっても良く、複数の見出しの組み合わせによって識別される文字列であっても良い。見出しとは、例えば、発明の名称、特許請求の範囲、または要約等の特許書類内の領域を識別するものであれば何でも良い。なお、特徴ベクトル取得手段21が、関連特許書類から用語を取得する方法について記載したが、非関連特許書類から用語を取得する場合は、上記の説明の関連特許書類を非関連特許書類、および関連特許書類格納部103を非関連特許書類格納部104に読み替えることで同様とする。   The term acquired from the related patent document by the feature vector acquisition unit 21 may be, for example, a predetermined part of speech (for example, a noun), or a predetermined continuous part of speech term group, Technical terms may be used, or other terms may be used. When acquiring technical terms, for example, technical terms are stored in a technical term storage unit (not shown), and the terms are acquired by determining whether the technical terms are included in the related patent documents. Alternatively, the term may be acquired by using an algorithm that extracts technical terms from the document. For the latter method, see, for example, the following document. Hirokazu Ohata, Hiroshi Nakagawa, “Extraction of technical terms by different number of words”, Information Processing Society of Japan Research Report, 2000-NL-136, p. 119-126. Nakagawa Hiroshi, Mori Yasunori, Yumoto Yasuaki, “Terminology Extraction Based on Appearance Frequency and Connection Frequency”, Natural Language Processing, Vol. 10 No. 1, p. 27-45, January 2003. When acquiring the term, the feature vector acquiring unit 21 may use the TF value or the TF-IDF value as the importance, and may acquire the term except for the less important term. In addition, the documents that are targeted when calculating the IDF value may be all documents stored in the related patent document storage unit 103 and the unrelated patent document storage unit 104. The term of low importance may be a term whose importance value is a threshold value or less, or may be a predetermined number of terms arranged in order of importance. The threshold may be a predetermined value, for example, or may be a value obtained by multiplying the maximum value of importance by a number smaller than 1 (for example, 0.9 or 0.8). The predetermined number may be a predetermined number, for example, and a value smaller than 1 (for example, 0.01 or 0.001) is added to the total number of terms acquired by the feature vector acquisition unit 21. It may be a multiplied number. The feature vector acquisition unit 21 acquires a term from a character string including at least a part of a patent document. The character string including at least a part of the patent document may be, for example, a full text described in the patent document, a character string identified by a headline, or a combination of a plurality of headlines. It may be a string. The heading may be anything as long as it identifies an area in a patent document, such as the name of an invention, a claim, or a summary. In addition, although the feature vector acquisition means 21 described about the method of acquiring a term from a related patent document, when acquiring a term from a non-related patent document, the related patent document of said description is related to a non-related patent document, and a related The same applies by replacing the patent document storage unit 103 with the unrelated patent document storage unit 104.

特徴ベクトル取得手段21が取得する各関連特許特徴ベクトルは、特徴ベクトル取得手段21が取得したすべての用語数分の次元を持つベクトルである。関連特許特徴ベクトルの要素は、例えば、用語の出現回数であっても良く、用語のTF値であっても良く、用語のTF−IDF値であっても良く、用語が特許書類内に存在するかどうかを示す数字、具体的には「1(存在する)」「−1(存在しない)」等であっても良い。なお、特徴ベクトル取得手段21が、関連特許特徴ベクトルを取得する方法について記載したが、非関連特許特徴ベクトルを取得する場合は、上記の説明の関連特許特徴ベクトルを非関連特許特徴ベクトルに読み替えることで同様とする。   Each related patent feature vector acquired by the feature vector acquisition unit 21 is a vector having dimensions corresponding to all the terms acquired by the feature vector acquisition unit 21. The element of the related patent feature vector may be, for example, the number of occurrences of the term, the TF value of the term, or the TF-IDF value of the term, and the term exists in the patent document. It may be a number indicating whether or not, specifically, “1 (present)”, “−1 (not present)”, or the like. In addition, although the feature vector acquisition means 21 described the method of acquiring a related patent feature vector, when acquiring an unrelated patent feature vector, it replaces the related patent feature vector of said description with an unrelated patent feature vector. The same shall apply.

また、特徴ベクトル取得手段21は、特許書類全体(全文)から特徴ベクトルを取得しても良いし、特許書類の一部分から特徴ベクトルを取得しても良い。特許書類の一部分とは、例えば、要約書のみ、特許請求の範囲のみ、要約書と特許請求の範囲、明細書のみ、または明細書の実施の形態のみ等である。   Further, the feature vector acquisition means 21 may acquire a feature vector from the entire patent document (full text), or may acquire a feature vector from a part of the patent document. The part of the patent document is, for example, only an abstract, claims only, an abstract and claims, a description only, or an embodiment of the specification.

なお、特徴ベクトル取得手段21は、図示しない関連用語辞書を保持しており、かかる関連用語辞書に格納されている関連用語は同一の用語であると判断して、特徴ベクトルを取得しても良い。ここで、関連用語辞書は、例えば、2以上の同義語や類義語等を有する関連用語群を1以上保持している。なお、例えば、関連用語群は「データベース、データーベース、DB、リポジトリ、辞書」である。そして、特徴ベクトル取得手段21は、一の関連用語群に含まれる2以上の用語は同一の用語として処理を行う。   Note that the feature vector acquisition unit 21 holds a related term dictionary (not shown), and may determine that the related terms stored in the related term dictionary are the same term and acquire the feature vector. . Here, the related term dictionary holds, for example, one or more related term groups having two or more synonyms and synonyms. For example, the related term group is “database, database, DB, repository, dictionary”. Then, the feature vector acquisition unit 21 processes two or more terms included in one related term group as the same term.

判断手段22は、1または2以上の関連特許特徴ベクトルと1または2以上の非関連特許特徴ベクトルとを用いて、関連特許のクラスに属するべき非関連特許特徴ベクトルに対応する非関連特許書類を決定する。また、判断手段22は、判断対象の非関連特許特徴ベクトルと、1以上の関連特許特徴ベクトルとを用いて関連特許のクラスに属するべき非関連特許特徴ベクトルに対応する非関連特許書類を決定しても良い。また、判断手段22は、判断対象の非関連特許特徴ベクトルと、1以上の非関連特許特徴ベクトルとを用いて非関連特許のクラスに属するべきでない非関連特許特徴ベクトルに対応する非関連特許書類を、関連特許のクラスに属するべき非関連特許特徴ベクトルの非関連特許書類として決定しても良い。また、判断手段22は、1または2以上の関連特許特徴ベクトルと1または2以上の非関連特許特徴ベクトルとを用いて、非関連特許のクラスに属するべき関連特許特徴ベクトルに対応する関連特許書類を決定しても良い。判断手段22は、1または2以上の関連特許特徴ベクトルと1または2以上の非関連特許特徴ベクトルとを用いて、非関連特許のクラスに属するべき関連特許特徴ベクトルに対応する関連特許書類を決定しても良い。また、判断手段22は、判断対象の関連特許特徴ベクトルと、1以上の非関連特許特徴ベクトルとを用いて非関連特許のクラスに属するべき関連特許特徴ベクトルに対応する関連特許書類を決定しても良い。また、判断手段22は、判断対象の関連特許特徴ベクトルと、1以上の関連特許特徴ベクトルとを用いて関連特許のクラスに属するべきでない関連特許特徴ベクトルに対応する関連特許書類を、非関連特許のクラスに属するべき関連特許特徴ベクトルの関連特許書類として決定しても良い。   The judging means 22 uses one or more related patent feature vectors and one or more unrelated patent feature vectors to obtain unrelated patent documents corresponding to unrelated patent feature vectors that should belong to the class of related patents. decide. Further, the determination means 22 determines an unrelated patent document corresponding to an unrelated patent feature vector that should belong to a related patent class using the unrelated patent feature vector to be determined and one or more related patent feature vectors. May be. In addition, the determination means 22 uses the unrelated patent feature vector to be determined and one or more unrelated patent feature vectors to correspond to an unrelated patent feature vector that should not belong to the class of unrelated patents. May be determined as an unrelated patent document of an unrelated patent feature vector that should belong to the class of related patents. In addition, the determination unit 22 uses one or more related patent feature vectors and one or more unrelated patent feature vectors, and related patent documents corresponding to related patent feature vectors that should belong to the class of unrelated patents. May be determined. The determination means 22 determines related patent documents corresponding to related patent feature vectors that should belong to a class of unrelated patents using one or more related patent feature vectors and one or more unrelated patent feature vectors. You may do it. The determination means 22 determines a related patent document corresponding to a related patent feature vector that should belong to a class of unrelated patents using the related patent feature vector to be determined and one or more unrelated patent feature vectors. Also good. In addition, the determination unit 22 uses the related patent feature vector to be determined and one or more related patent feature vectors as a related patent document corresponding to a related patent feature vector that should not belong to the related patent class. It may be determined as the related patent document of the related patent feature vector that should belong to the class.

クラスとは、1または2以上の特徴ベクトルが算出されたものの集合である。クラスには、異なる種類の特徴ベクトルを含まない。異なる種類の特徴ベクトルを含まないとは、例えば、関連特許のクラスには、関連特許特徴ベクトルではない特徴ベクトルを含まないということである。なお、判断手段22は、関連特許のクラスの補集合を非関連特許の集合と判断しても良く、非関連特許のクラスの補集合を関連特許の集合と判断しても良く、関連特許のクラスと非関連特許のクラスとの和集合の補集合を、関連特許でも非関連特許でもない特許書類と考えても良い。また、関連特許、および非関連特許は、それぞれ2以上のクラスを含んでいても良い。また、クラスは、公知のクラスタリング手法を用いて分類された集合であっても良く、後述する機械学習を用いて、学習器が分類した結果である集合であっても良い。クラスタリング手法とは、例えば、分割最適化クラスタリング(k−means法等)を用いて特徴ベクトルをクラスタリングしても良く、階層的クラスタリング(最短距離法等)を用いて特徴ベクトルをクラスタリングしても良く、その他の公知なクラスタリング手法を用いて特徴ベクトルをクラスタリングしても良い。なお、各クラスタリング手法の詳細は公知技術であるため、説明を省略する。   A class is a set of one or more feature vectors calculated. Classes do not contain different types of feature vectors. The phrase “not including different types of feature vectors” means, for example, that a related patent class does not include a feature vector that is not a related patent feature vector. The determination means 22 may determine a complementary set of related patent classes as a set of unrelated patents, or may determine a complementary set of unrelated patent classes as a set of related patents. A complement of the union of a class and a class of unrelated patents may be considered as a patent document that is neither a related patent nor a non-related patent. Further, the related patent and the non-related patent may each include two or more classes. Further, the class may be a set classified using a known clustering method, or may be a set resulting from classification by a learning device using machine learning described later. The clustering method may be, for example, clustering of feature vectors using division optimization clustering (such as k-means method), or clustering of feature vectors using hierarchical clustering (such as shortest distance method). The feature vectors may be clustered using other known clustering methods. The details of each clustering method are publicly known techniques, and thus description thereof is omitted.

判断手段22が、特徴ベクトルを用いて、上記の判断する方法は問わない。例えば、判断手段22は、ベクトルの類似度を用いて判断しても良く、機械学習を用いて判断しても良い。以下、判断手段22が特徴ベクトルを用いて(1)1以上の非関連特許書類から、関連特許書類を決定する方法について、(A)特徴ベクトルの類似度を用いた判断、(B)機械学習を用いた判断に分けて説明する。また、(2)1以上の関連特許書類から、非関連特許書類を決定する方法についても、(1)と同様に2つに分けて説明する。   The determination means 22 does not matter how to make the above determination using the feature vector. For example, the determination unit 22 may determine using vector similarity or may use machine learning. Hereinafter, the determination means 22 uses a feature vector to (1) determine a related patent document from one or more unrelated patent documents, (A) determination using the similarity of the feature vector, (B) machine learning The explanation will be divided into judgments using. Also, (2) a method for determining an unrelated patent document from one or more related patent documents will be described in two as in (1).

(1)1以上の非関連特許書類から、関連特許書類を決定する方法
(A)特徴ベクトルの類似度を用いた判断
判断手段22は、関連特許特徴ベクトル、および非関連特許特徴ベクトルを各々1以上のクラスに分類する。さらに、判断手段22は、分類した各クラスの代表ベクトルを取得する。そして、各クラスの代表ベクトルと判断対象の非関連特許特徴ベクトルとの類似度を用いて判断対象の非関連特許特徴ベクトルがどのクラスに属するか判断する。クラスの代表ベクトルとは、クラス内の最も頻出する特徴ベクトルであっても良く、クラスの平均ベクトルであっても良く、クラスから無作為に選出した1のベクトルであっても良い。なお、平均ベクトルは、通常のベクトル平均であっても良く、すべてを単位ベクトルとして扱って算出する単位ベクトル平均であっても良い。また、クラスの代表ベクトルは、その取得の過程に判断対象の特徴ベクトルが含まれていても良く、含まれていなくても良い。特徴ベクトルの類似度を用いる方法を用いた場合は、例えば、判断手段22は、判断対象の非関連特許特徴ベクトルと、関連特許特徴ベクトルの全てのクラスの代表ベクトルとの類似度を算出し、類似度が閾値以上であれば関連特許のクラスに含まれると判断しても良い。なお、この方法の場合は、非関連特許特徴ベクトルをクラスに分類しなくても良い。また、判断手段22は、判断対象の非関連特許特徴ベクトルに対して、関連特許特徴ベクトルの全てのクラス、および非関連特許特徴ベクトルの全てのクラスの代表ベクトルとのベクトルの類似度を全て算出し、ベクトルの類似度が最も大きい値であったクラスに属すると判断しても良い。また、判断手段22は、判断対象の非関連特許特徴ベクトルと、非関連特許特徴ベクトルの全てのクラスの代表ベクトルとの類似度を算出し、類似度が閾値以下であれば関連特許のクラスに含まれると判断しても良い。なお、この方法の場合は、関連特許特徴ベクトルをクラスに分類しなくても良い。ベクトルの類似度の算出方法は、例えば、COS尺度(コサイン尺度)を用いて算出する方法でも良く、ピアソンの相関係数を用いて算出する方法でも良く、偏差パターン類似度を用いて算出する方法でも良い。COS尺度、ピアソンの相関係数、および偏差パターン類似度の算出方法は、公知技術であるため説明を省略する。クラスに属するかどうかを判断する閾値は、予め決められた値であっても良く、算出され得る類似度が取り得る最大値より小さい数値(例えば、COS尺度の場合0.9や0.8等)等であっても良く、算出され得る類似度が取り得る最小値より大きい数(例えば、COS尺度の場合−0.9や−0.8等)であっても良い。
(1) Method for Determining Related Patent Documents from One or More Unrelated Patent Documents (A) Judgment Using Feature Vector Similarity Judgment means 22 determines related patent feature vectors and unrelated patent feature vectors as 1 Classify into the above classes. Furthermore, the determination means 22 acquires the representative vector of each classified class. Then, using the similarity between the representative vector of each class and the unrelated patent feature vector to be judged, it is judged to which class the unrelated patent feature vector to be judged belongs. The class representative vector may be a feature vector that appears most frequently in the class, may be an average vector of the class, or may be one vector randomly selected from the class. The average vector may be a normal vector average, or a unit vector average calculated by treating all as unit vectors. The class representative vector may or may not include the feature vector to be determined in the process of acquisition. When the method using the similarity of feature vectors is used, for example, the determination unit 22 calculates the similarity between unrelated patent feature vectors to be determined and representative vectors of all classes of the related patent feature vectors, If the degree of similarity is greater than or equal to the threshold value, it may be determined that it is included in the related patent class. In this method, unrelated patent feature vectors need not be classified into classes. In addition, the determination unit 22 calculates all vector similarities of all classes of related patent feature vectors and representative vectors of all classes of unrelated patent feature vectors with respect to the unrelated patent feature vectors to be determined. Alternatively, it may be determined that the vector belongs to the class having the highest value of similarity. Further, the judging means 22 calculates the similarity between the unrelated patent feature vector to be judged and the representative vectors of all classes of the unrelated patent feature vector. You may judge that it is included. In this method, the related patent feature vectors need not be classified into classes. The vector similarity calculation method may be, for example, a method using a COS scale (cosine scale), a method using a Pearson correlation coefficient, or a method using a deviation pattern similarity. But it ’s okay. Since the COS scale, the Pearson correlation coefficient, and the method of calculating the deviation pattern similarity are well-known techniques, their descriptions are omitted. The threshold value for determining whether or not it belongs to a class may be a predetermined value, and a numerical value smaller than the maximum value that can be calculated (for example, 0.9 or 0.8 in the case of the COS scale) Or a number larger than the minimum value that can be calculated (for example, -0.9 or -0.8 in the case of the COS scale).

(B)機械学習を用いた判断
判断手段22は、関連特許特徴ベクトル、および非関連特許特徴ベクトルを各々1以上のクラスに分類する。判断手段22は、分類したクラスとクラスに含まれる特徴ベクトルとを対応付けて学習器に学習させる。そして、学習が完了した学習器に対して、判断対象の非関連特許特徴ベクトルがどのクラスに属するか判断させる。学習させる手法の種類は問わない。学習させる手法は、例えば、ニューラルネットワークであっても良く、SVM(Support Vector Machine)であっても良く、SVR(Support Vector Regression)であっても良く、その他の公知な学習手法であっても良い。ニューラルネットワークとは、脳機能におけるいくつかの特性を計算機上のシミュレーションによって表現することを目指した学習モデルである。ニューラルネットワークには、様々な種類のモデルや方法が提案されているが、そのどれを採用しても良い。例えば、ニューラルネットワークの種類は、パーセプトロンを採用しても良く、バックプロパケーションを採用しても良く、ボルツマンマシン等を採用しても良い。ニューラルネットワークに関する各モデルの詳細は、公知技術であるため説明を省略する。SVMとは、教師データを用いて分類パターンを学習し、分類の境界線を設定し、分類を行う学習モデルである。SVMの詳細は、公知技術であるため説明を省略する。SVRとは、教師データを用いて分類パターンを学習し、3以上のクラスに分類する学習モデルである。SVRの詳細は、公知技術であるため説明を省略する。学習器に学習させる素性は、特徴ベクトル取得手段21が取得した各用語に対応した値である。また、判断手段22が学習に使用する素性には、特許分類が含まれていても良い。特許分類を素性に含める場合は、特許分類に対して、特許分類を一意に特定する数値を設定し、その値を用いて学習させる。なお、学習に使用する教師データには、判断対象となる特徴ベクトルが含まれていても良く、含まれていなくても良い。
(B) Determination Using Machine Learning The determination unit 22 classifies related patent feature vectors and unrelated patent feature vectors into one or more classes. The determination unit 22 causes the learning device to learn by associating the classified class and the feature vector included in the class. Then, the learning device that has completed learning is caused to determine which class the unrelated patent feature vector to be determined belongs to. There is no limitation on the type of learning method. The learning method may be, for example, a neural network, SVM (Support Vector Machine), SVR (Support Vector Regression), or any other known learning method. . A neural network is a learning model that aims to express some characteristics of brain function by computer simulation. Various types of models and methods have been proposed for neural networks, any of which may be employed. For example, as the type of neural network, a perceptron may be employed, back-property may be employed, or a Boltzmann machine may be employed. Details of each model relating to the neural network are well known in the art, and a description thereof will be omitted. SVM is a learning model that learns a classification pattern using teacher data, sets boundary lines for classification, and performs classification. Details of the SVM are well known in the art, and a description thereof will be omitted. SVR is a learning model that learns classification patterns using teacher data and classifies them into three or more classes. The details of SVR are well-known techniques, and thus the description thereof is omitted. The feature to be learned by the learning device is a value corresponding to each term acquired by the feature vector acquisition unit 21. The features used by the determination means 22 for learning may include patent classification. When the patent classification is included in the feature, a numerical value that uniquely identifies the patent classification is set for the patent classification, and learning is performed using the value. Note that the teacher data used for learning may or may not include a feature vector to be determined.

(2)1以上の関連特許書類から、非関連特許書類を決定する方法
(A)特徴ベクトルの類似度を用いた判断
判断手段22は、関連特許特徴ベクトル、および非関連特許特徴ベクトルを各々1以上のクラスに分類する。さらに、判断手段22は、分類した各クラスの代表ベクトルを取得する。そして、各クラスの代表ベクトルと判断対象の関連特許特徴ベクトルとの類似度を用いて判断対象の非関連特許特徴ベクトルがどのクラスに属するか判断する。クラスの代表ベクトル、ベクトルの類似度、および閾値については、(1)(A)と同様とする。特徴ベクトルの類似度を用いる方法を用いた場合は、例えば、判断手段22は、判断対象の関連特許特徴ベクトルと、関連特許特徴ベクトルの全てのクラスの代表ベクトルとの類似度を算出し、類似度が閾値以下であれば非関連特許のクラスに含まれると判断しても良い。なお、この場合は、非関連特許特徴ベクトルをクラスに分類しなくても良い。また、例えば、判断手段22は、判断対象の関連特許特徴ベクトルに対して、関連特許特徴ベクトルの全てのクラス、および非関連特許特徴ベクトルの全てのクラスの代表ベクトルとのベクトルの類似度を全て算出し、ベクトルの類似度が最も大きい値であったクラスに属すると判断しても良い。また、例えば、判断手段22は、判断対象の関連特許特徴ベクトルと、非関連特許特徴ベクトルの全てのクラスの代表ベクトルとの類似度を算出し、類似度が閾値以上であれば非関連特許のクラスに含まれると判断しても良い。なお、この方法の場合は、関連特許特徴ベクトルをクラスに分類しなくても良い。
(2) Method of determining unrelated patent document from one or more related patent documents (A) Judgment using feature vector similarity The judging means 22 determines the related patent feature vector and the unrelated patent feature vector as 1 each. Classify into the above classes. Furthermore, the determination means 22 acquires the representative vector of each classified class. Then, using the similarity between the representative vector of each class and the related patent feature vector to be determined, it is determined to which class the unrelated patent feature vector to be determined belongs. The class representative vector, vector similarity, and threshold value are the same as in (1) and (A). When the method using the similarity of feature vectors is used, for example, the determination unit 22 calculates the similarity between the related patent feature vector to be determined and the representative vectors of all classes of the related patent feature vector, and the similarity If the degree is less than or equal to the threshold value, it may be determined that it is included in the class of unrelated patents. In this case, unrelated patent feature vectors need not be classified into classes. In addition, for example, the determination unit 22 determines all the vector similarities with the representative vectors of all classes of related patent feature vectors and all classes of unrelated patent feature vectors with respect to the related patent feature vectors to be determined. It may be calculated and determined to belong to the class having the highest vector similarity. Further, for example, the determination unit 22 calculates the similarity between the related patent feature vector to be determined and the representative vectors of all classes of the unrelated patent feature vector. It may be determined that it is included in the class. In this method, the related patent feature vectors need not be classified into classes.

(B)機械学習を用いた判断
判断手段22は、関連特許特徴ベクトル、および非関連特許特徴ベクトルを各々1以上のクラスに分類する。判断手段22は、分類したクラスとクラスに含まれる特徴ベクトルとを対応付けて学習器に学習させる。そして、学習が完了した学習器に対して、判断対象の関連特許特徴ベクトルがどのクラスに属するか判断させる。学習させる手法の種類、および学習器に学習させる素性については、(1)(B)と同様とする。
(B) Determination Using Machine Learning The determination unit 22 classifies related patent feature vectors and unrelated patent feature vectors into one or more classes. The determination unit 22 causes the learning device to learn by associating the classified class and the feature vector included in the class. Then, the learning device that has completed learning is caused to determine which class the related patent feature vector to be determined belongs to. The types of techniques to be learned and the features to be learned by the learning device are the same as (1) and (B).

選別評価結果取得手段23は、判断手段22が決定した1以上の関連特許書類を選別ルールに適用し、第二の評価結果を取得する。また、選別評価結果取得手段23は、判断手段22が決定した1以上の非関連特許書類を選別ルールに適用し、第二の評価結果を取得しても良い。選別ルールに適用するとは、判断手段22が判断した関連特許に含まれるべき非関連特許書類と、非関連特許書類に含まれるべき関連特許書類が、選別ルールを満たすかどうかを判断することである。第二の評価結果は、選別ルールに合致した件数であっても良く、選別ルールごとに減点する方法を定めて、それを利用して算出した点数であっても良い。選別ルールごとに減点する方法を定める場合には、例えば、第二の評価結果は、選別ルール格納部106に、選別ルールと対応付けて格納されている減点情報を用いて算出しても良い。減点情報の概念は、検索式ルール格納部105に格納されている減点情報と同一の概念であるため、検索式ルールにおける減点情報の説明ついて、検索式ルールを選別ルールと読み替えるものとする。また、減点情報は、選別ルール格納部106以外に定義しても良い。例えば、選別評価結果取得手段23は、選別ルールに合致した件数に応じてさらに減点するルールを規定しても良い。なお、第二の評価結果は、通常、数値であるが、選別ルールに対応付けられた判断結果メッセージであっても良く、数値と判断結果メッセージとの組合せであっても良い。判断結果メッセージを取得する場合で、かつ選別ルール格納部106の判断結果メッセージに変数、または処理が含まれていた場合には、判断手段22が不適切であると判断した理由がわかるように取得しても良い。具体的には、選別評価結果取得手段23は、5件の関連特許書類が、誤って非関連特許書類に選別されていた場合には、非関連特許書類の中の関連特許書類に関する選別ルールの判断結果メッセージ「{[RelatedToNonRelatedCount]}件の関連特許書類が非関連特許書類として判断されていました。」が対応付けられていれば、「5件の関連特許書類が非関連特許書類として判断されていました。」等として取得しても良い。この具体例では、{[RelatedToNonRelatedCount]}の部分に非関連特許書類の中の関連特許書類の件数を代入するものとした。選別情報評価部108は、通常、MPUやメモリ等から実現され得る。選別情報評価部108の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The screening evaluation result acquisition unit 23 applies one or more related patent documents determined by the determination unit 22 to the screening rule, and acquires a second evaluation result. Further, the screening evaluation result acquisition unit 23 may apply one or more unrelated patent documents determined by the determination unit 22 to the screening rule to acquire the second evaluation result. The application to the selection rule is to determine whether or not the unrelated patent document to be included in the related patent determined by the determination unit 22 and the related patent document to be included in the unrelated patent document satisfy the selection rule. . The second evaluation result may be the number of cases that match the sorting rule, or may be a score calculated using a method for deducting points for each sorting rule. When determining a method for deducting points for each selection rule, for example, the second evaluation result may be calculated using deduction information stored in the selection rule storage unit 106 in association with the selection rule. Since the concept of deduction information is the same concept as the deduction information stored in the search formula rule storage unit 105, the description of the deduction information in the search formula rule will be replaced with the selection rule. Further, the deduction information may be defined other than the selection rule storage unit 106. For example, the sorting evaluation result acquisition unit 23 may define a rule for further deduction according to the number of cases that match the sorting rule. The second evaluation result is usually a numerical value, but may be a determination result message associated with the selection rule, or a combination of a numerical value and a determination result message. When the determination result message is acquired and the determination result message in the selection rule storage unit 106 includes a variable or a process, the determination means 22 is acquired so that the reason for determining that the determination means 22 is inappropriate is understood. You may do it. Specifically, the screening evaluation result acquisition means 23, when five related patent documents are erroneously selected as unrelated patent documents, the screening rule regarding the related patent documents in the unrelated patent documents. If the determination result message “{[RelatedToNonRelatedCount]} related patent documents were determined as unrelated patent documents.” Is associated, “5 related patent documents are determined as unrelated patent documents. It may be acquired as "." In this specific example, the number of related patent documents in the unrelated patent documents is substituted for {[RelatedToNonRelatedCount]}. The selection information evaluation unit 108 can be usually realized by an MPU, a memory, or the like. The processing procedure of the sorting information evaluation unit 108 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

評価構成部109は、第一の評価結果、および第二の評価結果を用いて、特許調査結果情報の評価を構成する。各評価結果を用いる方法は問わない。例えば、評価結果が点数の場合には、評価構成部109は、第一の評価結果の点数と第二の評価結果の点数との合計値を算出しても良く、平均値を算出しても良く、第一の評価結果の減点数と第二の評価結果の減点数との合計を予め持っている数値(例えば100点など)に加算して算出しても良い。つまり、評価構成部109は、第一の評価結果の点数と第二の評価結果の点数とが負の数であるならば、それらをパラメータとする減少関数により、評価を算出しても良く、第一の評価結果の点数と第二の評価結果の点数とが正の数であるならば、それらをパラメータとする増加関数により、評価を算出しても良い。また、特許調査結果情報の評価は、1つの点数であるが、第一の評価結果と第二の評価結果とを、単に含む情報であっても良く、第一の評価結果の点数と第二の評価結果の点数の合計と第一の評価結果と第二の評価結果とを含む情報であっても良く、上記情報に検索式評価部107、および選別評価結果取得手段23で合致した各ルールの判断結果メッセージを追加した情報出会っても良く、検索式評価部107、および選別評価結果取得手段23で合致した各ルールの判断結果メッセージのみであっても良い。評価構成部109は、通常、MPUやメモリ等から実現され得る。評価構成部109の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。   The evaluation configuration unit 109 configures the evaluation of the patent search result information using the first evaluation result and the second evaluation result. The method using each evaluation result does not matter. For example, when the evaluation result is a score, the evaluation configuration unit 109 may calculate the total value of the score of the first evaluation result and the score of the second evaluation result, or may calculate the average value. It is also possible to calculate by adding the total of the deduction points of the first evaluation result and the deduction points of the second evaluation result to a numerical value (for example, 100 points, etc.) having in advance. That is, if the score of the first evaluation result and the score of the second evaluation result are negative numbers, the evaluation configuration unit 109 may calculate the evaluation using a decreasing function using them as parameters, If the score of the first evaluation result and the score of the second evaluation result are positive numbers, the evaluation may be calculated by an increasing function using these as parameters. Further, although the evaluation of the patent search result information is one score, it may be information that simply includes the first evaluation result and the second evaluation result. May be information including the total score of the evaluation results, the first evaluation result, and the second evaluation result, and each rule that matches the above information in the search expression evaluation unit 107 and the selection evaluation result acquisition means 23 The determination result message may be added, or only the determination result message of each rule matched by the search expression evaluation unit 107 and the selection evaluation result acquisition unit 23 may be used. The evaluation configuration unit 109 can be usually realized by an MPU, a memory, or the like. The processing procedure of the evaluation configuration unit 109 is usually realized by software, and the software is recorded in a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).

評価出力部110は、特許調査結果情報の評価を出力する。ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への格納、他の処理装置や他のプログラム等への処理結果の引渡し等を含む概念である。また、評価出力部110は、通常、ネットワーク100を通じてユーザ端末2へ判断結果を送信する。評価出力部110は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。これにより、入力された特許調査結果情報の評価を提示することができ、必要であれば、再調査を行って特許調査の精度を上げることができる。   The evaluation output unit 110 outputs an evaluation of patent search result information. Here, output means display on a display, projection using a projector, printing with a printer, sound output, transmission to an external device, storage on a recording medium, other processing device or other program, etc. It is a concept including delivery of processing results. Further, the evaluation output unit 110 normally transmits the determination result to the user terminal 2 through the network 100. The evaluation output unit 110 may be realized by output device driver software, or output device driver software and an output device. Thereby, evaluation of the inputted patent search result information can be presented, and if necessary, re-search can be performed to improve the accuracy of the patent search.

図3は、本実施の形態における特許調査結果評価装置1の動作の一例を示すフローチャートである。以下、図3を用いて動作について説明する。   FIG. 3 is a flowchart showing an example of the operation of the patent search result evaluation apparatus 1 in the present embodiment. Hereinafter, the operation will be described with reference to FIG.

(ステップS201)受付部101は、ユーザ端末2から1以上の特許調査結果情報を受け付けたかどうかを判断する。そして、特許調査結果情報を受け付けた場合は、ステップS202へ進み、受け付けなかった場合は、ステップS201を繰り返し実行する。   (Step S <b> 201) The receiving unit 101 determines whether one or more patent search result information has been received from the user terminal 2. If patent search result information is received, the process proceeds to step S202. If not received, step S201 is repeatedly executed.

(ステップS202)受付部101は、受け付けた特許調査結果情報を特許調査結果情報格納部102に格納する。   (Step S <b> 202) The receiving unit 101 stores the received patent search result information in the patent search result information storage unit 102.

(ステップS203)受付部101は、受け付けた特許調査結果情報に含まれる関連特許書類を特定する情報を用いて、図示しない特許書類格納部から関連特許書類を取得し、関連特許書類格納部103に関連特許書類を格納する。   (Step S <b> 203) The receiving unit 101 acquires related patent documents from a patent document storage unit (not shown) using information for specifying related patent documents included in the received patent search result information, and stores the related patent documents in the related patent document storage unit 103. Stores related patent documents.

(ステップS204)受付部101は、受け付けた特許調査結果情報に含まれる非関連特許書類を特定する情報を用いて、図示しない特許書類格納部から非関連特許書類を取得し、非関連特許書類格納部104に非関連特許書類を格納する。   (Step S204) The accepting unit 101 acquires unrelated patent documents from a patent document storage unit (not shown) using information for specifying unrelated patent documents included in the received patent search result information, and stores the unrelated patent documents. An unrelated patent document is stored in the unit 104.

(ステップS205)検索式評価部107は、ステップS202で格納された特許調査結果情報に対して、検索式ルール格納部105に格納されているすべての検索式ルールを適用し、特許検索式を評価する。検索式評価部107の評価の詳細は、図4のフローチャートを用いて後述する。   (Step S205) The search formula evaluation unit 107 applies all the search formula rules stored in the search formula rule storage unit 105 to the patent search result information stored in step S202, and evaluates the patent search formula. To do. Details of the evaluation of the search expression evaluation unit 107 will be described later with reference to the flowchart of FIG.

(ステップS206)特徴ベクトル取得手段21は、関連特許書類格納部103に格納されている関連特許書類から関連特許特徴ベクトルを取得する。特徴ベクトル取得手段21の取得方法の詳細は、図5のフローチャートを用いて後述する。   (Step S206) The feature vector acquisition means 21 acquires a related patent feature vector from the related patent document stored in the related patent document storage unit 103. Details of the acquisition method of the feature vector acquisition means 21 will be described later using the flowchart of FIG.

(ステップS207)特徴ベクトル取得手段21は、非関連特許書類格納部104に格納されている非関連特許書類から非関連特許特徴ベクトルを取得する。特徴ベクトル取得手段21の取得方法の詳細は、図5のフローチャートを用いて後述する。   (Step S207) The feature vector acquisition means 21 acquires an unrelated patent feature vector from the unrelated patent documents stored in the unrelated patent document storage unit 104. Details of the acquisition method of the feature vector acquisition means 21 will be described later using the flowchart of FIG.

(ステップS208)判断手段22は、すべての関連特許特徴ベクトルから代表ベクトルを算出する。なお、ベクトルの次元が異なる場合は、最も次元の多い関連特許特徴ベクトルに次元を統一する。統一の際に増えた次元の要素には、0を代入する。なお、代表ベクトルは、平均ベクトルとしても良い。   (Step S208) The judging means 22 calculates a representative vector from all the related patent feature vectors. If the dimensions of the vectors are different, the dimensions are unified to the related patent feature vector having the largest number of dimensions. 0 is assigned to the dimension element that has been increased during unification. The representative vector may be an average vector.

(ステップS209)判断手段22は、すべての非関連特許特徴ベクトルから代表ベクトルを算出する。なお、ベクトルの次元が異なる場合は、最も次元の多い非関連特許特徴ベクトルに次元を統一する。統一の際に増えた次元の要素には、0を代入する。なお、代表ベクトルは、平均ベクトルとしても良い。   (Step S209) The determination means 22 calculates a representative vector from all unrelated patent feature vectors. If the dimensions of the vectors are different, the dimensions are unified to the unrelated patent feature vector having the largest number of dimensions. 0 is assigned to the dimension element that has been increased during unification. The representative vector may be an average vector.

(ステップS210)判断手段22は、非関連特許書類に選別されている特許書類が関連特許であるかを判断する。判断手段22の判断の詳細は図6のフローチャートを用いて後述する。   (Step S210) The determination means 22 determines whether the patent document selected as the unrelated patent document is a related patent. Details of the determination by the determination means 22 will be described later with reference to the flowchart of FIG.

(ステップS211)判断手段22は、関連特許書類に選別されている特許書類が非関連特許であるかを判断する。判断手段22の判断の詳細は図6のフローチャートを用いて後述する。   (Step S211) The determination means 22 determines whether the patent document selected as the related patent document is an unrelated patent. Details of the determination by the determination means 22 will be described later with reference to the flowchart of FIG.

(ステップS212)選別評価結果取得手段23は、ステップS210とS211で判断された関連特許書類、及び非関連特許書類が、選別ルールに合致するかを判断するかどうかを判断する。選別評価結果取得手段23の判断の詳細は図7のフローチャートを用いて後述する。   (Step S212) The screening evaluation result acquisition unit 23 determines whether or not the related patent document and the unrelated patent document determined in steps S210 and S211 match the screening rule. Details of the determination by the sorting evaluation result acquisition unit 23 will be described later with reference to the flowchart of FIG.

(ステップS213)選別評価結果取得手段23は、ステップS511で図示しない後述する選別判断結果格納部に格納されている選別ルールIDから減点情報を取得し、取得した減点情報を用いて第二の評価結果を算出する。   (Step S213) The screening evaluation result acquisition unit 23 acquires deduction information from a screening rule ID stored in a screening determination result storage unit (not shown) described later in Step S511, and uses the acquired deduction information to perform a second evaluation. Calculate the result.

(ステップS214)評価構成部109は、ステップS205で取得した第一の評価結果と、ステップS213で取得した第二の判断結果とを用いて特許調査結果情報の評価を構成する。   (Step S214) The evaluation configuration unit 109 configures the evaluation of the patent search result information using the first evaluation result acquired in step S205 and the second determination result acquired in step S213.

(ステップS215)評価出力部110は、ステップS214で構成した評価結果を出力し、終了する。   (Step S215) The evaluation output unit 110 outputs the evaluation result configured in step S214 and ends.

なお、図3のフローチャートのステップS207において、判断手段22は、すべての関連特許特徴ベクトルから代表ベクトルを取得した。しかし、判断手段22は、すべての関連特許特徴ベクトルの距離の差が一定以内(COS尺度が閾値以上)の2以上のクラスを構成し、クラスごとに、関連特許特徴ベクトルの代表ベクトルを算出しても良い。   In step S207 in the flowchart of FIG. 3, the determination unit 22 acquires a representative vector from all the related patent feature vectors. However, the determination means 22 constitutes two or more classes within which the difference in distance between all related patent feature vectors is within a certain range (COS scale is equal to or greater than a threshold), and calculates a representative vector of the related patent feature vectors for each class. May be.

また、ステップS208において、判断手段22は、すべての非関連特許特徴ベクトルから平均ベクトルを算出した。しかし、判断手段22は、すべての非関連特許特徴ベクトルの距離の差が一定以内(類似度が閾値以上等)の2以上のグループを構成し、グループごとに、非関連特許特徴ベクトルの平均ベクトルを算出しても良い。   In step S208, the determination unit 22 calculates an average vector from all unrelated patent feature vectors. However, the judging means 22 constitutes two or more groups within which the difference in distance between all unrelated patent feature vectors is within a certain range (similarity is greater than or equal to a threshold value, etc.). May be calculated.

図4は、図3の検索式ルールの判断(ステップS205)の動作の一例を示すフローチャートである。以下、図4を用いて、検索式ルールの判断処理について説明する。   FIG. 4 is a flowchart showing an example of the operation of the search formula rule determination (step S205) of FIG. Hereinafter, the search rule determination process will be described with reference to FIG.

(ステップS301)検索式評価部107は、カウンタmに1を代入する   (Step S301) The search expression evaluation unit 107 substitutes 1 for a counter m.

(ステップS302)検索式評価部107は、検索式ルール格納部105にm番目の検索式ルールが存在するかどうかを判断する。m番目の検索式ルールが存在する場合は、ステップS303に進み、存在しなかった場合は、ステップS307へ進む。   (Step S <b> 302) The search formula evaluation unit 107 determines whether or not the m th search formula rule exists in the search formula rule storage unit 105. When the m-th search formula rule exists, the process proceeds to step S303, and when it does not exist, the process proceeds to step S307.

(ステップS303)検索式評価部107は、ステップS202で受付部101が格納した特許調査結果情報に含まれる特許検索式と特許調査の目的とがm番目の検索式ルールに合致するかどうかを判断する。   (Step S303) The search formula evaluation unit 107 determines whether or not the patent search formula and the purpose of the patent search included in the patent search result information stored in the reception unit 101 in step S202 match the mth search formula rule. To do.

(ステップS304)検索式評価部107は、ステップS303でm番目の検索式ルールに合致していた場合は、ステップS305に進み、合致しなかった場合は、ステップS306へ進む。   (Step S304) The search expression evaluation unit 107 proceeds to step S305 if it matches the mth search expression rule in step S303, and proceeds to step S306 if it does not match.

(ステップS305)検索式評価部107は、合致した検索式ルールIDを図示しない検索式判断結果格納部に追記する。   (Step S305) The search formula evaluation unit 107 adds the matched search formula rule ID to a search formula determination result storage unit (not shown).

(ステップS306)検索式評価部107は、カウンタmを1だけインクリメントし、ステップS302に戻る。   (Step S306) The search expression evaluation unit 107 increments the counter m by 1, and returns to step S302.

(ステップS307)検索式評価部107は、図示しない検索式判断結果格納部に格納されている検索式ルールIDを用いて検索式ルール格納部105から減点情報を取得し、第一の評価結果を算出する。そして、上位の処理に戻る。   (Step S307) The search formula evaluation unit 107 acquires deduction information from the search formula rule storage unit 105 using the search formula rule ID stored in the search formula determination result storage unit (not shown), and uses the first evaluation result as the first evaluation result. calculate. Then, the process returns to the upper process.

図5は、図3の特徴ベクトルの算出(ステップS206、S207)の動作の一例を示すフローチャートである。以下、図5を用いて、特徴ベクトルの算出処理について説明する。なお、図5におけるXには、ステップS206から呼び出された場合は、関連特許書類が代入され、ステップS207から呼び出された場合は、非関連特許書類が代入される。以下は、Xに関連特許書類が代入されたステップ206から呼び出されたものとして説明する。なお、ステップ207の場合については、関連特許書類格納部103を非関連特許書類格納部104と読み替えるものとする。   FIG. 5 is a flowchart showing an example of the operation of the feature vector calculation (steps S206 and S207) in FIG. Hereinafter, the feature vector calculation processing will be described with reference to FIG. In FIG. 5, X is assigned a related patent document when called from step S206, and is called a non-related patent document when called from step S207. The following description will be made assuming that the process is called from step 206 in which the related patent document is assigned to X. In the case of step 207, the related patent document storage unit 103 is replaced with the non-related patent document storage unit 104.

(ステップS401)特徴ベクトル取得手段21は、カウンタpに1を代入する。   (Step S401) The feature vector acquisition means 21 substitutes 1 for the counter p.

(ステップS402)特徴ベクトル取得手段21は、p番目の関連特許書類が関連特許書類格納部103に格納されているかどうか判断する。p番目の関連特許書類が関連特許書類格納部103に格納されている場合は、ステップS403に進み、格納されていない場合は、上位の処理に戻る。   (Step S <b> 402) The feature vector acquisition unit 21 determines whether the p-th related patent document is stored in the related patent document storage unit 103. If the p-th related patent document is stored in the related patent document storage unit 103, the process proceeds to step S403. If not stored, the process returns to the upper level process.

(ステップS403)特徴ベクトル取得手段21は、p番目の関連特許書類から用語をすべて取得する。   (Step S403) The feature vector acquisition means 21 acquires all terms from the p-th related patent document.

(ステップS404)特徴ベクトル取得手段21は、ステップS403で取得した用語を図示しない用語格納部に重複しないように追記する。なお、図示しない用語格納部には、特許調査結果評価装置1の処理が終了するまで用語を追記され続ける。   (Step S404) The feature vector acquisition unit 21 adds the term acquired in step S403 so as not to overlap with a term storage unit (not shown). In addition, a term is continuously added to a term storage unit (not shown) until the process of the patent search result evaluation apparatus 1 is completed.

(ステップS405)特徴ベクトル取得手段21は、ステップS403で取得した用語のTF−IDF値を算出する。なお、特徴ベクトル取得手段21は、図示しない関連用語辞書を保持しており、かかる関連用語辞書に格納されている関連用語は同一の用語であると判断して、用語のTF−IDF値を算出しても良い。   (Step S405) The feature vector acquisition unit 21 calculates the TF-IDF value of the term acquired in step S403. Note that the feature vector acquisition means 21 holds a related term dictionary (not shown), determines that the related terms stored in the related term dictionary are the same term, and calculates the TF-IDF value of the term. You may do it.

(ステップS406)特徴ベクトル取得手段21は、図示しない用語格納部に格納されている用語が格納されている順に用語のTF−IDF値を要素に持ったベクトルを作成する。なお、p番目の関連特許書類に記載されていない用語の要素は0とする。   (Step S406) The feature vector acquisition unit 21 creates a vector having TF-IDF values of terms as elements in the order in which the terms stored in a term storage unit (not shown) are stored. In addition, the element of the term which is not described in the p-th related patent document is set to 0.

(ステップS407)特徴ベクトル取得手段21は、ステップS406で作成した特徴ベクトルを特許書類の種類と対応付けて図示しない特徴ベクトル格納部に格納する。特許書類の種類とは、関連特許であるか、非関連特許であるかを示す情報である。   (Step S407) The feature vector acquisition unit 21 stores the feature vector created in step S406 in a feature vector storage unit (not shown) in association with the type of patent document. The type of patent document is information indicating whether it is a related patent or an unrelated patent.

(ステップS408)特徴ベクトル取得手段21は、カウンタpを1だけインクリメントし、ステップS402に戻る。   (Step S408) The feature vector acquisition means 21 increments the counter p by 1 and returns to step S402.

図6は、図3の評価(ステップS210、S211)の動作の一例を示すフローチャートである。以下、図6を用いて、選別情報を判断する処理について説明する。なお、Yには、ステップS210から呼び出された場合は、非関連特許書類が代入され、ステップS211から呼び出された場合は、関連特許書類が代入されているものとする。以下は、Yに非関連特許書類が代入されたステップS210から呼び出されたものとして説明する。ステップS211については、非関連特許書類格納部104を関連特許書類格納部103、および関連特許の可能性を非関連特許の可能性と読み替えるものとする。   FIG. 6 is a flowchart showing an example of the operation of the evaluation (steps S210 and S211) in FIG. Hereinafter, the process of determining the selection information will be described with reference to FIG. It is assumed that an unrelated patent document is substituted for Y when called from step S210, and a related patent document is substituted when called from step S211. The following description will be made assuming that it is called from step S210 in which an unrelated patent document is substituted for Y. In step S211, the unrelated patent document storage unit 104 is replaced with the related patent document storage unit 103, and the possibility of the related patent is read as the possibility of the unrelated patent.

(ステップS501)判断手段22は、カウンタpに1を代入する。   (Step S501) The judging means 22 substitutes 1 for the counter p.

(ステップS502)判断手段22は、n番目の非関連特許書類が非関連特許書類格納部104に格納されているかどうか判断する。n番目の非関連特許書類が非関連特許書類格納部104に格納されている場合は、ステップS503に進み、格納されていない場合は、上位の処理に戻る。   (Step S <b> 502) The determination unit 22 determines whether the nth unrelated patent document is stored in the unrelated patent document storage unit 104. If the n-th unrelated patent document is stored in the unrelated patent document storage unit 104, the process proceeds to step S503, and if not, the process returns to a higher level process.

(ステップS503)判断手段22は、関連特許のクラスの代表ベクトルとn番目の非関連特許書類の特徴ベクトルとの類似度を算出する。なお、ベクトルの次元が異なる場合は、次元の多いベクトルに次元を統一する。統一の際に増えた次元の要素には、0を代入する。   (Step S503) The judging means 22 calculates the similarity between the representative vector of the related patent class and the feature vector of the nth unrelated patent document. When the dimensions of the vectors are different, the dimensions are unified into a vector with many dimensions. 0 is assigned to the dimension element that has been increased during unification.

(ステップS504)判断手段22は、非関連特許のクラスの平均ベクトルとm番目の非関連特許書類の特徴ベクトルとの類似度を算出する。なお、ベクトルの次元が異なる場合は、次元の多いベクトルに次元を統一する。統一の際に増えた次元の要素には、0を代入する。   (Step S504) The judging means 22 calculates the similarity between the average vector of the unrelated patent class and the feature vector of the mth unrelated patent document. When the dimensions of the vectors are different, the dimensions are unified into a vector with many dimensions. 0 is assigned to the dimension element that has been increased during unification.

(ステップS505)判断手段22は、類似度が大きい平均ベクトルが、非関連特許書類のクラスの代表ベクトルであるかどうか判断する。非関連特許書類のクラスの代表ベクトルであった場合は、ステップS513へ進み、非関連特許書類のクラスの代表ベクトルでなかった場合は、ステップS506へ進む。   (Step S505) The judging means 22 judges whether or not the average vector having a high degree of similarity is a representative vector of a class of unrelated patent documents. If it is the representative vector of the class of the unrelated patent document, the process proceeds to step S513. If it is not the representative vector of the class of the unrelated patent document, the process proceeds to step S506.

(ステップS506)判断手段22は、図示しない選別判断結果格納部にn番目の非関連特許書類は、関連特許の可能性があることと特許書類IDとを対応付けて格納する。   (Step S506) The determining means 22 stores the possibility that the nth unrelated patent document is a related patent and the patent document ID in association with each other in a screening determination result storage unit (not shown).

(ステップS507)判断手段22は、カウンタnを1だけインクリメントし、ステップS502に戻る。   (Step S507) The determination means 22 increments the counter n by 1 and returns to Step S502.

なお、判断手段22が、すべての関連特許特徴ベクトルの距離の差が一定以内の2以上のクラスを構成し、クラスごとに、関連特許特徴ベクトルの代表ベクトルを算出している場合に、図6のフローチャートにおいて、非関連特許の特許特徴ベクトルと、いずれかのクラスの関連特許特徴ベクトルの平均ベクトルとの類似度が閾値より大きければ、判断手段22は、かかる非関連特許を関連特許と判断しても良い。また、かかる場合に、図6のフローチャートにおいて、非関連特許の特許特徴ベクトルと、最も類似度が大きい代表ベクトルが、いずれかのクラスの関連特許特徴ベクトルの代表ベクトルである場合に、判断手段22は、かかる非関連特許を関連特許と判断しても良い。   It should be noted that when the determination unit 22 forms two or more classes within which the difference in distance between all related patent feature vectors is within a certain range and calculates a representative vector of the related patent feature vectors for each class, FIG. If the similarity between the patent feature vector of the unrelated patent and the average vector of the related patent feature vectors of any class is greater than the threshold in the flowchart of FIG. 6, the determination means 22 determines that the unrelated patent is a related patent. May be. Further, in such a case, in the flowchart of FIG. 6, when the representative feature vector having the highest degree of similarity with the patent feature vector of the unrelated patent is the representative vector of the related patent feature vector of any class, the judging means 22 May determine such a non-related patent as a related patent.

また、判断手段22が、すべての関連特許特徴ベクトルの距離の差が一定以内の2以上のクラスを構成し、クラスごとに、関連特許特徴ベクトルの代表ベクトルを算出している場合に、図6のフローチャートにおいて、関連特許の特許特徴ベクトルと、すべてのクラスの関連特許特徴ベクトルの代表ベクトルとの類似度が閾値より小さければ、判断手段22は、かかる関連特許を非関連特許と判断しても良い。さらに、図6のフローチャートにおいて、非関連特許の特許特徴ベクトルを用いなくても良い。   Further, when the determination unit 22 forms two or more classes within which the difference in distance between all related patent feature vectors is within a certain range, and calculates a representative vector of the related patent feature vectors for each class, FIG. If the similarity between the patent feature vector of the related patent and the representative vectors of the related patent feature vectors of all the classes is smaller than the threshold in the flowchart of FIG. good. Furthermore, in the flowchart of FIG. 6, it is not necessary to use the patent feature vector of the unrelated patent.

図7は、図3の評価(ステップS212)の動作の一例を示すフローチャートである。以下、図7を用いて、選別ルールに合致するかどうかを判断する処理について説明する。   FIG. 7 is a flowchart showing an example of the operation of the evaluation (step S212) in FIG. Hereinafter, a process for determining whether or not the selection rule is met will be described with reference to FIG.

(ステップS601)選別評価結果取得手段23は、カウンタqに1を代入する。   (Step S601) The sorting evaluation result acquisition unit 23 substitutes 1 for the counter q.

(ステップS602)選別評価結果取得手段23は、q番目の選別ルールが選別ルール格納部106に格納されているかどうか判断する。q番目の選別ルールが選別ルール格納部106に格納されている場合は、ステップS603に進み、格納されていない場合は、上位の処理に戻る。   (Step S <b> 602) The sorting evaluation result acquisition unit 23 determines whether or not the q th sorting rule is stored in the sorting rule storage unit 106. If the qth selection rule is stored in the selection rule storage unit 106, the process proceeds to step S603, and if it is not stored, the process returns to the upper level process.

(ステップS603)選別評価結果取得手段23は、n番目の非関連特許書類がq番目の選別ルールに合致するかどうかを判断する。   (Step S603) The sorting evaluation result acquisition unit 23 determines whether the nth unrelated patent document matches the qth sorting rule.

(ステップS604)選別評価結果取得手段23は、ステップS511でq番目の選別ルールに合致していた場合は、ステップS605に進み、合致していなかった場合は、ステップS606に進む   (Step S604) The sorting evaluation result acquisition unit 23 proceeds to step S605 if the q-th sorting rule is matched in step S511, and proceeds to step S606 if it does not match.

(ステップS605)選別評価結果取得手段23は、合致した選別ルールIDを選別判断結果格納部に追記する。   (Step S605) The sorting evaluation result acquisition unit 23 adds the matched sorting rule ID to the sorting judgment result storage unit.

(ステップS606)選別評価結果取得手段23は、カウンタqを1だけインクリメントし、ステップS508に戻る。   (Step S606) The sorting evaluation result acquisition unit 23 increments the counter q by 1, and returns to step S508.

以下、本実施の形態における特許調査結果評価装置1の具体的な動作について説明する。なお、この具体例において示した各図面の情報は、説明のために便宜上用意されたものであって、実際のデータを示すものではない。   Hereinafter, a specific operation of the patent search result evaluation apparatus 1 in the present embodiment will be described. In addition, the information of each drawing shown in this specific example is prepared for convenience of explanation, and does not indicate actual data.

本具体例において、特許調査結果情報は、図8のような特許調査報告書であるとする。図8の特許調査報告書には、調査目的、検索対象の特許書類の種類、検索対象の期間、2つの特許検索式、関連特許書類を特定する情報や非関連特許書類を特定する情報等が記載されている。なお、本具体例の特許調査報告書は、関連特許書類、および非関連特許書類を特定する情報として、公開番号が記載されているものとする。   In this specific example, it is assumed that the patent search result information is a patent search report as shown in FIG. The patent search report in FIG. 8 includes the search purpose, the type of patent document to be searched, the period of search target, two patent search formulas, information specifying related patent documents, information specifying unrelated patent documents, etc. Have been described. In the patent search report of this specific example, it is assumed that a publication number is described as information for specifying related patent documents and unrelated patent documents.

本具体例において、検索式ルールは、図9で示されるものであるとする。図9のテーブルは、検索式ルールID、検索式ルール、減点情報、および判断結果メッセージを有するレコードを多数有している。本具体例の検索式ルールと判断結果メッセージとは、ルール言語を用いて表現されている。本具体例におけるルール言語は、特許検索式の内容を、変数を用いて表現できるものとした。また、本具体例におけるルール言語は、角括弧(「[」と「]」)で1以上の値を格納する変数を表現している。例えば、[Code]と記載した場合は、特許検索式に含まれる特許分類がすべて格納された変数を表しているものとする。例えば、本具体例では、[Code]以外にも以下の変数を用いて検索式ルールを表現しているものとする。[Purpose]は、特許調査の目的が格納された変数を表しているものとする。[SearchTarget]は、検索対象の特許書類が格納された変数を表しているものとする。[SDate]は、検索対象の期間の始点が格納された変数を表しているものとする。[EDate]は、検索対象の期間の終点が格納された変数を表しているものとする。[Term]は、特許検索式に含まれる用語が全て格納された変数を表しているものとする。[TextSearchField]は、用語の検索フィールドが格納された変数を表しているものとする。[SearchCount]は、特許検索式で検索すると特定できる特許書類の件数が格納された変数を表しているものとする。[RelatedCount]は、人手で選別した関連特許書類の件数が格納された変数を表しているものとする。[Query]は、特許調査結果情報に記載されているすべての特許検索式が格納された変数を表しているものとする。なお、本具体例における上記変数名は、変数を示す角括弧を外すことで、列挙子として扱うこともできるものとする。   In this specific example, it is assumed that the retrieval formula rule is as shown in FIG. The table in FIG. 9 has a large number of records having a search formula rule ID, a search formula rule, deduction information, and a determination result message. The search formula rule and the determination result message in this specific example are expressed using a rule language. The rule language in this specific example can express the contents of the patent search formula using variables. In addition, the rule language in this specific example expresses a variable that stores one or more values in square brackets (“[” and “]”). For example, when “Code” is described, it represents a variable in which all patent classifications included in the patent search formula are stored. For example, in this specific example, it is assumed that a search expression rule is expressed using the following variables in addition to [Code]. [Purpose] represents a variable in which the purpose of patent search is stored. [SearchTarget] represents a variable in which a patent document to be searched is stored. [SDate] represents a variable in which the start point of the period to be searched is stored. [EDate] represents a variable in which the end point of the period to be searched is stored. [Term] represents a variable in which all terms included in the patent search formula are stored. [TextSearchField] represents a variable in which a term search field is stored. [SearchCount] represents a variable in which the number of patent documents that can be specified by searching with a patent search formula is stored. [Related Count] represents a variable in which the number of related patent documents selected manually is stored. [Query] represents a variable in which all patent search formulas described in the patent search result information are stored. Note that the variable names in this specific example can also be handled as enumerators by removing the square brackets indicating the variables.

また、本具体例におけるルール言語は、一般的な四則演算と比較演算と論理演算とが可能であり、各々一般的に使用されている「*」や「==」や「AND」等の記号で表現しているものとする。例えば、「[Purpose] == 無効材料調査」とすれば、特許調査の目的が無効化資料調査であるかどうかが判断できる。また、本具体例におけるルール言語は、変数への代入が可能であり、「←」で代入を表現しているものとする。例えば、「[SearchTarget] ← 全て」と記載した場合は、検索対象の特許書類を全ての特許書類を対象とすることにできる。   In addition, the rule language in this specific example can perform general four arithmetic operations, comparison operations, and logical operations. Symbols such as “*”, “==”, “AND”, etc. that are generally used. It is assumed that For example, if “[Purpose] == invalid material search”, it can be determined whether the purpose of the patent search is an invalidation data search. Further, the rule language in this specific example can be assigned to a variable, and “←” represents the substitution. For example, when “[SearchTarget] ← all” is described, the patent documents to be searched can be targeted for all patent documents.

また、本具体例におけるルール言語は、「[任意の変数].Include(要素)」と記載することで、[任意の変数]内に「要素」が含まれているかどうか(TRUEかFALSEか)を判断する処理を表しているものとする。例えば、「[TextSearchField].Include(全文)」と記載した場合は、検索フィールドに全文を指定した用語が含まれているかどうかを取得できる。また、例えば、「[Query].Include(CodeOnlyQuery)」と記載した場合は、特許検索式に特許分類のみで構成された特許検索式が含まれているかどうかを取得できる。同様に、例えば、「[Query].Include(TermAndCodeQuery)」と記載した場合は、特許検索式に特許分類と用語の両方で構成された特許検索式が含まれているかどうかを取得できる。また、本具体例におけるルール言語は、「isCodeExist([Code], [SDate], [EDate])」と記載することで、特許分類が存在する期間が検索対象の期間と重複するかどうかを判断する処理を表しているものとする。なお、本具体例では、その処理を行うために、後述する図10の特許分類期間情報から特定の特許分類に対する発行日と廃止とを取得して判断するものとした。また、本具体例におけるルール言語は、「BadCombination_AND([Term], [Code])」と記載することで、AND演算子で関連づけられた用語と特許分類が不適切な組み合わせかどうかを判断する処理を表しているものとする。なお、本具体例では、その処理を行うために、後述する図11の用語特許分類の誤った組合せ情報から用語と特許分類との誤った組み合わせを取得して判断するものとした。また、本具体例におけるルール言語は、「PopularTerm([Term])」と記載することで、検索式に含まれる用語が絞り込み能力の低い用語かどうかを判断する処理を表しているものとする。なお、本具体例では、その処理を行うために、後述する図12の絞り込み能力の低い用語情報から絞り込み能力の低い用語を取得して判断するものとした。また、本具体例におけるルール言語は、「処理.Match」と記載することで、処理した結果合致した情報を取得する処理を表しているものとする。例えば、「BadCombination([Term], [Code]).Match」と記載した場合は、不適切と判断された用語と特許分類の組み合わせとを取得する。なお、「処理.UnMatch」については、処理した結果合致しなかった情報を取得する処理を表している。また、本具体例におけるルール言語は、「Today.AddYear(−20)」と記載することで、本日の20年前を取得する処理を表しているものとする。また、本具体例におけるルール言語は、波カッコ「{」「}」で値を囲むことで、文字列として出力する処理を表しているものとする。例えば、「{PopularTerm([Term]).Match}は、絞り込み能力の低い用語です。」と記載した場合は、「PopularTerm([Term]).Match」で「情報」を取得すると、「「情報」は、絞り込み能力の低い用語です。」と出力される。   Also, the rule language in this specific example is described as “[arbitrary variable] .Include (element)”, so that “arbitrary variable” includes “element” (TRUE or FALSE). It is assumed that this represents a process for determining For example, when “[TextSearchField] .Include (full text)” is described, it is possible to acquire whether or not a term specifying the full text is included in the search field. For example, when “[Query] .Include (CodeOnlyQuery)” is described, it is possible to acquire whether or not a patent search formula including only a patent classification is included in the patent search formula. Similarly, for example, when “[Query] .Include (TermAndCodeQuery)” is described, it is possible to acquire whether or not the patent search formula includes a patent search formula composed of both patent classifications and terms. In addition, the rule language in this specific example is described as “isCodeExist ([Code], [SDate], [EDate])”, thereby determining whether the period in which the patent classification exists overlaps with the period to be searched. It is assumed that the processing to be performed is represented. In this specific example, in order to perform the processing, the issue date and the abolition for a specific patent classification are acquired from the patent classification period information of FIG. In addition, the rule language in this specific example is described as “BadCombination_AND ([Term], [Code])”, thereby determining whether the term associated with the AND operator and the patent classification are an inappropriate combination. . In this specific example, in order to perform the processing, an incorrect combination of a term and a patent classification is acquired from a wrong combination information of a term patent classification in FIG. Further, the rule language in this specific example is described as “PopularTerm ([Term])”, and represents a process for determining whether a term included in the search formula is a term with a low narrowing ability. In this specific example, in order to perform the process, a term having a low narrowing ability is acquired from the term information having a low narrowing ability shown in FIG. In addition, the rule language in this specific example is described as “processing.Match”, and represents processing for acquiring information that matches the processing result. For example, when “BadCombination ([Term], [Code]). Match” is described, a combination of a term determined to be inappropriate and a patent classification is acquired. “Processing. UnMatch” represents processing for acquiring information that did not match as a result of processing. In addition, the rule language in this specific example is described as “Today.AddYear (−20)”, and represents the process of acquiring the current 20 years ago. In addition, the rule language in this specific example represents a process of outputting as a character string by enclosing a value in curly braces “{” “}”. For example, if “{PopularTerm ([Term]). Match} is a term with a low refining ability” is described, when “Information” is acquired with “PopularTerm ([Term]). Match”, “ "Is a term with a low refining ability. Is output.

以上により、「検索式ルールID:1」は、特許調査の目的が「無効化資料調査」である場合で、かつ検索対象の特許書類の種類に「特許公開公報」と「公開実用新案」と「公表特許」と「公表実用新案」と「再公表特許」と「再公表実用新案」とが含まれていない場合に不適切であるとする検索式ルールである。また、「検索式ルールID:2」は、検索対象の期間が、特許検索式に含まれる特許分類の発行日以前、または廃止日以降のみを指定した場合に不適切であるとする検索式ルールである。また、「検索式ルールID:2」は、不適切と判断された特許分類を含む判断結果メッセージを有する。また、「検索式ルールID:3」は、特許調査の目的が「侵害予防調査」である場合で、かつ検索対象の期間が特許権の存続期間が満了した特許書類を含めるように指定されていた場合に不適切であるとする検索式ルールである。また、「検索式ルールID:4」は、特許調査の目的が「侵害予防調査」である場合で、かつ検索フィールドに「全文」が指定されていなかった場合に不適切であるとする検索式ルールである。また、「検索式ルールID:5」は、特許分類と用語との組み合わせが、図11の用語特許分類の誤った組合せ情報に含まれている場合に不適切であると判断する検索式ルールである。また、「検索式ルールID:5」は、不適切と判断された特許分類と用語を含む判断結果メッセージを有する。また、「検索式ルールID:6」は、特許検索式に含まれる用語が、図12の絞り込み能力の低い用語情報に含まれている場合に不適切であると判断する検索式ルールである。また、「検索式ルールID:6」は、絞り込み能力が低いと判断された用語を含む判断結果メッセージを有する。また、「検索式ルールID:7」は、調査対象の検索結果のうち、関連特許書類の割合が1%未満である場合に不適切であると判断する検索式ルールである。また、「検索式ルールID:8」は、特許分類のみで構成される特許検索式と、特許分類と用語からなる特許検索式が含まれていない場合に不適切であると判断する検索式ルールである。   As described above, “search formula rule ID: 1” is a case where the purpose of the patent search is “invalidation document search” and the types of patent documents to be searched are “patent publication gazette” and “public utility model”. This is a search rule that is inappropriate when “published patent”, “published utility model”, “republished patent”, and “republished utility model” are not included. In addition, “search formula rule ID: 2” is a search formula rule that is inappropriate when the search target period is specified before the issue date of the patent classification included in the patent search formula or only after the abolition date. It is. Further, “search formula rule ID: 2” has a determination result message including a patent classification determined to be inappropriate. In addition, “search expression rule ID: 3” is specified to include patent documents whose patent search purpose is “infringement prevention search” and whose search target period has expired. This is a search rule that is inappropriate when Further, “search formula rule ID: 4” is a search formula that is inappropriate when the purpose of patent search is “infringement prevention search” and “full text” is not specified in the search field. It is a rule. The “search formula rule ID: 5” is a search formula rule that determines that the combination of the patent classification and the term is inappropriate when the combination of the patent classification and the term is included in the incorrect combination information of the term patent classification in FIG. is there. Further, “search formula rule ID: 5” has a determination result message including a patent classification and a term determined to be inappropriate. The “search formula rule ID: 6” is a search formula rule that determines that a term included in the patent search formula is inappropriate when it is included in the term information having a low narrowing ability in FIG. Further, “search formula rule ID: 6” has a determination result message including a term determined to have a low narrowing ability. “Search expression rule ID: 7” is a search expression rule that is determined to be inappropriate when the ratio of related patent documents is less than 1% of the search results to be searched. Also, the “search formula rule ID: 8” is a search formula rule that is judged to be inappropriate when a patent search formula composed only of patent classifications and a patent search formula consisting of patent classifications and terms are not included. It is.

本具体例において、特許分類期間情報は、図10で示されるものであるとする。図10のテーブルは、特許分類と、その特許分類の発行日と廃止日とを有するレコードを多数有している。例えば、「IPC:A63C9/00」は、「2006.01」に発行され、「2012.01」に廃止されている。また、「IPC:G06F17/30」は、「2006.01」に発行され、現在も継続している。本具体例では、特許分類期間情報は、「検索式ルールID:2」を判断する際に参照される。   In this specific example, it is assumed that the patent classification period information is as shown in FIG. The table shown in FIG. 10 has a large number of records having patent classifications, issuance dates and abolition dates of the patent classifications. For example, “IPC: A63C9 / 00” is issued to “2006.01” and is abolished to “2012.01”. In addition, “IPC: G06F17 / 30” was issued to “2006.01” and continues even now. In this specific example, the patent classification period information is referred to when determining “search formula rule ID: 2”.

本具体例において、用語特許分類の誤った組合せ情報は、図11で示されるものであるとする。図11のテーブルは、特許分類と、その特許分類と不適切な組み合わせとなる用語とを有するレコードを多数有している。例えば、「IPC:G06F17/30」と「データベース」との組合せは、不適切である。本具体例では、用語特許分類の誤った組合せ情報は、「検索式ルールID:5」を判断する際に参照される。   In this specific example, it is assumed that the incorrect combination information of the term patent classification is as shown in FIG. The table of FIG. 11 includes a large number of records having patent classifications and terms that are inappropriate combinations with the patent classifications. For example, the combination of “IPC: G06F17 / 30” and “database” is inappropriate. In this specific example, incorrect combination information of the term patent classification is referred to when determining “search formula rule ID: 5”.

本具体例において、絞り込み能力の低い用語情報は、図12で示されるものであるとする。図12のテーブルは、全分野において頻出する絞り込み能力の低い用語を有するレコードを多数有している。絞り込み能力の低い用語情報は、例えば、「情報」等である。本具体例では、絞り込み能力の低い用語情報は、「検索式ルールID:6」を判断する際に参照される。   In this specific example, it is assumed that the term information having a low narrowing ability is as shown in FIG. The table of FIG. 12 has a large number of records having terms with low narrowing ability that appear frequently in all fields. The term information having a low narrowing ability is, for example, “information”. In this specific example, the term information having a low narrowing ability is referred to when “search expression rule ID: 6” is determined.

本具体例において、選別ルールは、図13で示されるものであるとする。図13のテーブルは、選別ルールID、選別ルール、減点情報、および判断結果メッセージを有するレコードを多数有している。本具体例の選別ルールと減点情報と判断結果メッセージとは、ルール言語を用いて表現されている。本具体例におけるルール言語は、例えば、[NonRelatedToRelatedCount]は、非関連特許と人手で選別された特許書類のうち、判断手段22が関連特許書類であると判断した特許書類の件数が格納された変数を表しているものとする。また、例えば、[RelatedToNonRelatedCount]は、関連特許と人手で選別された特許書類のうち、判断手段22が非関連特許書類であると判断した特許書類の件数が格納された変数を表しているものとする。以上により、例えば、「選別ルールID:1」は、人手で非関連特許書類であると選別された特許書類のうち、関連特許書類の可能性があると判断された特許書類が1以上含まれていた場合に不適切であるとする選別ルールである。また、「選別ルールID:1」は、不適切と判断された特許書類の件数を含む判断結果メッセージを有する。また「選別ルールID:1」は、不適切と判断された特許書類の件数に−2を掛けた点数を減点する減点情報を有する。また、「選別ルールID:2」は、人手で関連特許書類である選別された特許書類のうち、非関連特許書類の可能性があると判断された特許書類が1以上含まれていた場合に不適切であるとする選別ルールである。また、「選別ルールID:2」は、不適切と判断された特許書類の件数を含む判断結果メッセージを有する。また「選別ルールID:2」は、不適切と判断された特許書類の件数に−1を掛けた点数を減点する減点情報を有する。   In this specific example, the selection rule is assumed to be as shown in FIG. The table in FIG. 13 includes a large number of records having a selection rule ID, a selection rule, deduction information, and a determination result message. The selection rule, deduction information, and determination result message in this specific example are expressed using a rule language. The rule language in this specific example is, for example, [NonRelatedToRelatedCount] is a variable in which the number of patent documents judged by the judging means 22 to be related patent documents out of patent documents manually selected from unrelated patents is stored. . In addition, for example, [RelatedToNonRelatedCount] represents a variable in which the number of patent documents that the determination unit 22 has determined to be unrelated patent documents out of the related patents and the patent documents manually selected is stored. To do. As described above, for example, “selection rule ID: 1” includes one or more patent documents that are judged to be related patent documents among the patent documents that are manually selected as non-related patent documents. This is a sorting rule that is inappropriate when it has been. “Selection rule ID: 1” has a determination result message including the number of patent documents determined to be inappropriate. “Selection rule ID: 1” has deduction information for deducting a score obtained by multiplying the number of patent documents determined to be inappropriate by −2. In addition, “selection rule ID: 2” is a case where one or more patent documents that are judged to be unrelated patent documents are included among the selected patent documents that are manually related patent documents. This is a screening rule that is inappropriate. “Selection rule ID: 2” has a determination result message including the number of patent documents determined to be inappropriate. “Selection rule ID: 2” has deduction information for deducting a score obtained by multiplying the number of patent documents determined to be inappropriate by -1.

ユーザ端末2のユーザが、ポインティングデバイスやキーボード等を操作し、図14で示されるように特許調査報告書を入力した後、「実行」ボタンを押したとする。すると、特許検索式「特許書類:特許(公開系) 検索対象の期間:1983.1.1〜2012.3.31 要約+請求項:データベース AND 要約+請求項:装置 AND IPC:G06F17/30」と、特許調査の目的「侵害予防調査」と、関連特許書類を特定する公開番号と、非関連特許書類を特定する公開番号とが、ユーザ端末2から特許調査結果評価装置1に送信される。その送信された特許調査報告書は、特許調査結果評価装置1の受付部101で受信され、特許調査結果情報として特許調査結果情報格納部102に格納される(ステップS201、S202)。   Assume that the user of the user terminal 2 operates a pointing device, a keyboard, etc., inputs a patent search report as shown in FIG. 14, and then presses the “execute” button. Then, the patent search formula “patent document: patent (public) search period: 1983.1.1-2012.3.31 summary + claim: database AND summary + claim: device AND IPC: G06F17 / 30” Then, the purpose of patent search “infringement prevention search”, a public number for identifying related patent documents, and a public number for identifying unrelated patent documents are transmitted from the user terminal 2 to the patent search result evaluation apparatus 1. The transmitted patent search report is received by the receiving unit 101 of the patent search result evaluation apparatus 1 and stored in the patent search result information storage unit 102 as patent search result information (steps S201 and S202).

受付部101は、特許調査結果情報格納部102に特許調査結果情報を格納し終えると、特許調査結果情報から関連特許書類、および非関連特許書類の公開番号を取得する。受付部101は、取得した公開番号を用いて、図示しない特許書類格納部から特許書類を取得する。受付部101は、取得した特許書類のうち、関連特許の公開番号を用いて取得した特許書類を、関連特許書類格納部103に格納する。さらに受付部101は、非関連特許の公開番号を用いて取得した特許書類を非関連特許書類格納部104に格納する(ステップS203、S204)。なお、本具体例において、各特許書類格納部に格納されている特許書類は、図15で示されるものであるとする。図15(a)は、関連特許書類格納部103に格納されている関連特許書類を示し、図15(b)は、非関連特許書類格納部104に格納されている非関連特許書類を示す。図15の各テーブルは、特許書類IDと、発明の名称と、要約の文章と、特許請求の範囲の文章と、背景技術の文章等とを有するレコードを多数有している。なお、特許書類IDは、ここでは、公開番号である。また、特許書類は、ここではテーブルのレコードで示しているが、そのデータ構造は問わないことは言うまでもない。   Upon completion of storing the patent search result information in the patent search result information storage unit 102, the reception unit 101 acquires the disclosure numbers of the related patent documents and the unrelated patent documents from the patent search result information. The reception unit 101 acquires a patent document from a patent document storage unit (not shown) using the acquired public number. The receiving unit 101 stores, in the related patent document storage unit 103, a patent document acquired using the related patent publication number among the acquired patent documents. Further, the receiving unit 101 stores the patent document acquired using the unrelated patent publication number in the unrelated patent document storage unit 104 (steps S203 and S204). In this specific example, it is assumed that the patent documents stored in each patent document storage unit are as shown in FIG. FIG. 15A shows related patent documents stored in the related patent document storage unit 103, and FIG. 15B shows non-related patent documents stored in the non-related patent document storage unit 104. Each table in FIG. 15 has a large number of records including a patent document ID, an invention name, a summary text, a claim text, a background art text, and the like. Here, the patent document ID is a public number here. Further, although patent documents are shown here as records in a table, it goes without saying that the data structure does not matter.

検索式評価部107は、特許調査結果情報格納部102に新たな特許調査結果情報が格納されたことを検知すると、その特許調査結果情報に含まれる特許検索式等に対して検索式ルール格納部105に格納されている検索式ルールが合致するかを判断する(ステップS205)。以下、かかる処理の詳細を説明する。   When the search formula evaluation unit 107 detects that new patent search result information is stored in the patent search result information storage unit 102, the search formula evaluation unit 107 searches for a patent search formula included in the patent search result information, etc. It is determined whether or not the search formula rule stored in 105 matches (step S205). Hereinafter, details of such processing will be described.

検索式評価部107は、特許検索式等が格納されると、図示しない検索式判断結果格納部にNULLを格納し、検索式ルール格納部105から検索式ルールを順番に取得する(ステップS301、S302)。そして、検索式評価部107は、受け付けた特許検索式等が、検索式ルールと合致するかを1件ずつ判断する(ステップS303、S304)。   When a patent search formula or the like is stored, the search formula evaluation unit 107 stores NULL in a search formula determination result storage unit (not shown), and sequentially acquires the search formula rules from the search formula rule storage unit 105 (step S301, S302). Then, the search formula evaluation unit 107 determines whether the received patent search formula or the like matches the search formula rule one by one (steps S303 and S304).

検索式評価部107は、1つめのルールである、「検索式ルールID:1」について判断する。本実施例で指定された特許調査の目的は「侵害予防調査」であるため、上記検索式ルールには合致していない(ステップS303、S304)。検索式評価部107は、次のルールを適用する(ステップS306)。検索式評価部107は、2つめのルールである、「検索式ルールID:2」について判断する。本実施例で指定された特許分類は「IPC:G06F17/30」であり、特許分類期間情報を参照しても期間内であるため、上記検索式ルールには合致していない。検索式評価部107は、さらに、次のルールを適用する。検索式評価部107は、3つめのルールである、「検索式ルールID:3」について判断する。本実施例で指定された特許調査の目的は「侵害予防調査」であり、検索対象の期間も現在から20年以上前の特許書類も含めて検索しようとしているため、上記検索式ルールに合致する。そして、検索式評価部107は、図示しない検索式判断結果格納部に「検索式ルールID:3」と「判断結果メッセージ:侵害予防調査に出願日が20年以上前の特許公報を検索対象にする必要はありません。」とを追記する(ステップS305)。え検索式評価部107は、さらに、次のルールを適用する。検索式評価部107は、4つめのルールである、「検索式ルールID:4」について判断する。本実施例で指定された特許調査の目的は「侵害予防調査」であり、検索フィールドは「全文」を含まないため、上記検索式ルールに合致する。そして、検索式評価部107は、図示しない検索式判断結果格納部に「検索式ルールID:4」と「判断結果メッセージ:侵害予防調査は、全文に対して行うのが適切です。」とを追記する。検索式評価部107は、さらに、次のルールを適用する。検索式評価部107は、5つめのルールである、「検索式ルールID:5」について判断する。本実施例で指定された「IPC:G06F17/30」と「データベース」とは、上記検索式ルールに合致する。そして、検索式評価部107は、図示しない検索式判断結果格納部に「検索式ルールID:5」と判断結果を含むよう処理した「判断結果メッセージ:「「G06F17/30,データベース」は、不適切な組み合わせです。」とを追記する。検索式評価部107は、6つめのルールである、「検索式ルールID:6」について判断する。本実施例で指定された「装置」は、上記検索式ルールに合致する。そして、検索式評価部107は、図示しない検索式判断結果格納部に「検索式ルールID:6」と判断結果を含むよう処理した「判断結果メッセージ:「「装置」は、絞り込み能力の低い用語です。」とを追記する。検索式評価部107は、7つめのルールである、「検索式ルールID:7」について判断する。本実施例では、100件の特許書類から10件の関連特許書類を選別したとする。本実施例では、上記検索式ルールに合致しない。検索式評価部107は、8つめのルールである、「検索式ルールID:8」について判断する。本実施例で指定された特許検索式の作成過程では、特許分類のみの特許検索式を作成していないため、上記検索式ルールに合致する。そして、検索式評価部107は、図示しない検索式判断結果格納部に「検索式ルールID:8」と「特許分類のみの特許検索式で分野を調査し、特許分類と用語を含めた特許検索式で選別対象を絞り込む作成方法が適切です。」とを追記する。以下同様に検索式ルール格納部105に格納されているすべての検索式ルールを判断する。   The search formula evaluation unit 107 determines the first rule, “search formula rule ID: 1”. Since the purpose of the patent search specified in this embodiment is “infringement prevention search”, it does not match the search rule (steps S303 and S304). The search expression evaluation unit 107 applies the following rule (step S306). The search expression evaluation unit 107 determines “search expression rule ID: 2”, which is the second rule. The patent classification specified in the present embodiment is “IPC: G06F17 / 30”, and even if the patent classification period information is referred to, it is still within the period, so it does not match the search formula rule. The search expression evaluation unit 107 further applies the following rule. The search expression evaluation unit 107 determines “search expression rule ID: 3” which is the third rule. The purpose of the patent search specified in this embodiment is “infringement prevention search”, and the search target period also includes patent documents more than 20 years ago. . Then, the search formula evaluation unit 107 searches the search formula judgment result storage unit (not shown) for “search formula rule ID: 3” and “Judgment Result Message: Patent Gazette whose application date is 20 years or more before infringement prevention search”. It is not necessary to add "(step S305). The search expression evaluation unit 107 further applies the following rule. The search expression evaluation unit 107 determines “search expression rule ID: 4”, which is the fourth rule. The purpose of the patent search specified in this embodiment is “infringement prevention search”, and the search field does not include “full text”, and therefore matches the search formula rule. Then, the search formula evaluation unit 107 reads “Search formula rule ID: 4” and “Judgment result message: the infringement prevention investigation is appropriate for the whole sentence” in a search formula determination result storage unit (not shown). Append. The search expression evaluation unit 107 further applies the following rule. The search expression evaluation unit 107 determines “search expression rule ID: 5”, which is the fifth rule. “IPC: G06F17 / 30” and “database” specified in the present embodiment match the search formula rule. Then, the search formula evaluation unit 107 processes the “search formula rule ID: 5” and the determination result included in the search formula determination result storage unit (not shown) “judgment result message:“ G06F17 / 30, database ”is invalid. The right combination. "Is added. The search expression evaluation unit 107 determines the sixth rule, “search expression rule ID: 6”. The “device” specified in the present embodiment matches the search formula rule. Then, the search formula evaluation unit 107 performs processing so that the search formula determination result storage unit (not shown) includes “search formula rule ID: 6” and the determination result “judgment result message:“ “device” is a term with a low narrowing ability ” is. "Is added. The search formula evaluation unit 107 determines “search formula rule ID: 7”, which is the seventh rule. In the present embodiment, it is assumed that 10 related patent documents are selected from 100 patent documents. In this embodiment, the retrieval formula rule does not match. The search formula evaluation unit 107 determines “search formula rule ID: 8”, which is the eighth rule. In the process of creating the patent search formula designated in the present embodiment, the patent search formula for only the patent classification is not created, and therefore it matches the search formula rule. Then, the search formula evaluation unit 107 searches a field with a search formula rule ID: 8 and a patent search formula of only patent classification in a search formula determination result storage unit (not shown), and searches for patents including patent classifications and terms. "The creation method that narrows down the selection target by the formula is appropriate." Similarly, all search formula rules stored in the search formula rule storage unit 105 are determined.

検索式評価部107は、検索式ルール格納部105に格納されているすべての検索式ルールを用いた判断を終えると、図示しない検索式判断結果格納部に格納されている検索式ルールIDを用いて減点情報を取得し、減点情報の合計である−27点を算出する。検索式評価部107は、第一の評価結果である−27点と図示しない検索式判断結果格納部に格納されている判断結果メッセージを第一の評価結果として取得する(ステップS307)。検索式評価部107は、第一の評価結果を取得すると、評価構成部109に第一の評価結果を渡す。   When the search expression evaluation unit 107 finishes using all the search expression rules stored in the search expression rule storage unit 105, the search expression rule ID is stored in a search expression rule result storage unit (not shown). The deduction information is acquired and -27 points, which is the total deduction information, are calculated. The search formula evaluation unit 107 acquires -27 points as the first evaluation result and a determination result message stored in a search formula determination result storage unit (not shown) as the first evaluation result (step S307). When the search expression evaluation unit 107 acquires the first evaluation result, it passes the first evaluation result to the evaluation configuration unit 109.

特徴ベクトル取得手段21は、関連特許書類格納部103に格納されている関連特許書類と、非関連特許書類格納部104に格納されている非関連特許書類とから特徴ベクトルを作成する(ステップS206、S207)。以下、かかる処理の詳細を説明する。   The feature vector acquisition means 21 creates a feature vector from the related patent documents stored in the related patent document storage unit 103 and the non-related patent documents stored in the non-related patent document storage unit 104 (step S206, S207). Hereinafter, details of such processing will be described.

特徴ベクトル取得手段21は、関連特許書類格納部103から1件目の関連特許書類である「特許書類ID:特開2011−AAAAAA」を取得する(ステップS401、S402)。特徴ベクトル取得手段21は、取得した「特許書類ID:特開2011−AAAAAA」から、名詞の連続である「データ管理装置」、「表示部」、「検索キーワード」、「データ管理システム」、「電子機器」、「位置情報」、「現在位置」や「コンピュータ」等を用語として取得する(ステップS403)。特徴ベクトル取得手段21は、取得した用語を図示しない用語格納部に追記する(ステップS404)。特徴ベクトル取得手段21は、取得した用語ごとにTF−IDF値を「データ管理装置:0.0264」や「表示部:0.1628」等のように算出する(ステップS405)。そして、特徴ベクトル取得手段21は、TF−IDF値を要素に持ったベクトルを作成し、図示しない特徴ベクトル格納部に格納する(ステップS406、S407)。そして、特徴ベクトル取得手段21は、次の特許書類に処理を移す(ステップS408)。以下、特徴ベクトル取得手段21は、同様に関連特許書類格納部103、非関連特許書類格納部104のすべての特許書類に対して特徴ベクトルを作成する。特徴ベクトル取得手段21が取得した各特許書類の特徴ベクトルは、図16で示されるものであるとする。図16のテーブルは、特許書類IDと、特許書類の種類と、図示しない用語格納部に格納された用語に対応するベクトルの要素とを有するレコードを多数有している。   The feature vector acquisition unit 21 acquires “patent document ID: JP2011-AAAAAA” which is the first related patent document from the related patent document storage unit 103 (steps S401 and S402). The feature vector acquisition means 21 obtains “data management device”, “display unit”, “search keyword”, “data management system”, “data management system”, “noun series” from the acquired “patent document ID: JP2011-AAAAAA”. “Electronic device”, “position information”, “current position”, “computer”, and the like are acquired as terms (step S403). The feature vector acquisition unit 21 adds the acquired term to a term storage unit (not shown) (step S404). The feature vector acquisition unit 21 calculates the TF-IDF value for each acquired term as “data management device: 0.0264”, “display unit: 0.1628”, or the like (step S405). Then, the feature vector obtaining unit 21 creates a vector having the TF-IDF value as an element and stores it in a feature vector storage unit (not shown) (steps S406 and S407). Then, the feature vector acquisition unit 21 moves the process to the next patent document (step S408). Thereafter, the feature vector acquisition unit 21 similarly creates feature vectors for all patent documents in the related patent document storage unit 103 and the unrelated patent document storage unit 104. It is assumed that the feature vector of each patent document acquired by the feature vector acquisition unit 21 is as shown in FIG. The table of FIG. 16 has a large number of records having patent document IDs, types of patent documents, and vector elements corresponding to terms stored in a term storage unit (not shown).

判断手段22は、代表ベクトルとして、関連特許の特徴ベクトルの平均ベクトルと非関連特許の特徴ベクトルの平均ベクトルを算出する(ステップS208、S209)。   The determination means 22 calculates an average vector of feature vectors of related patents and an average vector of feature vectors of unrelated patents as representative vectors (steps S208 and S209).

判断手段22は、関連特許特徴ベクトルと非関連特許特徴ベクトルとの平均ベクトルが算出されると、関連特許書類格納部103に格納されている関連特許書類から非関連特許が含まれているかどうか、および非関連特許書類格納部104に格納されている非関連特許書類から関連特許が含まれているかどうかを判断する。(ステップS210、S211)。以下、かかる処理の詳細を説明する。   When the average vector of the related patent feature vector and the unrelated patent feature vector is calculated, the determination unit 22 determines whether or not an unrelated patent is included in the related patent documents stored in the related patent document storage unit 103. Whether or not a related patent is included is determined from the unrelated patent documents stored in the unrelated patent document storage unit 104. (Steps S210 and S211). Hereinafter, details of such processing will be described.

判断手段22は、図示しない選別判断結果格納部にNULLを格納する。そして、判断手段22は、1件目の非関連特許書類である「特許書類ID:特開2012−DDDDDD」の非関連特許特徴ベクトルを図示しない特徴ベクトル格納部から取得する(ステップS501、S502)。判断手段22は、取得した非関連特許特徴ベクトルと関連特許特徴ベクトルの平均ベクトルとのCOS尺度、および非関連特許特徴ベクトルの平均ベクトルとのCOS尺度を算出する(ステップS503、S504)。「特許書類ID:特開2012−DDDDDD」の非関連特許特徴ベクトルは、関連特許特徴ベクトルの平均ベクトルとのCOS尺度の方が大きかったとする(ステップS505)。判断手段22は、「特許書類ID:特開2012−DDDDDD」を図示しない判断結果格納部に関連特許の可能性があることを示す情報と対応付けて格納する(ステップS506)。なお、判断手段22は、非関連特許特徴ベクトルの平均ベクトルとのCOS尺度の方が大きかった場合は、何も格納しない。そして、判断手段22は、次の非関連特許特徴ベクトルに処理を移す(ステップS507)。以降、判断手段22は、図示しない特徴ベクトル格納部に格納されている残りの非関連特許書類、および関連特許書類のすべてに対しても同様に判断する。   The determination unit 22 stores NULL in a selection determination result storage unit (not shown). Then, the determination unit 22 acquires an unrelated patent feature vector of “patent document ID: JP2012-DDDDDD” which is the first unrelated patent document from a feature vector storage unit (not shown) (steps S501 and S502). . The determination unit 22 calculates a COS measure between the acquired unrelated patent feature vector and the average vector of the related patent feature vectors, and a COS measure between the average vector of the unrelated patent feature vectors (steps S503 and S504). It is assumed that the COS scale of the unrelated patent feature vector of “Patent Document ID: JP2012-DDDDDD” and the average vector of the related patent feature vectors is larger (step S505). The determination unit 22 stores “patent document ID: JP2012-DDDDDD” in association with information indicating that there is a possibility of a related patent in a determination result storage unit (not shown) (step S506). Note that if the COS scale with the average vector of unrelated patent feature vectors is larger, the determination unit 22 stores nothing. Then, the determination unit 22 moves the process to the next unrelated patent feature vector (step S507). Thereafter, the determination unit 22 similarly determines all remaining unrelated patent documents and related patent documents stored in a feature vector storage unit (not shown).

さらに、選別評価結果取得手段23は、図示しない選別判断結果格納部に格納された情報に対して、選別ルール格納部106に格納されている選別ルールが合致するかどうかを判断する(ステップS212)。選別評価結果取得手段23は、1つめの選別ルールである「選別ルールID:1」について判断する(ステップS601、S602)。選別評価結果取得手段23は、「特許書類ID:特開2012−DDDDDD」等4件の非関連特許書類が関連特許のクラスに含まれると判断されていたとするため、「選別ルールID:1」に合致する(ステップS603、S604)。そして、選別評価結果取得手段23は、図示しない選別判断結果格納部に「選別ルールID:1」を追記する(ステップS605)選別評価結果取得手段23は、次のルールを適用する(ステップS606)。選別評価結果取得手段23は、以下同様に選別ルール格納部106に格納されているすべての選別ルールを判断する。以降、選別評価結果取得手段23は、図示しない特徴ベクトル格納部に格納されている残りの非関連特許書類、および関連特許書類のすべてに対しても同様に判断する。   Furthermore, the screening evaluation result acquisition unit 23 determines whether or not the screening rules stored in the screening rule storage unit 106 match information stored in the screening determination result storage unit (not shown) (step S212). . The sorting evaluation result acquisition unit 23 determines “screening rule ID: 1” which is the first screening rule (steps S601 and S602). Since the screening evaluation result acquisition unit 23 determines that four unrelated patent documents such as “Patent Document ID: JP2012-DDDDDD” are included in the related patent class, “Selection Rule ID: 1”. (Steps S603 and S604). Then, the screening evaluation result acquisition unit 23 adds “screening rule ID: 1” to a screening determination result storage unit (not shown) (step S605), and the screening evaluation result acquisition unit 23 applies the following rule (step S606). . The sorting evaluation result acquisition unit 23 determines all sorting rules stored in the sorting rule storage unit 106 in the same manner. Thereafter, the sorting evaluation result acquisition unit 23 makes the same determination for all of the remaining unrelated patent documents and related patent documents stored in a feature vector storage unit (not shown).

次に、選別評価結果取得手段23は、図示しない特徴ベクトル格納部に格納されているすべての特徴ベクトルに対する判断を終えると、図示しない選別判断結果格納部に格納されている選別ルールIDを用いて減点数を算出する。本具体例では、人手で非関連特許と選別された特許書類のうち4件が関連特許の可能性があると判断され、人手で関連特許と選別された特許書類のうち6件が非関連特許の可能性があると判断されたとする。選別評価結果取得手段23は、図示しない選別判断結果格納部に格納されている選別ルールIDに対応する減点情報を取得して、減点情報の合計である−14点を算出する。次に、選別評価結果取得手段23は、図示しない選別判断結果格納部に格納されている選別ルールIDから判断結果メッセージ「4件の非関連特許書類が関連特許の可能性があると判断されていました。」と「6件の関連特許書類が非関連特許の可能性があると判断されていました。」とを取得する。さらに、選別評価結果取得手段23は、図示しない選別判断結果格納部に格納されている特許書類IDを取得する。そして、選別評価結果取得手段23は、−14点と、判断結果メッセージと、特許書類IDとを第二の判断結果として取得する(ステップS213)。選別評価結果取得手段23は、第二の評価結果を取得すると、評価構成部109に第二の評価結果を渡す。   Next, the screening evaluation result acquisition unit 23 uses the screening rule ID stored in the screening determination result storage unit (not shown) after finishing the determination on all the feature vectors stored in the feature vector storage unit (not illustrated). Calculate deduction points. In this specific example, four of the patent documents manually selected as unrelated patents are judged to be related patents, and six of the patent documents manually selected as related patents are unrelated patents. Suppose that there is a possibility. The screening evaluation result acquisition unit 23 acquires deduction information corresponding to the selection rule ID stored in the screening determination result storage unit (not shown), and calculates -14 points that are the total of the deduction information. Next, the screening evaluation result acquisition means 23 determines from the screening rule ID stored in the screening determination result storage unit (not shown) that the determination result message “4 unrelated patent documents are likely to be related patents”. And "6 related patent documents were judged to be unrelated patents." Further, the screening evaluation result acquisition unit 23 acquires a patent document ID stored in a screening determination result storage unit (not shown). Then, the sorting evaluation result acquisition unit 23 acquires -14 points, a determination result message, and a patent document ID as the second determination result (step S213). Upon obtaining the second evaluation result, the sorting evaluation result acquisition unit 23 passes the second evaluation result to the evaluation configuration unit 109.

評価構成部109は、第一、および第二の評価結果が渡されると、第一、および第二の評価結果の得点を100点に加算して、59点を算出する。評価構成部109は、59点と、第一の評価結果と第二の評価結果とを合わせて特許調査結果情報の評価を構成する(ステップS214)。評価構成部109は、特許調査結果情報の評価を評価出力部110に渡す。   When the first and second evaluation results are passed, the evaluation configuration unit 109 adds the scores of the first and second evaluation results to 100 points to calculate 59 points. The evaluation configuration unit 109 configures the evaluation of the patent search result information by combining the 59 points, the first evaluation result, and the second evaluation result (step S214). The evaluation configuration unit 109 passes the evaluation of the patent search result information to the evaluation output unit 110.

評価出力部110は、特許調査結果情報の評価を渡されると、特許調査結果情報の評価をネットワーク100を介して、ユーザ端末2に特許調査結果情報の評価を送信する(ステップS215)。ユーザ端末2は、評価出力部110が送信した判断結果を受信すると、図17で示される表示を行う。ユーザは、図17の表示を見ることにより、特許調査結報告書の評価を確認し、必要であれば再調査を行う。   When the evaluation of the patent search result information is passed, the evaluation output unit 110 transmits the evaluation of the patent search result information to the user terminal 2 via the network 100 (step S215). When the user terminal 2 receives the determination result transmitted by the evaluation output unit 110, the user terminal 2 performs the display shown in FIG. The user confirms the evaluation of the patent search result report by looking at the display of FIG. 17, and performs a re-search if necessary.

以上、本実施の形態の特許調査結果評価装置1によれば、特許調査結果情報に含まれる不適切な特許検索式が評価できるため、特許調査が妥当であるかどうかを知ることができる。例えば、特許検索式に含まれる特許調査の目的と特許書類の種類との組み合わせを評価できる。また、特許検索式に含まれる検索対象の期間を評価できる。また、特許検索式に含まれる特許分類と検索対象の期間との組み合わせを評価できる。また、特許検索式に含まれる特許調査の目的と検索対象の期間との組み合わせを評価できる。また、特許検索式に含まれる検索フィールドを評価できる。また、特許検索式に含まれる特許調査の目的と検索フィールドとの組み合わせを評価できる。また、特許検索式に含まれる特許分類と用語との組み合わせを評価できる。また、特許検索式に含まれる特許書類の絞り込みの能力が低い用語を含んでいるかどうかを評価できる。また、関連特許の割合から特許検索式の妥当性を評価できる。また、特許検索式の作成過程が適切であるかを評価できる。また、特許調査結果情報に含まれる選別情報を評価できるため、特許調査が妥当であるかどうかを知ることができる。例えば、特許調査を行った際に誤って関連特許を非関連特許書類として分類していないかどうかを評価できる。また、特許調査を行った際に誤って非関連特許を関連特許書類として分類していないかどうかを評価できる。以上により、特許調査者の能力を評価することができる。また、処理を機械的に行うため効率的に評価を行うことができる。   As described above, according to the patent search result evaluation apparatus 1 of the present embodiment, since an inappropriate patent search formula included in the patent search result information can be evaluated, it is possible to know whether the patent search is valid. For example, the combination of the purpose of patent search and the type of patent document included in the patent search formula can be evaluated. In addition, it is possible to evaluate the search target period included in the patent search formula. In addition, a combination of a patent classification and a search target period included in the patent search formula can be evaluated. In addition, a combination of the purpose of the patent search included in the patent search formula and the search target period can be evaluated. In addition, the search field included in the patent search formula can be evaluated. Also, the combination of the purpose of the patent search included in the patent search formula and the search field can be evaluated. Moreover, the combination of the patent classification | category and term contained in a patent search formula can be evaluated. In addition, it is possible to evaluate whether or not a term that has a low ability to narrow down patent documents included in the patent search formula is included. In addition, the validity of the patent search formula can be evaluated from the ratio of related patents. It is also possible to evaluate whether the process of creating a patent search formula is appropriate. In addition, since the selection information included in the patent search result information can be evaluated, it is possible to know whether the patent search is valid. For example, it is possible to evaluate whether or not a related patent has been mistakenly classified as an unrelated patent document during a patent search. In addition, it is possible to evaluate whether or not an unrelated patent is mistakenly classified as a related patent document during a patent search. As described above, the patent investigator's ability can be evaluated. Moreover, since the processing is performed mechanically, the evaluation can be performed efficiently.

なお、本実施の形態において、特許調査結果評価装置1が受付部101を備える場合について説明したが、特許調査結果評価装置1は、受付部101を備えていなくてもよい。受付部101を備えていない場合には、特許調査結果情報格納部102と関連特許書類格納部103と非関連特許書類格納部104とに予め情報が格納されている特許調査結果評価装置1であっても良い。   In addition, in this Embodiment, although the case where the patent search result evaluation apparatus 1 was provided with the reception part 101 was demonstrated, the patent search result evaluation apparatus 1 does not need to be provided with the reception part 101. FIG. When the reception unit 101 is not provided, the patent search result evaluation apparatus 1 in which information is stored in advance in the patent search result information storage unit 102, the related patent document storage unit 103, and the unrelated patent document storage unit 104 is used. May be.

また、本実施の形態において、特許調査結果評価装置1の受付部101が受け付けた特許調査結果情報に含まれている関連特許書類、および非関連特許書類が特許書類そのものであった場合は、特許調査結果情報格納部102と関連特許書類格納部103と非関連特許書類格納部とは、格納領域を共有していても良い。   In the present embodiment, when the related patent document and the unrelated patent document included in the patent search result information received by the receiving unit 101 of the patent search result evaluation apparatus 1 are the patent documents themselves, The search result information storage unit 102, the related patent document storage unit 103, and the unrelated patent document storage unit may share a storage area.

また、本実施の形態において、特許調査結果評価装置1の判断手段22は、関連特許書類格納部103に格納された特許書類に対して、非関連特許である可能性を判断する場合について説明したが、判断手段22は、関連特許書類格納部103に格納された特許書類に対して、非関連特許である可能性を判断しなくても良い。関連特許書類格納部103に格納された特許書類に対して、非関連特許である可能性を判断しない場合は、非関連特許書類格納部104に格納された特許書類に対して、関連特許である可能性ののみを判断しても良い。   Further, in the present embodiment, the case has been described in which the determination unit 22 of the patent search result evaluation apparatus 1 determines the possibility of being an unrelated patent for the patent document stored in the related patent document storage unit 103. However, the determination unit 22 may not determine the possibility that the patent document stored in the related patent document storage unit 103 is an unrelated patent. If it is not determined that the patent document stored in the related patent document storage unit 103 is an unrelated patent, the patent document stored in the unrelated patent document storage unit 104 is a related patent. You may judge only the possibility.

また、本実施の形態において、特許調査結果評価装置1の判断手段22は、非関連特許書類格納部104に格納された特許書類に対して、関連特許である可能性を判断する場合について説明したが、判断手段22は、非関連特許書類格納部104に格納された特許書類に対して、関連特許である可能性を判断しなくても良い。非関連特許書類格納部104に格納された特許書類に対して、関連特許である可能性を判断しない場合は、関連特許書類格納部103に格納された特許書類に対して、非関連特許である可能性ののみを判断しても良い。   Further, in the present embodiment, a case has been described in which the determination unit 22 of the patent search result evaluation apparatus 1 determines the possibility of a related patent for a patent document stored in the unrelated patent document storage unit 104. However, the determination unit 22 may not determine the possibility that the patent document stored in the unrelated patent document storage unit 104 is a related patent. If it is not determined that the patent document stored in the unrelated patent document storage unit 104 is a related patent, the patent document stored in the related patent document storage unit 103 is an unrelated patent. You may judge only the possibility.

また、本実施の形態において、特許調査結果評価装置1の判断手段22が、非関連特許のクラスに判断対象の特徴ベクトルが属する場合に非関連特許であると判断したが、判断手段22は、非関連特許のクラスを用いず、関連特許のクラスのみを用いて、非関連特許書類格納部104に格納された特許書類から関連特許の可能性のある特許書類であるかを判断しても良く、関連特許書類格納部103に格納された特許書類から非関連特許の可能性のある特許書類であるかを判断しても良い。非関連特許のクラスを用いない場合は、関連特許のクラスに属さない特徴ベクトルを非関連特許としても良い。なお、非関連特許のクラスを用いない場合には、機械学習を用いる方法は、使用できないため、判断手段22は、関連特許特徴ベクトルの1または2以上のクラスの代表ベクトルとの類似度を用いて関連特許のクラスに属するか否かを判断する。クラスに属するか否かの判断は、例えば、代表ベクトルと判断対象の特徴ベクトルとの類似度が予め定めた閾値以上であるかどうかで判断しても良く、各クラスタリング手法を用いて、関連特許のクラスにクラスタリングされるか否かで判断しても良い。   In the present embodiment, the determination unit 22 of the patent search result evaluation apparatus 1 determines that the determination target feature vector belongs to the class of the unrelated patent, but the determination unit 22 It may be possible to determine whether a patent document that may be a related patent from the patent documents stored in the unrelated patent document storage unit 104 by using only the related patent class without using the non-related patent class. Further, it may be determined from the patent documents stored in the related patent document storage unit 103 whether the patent document has a possibility of an unrelated patent. When the non-related patent class is not used, a feature vector that does not belong to the related patent class may be used as the non-related patent. Note that, when a class of unrelated patents is not used, a method using machine learning cannot be used. Therefore, the determination unit 22 uses the degree of similarity of the related patent feature vectors with representative vectors of one or more classes. To determine whether it belongs to the related patent class. The determination as to whether or not belonging to a class may be made based on, for example, whether or not the similarity between the representative vector and the feature vector to be determined is equal to or greater than a predetermined threshold. You may judge by whether it is clustered into this class.

また、本実施の形態における特許調査結果評価装置1を実現するソフトウェアは、以下のようなプログラムである。つまり、プログラムは、1以上の特許検索式と特許の選別の結果に関する選別情報とを有する特許調査結果情報を格納し得る特許調査結果情報格納部と、1以上の特許検索式が不適切であることを判断するためのルールである1以上の検索式ルールを格納し得る検索式ルール格納部と、調査対象の特許の選別作業の妥当性を判断するためのルールである1以上の選別ルールを格納し得る選別ルール格納部とにアクセス可能なコンピュータを、1以上の特許検索式を1以上の検索式ルールに適用し、1以上の特許検索式に合致する検索式ルールを決定し、合致する1以上の検索式ルールに対応する第一の評価結果を取得する検索式評価部、選別情報を1以上の選別ルールに適用し、選別情報に合致する選別ルールを決定し、合致する1以上の選別ルールに対応する第二の評価結果を取得する選別情報評価部、第一の評価結果および第二の評価結果を用いて、特許調査結果情報の評価を構成する評価構成部、特許調査結果情報の評価を出力する評価出力部として機能させるためのプログラムである。   Moreover, the software which implement | achieves the patent search result evaluation apparatus 1 in this Embodiment is the following programs. That is, in the program, the patent search result information storage unit that can store the patent search result information having one or more patent search formulas and the selection information related to the results of the patent selection, and the one or more patent search formulas are inappropriate. A search expression rule storage unit that can store one or more search expression rules that are rules for determining the above, and one or more selection rules that are rules for determining the validity of the selection process of the patent to be searched One or more patent search formulas are applied to one or more search formula rules, and a search formula rule that matches one or more patent search formulas is determined and matched with a computer that has access to a screening rule storage that can be stored. A search formula evaluation unit that obtains a first evaluation result corresponding to one or more search formula rules, applies selection information to one or more selection rules, determines a selection rule that matches the selection information, and matches one or more matching rules Selection The selection information evaluation unit that acquires the second evaluation result corresponding to the rule, the evaluation configuration unit that constitutes the evaluation of the patent search result information using the first evaluation result and the second evaluation result, the patent search result information It is a program for making it function as an evaluation output part which outputs evaluation.

なお、本実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されても良く、または、複数の装置によって分散処理されることによって実現されても良い。また、本実施の形態において、一の装置に存在する2以上の通信手段(受付部101等)は、物理的に一の媒体で実現されても良いことは言うまでもない。   In the present embodiment, each process (each function) may be realized by centralized processing by a single device (system), or by distributed processing by a plurality of devices. May be. In the present embodiment, it is needless to say that two or more communication means (such as the receiving unit 101) existing in one apparatus may be physically realized by one medium.

また、本実施の形態では、サーバ・クライアントシステムである場合について説明したが、本発明は、サーバ・クライアントシステムにおけるサーバ装置であっても良く、スタンドアロンの装置であっても良い。スタンドアロンの装置であった場合における、受付部101は、キーボードやマウス、タッチパネル等の入力デバイスから入力された情報の受け付けても良い。評価出力部110は、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字等のための出力を行っても良い。   In the present embodiment, the server / client system has been described. However, the present invention may be a server device in a server / client system or a stand-alone device. In the case of a stand-alone device, the receiving unit 101 may receive information input from an input device such as a keyboard, a mouse, or a touch panel. The evaluation output unit 110 may perform output for display on a display, projection using a projector, printing with a printer, and the like.

また、本実施の形態において、各構成要素は、専用のハードウェアにより構成されても良く、または、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されても良い。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行部が読み出して実行することによって、各構成要素が実現され得る。   In the present embodiment, each component may be configured by dedicated hardware, or a component that can be realized by software may be realized by executing a program. For example, each component can be realized by a program execution unit such as a CPU reading and executing a software program recorded on a recording medium such as a hard disk or a semiconductor memory.

なお、上記プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を取得する取得部や、情報を出力する出力部等におけるモデムやインターフェースカード等のハードウェアでしか実現できない機能は、上記プログラムが実現する機能には含まれない。   In the program, the functions realized by the program do not include functions that can be realized only by hardware. For example, functions that can be realized only by hardware such as a modem and an interface card in an acquisition unit that acquires information, an output unit that outputs information, and the like are not included in the functions realized by the program.

図18は、上記プログラムを実行して、上記実施の形態による本発明を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェアおよびその上で実行されるコンピュータプログラムによって実現され得る。   FIG. 18 is a schematic diagram showing an example of the appearance of a computer that executes the program and implements the present invention according to the embodiment. The embodiment described above can be realized by computer hardware and a computer program executed on the computer hardware.

図18において、コンピュータシステム1100は、CD−ROMドライブ1105、FDドライブ1106を含むコンピュータ1101と、キーボード1102と、マウス1103と、モニタ1104とを備える。   In FIG. 18, a computer system 1100 includes a computer 1101 including a CD-ROM drive 1105 and an FD drive 1106, a keyboard 1102, a mouse 1103, and a monitor 1104.

図19は、コンピュータシステム1100の内部構成を示す図である。図19において、コンピュータ1101は、CD−ROMドライブ1105、FDドライブ1106に加えて、MPU1111と、ブートアッププログラム等のプログラムを記憶するためのROM1112と、MPU1111に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM1113と、アプリケーションプログラム、システムプログラム、およびデータを記憶するハードディスク1114と、MPU1111と、ROM1112等を相互に接続するバス1115とを備える。なお、コンピュータ1101は、LANへの接続を提供する図示しないネットワークカードを含んでいても良い。   FIG. 19 is a diagram showing an internal configuration of the computer system 1100. In FIG. 19, in addition to the CD-ROM drive 1105 and the FD drive 1106, a computer 1101 is connected to an MPU 1111, a ROM 1112 for storing a program such as a bootup program, and an MPU 1111. And a RAM 1113 that provides a temporary storage space, a hard disk 1114 that stores application programs, system programs, and data, an MPU 1111, a bus 1115 that interconnects the ROM 1112, and the like. The computer 1101 may include a network card (not shown) that provides connection to the LAN.

コンピュータシステム1100に、上記実施の形態による本発明等の機能を実行させるプログラムは、CD−ROM1121、またはFD1122に記憶されて、CD−ROMドライブ1105、またはFDドライブ1106に挿入され、ハードディスク1114に転送されても良い。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ1101に送信され、ハードディスク1114に記憶されても良い。プログラムは実行の際にRAM1113にロードされる。なお、プログラムは、CD−ROM1121やFD1122、またはネットワークから直接、ロードされても良い。   A program for causing the computer system 1100 to execute the functions of the present invention according to the above embodiment is stored in the CD-ROM 1121 or the FD 1122, inserted into the CD-ROM drive 1105 or the FD drive 1106, and transferred to the hard disk 1114. May be. Instead, the program may be transmitted to the computer 1101 via a network (not shown) and stored in the hard disk 1114. The program is loaded into the RAM 1113 when executed. The program may be loaded directly from the CD-ROM 1121, the FD 1122, or the network.

プログラムは、コンピュータ1101に、上記実施の形態による本発明の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいても良い。コンピュータシステム1100がどのように動作するのかについては周知であり、詳細な説明は省略する。   The program does not necessarily include an operating system (OS) or a third-party program that causes the computer 1101 to execute the functions of the present invention according to the above-described embodiment. The program may include only a part of an instruction that calls an appropriate function (module) in a controlled manner and obtains a desired result. How the computer system 1100 operates is well known and will not be described in detail.

本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。   The present invention is not limited to the above-described embodiments, and various modifications are possible, and it goes without saying that these are also included in the scope of the present invention.

以上のように、本発明にかかる特許調査結果評価装置等は、特許調査の結果を評価できるという効果を有し、例えば、特許調査の結果を評価する装置等として有用である。   As described above, the patent search result evaluation apparatus and the like according to the present invention have an effect that the result of the patent search can be evaluated, and are useful as an apparatus for evaluating the result of the patent search, for example.

1 特許調査結果評価装置
21 特徴ベクトル取得手段
22 判断手段
23 選別評価結果取得手段
101 受付部
102 特許調査結果情報格納部
103 関連特許書類格納部
104 非関連特許書類格納部
105 検索式ルール格納部
106 選別ルール格納部
107 検索式評価部
108 選別情報評価部
109 評価構成部
110 評価出力部
DESCRIPTION OF SYMBOLS 1 Patent search result evaluation apparatus 21 Feature vector acquisition means 22 Judgment means 23 Sorting evaluation result acquisition means 101 Reception part 102 Patent search result information storage part 103 Related patent document storage part 104 Unrelated patent document storage part 105 Search type rule storage part 106 Selection rule storage unit 107 Search expression evaluation unit 108 Selection information evaluation unit 109 Evaluation configuration unit 110 Evaluation output unit

Claims (16)

1以上の特許検索式と特許の選別の結果に関する選別情報とを有する特許調査結果情報を格納し得る特許調査結果情報格納部と、
1以上の特許検索式が不適切であることを判断するためのルールである1以上の検索式ルールを格納し得る検索式ルール格納部と、
調査対象の特許の選別作業の妥当性を判断するためのルールである1以上の選別ルールを格納し得る選別ルール格納部と、
前記1以上の特許検索式を前記1以上の検索式ルールに適用し、前記1以上の特許検索式に合致する検索式ルールを決定し、当該合致する1以上の検索式ルールに対応する第一の評価結果を取得する検索式評価部と、
前記選別情報を前記1以上の選別ルールに適用し、前記選別情報に合致する選別ルールを決定し、当該合致する1以上の選別ルールに対応する第二の評価結果を取得する選別情報評価部と、
前記第一の評価結果および第二の評価結果を用いて、特許調査結果情報の評価を構成する評価構成部と、
前記特許調査結果情報の評価を出力する評価出力部とを具備する特許調査結果評価装置。
A patent search result information storage unit capable of storing patent search result information having one or more patent search expressions and selection information related to a result of patent selection;
A search formula rule storage unit that can store one or more search formula rules that are rules for determining that one or more patent search formulas are inappropriate;
A screening rule storage unit that can store one or more screening rules that are rules for determining the validity of the screening operation of the patent to be searched;
Applying the one or more patent search formulas to the one or more search formula rules, determining a search formula rule that matches the one or more patent search formulas, and corresponding to the one or more search formula rules that match A search expression evaluation unit for obtaining the evaluation result of
A sorting information evaluation unit that applies the sorting information to the one or more sorting rules, determines a sorting rule that matches the sorting information, and acquires a second evaluation result corresponding to the matching one or more sorting rules; ,
Using the first evaluation result and the second evaluation result, an evaluation component that constitutes an evaluation of patent search result information;
A patent search result evaluation apparatus comprising: an evaluation output unit that outputs an evaluation of the patent search result information.
前記特許調査結果情報は、
特許調査の目的と特許調査の対象の特許書類の種類とを含み、
前記検索式ルールは、
特許調査の目的と特許書類の種類とを含むルールであり、
前記検索式評価部は、
前記特許調査結果情報に含まれる特許書類の種類と特許調査の目的とを、前記1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、当該合致する1以上の検索式ルールに対応する第一の評価結果を取得する、請求項1記載の特許調査結果評価装置。
The patent search result information is
Including the purpose of the patent search and the types of patent documents subject to the patent search,
The search rule is
Rules that include the purpose of patent search and the types of patent documents,
The search expression evaluation unit
The type of patent document included in the patent search result information and the purpose of patent search are applied to the one or more search formula rules, one or more search formula rules that match are determined, and the one or more search matches. The patent search result evaluation apparatus according to claim 1, wherein a first evaluation result corresponding to the expression rule is acquired.
前記特許調査結果情報は、
検索対象の期間を含み、
前記検索式ルールは、
検索対象の期間を含むルールであり、
前記検索式評価部は、
前記特許調査結果情報に含まれる検索対象の期間を前記1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、当該合致する1以上の検索式ルールに対応する第一の評価結果を取得する、請求項1記載の特許調査結果評価装置。
The patent search result information is
Including the search period,
The search rule is
A rule that includes the time period to be searched,
The search expression evaluation unit
The search target period included in the patent search result information is applied to the one or more search expression rules, one or more matching search expression rules are determined, and the first corresponding to the one or more matching search expression rules The patent search result evaluation apparatus according to claim 1, wherein the evaluation result is acquired.
前記特許調査結果情報は、
特許分類と検索対象の期間とを含み、
前記検索式ルールは、
特許分類と検索対象の期間とを含むルールであり、
前記検索式評価部は、
前記特許調査結果情報に含まれる特許分類と検索対象の期間とを前記1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、当該合致する1以上の検索式ルールに対応する第一の評価結果を取得する、請求項1記載の特許調査結果評価装置。
The patent search result information is
Including patent classification and period of search,
The search rule is
A rule that includes a patent classification and a search period,
The search expression evaluation unit
The patent classification and the search target period included in the patent search result information are applied to the one or more search expression rules, one or more search expression rules that match are determined, and the one or more search expression rules that match are determined. The patent search result evaluation apparatus according to claim 1, wherein the corresponding first evaluation result is acquired.
前記特許調査結果情報は、
特許調査の目的と検索対象の期間とを含み、
前記検索式ルールは、
特許調査の目的と検索対象の期間とを含むルールであり、
前記検索式評価部は、
前記特許調査結果情報に含まれる検索対象の期間と特許調査の目的とを前記1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、当該合致する1以上の検索式ルールに対応する第一の評価結果を取得する、請求項1記載の特許調査結果評価装置。
The patent search result information is
Including the purpose of the patent search and the search period,
The search rule is
A rule that includes the purpose of the patent search and the time period for the search,
The search expression evaluation unit
The search target period and the purpose of patent search included in the patent search result information are applied to the one or more search formula rules, one or more search formula rules that match are determined, and the one or more search formulas that match The patent search result evaluation apparatus according to claim 1, wherein a first evaluation result corresponding to the rule is acquired.
前記特許調査結果情報は、
検索フィールドを含み、
前記検索式ルールは、
検索フィールドを含むルールであり、
前記検索式評価部は、
前記特許調査結果情報に含まれる検索フィールドを前記1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、当該合致する1以上の検索式ルールに対応する第一の評価結果を取得する、請求項1記載の特許調査結果評価装置。
The patent search result information is
Including a search field,
The search rule is
A rule that includes a search field,
The search expression evaluation unit
A search field included in the patent search result information is applied to the one or more search expression rules to determine one or more matching search expression rules, and a first evaluation corresponding to the one or more matching search expression rules The patent search result evaluation device according to claim 1 which acquires a result.
前記特許調査結果情報は、
特許調査の目的と検索フィールドとを含み、
前記検索式ルールは、
特許調査の目的と検索フィールドとを含むルールであり、
前記検索式評価部は、
前記特許調査結果情報に含まれる検索フィールドと特許調査の目的とを前記1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、当該合致する1以上の検索式ルールに対応する第一の評価結果を取得する、請求項1記載の特許調査結果評価装置。
The patent search result information is
Including patent search objectives and search fields,
The search rule is
A rule that includes the purpose of a patent search and a search field,
The search expression evaluation unit
The search field included in the patent search result information and the purpose of the patent search are applied to the one or more search formula rules, one or more search formula rules that match are determined, and the one or more search formula rules that match The patent search result evaluation apparatus according to claim 1, wherein the corresponding first evaluation result is acquired.
特許調査結果情報に含まれる特許検索式は、
特許分類と用語とを含み、
前記検索式ルールは、
特許分類と用語とを含むルールであり、
前記検索式評価部は、
前記特許検索式に含まれる特許分類と用語とを、前記1以上の検索式ルールに適用し、合致する1以上の検索式ルールを決定し、当該合致する1以上の検索式ルールに対応する第一の評価結果を取得する、請求項1記載の特許調査結果評価装置。
The patent search formula included in the patent search result information is
Including patent classification and terminology,
The search rule is
Rules that include patent classifications and terms,
The search expression evaluation unit
The patent classification and terms included in the patent search formula are applied to the one or more search formula rules, one or more search formula rules that match are determined, and the first search formula rule corresponding to the one or more search formula rules that match. The patent search result evaluation apparatus according to claim 1, wherein one evaluation result is acquired.
特許調査結果情報に含まれる特許検索式は、
1以上の用語を含み、
前記検索式ルールは、
特許書類の絞り込みの能力が低い1以上の用語を含むルールであり、
前記検索式評価部は、
前記特許検索式に含まれる1以上の用語を前記1以上の検索式ルールに適用し、前記1以上の各用語が絞り込みの能力が低いか否かを判断し、当該判断結果を用いて第一の評価結果を取得する、請求項1記載の特許調査結果評価装置。
The patent search formula included in the patent search result information is
Contains one or more terms,
The search rule is
A rule that includes one or more terms that have a low ability to narrow patent documents,
The search expression evaluation unit
Apply one or more terms included in the patent search formula to the one or more search formula rules, determine whether each of the one or more terms has a low narrowing ability, and use the determination result to determine the first The patent search result evaluation apparatus according to claim 1, wherein the evaluation result is acquired.
前記選別情報は、
選別対象の特許件数と関連特許の件数とを含み、
前記検索式ルールは、
選別対象の特許件数と関連特許の件数とを用いたルールであり、
前記検索式評価部は、
前記選別情報に含まれる選別対象の特許件数と関連特許の件数とを、前記検索式ルールに適用し、第一の評価結果を取得する、請求項1記載の特許調査結果評価装置。
The sorting information is
Including the number of patents to be sorted and the number of related patents,
The search rule is
It is a rule that uses the number of patents to be selected and the number of related patents.
The search expression evaluation unit
The patent search result evaluation apparatus according to claim 1, wherein the number of patents to be selected and the number of related patents included in the selection information are applied to the search formula rule to acquire a first evaluation result.
前記特許調査結果情報は、
2以上の特許検索式を有し、
前記検索式ルールは、
2以上の特許検索式を有するルールであり、
前記検索式評価部は、
前記特許調査結果情報が有する2以上の特許検索式を前記検索式ルールに適用し、選別対象の絞り込み方の妥当性を評価し、第一の評価結果を取得する、請求項1記載の特許調査結果評価装置。
The patent search result information is
Have two or more patent search formulas,
The search rule is
A rule having two or more patent search expressions,
The search expression evaluation unit
The patent search according to claim 1, wherein two or more patent search formulas included in the patent search result information are applied to the search formula rule, the validity of a method of narrowing down selection targets is evaluated, and a first evaluation result is acquired. Result evaluation device.
前記検索式評価部は、
前記特許調査結果情報が有する2以上の特許検索式の中に、用語を含まず特許分類を含む特許検索式と、用語と特許分類とを含む特許検索式の両方が存在するか否かを判断し、両方存在しない場合、両方存在する場合と比較して、低い第一の評価結果を取得する、請求項11記載の特許調査結果評価装置。
The search expression evaluation unit
It is determined whether or not there are both a patent search expression including a patent classification that does not include a term and a patent search expression including a term and a patent classification among two or more patent search expressions included in the patent search result information. And the patent search result evaluation apparatus of Claim 11 which acquires a low 1st evaluation result compared with the case where both exist when both do not exist.
特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る関連特許書類格納部と、
特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る非関連特許書類格納部とをさらに具備し、
前記選別ルールは、
非関連特許書類の中の関連特許書類に関するルールであり、
前記選別情報評価部は、
前記1以上の各関連特許書類から1以上の用語を取得し、当該1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、前記1以上の各非関連特許書類から1以上の用語を取得し、当該1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得する特徴ベクトル取得手段と、
前記1以上の関連特許特徴ベクトルと前記1以上の非関連特許特徴ベクトルとを用いて、関連特許のクラスに属するべき非関連特許特徴ベクトルに対応する非関連特許書類を決定する判断手段と、
前記判断手段が決定した1以上の非関連特許書類を前記選別ルールに適用し、第二の評価結果を取得する選別評価結果取得手段とを具備する、請求項1記載の特許調査結果評価装置。
A related patent document storage unit capable of storing one or more related patent documents, which are related patent documents determined to be related as a result of the screening work in the patent search;
A non-related patent document storage unit that can store one or more non-related patent documents that are non-related patent documents determined to be irrelevant as a result of screening in the patent search;
The screening rule is
Rules regarding related patent documents in unrelated patent documents,
The screening information evaluation unit
Obtaining one or more terms from each of the one or more related patent documents, obtaining a related patent feature vector, which is a vector of each related patent document using the one or more terms, for each related patent document; and Features that acquire one or more terms from each of one or more unrelated patent documents, and acquire, for each unrelated patent document, an unrelated patent feature vector that is a vector of each unrelated patent document using the one or more terms Vector acquisition means;
Determining means for determining an unrelated patent document corresponding to an unrelated patent feature vector that should belong to a class of related patents using the one or more related patent feature vectors and the one or more unrelated patent feature vectors;
The patent search result evaluation apparatus according to claim 1, further comprising a selection evaluation result acquisition unit that applies one or more unrelated patent documents determined by the determination unit to the selection rule and acquires a second evaluation result.
特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る関連特許書類格納部と、
特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る非関連特許書類格納部とをさらに具備し、
前記選別ルールは、
関連特許書類の中の非関連特許書類に関するルールであり、
前記選別情報評価部は、
前記1以上の各関連特許書類から1以上の用語を取得し、当該1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、前記1以上の各非関連特許書類から1以上の用語を取得し、当該1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得する特徴ベクトル取得手段と、
前記1以上の関連特許特徴ベクトルと前記1以上の非関連特許特徴ベクトルとを用いて、非関連特許のクラスに属するべき関連特許特徴ベクトルに対応する関連特許書類を決定する判断手段と、
前記判断手段が決定した1以上の関連特許書類を前記選別ルールに適用し、第二の評価結果を取得する選別評価結果取得手段とを具備する、請求項1記載の特許調査結果評価装置。
A related patent document storage unit capable of storing one or more related patent documents, which are related patent documents determined to be related as a result of the screening work in the patent search;
A non-related patent document storage unit that can store one or more non-related patent documents that are non-related patent documents determined to be irrelevant as a result of screening in the patent search;
The screening rule is
Rules regarding unrelated patent documents in related patent documents,
The screening information evaluation unit
Obtaining one or more terms from each of the one or more related patent documents, obtaining a related patent feature vector, which is a vector of each related patent document using the one or more terms, for each related patent document; and Features that acquire one or more terms from each of one or more unrelated patent documents, and acquire, for each unrelated patent document, an unrelated patent feature vector that is a vector of each unrelated patent document using the one or more terms Vector acquisition means;
Determining means for determining a related patent document corresponding to a related patent feature vector to belong to a class of unrelated patents using the one or more related patent feature vectors and the one or more unrelated patent feature vectors;
The patent search result evaluation apparatus according to claim 1, further comprising a selection evaluation result acquisition unit that applies one or more related patent documents determined by the determination unit to the selection rule and acquires a second evaluation result.
1以上の特許検索式と特許の選別の結果に関する選別情報とを有する特許調査結果情報を格納し得る特許調査結果情報格納部と、1以上の特許検索式が不適切であることを判断するためのルールである1以上の検索式ルールを格納し得る検索式ルール格納部と、調査対象の特許の選別作業の妥当性を判断するためのルールである1以上の選別ルールを格納し得る選別ルール格納部と、検索式評価部と、選別情報評価部と、評価構成部と、評価出力部とを用いて処理される特許調査結果評価方法であって、
前記検索式評価部が、前記1以上の特許検索式を前記1以上の検索式ルールに適用し、前記1以上の特許検索式に合致する検索式ルールを決定し、当該合致する1以上の検索式ルールに対応する第一の評価結果を取得する検索式評価ステップと、
前記選別情報評価部が、前記選別情報を前記1以上の選別ルールに適用し、前記に合致する選別ルールを決定し、当該合致する1以上の選別ルールに対応する第二の評価結果を取得する選別情報評価ステップと、
前記評価構成部が、前記第一の評価結果および第二の評価結果を用いて、特許調査結果情報の評価を構成する評価構成ステップと、
前記評価出力部が、前記特許調査結果情報の評価を出力する評価出力ステップとを具備する特許調査結果評価方法。
Patent search result information storage unit capable of storing patent search result information having one or more patent search formulas and selection information related to the results of patent selection, and for determining that one or more patent search formulas are inappropriate Search formula rule storage unit that can store one or more search formula rules, and a selection rule that can store one or more selection rules that are rules for judging the validity of the screening process of the patent to be searched A patent search result evaluation method processed using a storage unit, a search expression evaluation unit, a selection information evaluation unit, an evaluation configuration unit, and an evaluation output unit,
The search expression evaluation unit applies the one or more patent search expressions to the one or more search expression rules, determines a search expression rule that matches the one or more patent search expressions, and the one or more search that matches the search expression rule. A search expression evaluation step for obtaining a first evaluation result corresponding to the expression rule;
The sorting information evaluation unit applies the sorting information to the one or more sorting rules, determines a sorting rule that matches the sorting rules, and acquires a second evaluation result corresponding to the matching one or more sorting rules. Screening information evaluation step;
An evaluation configuration step in which the evaluation configuration unit configures an evaluation of patent search result information using the first evaluation result and the second evaluation result;
A patent search result evaluation method, comprising: an evaluation output step in which the evaluation output unit outputs an evaluation of the patent search result information.
1以上の特許検索式と特許の選別の結果に関する選別情報とを有する特許調査結果情報を格納し得る特許調査結果情報格納部と、
1以上の特許検索式が不適切であることを判断するためのルールである1以上の検索式ルールを格納し得る検索式ルール格納部と、
調査対象の特許の選別作業の妥当性を判断するためのルールである1以上の選別ルールを格納し得る選別ルール格納部とにアクセス可能なコンピュータを、
前記1以上の特許検索式を前記1以上の検索式ルールに適用し、前記1以上の特許検索式に合致する検索式ルールを決定し、当該合致する1以上の検索式ルールに対応する第一の評価結果を取得する検索式評価部、
前記選別情報を前記1以上の選別ルールに適用し、前記に合致する選別ルールを決定し、当該合致する1以上の選別ルールに対応する第二の評価結果を取得する選別情報評価部、
前記第一の評価結果および第二の評価結果を用いて、特許調査結果情報の評価を構成する評価構成部、
前記特許調査結果情報の評価を出力する評価出力部として機能させるためのプログラム。
A patent search result information storage unit capable of storing patent search result information having one or more patent search expressions and selection information related to a result of patent selection;
A search formula rule storage unit that can store one or more search formula rules that are rules for determining that one or more patent search formulas are inappropriate;
A computer that can access a screening rule storage unit that can store one or more screening rules, which are rules for determining the validity of the screening of patents to be searched;
Applying the one or more patent search formulas to the one or more search formula rules, determining a search formula rule that matches the one or more patent search formulas, and corresponding to the one or more search formula rules that match A search expression evaluation unit that obtains the evaluation result of
A sorting information evaluation unit that applies the sorting information to the one or more sorting rules, determines a sorting rule that matches the sorting rule, and obtains a second evaluation result corresponding to the matching one or more sorting rules;
Using the first evaluation result and the second evaluation result, an evaluation component that constitutes an evaluation of patent search result information,
The program for functioning as an evaluation output part which outputs the evaluation of the said patent search result information.
JP2012101298A 2012-04-26 2012-04-26 Patent Search Result Evaluation Device, Patent Search Result Evaluation Method, and Program Active JP5912813B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012101298A JP5912813B2 (en) 2012-04-26 2012-04-26 Patent Search Result Evaluation Device, Patent Search Result Evaluation Method, and Program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012101298A JP5912813B2 (en) 2012-04-26 2012-04-26 Patent Search Result Evaluation Device, Patent Search Result Evaluation Method, and Program

Publications (2)

Publication Number Publication Date
JP2013228933A true JP2013228933A (en) 2013-11-07
JP5912813B2 JP5912813B2 (en) 2016-04-27

Family

ID=49676483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012101298A Active JP5912813B2 (en) 2012-04-26 2012-04-26 Patent Search Result Evaluation Device, Patent Search Result Evaluation Method, and Program

Country Status (1)

Country Link
JP (1) JP5912813B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6457058B1 (en) * 2017-12-06 2019-01-23 株式会社ゴールドアイピー Intellectual property system, intellectual property support method and intellectual property support program
JP2021092834A (en) * 2019-12-06 2021-06-17 キヤノン株式会社 Information processing apparatus, information processing method, and program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07262196A (en) * 1994-03-16 1995-10-13 Fujitsu Ltd Data base retrieval device using knowledge base
WO2006087854A1 (en) * 2004-11-25 2006-08-24 Sharp Kabushiki Kaisha Information classifying device, information classifying method, information classifying program, information classifying system
US20080249785A1 (en) * 2004-05-20 2008-10-09 Isao Kinjou Intellectual Property Creation Assisting Method by Cooperative Intellectual Property Management System, Information Providing System Added with Sub-License Management Function, and Computer Program
JP2009163303A (en) * 2007-12-28 2009-07-23 Mitsubishi Electric Corp Retrieval filtering device and retrieval filtering program
US20120143801A1 (en) * 2009-08-11 2012-06-07 Nec Corporation Information classification device, information classification method, and computer readable recording medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07262196A (en) * 1994-03-16 1995-10-13 Fujitsu Ltd Data base retrieval device using knowledge base
US20080249785A1 (en) * 2004-05-20 2008-10-09 Isao Kinjou Intellectual Property Creation Assisting Method by Cooperative Intellectual Property Management System, Information Providing System Added with Sub-License Management Function, and Computer Program
WO2006087854A1 (en) * 2004-11-25 2006-08-24 Sharp Kabushiki Kaisha Information classifying device, information classifying method, information classifying program, information classifying system
JP2009163303A (en) * 2007-12-28 2009-07-23 Mitsubishi Electric Corp Retrieval filtering device and retrieval filtering program
US20120143801A1 (en) * 2009-08-11 2012-06-07 Nec Corporation Information classification device, information classification method, and computer readable recording medium

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6457058B1 (en) * 2017-12-06 2019-01-23 株式会社ゴールドアイピー Intellectual property system, intellectual property support method and intellectual property support program
JP2019101944A (en) * 2017-12-06 2019-06-24 株式会社AI Samurai Intellectual Property System, Intellectual Property Support Method and Intellectual Property Support Program
JP2021092834A (en) * 2019-12-06 2021-06-17 キヤノン株式会社 Information processing apparatus, information processing method, and program
JP7451157B2 (en) 2019-12-06 2024-03-18 キヤノン株式会社 Information processing device, information processing method, and program

Also Published As

Publication number Publication date
JP5912813B2 (en) 2016-04-27

Similar Documents

Publication Publication Date Title
JP6053131B2 (en) Information processing apparatus, information processing method, and program
US9799040B2 (en) Method and apparatus for computer assisted innovation
EP2866421A1 (en) Method and apparatus for identifying a same user in multiple social networks
CN111324771B (en) Video tag determination method and device, electronic equipment and storage medium
CN104361115B (en) It is a kind of based on the entry Weight Determination clicked jointly and device
US11989239B2 (en) Visual mapping of aggregate causal frameworks for constructs, relationships, and meta-analyses
JP6605022B2 (en) Systems and processes for analyzing, selecting, and capturing sources of unstructured data by experience attributes
CN113724848A (en) Medical resource recommendation method, device, server and medium based on artificial intelligence
US11734322B2 (en) Enhanced intent matching using keyword-based word mover&#39;s distance
US20230040412A1 (en) Multi-language source code search engine
CN112543931A (en) Method, system and storage medium for automatic identification of related compounds in patent literature
US10229194B2 (en) Providing known distribution patterns associated with specific measures and metrics
JP2022035314A (en) Information processing unit and program
JP5912813B2 (en) Patent Search Result Evaluation Device, Patent Search Result Evaluation Method, and Program
Moin et al. Assisting bug triage in large open source projects using approximate string matching
EP3499386A1 (en) Apparatus, program, and method for storing and processing graph data
CN112163415A (en) User intention identification method and device for feedback content and electronic equipment
CN104809236B (en) A kind of age of user sorting technique and system based on microblogging
Rahman et al. Toward optimal selection of information retrieval models for software engineering tasks
JP5971794B2 (en) Patent search support device, patent search support method, and program
JP2012138027A (en) Information retrieval system, retrieval keyword presentation method, and program
US11507593B2 (en) System and method for generating queryeable structured document from an unstructured document using machine learning
Butcher Contract Information Extraction Using Machine Learning
CN107330672A (en) A kind of information processing method based on similarity, device and computing device
JP6712520B2 (en) Search formula presentation system, search formula presentation method, and program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20150316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20150316

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150422

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160324

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160401

R150 Certificate of patent or registration of utility model

Ref document number: 5912813

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250