WO2022153613A1 - データ提供装置、システム、プログラム、方法、データ分析装置、データ管理システム、方法、及び記録媒体 - Google Patents

データ提供装置、システム、プログラム、方法、データ分析装置、データ管理システム、方法、及び記録媒体 Download PDF

Info

Publication number
WO2022153613A1
WO2022153613A1 PCT/JP2021/035544 JP2021035544W WO2022153613A1 WO 2022153613 A1 WO2022153613 A1 WO 2022153613A1 JP 2021035544 W JP2021035544 W JP 2021035544W WO 2022153613 A1 WO2022153613 A1 WO 2022153613A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
data
processing means
validity
vector
Prior art date
Application number
PCT/JP2021/035544
Other languages
English (en)
French (fr)
Inventor
光弘 岡本
Original Assignee
IPDefine株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IPDefine株式会社 filed Critical IPDefine株式会社
Priority to EP21919504.7A priority Critical patent/EP4280151A1/en
Priority to US17/791,178 priority patent/US20240177255A1/en
Priority to CN202180084854.0A priority patent/CN116615723A/zh
Publication of WO2022153613A1 publication Critical patent/WO2022153613A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Definitions

  • the present invention relates to a data providing device, a data analyzing device, a data management system, a data providing system, a data providing program, a recording medium, a data providing method, and a data management method for providing information on the validity of industrial property rights.
  • a patent is one in which the prior art is manually investigated and the patentability is evaluated in examinations, etc. Therefore, there are often omissions in the search for patentability, and the fact is that patents are set and registered in a state where the validity is unclear. Other industrial property rights, such as design rights and trademark rights, are also manually investigated, so as with patents, the validity is unclear.
  • the right holder (right holder) of an industrial property right wants to know the objective validity of the right before filing a proceeding with another company or when deciding whether or not to continue the right.
  • a third party wants to know the validity of the right as well as the existence or nonexistence of the right that may be an obstacle in implementation or use.
  • a third party will need to investigate invalid materials when a warning letter is received from another person.
  • Patent Document 1 The patent validity evaluation device of Patent Document 1 collates a designated patent with a known technique and extracts a known technique having an element matching the element in the patent.
  • Patent Document 1 when the patent validity evaluation device of Patent Document 1 receives the designation of the patent by the user, the process for evaluating the validity of the designated patent is started. Therefore, it becomes necessary to utilize resources such as a processing unit such as a CPU and a memory one by one, and it takes a lot of time to provide information on the validity of an industrial property right to a user. Therefore, there is a demand for a system that suppresses wasteful use of the processing unit and memory and promptly provides information on the validity of industrial property rights.
  • resources such as a processing unit such as a CPU and a memory one by one, and it takes a lot of time to provide information on the validity of an industrial property right to a user. Therefore, there is a demand for a system that suppresses wasteful use of the processing unit and memory and promptly provides information on the validity of industrial property rights.
  • the present invention has been made to solve the above-mentioned problems, and is a data providing device for suppressing wasteful use of a processing unit and memory and promptly providing information on the validity of industrial property rights.
  • the data providing device is constructed based on information related to a plurality of industrial property rights, and is external from a database that manages validity data related to the validity of each of the plurality of industrial property rights. It is provided with a provision processing unit that extracts and provides validity data corresponding to a request, and the validity data includes a rating score indicating relative validity among a plurality of industrial property rights.
  • the data management system includes a data analysis device that estimates the effectiveness of each of the plurality of industrial property rights using information related to the plurality of industrial property rights, and the above-mentioned data providing device.
  • the data analyzer is a translation processing means that generates translation data by performing translation processing that unifies the core data into a common language for the core data contained in each of the information related to multiple industrial property rights collected from the outside. It has a learning processing means for generating an estimation model for obtaining effectiveness data by machine learning using learning data based on translation data.
  • the data analyzer converts one or more claim elements of claims in the subject right of the patent or utility novel to be analyzed into a first vector which is a semantic vector, and also invents or A part or all of the information related to the invention and published before the filing date of the target right is converted into a second vector, which is a semantic vector, for each divided data.
  • the matching degree processing means for obtaining the total matching degree which is the matching degree between the claim element of the claim in the target right and each day-ahead information, and the matching degree processing means were obtained.
  • It has a rating processing means for obtaining an individual score which is an index of the validity of a claim based on each total degree of agreement, and the rating processing means uses individual scores for all target rights and is used between a plurality of target rights. It seeks an overall score that indicates the validity of the relative rights in.
  • the data management system is an individual corresponding to an external request from the above-mentioned data analysis device and a database for managing individual scores and total scores of each of a plurality of target rights obtained by a rating processing means. It has a data providing device that extracts and provides at least one of a score and an overall score.
  • the data providing system includes the above-mentioned data providing device and an information terminal capable of communicating with the data providing device, and the providing processing unit provides screen information including validity data to the information terminal.
  • the information terminal has a display unit that displays information on the screen provided by the data providing device.
  • the data providing system includes the above-mentioned data management system and an information terminal capable of communicating with the data providing device, and the providing processing unit provides screen information including validity data to the information terminal.
  • the information terminal has a display unit that displays information on the screen provided by the data providing device.
  • the data providing program is constructed by constructing a computer mounted on a data providing device based on information related to a plurality of industrial property rights, and each industrial property right for each of the plurality of industrial property rights. It is intended to function as an information processing means that extracts and provides effectiveness data corresponding to external requests from a database that manages effectiveness data including rating scores that indicate relative effectiveness between the two. be.
  • the recording medium is a computer-readable recording medium on which the above data providing program is recorded.
  • the data analysis program unifies the computer mounted on the data analyzer into a common language for the core data included in each of the information related to a plurality of industrial property rights collected from the outside. Relative between each industrial property right for each of multiple industrial property rights by means of translation processing to generate translation data by performing translation processing and machine learning using learning data based on the translation data. It is intended to function as a learning processing means for generating an estimation model for obtaining effectiveness data including a rating score indicating effectiveness.
  • the recording medium is a computer-readable recording medium on which the above data analysis program is recorded.
  • the data providing method is a database constructed based on information related to a plurality of industrial property rights by accepting designation of one or a plurality of industrial property rights from an information terminal via a network. From the database that manages the validity data including the rating score showing the relative validity of each of the multiple industrial property rights among the industrial property rights, the validity data corresponding to the designated industrial property right. Is extracted, and the extracted validity data is provided to the information terminal.
  • the core data included in each of the information related to a plurality of industrial property rights collected from the outside is subjected to a translation process unified into a common language to generate translation data. Then, by machine learning using the learning data based on the generated translation data, the validity data including the rating score showing the relative validity between each industrial property right for each of the multiple industrial property rights is obtained. It is designed to generate an estimation model for the calculation.
  • the validity data corresponding to the external request is extracted from the database constructed in advance, it is not necessary to perform the process for evaluating the validity of the right when the request is received. .. Therefore, wasteful use of the processing unit and the memory can be suppressed, and information on the validity of the industrial property right can be promptly provided.
  • FIG. 1 It is a block diagram which illustrated the data provision system which concerns on Embodiment 1 of this invention, and its peripheral configuration. It is a block diagram exemplifying the functional configuration of the data management system of FIG. It is a block diagram exemplifying the functional configuration of the information terminal of FIG. It is explanatory drawing which schematically exemplifies the initial screen displayed on the information terminal of FIG. It is explanatory drawing which schematically exemplifies the user screen displayed on the information terminal of FIG. It is explanatory drawing which schematically exemplifies the basic screen displayed on the information terminal of FIG. It is explanatory drawing which schematically exemplifies the detailed screen displayed on the information terminal of FIG.
  • FIG. 24 It is a block diagram which illustrates the functional structure of the data analysis apparatus which concerns on modification 1 of Embodiment 1 of this invention. It is explanatory drawing which illustrated the outline of the classification database generated by the collection processing means of FIG. It is a table exemplifying various data corresponding to the claim element of a claim. It is a table exemplifying the total degree of agreement between each claim element and a plurality of invention-related information required by the evaluation processing means of FIG. 20. It is a table exemplifying the total degree of agreement between the claim element of a certain claim and a plurality of invention-related information required by the evaluation processing means of FIG. 20. It is explanatory drawing which arranged each total degree of agreement of FIG. 24 according to whether or not the agreement flag is set.
  • FIG. 5 is an explanatory diagram schematically illustrating a detailed screen displayed on an information terminal in the data providing system according to the second embodiment of the present invention.
  • the data providing system 100 includes a data management system 10 and one or more information terminals 40.
  • the data management system 10 collects information related to a plurality of industrial property rights from the information providing server group 500, and performs arithmetic processing for obtaining the validity of each of the plurality of industrial property rights, thereby performing various significant operations. It seeks and manages information.
  • the industrial property right is a patent right, a utility model right, a design right, and a trademark right among the intellectual property rights.
  • the industrial property right is associated with information on the progress of the application and information indicating the content of examination and the like.
  • the information indicating the content of the examination or the like includes, for example, a search report of a search company and information indicating a search process or examination by an examiner or the like. That is, the information related to the industrial property right is the above-mentioned information linked to the industrial property right.
  • the information related to the industrial property right is also referred to as "right-related information", and the industrial property right is also simply referred to as "right”.
  • the industrial property right is a patent right, a utility model right, a design right, and a trademark right among the intellectual property rights.
  • the industrial property right is associated with information on the progress of the application and information indicating the content of examination and the like.
  • the information indicating the content of the examination or the like includes, for example, a search report of a search company and information indicating a search process or examination by an examiner or the like.
  • the information related to the industrial property right includes the above-mentioned information linked to the industrial property right, as well as information such as various technical papers / technical reports and SNS (social networking service). Among them, those that can be acquired via network N and are related to industrial property rights are included.
  • the information related to the industrial property right is also referred to as "right-related information”
  • the industrial property right is also simply referred to as "right”.
  • the data management system 10 includes a data analysis device 20 and a data providing device 30.
  • the data analysis device 20, the data providing device 30, the information terminal 40, the information providing server group 500, and the payment server 600 are communicably connected via a network N such as the Internet.
  • the information providing server group 500 is, for example, a server in each country in the world that provides rights-related information through API (Application Programming Interface).
  • right-related information which is one data set, is associated with one right.
  • the payment server 600 is a server operated by a payment agency for credit cards and electronic money, and a plurality of payment servers 600 are usually connected to the network N.
  • the data providing device 30 executes the payment processing of the user of the information terminal 40 by communicating with the payment server 600 corresponding to the payment method specified by the information terminal 40.
  • the data analysis device 20 analyzes the validity of each right based on a plurality of rights-related information collected from the information providing server group 500, and analyzes the analysis result and the information used as the basis for deriving the analysis result. , It is stored in association with the right related to analysis.
  • the data analysis device 20 is composed of a cloud server based on cloud computing, a physical server, or a system combining these.
  • the data providing device 30 is constructed based on a plurality of rights-related information, and extracts information such as validity data corresponding to an external request from a database 5a that manages validity data related to the validity of each right. And provide it.
  • the "providing" of information is to give access authority to a part or all of the information in the database 5a in the providing database unit 35.
  • the data providing device 30 provides public information to the information terminal 40 that has requested access, and part or all of the non-public information to the information terminal 40 of the user who has paid a predetermined fee.
  • the public information is information that is open to the public to the user regardless of the payment of the fee.
  • Non-public information is information provided to users who have made purchases on a company-by-company, period-by-time, or rights-by-right basis, or who have taken steps to lift disclosure restrictions such as upgrading. ..
  • the data providing device 30 is composed of a cloud server based on cloud computing, a physical server, or a system combining these.
  • the data providing system 100 may adopt a configuration in which the information purchased by the user is downloaded to the information terminal 40. At that time, the data providing device 30 may add a time stamp by using a hash function. Further, the information purchased by the user in the data providing system 100 may be provided as a data file such as an XLS file of MICROSOFT EXCEL (registered trademark), a CSV (Comma-Separated Values) file, or a text file, and is printed on a paper medium. It may be provided out.
  • a data file such as an XLS file of MICROSOFT EXCEL (registered trademark), a CSV (Comma-Separated Values) file, or a text file, and is printed on a paper medium. It may be provided out.
  • the information terminal 40 communicates with the data providing device 30 in response to the user's request, acquires information such as validity data, and provides it to the user.
  • the information terminal 40 accesses or logs in to the website provided by the data providing device 30 according to the operation of the user, displays various information in the website, and displays the information associated with the right. Performs processing related to transactions, etc.
  • the data analysis device 20 includes a communication unit 21, an analysis processing unit 22, a storage unit 23, a collection database unit 24, and an output database unit 25.
  • the communication unit 21 is an interface for the analysis processing unit 22 to perform wired or wireless communication with a device or the like connected to the network N.
  • the storage unit 23 stores various data related to generation, update, and management of validity data and the like, in addition to the operation program of the analysis processing unit 22 such as the data analysis program P1. Further, the storage unit 23 stores the estimation model M1 generated by machine learning using the learning data.
  • the storage unit 23 can be configured by a RAM (RandomAccessMemory) and a ROM (ReadOnlyMemory), a PROM (ProgrammableROM) such as a flash memory, an SSD (SolidStateDrive), an HDD (HardDiskDrive), or the like. ..
  • the collection database unit 24 is a storage device that stores rights-related information and the like collected by the analysis processing unit 22.
  • the collection database unit 24 is composed of a RAM, a ROM, a PROM such as a flash memory, an SSD, an HDD, or the like.
  • the output database unit 25 is a storage device that stores a database in which information such as validity data is organized for each right.
  • the output database unit 25 is composed of a RAM, a ROM, a PROM such as a flash memory, an SSD, an HDD, or the like.
  • the analysis processing unit 22 generates the estimation model M1 using the rights-related information which is a data set collected from the outside.
  • the rights-related information includes core data required for generating the estimation model M1 and auxiliary data which is auxiliary or incidental data. If the industrial property right is a patent right, the core data includes claim information, a notice of reasons for refusal, a search report of a search company, and the like.
  • the analysis processing unit 22 generates information such as validity data using the core data and the estimation model M1, and constructs a database in the output database unit 25 by organizing the information such as validity data for each right. It is a thing.
  • the analysis processing unit 22 uses the core data included in the rights-related information as the learning target data in the learning phase, and uses the core data included in the rights-related information as the analysis target data in the estimation phase.
  • the analysis processing unit 22 has a collection processing means 22a, an evaluation processing means 22b, and a construction processing means 22c.
  • the collection processing means 22a periodically collects rights-related information through API or the like.
  • the collection processing means 22a collects data such as patent documents, design publications, trademark publications, and non-patent documents all over the world. Non-patent documents include information on various technical papers / technical reports, technical standards, websites of companies / research institutes / universities, articles / catalogs on the Web, blogs, SNS, YouTube (registered trademark), etc. , Not limited to those cited in the notice of reasons for refusal.
  • the data collected by the collection processing means 22a includes a plurality of rights-related information.
  • the collection processing means 22a has a function of normalizing a part or all of various data including a plurality of collected rights-related information by organizing information delimiters and preparing a file format. There is.
  • the evaluation processing means 22b evaluates matters related to the validity of industrial property rights.
  • the evaluation processing means 22b may use data other than the rights-related information collected by the collection processing means 22a as the learning target data or the analysis target data.
  • the evaluation processing means 22b includes a translation processing means 121, a pre-processing means 122, a learning processing means 123, and an estimation processing means 124.
  • the translation processing means 121 unifies the learning target data or the analysis target data into a preset common language.
  • target data when the learning target data and the analysis target data are used without distinction, they are collectively referred to as “target data”.
  • the translation processing means 121 extracts the target data for each right-related information, and if the extracted target data is composed of a language other than the common language, the translation processing means 121 translates the target data into a common language to generate translation data. do. Even if the target data includes a common language, the translation processing means 121 performs translation processing on the target data to generate translation data if a part of the target data includes a language other than the common language. On the other hand, the translation processing means 121 does not perform any processing on the target data if the entire target data extracted from the rights-related information is composed of a common language.
  • learning translation data the learning target data unified in the common language
  • analysis translation data the analysis target data unified in the common language
  • translation data these will be collectively referred to as "translation data”.
  • English is adopted as the common language, but other languages may be adopted as the common language.
  • the preprocessing means 122 generates learning data to be used for training the estimation model M1 by performing analysis processing on the learning translation data.
  • the preprocessing means 122 performs analysis processing on the analysis translation data to generate analysis data to be input to the estimation model M1 in order to estimate the rating of the right.
  • the preprocessing means 122 has a text analysis function that performs natural language processing such as morphological analysis on the translated data. Morphological analysis is to divide translation data written in natural language into morphemes, which are the smallest units in the language (separate writing), and determine the part of speech and changes of each morpheme. That is, the preprocessing means 122 generates learning data and analysis data by adding part-speech information such as verbs, nouns, and adjectives to each of the morphemes divided from the translation data and converting them into a distributed expression. , The generated learning data and analysis data are stored in the storage unit 23. The preprocessing means 122 may extract key information that is a key to machine learning when performing conversion processing on each of the morphemes, and further performs processing such as weighting on the extracted key information. May be good.
  • the preprocessing means 122 decomposes the translation data related to the claim to generate learning data and analysis data, and the learning processing means 123 uses the learning data to make an estimation model.
  • M1 may be generated and updated.
  • the estimation model M1 becomes a trained model that accurately extracts technical information including words that match or approximate each of the decomposed words.
  • the learning processing means 123 generates / updates the estimation model M1 by using information obtained by combining the wording subdivided by decomposition from the translation data related to the claim and the technical information extracted by the estimation processing means 124 as teacher data. Processing may be performed.
  • the preprocessing means 122 may generate a phrase pattern in which words are combined, and may associate technical information with each generated phrase pattern. Then, the learning processing means 123 may perform the generation / update processing of the estimation model M1 by using the information obtained by combining the phrase pattern and the technical information as the teacher data. As a result, the estimation model M1 becomes a learned model that accurately performs processing such as extraction of phrase patterns related to technical information or extraction of technical information related to phrase patterns.
  • the preprocessing means 122 may generate learning data or analysis data by a relatively simple analysis process such as deleting unnecessary data from the translated data.
  • Unnecessary data is, for example, numerical values, line breaks, symbols, and other characters that are less important for training the estimation model M1 and for operations using the model.
  • the preprocessing means 122 may have an image analysis function of performing analysis processing on the image data included in the core data to generate learning data or analysis data.
  • the preprocessing means 122 performs image analysis processing on, for example, information on the drawing of the design as image data, information on the trademark logo, information on the characters of the trademark, and the like.
  • the similarity of drawings can be used as a material for judging the validity of the rights. That is, the preprocessing means 122 may have both a text analysis function and an image analysis function, and may have either a text analysis function or an image analysis function.
  • the learning processing means 123 generates the estimation model M1 by machine learning based on the learning data.
  • the estimation model M1 is a trained model for outputting validity data regarding the validity of rights.
  • the validity data in the first embodiment includes a rating score indicating a rating that is an index of the validity of the right, and information that is the basis for generating the rating score.
  • the rating score is information that quantifies or encodes the validity of a right and is an index of the validity of the right.
  • the rating score of the first embodiment shows the relative effectiveness of each of the plurality of industrial property rights among the industrial property rights.
  • the estimation model M1 is configured to output at least one of an individual score, which is an index of the validity of claims in the claims, and an overall score, which is an index of the validity of industrial property rights, as a rating score. ..
  • the validity data may include pension cost information indicating high cost performance for maintaining rights. If the industrial property right is a patent right, the validity data includes technical information related to the validity of the patent right. Hereinafter, the technical information related to the validity of the patent right is also simply referred to as "technical information". The technical information includes the technical information on which the rating score is derived, and the patent invalidation material. When the industrial property right is a patent right or a design right, the validity data may include the patent right, the utility model right, or the ESG score which is an index value in which the design right is evaluated from the viewpoint of ESG.
  • the validity data includes the preceding trademark data which is the information of the preceding trademark whose similarity with the trademark related to the trademark right is equal to or higher than a preset threshold.
  • Prior trademark includes not only the prior registered trademark but also the prior application trademark.
  • the industrial property right is a design right
  • the validity data includes publicly known design data which is information on a publicly known design whose similarity with the design related to the industrial right is equal to or higher than a preset threshold value.
  • the collection processing means 22a collects the rights-related information of each country in the world sequentially or at a predetermined timing from the information providing server group 500, and stores the collected rights-related information in the storage unit 23 or the collection database unit 24.
  • the translation processing means 121 sequentially or at a predetermined timing, performs translation processing on the core data of the rights-related information added to the storage unit 23 and the like to generate translation data, and stores the generated translation data in the storage unit 23 and the like. Let me.
  • the preprocessing means 122 performs the above analysis processing on the translated data sequentially or at a predetermined timing to generate learning data, and stores the generated analysis data in a storage unit 23 or the like.
  • the learning processing means 123 appropriately tunes the parameters of the estimation model M1 and the like using the learning data newly accumulated in the storage unit 23 and the like at the set timing, and executes the update processing of the estimation model M1. ..
  • the learning processing means 123 may execute the update processing of the estimation model M1 every arbitrary update period such as every day or every week in cooperation with each of the above means.
  • the learning processing means 123 generates the estimation model M1 by supervised learning using DNN (Deep Neural Network).
  • the learning processing means 123 may generate the estimation model M1 by unsupervised learning or semi-supervised learning.
  • the learning processing means 123 may generate the estimation model M1 by machine learning using GBDT (Gradient Boosting Decision Tree).
  • the learning processing means 123 may generate the estimation model M1 by machine learning using the character level CNN.
  • the learning processing means 123 may generate the estimation model M1 by a regression method such as linear regression, logistic regression, or decision tree.
  • the learning processing means 123 may generate the estimation model M1 by a classification method such as a random forest or a support vector machine.
  • the learning processing means 123 may generate the estimation model M1 by a method combining the above-mentioned plurality of machine learning.
  • the estimation processing means 124 uses the analysis data as an input of the estimation model M1 to obtain information such as effectiveness data corresponding to the analysis data.
  • the estimation processing means 124 obtains validity data indicating the relative effectiveness of each of the plurality of industrial property rights among the industrial property rights. For example, the estimation processing means 124 obtains a relative rating score among the industrial property rights for each of the plurality of industrial property rights.
  • the estimation processing means 124 sequentially stores information such as effectiveness data obtained by the estimation model M1 in the storage unit 23 or the like.
  • the estimation processing means 124 associates the obtained information such as the validity data with the right-related information which is the original data of the analysis data used as the input of the estimation model M1 and associates it with the storage unit 23 or the output database unit 25. To memorize.
  • the estimation processing means 124 provides a rating score and an ESG score according to each period such as the entire period, the first period, the second period, the third period, and the user-designated period, which will be described later, as information other than the validity data. , Pension cost information, etc. can be requested.
  • a part or all of the information stored in the output database unit 25 and the provision database unit 35, such as the information required by the estimation processing means 124, is to be sold or provided to the user. Therefore, from now on, among the information stored in the output database unit 25 and the provision database unit 35 such as the validity data, the information to be sold or provided to the user is a product related to the industrial property right, or simply. Also called a "product".
  • the price of a product is, for example, the unit price of information on one right multiplied by the number of rights. However, the unit price may be changed for each jurisdiction, or the unit price may be changed according to the rating score or the like.
  • the construction processing means 22c constructs a database in the output database unit 25 based on the information stored in the storage unit 23 and the collection database unit 24.
  • the information stored in the storage unit 23 also includes information stored by the collection processing means 22a, the translation processing means 121, the preprocessing means 122, the learning processing means 123, and the estimation processing means 124.
  • the database in the output database unit 25 is an account table, a right holder table (company table, etc.), a person table (inventor table, etc.), a right table (patent table, design table, trademark table, etc.). ), Statistical table, and financial table.
  • the account table includes email address, ID, password, purchase history, activity log, personal information, etc. for each user.
  • Personal information includes nationality, corporate name, address, name, contact information, telephone number, and the like.
  • the right holder table includes basic information, related person information, history information, score information such as rating score / ESG score, statistical information, etc. for each right holder.
  • Related person information includes information such as the right holder, the inventor, and the agent.
  • the history information includes information such as an application date, an application date for various procedures, a registration date, and a dispute date and time.
  • the statistical information includes a history of score information organized in chronological order.
  • the person table includes basic information, history information, score information, statistical information, etc. for each person such as the inventor.
  • the rights table contains basic information, history information, score information, statistical information, translation data, related information, etc. for all rights.
  • the rights table includes at least one of a patent table for managing patent rights, a draft table for managing utility model rights, a design table for managing design rights, and a trademark table for managing trademark rights.
  • the related information in the patent table includes information on similar techniques, invalidation materials, and the like.
  • the statistical table includes ranking information such as the number of rights acquired for each right holder, rating score, and ESG score, and ranking information such as rating score and ESG score for each right.
  • the statistical table also contains IP (intellectual property) landscape information regarding the future outlook for each right.
  • IP landscape information includes pension cost information indicating high cost performance for maintaining rights.
  • the financial table contains information related to settlement.
  • the analysis processing unit 22 may be configured by an arithmetic unit such as a CPU (Central Processing Unit) or a GPU (Graphics Processing Unit) and a data analysis program P1 that realizes the above-mentioned various functions in cooperation with such an arithmetic unit.
  • the data analysis program P1 is a program for causing the analysis processing unit 22 and the storage unit 23 as computers to function as the collection processing means 22a, the evaluation processing means 22b, and the construction processing means 22c.
  • the data providing device 30 includes a communication unit 31, a providing processing unit 32, a storage unit 33, and a providing database unit 35.
  • the communication unit 31 is an interface for the provision processing unit 32 to perform wired or wireless communication with a device or the like connected to the network N.
  • the storage unit 33 stores various data related to the provision of validity data and the like, in addition to the operation program of the provision processing unit 32 such as the data provision program P2.
  • the storage unit 23 can be composed of a RAM and a ROM, a PROM such as a flash memory, an SSD, an HDD, or the like.
  • the providing processing unit 32 provides the information in the providing database unit 35 to the information terminal 40 in response to a request from the information terminal 40.
  • the provision processing unit 32 extracts and provides the validity data corresponding to the external request from the database 5a, which is constructed based on a plurality of rights-related information and includes the validity data related to the validity of each right.
  • the information processing means 32a is provided.
  • the information processing means 32a executes synchronous processing between the output database unit 25 and the provision database unit 35.
  • the database 5a in the providing database unit 35 includes an account table, a right holder table, a person table, a rights table, a statistical table, and a financial table, like the database in the output database unit 25. It is composed of. Further, the information processing means 32a has a function of optimizing the database 5a.
  • the information processing means 32a When one or more rights are specified in the information terminal 40, the information processing means 32a provides the information terminal 40 with validity data corresponding to the rights. When the information processing means 32a specifies an arrangement method based on the rating score together with a plurality of industrial property rights in the information terminal 40, the information processing means 32a organizes and provides the validity data corresponding to each industrial property right according to the specified arrangement method. Is what you do.
  • the information processing means 32a When the right holder and the period are specified in the information terminal 40, the information processing means 32a provides the information terminal 40 with validity data corresponding to the rights of the right holder within the period.
  • the information terminal 40 when the information terminal 40 is specified to be arranged based on the rating score together with the right holder and the period, and a plurality of industrial property rights are included in the period, each industry of the right holder within the period. Validity data corresponding to each property right is organized and provided in a specified arrangement.
  • the information processing means 32a When at least one of the rating scores is designated together with the right holder and the period in the information terminal 40, the information processing means 32a is an industrial property right to which the designated rating score is given within the period of the right holder. It provides effectiveness data corresponding to. When at least one of the rating scores is designated together with the right holder in the information terminal 40, the information processing means 32a provides information on one or more industrial property rights to which the designated rating score is given by the right holder. May be provided in a selectable manner.
  • the information processing means 32a transmits the first original data in which the rights of the right holder in the first period are arranged for each second period shorter than the first period to the information terminal 40. It may be provided. Further, when the second period is specified in the information terminal 40, the information processing means 32a provides information on the second source data in which the rights of the right holder in the second period are arranged for each third period shorter than the second period. It may be provided to the terminal 40. Then, when the information processing means 32a specifies the third period in the information terminal 40, the information processing means 32a may provide the information terminal 40 with validity data corresponding to the rights in the third period.
  • the first source data should include the rating score for the entire second period.
  • the first source data may include at least one of the ESG score and pension cost information for the entire second period.
  • the second source data may include the rating score for the entire third period.
  • the second source data may include at least one of the ESG score and pension cost information for the entire third period.
  • the information processing means 32a When the inventor is designated by the information terminal 40, the information processing means 32a provides the information terminal 40 with information on the evaluation index of the inventor.
  • the information processing means 32a has a function of rearranging each technical information in the database 5a in descending order of the degree of relevance to the patent right related to the validity data for the validity data including a plurality of technical information.
  • the information processing means 32a has a function of rearranging each prior trademark data in the database 5a in descending order of similarity with the trademark related to the validity data for the validity data including a plurality of prior trademark data.
  • the information processing means 32a has a function of rearranging each known design data in the database 5a in descending order of similarity with the design related to the validity data for the validity data including a plurality of known design data.
  • the providing processing unit 32 can be configured by an arithmetic unit such as a CPU or GPU and a data providing program P2 that realizes the above-mentioned various functions in cooperation with such an arithmetic unit. That is, the data providing program P2 is a program for causing the providing processing unit 32 and the storage unit 33 as a computer to function as the information processing means 32a.
  • the provision database unit 35 is a storage device that stores a database 5a in which information such as validity data is organized for each right.
  • the database 5a in the provision database unit 35 is obtained by subjecting the database in the output database unit 25 to a predetermined process such as optimization.
  • the database 5a may be the same as the database in the output database unit 25.
  • the providing database unit 35 is composed of a RAM, a ROM, a PROM such as a flash memory, an SSD, an HDD, or the like.
  • the collection processing means 22a collects rights-related information from each country in the world sequentially or at a predetermined timing from the information providing server group 500, and stores the collected rights-related information in the storage unit 23 or the collection database unit 24. Specifically, the collection processing means 22a changes the difference in the rights-related information of each country in the world, that is, the information increased from the time of the previous collection of the rights-related information of each country in the world, and the information changed after the previous collection.
  • the stored information is stored in the storage unit 23 or the like.
  • the evaluation processing means 22b additionally obtains or updates information such as effectiveness data by using the above difference.
  • the construction processing means 22c updates the database of the output database unit 25 based on the information such as the validity data added or updated by the evaluation processing means 22b.
  • the information processing means 32a updates the database 5a based on the database of the output database unit 25.
  • the information terminal 40 includes a terminal communication unit 41, a terminal processing unit 42, a terminal storage unit 43, a terminal input unit 46, and a terminal display unit 47.
  • the terminal communication unit 41 is an interface for the terminal processing unit 42 to perform wired or wireless communication with a device or the like connected to the network N.
  • the terminal storage unit 43 stores various information in addition to the operation program of the terminal processing unit 42.
  • the terminal storage unit 43 is composed of a RAM, a ROM, a PROM such as a flash memory, an SSD, an HDD, or the like.
  • the terminal processing unit 42 displays characters, images, and the like on the terminal display unit 47 when a request for displaying or switching data is received via the terminal input unit 46, or when information is provided from the data providing device 30. Or switch a part or all of the display information of the terminal display unit 47.
  • the terminal processing unit 42 can be configured by an arithmetic unit such as a CPU or GPU and an operation program that cooperates with such an arithmetic unit to realize the above-mentioned various functions.
  • the terminal input unit 46 includes, for example, a keyboard and a pointing device such as a mouse or a trackball.
  • the terminal input unit 46 receives an input operation by the user and transmits an operation signal corresponding to the received input operation to the terminal processing unit 42.
  • the terminal display unit 47 is composed of, for example, a liquid crystal display (LCD), and displays various information according to instructions from the terminal processing unit 42.
  • the information terminal 40 is a touch panel that includes a display panel that displays characters or images instead of the terminal input unit 46 and the terminal display unit 47, and a detection means that is laminated on the display panel to detect a touch operation. May have. However, the information terminal 40 may have a touch panel and a mouse, a keyboard, or the like.
  • the information terminal 40 may have a notification unit for notifying sound or voice, a light emitting unit including a light emitting element, and the like.
  • the initial screen G1 illustrated in FIG. 4 has a login button L, a registration button X, a search unit A, and a ranking instruction unit B.
  • the registration button X is a virtual button that displays a registration screen (not shown) for registering user information according to a user operation.
  • the login button L is a virtual button for displaying a login screen (not shown) according to a user operation. That is, the terminal processing unit 42 has a function of displaying the registration screen and the login screen on the terminal display unit 47 in cooperation with the data providing device 30 and accepting operations related to user registration and login.
  • the search unit A has an input field A1 and a search button A2.
  • the input field A1 is a field for inputting characters or the like via a keyboard or the like.
  • An organization name such as a company name or an individual name is input in the input field A1.
  • the search button A2 is a virtual button for requesting the data providing device 30 to search for the information input in the input field A1.
  • FIG. 4 illustrates a search unit 47a in which "company name" is displayed as a character indicating an input target, but the present invention is not limited to this, and the search unit 47a is provided with "company name” instead of "company name”. "Right holder” etc. may be displayed.
  • the ranking instruction unit B is composed of one or a plurality of virtual buttons for changing the screen or displaying a sub-window according to the user's operation.
  • the ranking instruction unit B has a rating button B1 for displaying a rating screen (not shown) showing the ranking of the rating score of the right holder, and an ESG score (Environment) and a society (Social) of the right holder. ),
  • An example including an ESG button B2 for displaying an ESG screen (FIG. 15 or the like described later) showing a ranking of governance) is shown. That is, the terminal processing unit 42 has a function of displaying the rating screen and the ESG screen on the terminal display unit 47 in cooperation with the data providing device 30.
  • the terminal processing unit 42 causes the terminal display unit 47 to display the user screen G2 as shown in FIG. 5, for example, in cooperation with the data providing device 30.
  • the user screen G2 has a search unit A and a ranking instruction unit B.
  • the user screen G2 has a user name display unit U and a logout button Y. Information indicating the logged-in user is displayed on the user name display unit U.
  • the logout button Y is a virtual button for the user to log out.
  • the user screen G2 has a calling unit Z1 for calling a purchased product.
  • FIG. 5 illustrates a calling unit Z1 which is a drop-down type or combo box type UI (User Interface). That is, the calling unit Z1 of FIG. 5 has a display field Za on which a product selected by the user or an input product is displayed, an expansion button Zb for displaying a list of right holders or rights, and a right holder or right. It has a list unit Zc and a list unit Zc showing a list of.
  • the calling unit Z1 may be in a mode in which a list of rights is displayed in a selectable manner when a mouse cursor or the like is placed on the list unit Zc.
  • the mode of the calling unit Z1 is not limited to the example of FIG.
  • the calling unit Z1 may have a mode in which a list of purchased products is displayed on the list unit Zc.
  • the calling unit Z1 may have a function of sequentially selecting the right holder and the right.
  • the calling unit Z1 may be a mode in which the right holder, the product, the right, or the like is simply displayed in a list instead of the drop-down type or the like.
  • the user screen G2 illustrated in FIG. 5 has a dashboard unit C.
  • the dashboard unit C is configured to include information that visualizes various data such as graphs and tables.
  • the terminal processing unit 42 may display information suitable for the preference of the logged-in user on the dashboard unit C in cooperation with the data providing device 30.
  • the user screen G2 illustrated in FIG. 5 has a notification column J1 in which information generated based on the user's personal information, search history, purchase history, and the like is displayed.
  • the terminal processing unit 42 and the data providing device 30 For example, the basic screen G3 as shown in FIG. 6 is displayed on the terminal display unit 47 by the cooperation of.
  • the basic screen G3 is configured to include the first data K1 in which the number of registered rights in the first period of the right holder is arranged for each second period shorter than the first period.
  • the first data K1 is information to be displayed by the terminal processing unit 42 based on the first original data.
  • the first data K1 illustrated in FIG. 6 has a bar graph with the year on the horizontal axis and the number of registrations on the vertical axis.
  • FIG. 6 shows an example in which the period (the entire period) from the year in which the right holder first acquired the right to the present is adopted as the first period.
  • the first period is not limited to the entire period, and may be any preset period.
  • FIG. 6 shows an example in which the second period is one year, but the second period is not limited to this, and the second period may be an arbitrary period set in advance.
  • the first data K1 of the first embodiment has a first rating unit D1 indicating a rating score for each second period.
  • the terminal processing unit 42 may indicate an estimated value of the final number of registrations in the second period as shown by a broken line in FIG.
  • the terminal processing unit 42 accepts selection and designation of one or a plurality of second periods via the terminal input unit 46.
  • FIG. 6 shows an example in which 2012 was selected as the second period.
  • the method of designating the second period and the display mode of the designated second period are not limited to the example of FIG. 6, and can be changed as appropriate.
  • the basic screen G3 of FIG. 6 has a designation button E1 for accepting designation of one or a plurality of second periods.
  • the terminal processing unit 42 When one or a plurality of second periods are selected on the basic screen G3 as shown in FIG. 6 and designated by pressing the designation button E1, the terminal processing unit 42 cooperates with the data providing device 30, for example, FIG.
  • the detailed screen G4 such as the above is displayed on the terminal display unit 47.
  • the detail screen G4 is configured to include the second data K2 in which the number of registered rights in the second period of the right holder is arranged for each third period shorter than the second period.
  • the second data K2 is information to be displayed by the terminal processing unit 42 based on the second source data.
  • the second data K2 illustrated in FIG. 7 has a bar graph with the month on the horizontal axis and the number of registrations on the vertical axis.
  • FIG. 7 shows an example in which the second period corresponds to FIG. 6 and is set to one year, and the third period is set to one month.
  • the third period is not limited to one month, and may be any preset period.
  • the second data K2 of the first embodiment has a second rating unit D2 showing the rating score for each third period.
  • the terminal processing unit 42 accepts selection and designation of one or a plurality of second periods via the terminal input unit 46.
  • FIG. 7 shows an example in which June is designated as the second period.
  • the method of designating the third period and the display mode of the designated third period are not limited to the example of FIG. 7, and can be changed as appropriate.
  • the detailed screen G4 of FIG. 7 has a confirmation button E2 for accepting the designation of one or a plurality of third periods.
  • the terminal processing unit 42 cooperates with the data providing device 30.
  • the purchase screen Gx as shown in FIG. 8 is displayed on the terminal display unit 47.
  • the purchase screen Gx has a content column P indicating the content of the information to be purchased and an amount column Q indicating the purchase amount.
  • the purchase screen Gx has a purchase button E3 for making a payment.
  • the purchase screen Gx may have a payment method unit H indicating one or more payment methods.
  • the terminal processing unit 42 displays the list screen G5 as shown in FIG. 9 in cooperation with the data providing device 30. You may.
  • the list screen G5 illustrated in FIG. 9 has a period display unit T indicating a period selected by the user. Further, the list screen G5 has a list display unit K3 configured including a combination of the selection box S1 and the right number column S2.
  • the list display unit K3 is for selecting or canceling the rights described in the right number column S2 by the user moving the cursor to the selection box S1 and clicking the mouse.
  • FIG. 9 shows an example in which the list display unit K3 includes a remarks column S3 for displaying supplementary information regarding rights.
  • the terminal processing unit 42 may display the list display unit K3 in a scroll format or the like.
  • the terminal processing unit 42 may shift from the basic screen G3 to the list screen G5.
  • the user screen G2 may have a period designation field K4 for designating a period as shown in FIG.
  • the terminal processing unit 42 cooperates with the data providing device 30.
  • the list screen G5 may be displayed on the terminal display unit 47.
  • the terminal processing unit 42 may display the basic screen G3 or the detailed screen G4 whose graphs and the like are adjusted according to the length of the designated period on the terminal display unit 47.
  • the data providing device 30 may have at least one of a subscription function and a sequential purchase function.
  • the subscription function is a function of providing products to users who have applied for subscription at arbitrary periods such as one week, ten days, one month, six months, and one year.
  • the sequential purchase function is a timing in which an industrial property right is registered for a user who has applied for a sequential purchase, and validity data or the like corresponding to the industrial property right is stored in the database 5a. It is a function to be provided.
  • the right holder screen G6 illustrated in FIG. 11 has a comprehensive evaluation unit Lo, an individual evaluation unit L1, and a sort instruction unit L2.
  • the comprehensive evaluation unit Lo is a place where the comprehensive evaluation of all rights by the right holder is displayed.
  • FIG. 11 shows an example in which the rating score of the right holder, the ESG score, and the pension cost information are displayed in the comprehensive evaluation unit Lo and the individual evaluation unit L1.
  • the pension cost information is expressed as pension cost performance.
  • the sort instruction unit L2 has a virtual button associated with each item of the individual evaluation unit L1.
  • the sort instruction unit L2 has a rating priority key La for sorting the individual evaluation unit L1 in descending order of rating score, an ESG priority key Lb for sorting the individual evaluation unit L1 in descending order of ESG score, and a pension cost. It has a pension priority key Lc for sorting the individual evaluation units L1 in descending order of information.
  • FIG. 11 shows an example in which the individual evaluation unit L1 is sorted in descending order of rating score.
  • the terminal processing unit 42 cooperates with the data providing device 30 to show the figure.
  • the right screen G7 such as 12 is displayed on the terminal display unit 47.
  • the terminal processing unit 42 does not go through the right holder screen G6 as shown in FIG.
  • the right screen G7 such as the above is displayed on the terminal display unit 47.
  • the right screen G7 illustrated in FIG. 12 has a publication button L3, a list unit L4, a material unit L5, a progress information unit L6, and an inventor information unit L7.
  • the publication button L3 is a virtual button for displaying a publication indicating the content of the right.
  • the list unit L4 is a portion indicating the score of the right as in the individual evaluation unit L1.
  • the reference part L5 is a part showing information on the literature related to the calculation of the rating score.
  • the progress information unit L6 is a part that shows progress information regarding acquisition and maintenance of rights.
  • the inventor information unit L7 is a part showing information on the inventor of the invention according to the patent right.
  • the terminal processing unit 42 cooperates with the data providing device 30, for example, the right holder screen as shown in FIG. G6 may be displayed on the terminal display unit 47.
  • the right holder screen G6 of FIG. 13 has a publication section Q1, a detailed list section Q2, and a selection section Q3.
  • the gazette section Q1 functions as a virtual button for displaying a gazette indicating the content of the right, and displays the detailed list section Q2 by moving the mouse cursor over it.
  • the selection unit Q3 is for causing the detail list unit Q2 to select a score to be preferentially displayed.
  • FIG. 13 illustrates the selection unit Q3, which is a drop-down UI.
  • the selection unit Q3 shows a display field Qa in which the score selected by the user is displayed, an expansion button Qb for displaying a list of scores to be displayed in the detail list unit Q2, and a list of scores. It has a list unit Qc and.
  • the detailed list unit Q2 includes a score unit Qx that displays the score selected by the selection unit Q3, a reference list unit Qy that shows a list of related documents, and a relevance display unit Qz that shows the degree of relevance between the right and the related documents. And have.
  • the terminal processing unit 42 may display the user screen G2 as shown in FIG. 14, for example, on the terminal display unit 47 in cooperation with the data providing device 30.
  • the user screen G2 illustrated in FIG. 14 has a narrowing down unit Az composed of an input field A1, a search button A2, a score designating unit Z2, an order designating unit Z3, and a number number unit Zo.
  • the score designation unit Z2 is for selecting one of the rating score, the ESG score, the pension cost information, and the like, and has a display field Zd, an expansion button Ze, and a list unit Zf.
  • the expansion button Ze is a virtual button for displaying the list unit Zf
  • the list unit Zf displays information for the user to select in conjunction with the operation of the expansion button Ze. In the display column Zd, characters and the like selected from the list unit Zf are displayed.
  • the order designation unit Z3 is for designating whether to arrange the information selected in the score designation unit Z2 from the upper one or the lower one, and includes a display field Zk, an expansion button Zm, and a list. It has a portion Zn and.
  • the expansion button Zm is a virtual button for displaying the list unit Zn, and the list unit Zn displays information for the user to select in conjunction with the operation of the expansion button Zm.
  • the number part Zo is a field for inputting a numerical value corresponding to the number of cases.
  • the operation in which the rating score is selected in the score designation unit Z2 and the "higher” or “lower” is specified in the order designation unit Z3 corresponds to the operation in which the arrangement method based on the rating score is specified.
  • “Company Z” is specified in the input field A1
  • "Rating score” is selected in the score designation unit Z2
  • "Higher rank” is specified in the order specification unit Z3
  • "15" is input in the number part Zoo.
  • the search button A2 is pressed.
  • the terminal processing unit 42 displays a list of 15 pieces of information on the industrial property rights of company X in order from the top of the rating score in cooperation with the data providing device 30.
  • the narrowing-down unit Az may have a period designation column (not shown) for accepting the designation of the period in place of the number-of-cases part ZO or together with the number-of-cases zo.
  • This period designation column may have the same aspect as the period designation column K4 of FIG.
  • the narrowing-down unit Az may have a configuration that does not have at least one of the order designation unit Z3 and the number of cases part Zo.
  • the narrowing-down unit Az may have a score selection unit (not shown) for selecting at least one of the rating scores instead of the order designation unit Z3.
  • a score selection unit (not shown) for selecting at least one of the rating scores instead of the order designation unit Z3.
  • the terminal processing unit 42 selects the information of one or a plurality of industrial property rights of the designated right holder to which the selected rating score is given to the terminal display unit 47 in cooperation with the data providing device 30. It is preferable to display it in a possible manner.
  • the rating score is set in seven stages of "AAA”, “AA”, “A”, “BB”, “B”, “CC”, and "C" in order from the top.
  • the user can select at least one of the above seven grades of rating score.
  • the terminal processing unit 42 selects information on one or more industrial property rights to which the selected one or more rating scores are given in cooperation with the data providing device 30. It is possible to display it on the terminal display unit 47.
  • ESG display Next, with reference to FIGS. 15 and 16, a configuration and a display screen related to the user's confirmation of information regarding ESG will be described.
  • the same reference numerals are used for the same configurations as those shown in the above drawings, and the description thereof will be omitted.
  • the terminal processing unit 42 cooperates with the data providing device 30 to perform an ESG as shown in FIG.
  • the general screen G8 may be displayed on the terminal display unit 47.
  • the ESG general screen G8 of FIG. 15 has comparative data R1 in which the number of ESG-related patents is integrated and graphed on a weekly basis for each right holder, and ranking unit R2 showing a ranking of the number of ESG-related patents. is doing.
  • the comparative data R1 is arranged based on, for example, the publication date of the patent gazette.
  • each column of the ranking unit R2 functions as a virtual button for accepting the selection of the right holder.
  • the terminal processing unit 42 may display the ESG individual screen G9 as shown in FIG. 16 on the terminal display unit 47 in cooperation with the data providing device 30. good.
  • the ESG individual screen G9 illustrated in FIG. 16 has a detailed analysis column R3 showing individual evaluations for a plurality of indicators related to the calculation of the ESG score.
  • a plurality of indexes related to the calculation of the ESG score Environmental, Social, Governance, keyword score, novelty score, number of patents, and total score are illustrated, but are not limited thereto.
  • a plurality of indicators related to the calculation of the ESG score can be appropriately selected.
  • the terminal processing unit 42 may display the inventor screen G10 as shown in FIG. 17 on the terminal display unit 47 in cooperation with the data providing device 30.
  • the terminal processing unit 42 may display an inventor search field for inputting the inventor name and requesting the inventor's information on the user screen G2 as shown in FIG.
  • a link is attached to the inventor name described in the inventor information unit L7 of FIG. 12, and when the user clicks the inventor name, the inventor screen G10 corresponding to the inventor is displayed on the terminal processing unit 42. May be displayed on the terminal display unit 47.
  • the inventor screen G10 illustrated in FIG. 17 includes a list display unit V1 that displays a list of information on patent rights related to the inventor, an evaluation unit V2 that displays the comprehensive evaluation of the inventor, and a past history of the inventor. It has a unique information unit J2 indicating such as.
  • the list display unit V1 of FIG. 17 displays related information, rating score, pension cost information, and ESG score for each patent right.
  • As the related information information indicating the degree of contribution to the right, such as whether or not the inventor is the first inventor, is displayed.
  • Information such as the ratio of highly effective patents, the number of patent applications, the number of registered patent rights, and the number of inventor applications cited in notifications of reasons for refusal (number of citations) is displayed in the evaluation unit V2.
  • the evaluation unit V2 may show the inventor's comprehensive evaluation for each item of the list display unit V1.
  • the terminal processing unit 42 when the terminal processing unit 42 receives an instruction to access the website provided by the data providing device 30 via the terminal input unit 46 (step S101), the terminal processing unit 42 provides data for the access request to the website. It is transmitted to the device 30 (step S102).
  • the providing processing unit 32 provides the information of the user screen to the information terminal 40 (step S103), and the terminal processing unit 42 causes the terminal display unit 47 to display the user screen G2 as shown in FIG. 5, for example. (Step S104).
  • the terminal processing unit 42 When the terminal processing unit 42 receives the designation of the right holder through the user screen G2 (step S105), the terminal processing unit 42 transmits the information of the designated right holder to the data providing device 30 (step S106).
  • the provision processing unit 32 provides the information terminal 40 with information on the basic screen corresponding to the right holder information (step S107). Then, the terminal processing unit 42 causes the terminal display unit 47 to display the basic screen G3 as shown in FIG. 6 (step S108).
  • the terminal processing unit 42 When the terminal processing unit 42 receives the designation of the second period through the basic screen G3 (step S109), the terminal processing unit 42 transmits the designated information indicating the designated one or more second periods to the data providing device 30 (step S110).
  • the provision processing unit 32 provides the information terminal 40 with information on the detailed screen corresponding to the designated information (step S111). Then, the terminal processing unit 42 causes the terminal display unit 47 to display the detailed screen G4 as shown in FIG. 7, for example.
  • the providing processing unit 32 may display the detail screen G4 corresponding to each second period in a switchable manner, and in all the second periods related to the designation.
  • the corresponding image data may be included in the detail screen G4 (step S112).
  • the terminal processing unit 42 When the terminal processing unit 42 receives the designation of the third period through the detail screen G4 (step S113), the terminal processing unit 42 transmits the final designation information indicating the designated one or more third periods to the data providing device 30 (step S114). .. The provision processing unit 32 provides the information terminal 40 with information on the purchase screen that reflects the final designated information (step S115). Then, the terminal processing unit 42 causes the terminal display unit 47 to display the purchase screen Gx as shown in FIG. 8 (step S116).
  • the terminal processing unit 42 When the terminal processing unit 42 receives a purchase instruction by pressing the purchase button E3 of the user (step S117), the terminal processing unit 42 transmits a purchase request to the data providing device 30 (step S118). Then, the provision processing unit 32 requests the payment server 600 to make a payment (step S119). The payment server 600 transmits confirmation information including the content of the product to be purchased and the payment amount to the information terminal 40 (step S120). The terminal processing unit 42 causes the terminal display unit 47 to display a confirmation screen (not shown) based on the confirmation information (step S121).
  • the terminal processing unit 42 When the terminal processing unit 42 receives the payment instruction through the confirmation screen (step S122), the terminal processing unit 42 requests the payment server 600 to make the payment (step S123).
  • the payment server 600 executes the payment process and transmits a payment notification indicating the completion of the payment to the data providing device 30 (step S124).
  • the data providing device 30 provides the product related to the user's purchase to the information terminal 40 (step S125). That is, since the user has acquired the access authority to the information related to the purchased product by each of the above series of steps, the user can browse the information related to the product at any time via the information terminal 40.
  • the data providing device 30 and the information terminal 40 execute the processes of steps S101 to S104 in the same manner as in the example of FIG.
  • the terminal processing unit 42 transmits a calling request for the product related to the instruction to the data providing device 30 (step S201). Step S202).
  • step S201 the provision processing unit 32 transmits the information on the right holder screen about the right holder according to the designation to the information terminal 40 (step S203). Then, the terminal processing unit 42 causes the right holder screen G6 to be displayed on the terminal display unit 47 as shown in FIG. 11 or 13, for example (step S204).
  • the terminal processing unit 42 When the terminal processing unit 42 receives the designation of the right through the right holder screen G6 (step S205), the terminal processing unit 42 transmits the right information indicating the designated right to the data providing device 30 (step S206).
  • the provision processing unit 32 provides the information terminal 40 with information on the right screen corresponding to the right information (step S207). As a result, the terminal processing unit 42 causes the right screen G7 to be displayed on the terminal display unit 47 as shown in FIG. 12 (step S208).
  • the data providing device 30 of the first embodiment extracts the effectiveness data corresponding to the external request from the database 5a constructed in advance. Therefore, when the data providing device 30 receives a data request, it is not necessary to perform a process for evaluating the validity of the right, so that wasteful use of the processing unit and the memory can be suppressed, and the industrial property right can be obtained. Information on effectiveness can be provided promptly.
  • Validity data also includes rating scores that indicate relative validity across multiple industrial property rights. That is, the database 5a in the providing database unit 35 stores the validity data including the rating score obtained by the estimation processing means 124. Therefore, the user can quickly and accurately select the right that meets his / her needs by visually recognizing the rating score associated with each right on the screen as shown in FIGS. 11 to 13, for example. ..
  • the data providing system 100 includes a data providing device 30 and an information terminal 40. Then, the providing processing unit 32 provides the information terminal 40 with screen information including the validity data, and the information terminal 40 is a terminal display unit 47 that displays the screen information provided by the data providing device 30. have. Therefore, the user who uses the information terminal 40 can obtain useful information on the industrial property right without requiring specialization.
  • the estimation processing means 124 may obtain a rating score for each right holder in units of periods such as the entire period, the first period, the second period, and the third period. Then, the construction processing means 22c may reflect the rating score corresponding to each period in the database. As a result, the information processing means 32a can provide the information terminal 40 with a rating score corresponding to each period. Therefore, the user can confirm the rating score corresponding to each period on the screen as shown in FIGS. 6, 7, 11, and 13, for example, so that the right holder and the period can be selected quickly. It can be done accurately.
  • the validity data should include technical information related to the validity of the patent right.
  • the database 5a stores validity data in which one or more technical information is associated with the rating score.
  • the information terminal 40 can show the technical information related to the patent right in association with the rating score on the screen as shown in FIG. 12 or FIG. 13, for example. Therefore, the user can quickly confirm the literature or the like that is the basis of the rating score.
  • the validity data can be configured to include an ESG score, which is an index value obtained by evaluating the patent right from the viewpoint of ESG. Therefore, since the user can confirm the ESG score for each right on the screen as shown in FIGS. 11 to 17, it is possible to grasp at a glance the companies and the like that are focusing on ESG. It can be used for product selection.
  • the estimation processing means 124 may obtain an ESG score for each right holder in units of periods such as the entire period, the first period, the second period, and the third period.
  • the construction processing means 22c may reflect the ESG score corresponding to each period in the database.
  • the information processing means 32a can provide the information terminal 40 with the ESG score corresponding to each period. Therefore, the user can confirm the ESG score corresponding to each period on the screen as shown in FIGS. 11, 13 to 17, and can utilize it for the selection of the right holder and the like.
  • the validity data may include pension cost information indicating high cost performance for maintaining rights.
  • the estimation processing means 124 may request pension cost information for each right holder in units of periods such as the entire period, the first period, the second period, and the third period.
  • the construction processing means 22c may reflect the pension cost information corresponding to each period in the database.
  • the information processing means 32a can provide the information terminal 40 with the pension cost information corresponding to each period. Therefore, the user can confirm the pension cost information corresponding to each period on the screen as shown in FIGS. 11 to 13, and can utilize it for the evaluation and selection of the right holder.
  • the validity data may include the preceding trademark data which is the information of the preceding trademark whose similarity with the trademark related to the trademark right is equal to or higher than the threshold value.
  • the preceding trademark data related to the trademark right can be shown in association with the rating score on the screen as shown in FIG. 12 or 13, for example. Therefore, the user can promptly confirm the preceding trademark data that is the basis of the rating score, and can examine the invalidity of the trademark right.
  • the validity data may include publicly known design data which is information on publicly known designs whose similarity with the design related to the industrial right is equal to or higher than the threshold value.
  • the publicly known design data related to the design right can be shown in association with the rating score on the screen as shown in FIG. 12 or FIG. 13, for example. Therefore, the user can promptly confirm the publicly known design data that is the basis of the rating score, and can examine the validity of the design right and the like.
  • the provision processing unit 32 has a function of rearranging each technical information in the database 5a in descending order of the degree of relevance to the patent right related to the validity data for the validity data including a plurality of technical information.
  • the degree of relevance is an index value indicating how much the wording of the claim relating to the patent right and the wording of the technical information match or approximate.
  • the providing processing unit 32 has a function of rearranging each prior trademark data in the database 5a in descending order of similarity with the trademark related to the validity data for the validity data including a plurality of prior trademark data.
  • the providing processing unit 32 has a function of rearranging each known design data in the database 5a in descending order of similarity with the design related to the validity data for the validity data including a plurality of known design data. In this way, the information terminal 40 can display the sorted data on the screens as shown in FIGS. 11 to 13 without separately performing the data sorting process, and the efficiency of the user's confirmation work is improved. Can be planned.
  • the provision processing unit 32 When one or more rights are specified in the information terminal 40, the provision processing unit 32 provides validity data corresponding to the rights. Therefore, the user can select and purchase the product related to the industrial property right in units of one item, and can acquire necessary and sufficient data.
  • the provision processing unit 32 provides the validity data corresponding to the rights of the right holder within the period. Therefore, the user can quickly purchase the product in a period unit that meets the needs without making a detailed selection.
  • the providing processing unit 32 may provide information on the evaluation index of the inventor. In this way, the user can confirm the rank and contribution of the inventor on the screen as shown in FIG. 17, for example, and can utilize it for head hunting and the like. Further, the providing processing unit 32 may provide unique information of the inventor when the inventor is designated in the information terminal 40. In this way, the user can know the background of the inventor, the co-inventor, etc. by checking the unique information unit J2 on the screen as shown in FIG. 17, for example, and can utilize it for human resource discovery and the like. can.
  • the provision processing unit 32 When one or more rights are specified in the information terminal 40, the provision processing unit 32 provides validity data corresponding to the rights. Therefore, the user can select and purchase the product related to the industrial property right in units of one item, and can acquire necessary and sufficient data.
  • the provision processing unit 32 provides the validity data corresponding to the rights of the right holder within the period. Therefore, the user can quickly purchase the product in a period unit that meets the needs without making a detailed selection.
  • the provision processing unit 32 may provide the first source data in which the rights of the right holder in the first period are arranged for each second period.
  • the first original data is displayed as the first data K1 on the information terminal 40 side.
  • the provision processing unit 32 may provide the second source data in which the rights of the right holder in the second period are arranged for each third period.
  • the second source data is displayed as the second data K2 on the information terminal 40 side.
  • the provision processing unit 32 may provide the validity data corresponding to the rights in the third period.
  • the user can select a period that meets the needs while narrowing the selection period by an intuitive and simple operation, so that usability can be improved.
  • the information terminal 40 is configured to display a rating score or the like in association with each period, the convenience of the user's period selection can be improved.
  • the providing processing unit 32 may provide information on the evaluation index of the inventor. In this way, the user can confirm the rank and contribution of the inventor on the screen as shown in FIG. 17, for example, and can utilize it for head hunting and the like. Further, the providing processing unit 32 may provide unique information of the inventor when the inventor is designated in the information terminal 40. In this way, the user can know the background of the inventor, the co-inventor, etc. by checking the unique information unit J2 on the screen as shown in FIG. 17, for example, and can utilize it for human resource discovery. can.
  • the data analysis device 20 performs machine learning using translation processing means 121 that performs translation processing on core data included in rights-related information to generate translation data, and learning data based on the translation data. It has a learning processing means 123 that generates an estimation model M1 by the above. Therefore, it is possible to prevent a decrease in estimation accuracy due to a difference in language and to substantially increase the amount of data for machine learning by unifying the languages. Therefore, it is possible to improve the accuracy of the rating score and the like, and to improve the reliability of the product such as the effectiveness data. That is, according to the data management system 10, it is possible to accurately show what kind of related materials exist for the rights of patents and the like all over the world.
  • the data analysis device 20 has a preprocessing means 122 that performs analysis processing on the translated data to generate learning data. Therefore, the characteristics of the core data can be analyzed with high accuracy.
  • the preprocessing means 122 performs analysis processing on the translated data to generate analysis data.
  • the data analysis device 20 has an estimation processing means 124 for obtaining validity data and the like by using the analysis data generated by the preprocessing means 122 as an input of the estimation model M1. Therefore, it is possible to obtain an accurate estimation result or the like by the estimation model M1.
  • the configuration and operation of the data providing system 100 in the first modification of the first embodiment will be described with reference to FIGS. 20 to 32.
  • the data providing system 100 of the present modification 1 is configured to perform processing specialized for patent rights and utility model rights among industrial property rights, and the natural language in the data collected from the outside is vectorized and analyzed. It has a data analyzer 20A having a function of performing. Since the overall configuration and operation of the data providing system 100 are the same as those described above with reference to FIGS. 1 to 19, the equivalent configurations are designated by the same reference numerals and the description thereof will be omitted.
  • the functional configuration of the data analyzer 20A will be described with reference to FIG.
  • the data analyzer 20A performs rating processing on the rights to be analyzed.
  • the rights that are the subject of analysis are also referred to as "target rights". That is, the data analyzer 20A executes the rating related to the validity of each claim and each target right by analyzing the claims (claims, utility model registration claims, etc.) of each target right. do. In this modification 1, patent rights and utility model rights all over the world are analyzed. Usually, the number of analysis targets increases when the renewal period elapses.
  • the data analyzer 20A also sequentially executes the rating process for the target rights that have increased due to the elapse of the renewal period.
  • the data analyzer 20A has an analysis processing unit 22A that analyzes the effectiveness of each of the plurality of target rights.
  • the analysis processing unit 22A has a function of vectorizing a sentence by natural language analysis to generate a meaning vector. For example, the analysis processing unit 22A executes vectorization into a meaning vector of a sentence by natural language processing based on a Transformer-based encoder (encoder) such as BERT (Bidirectional Encoder Representations from Transformers). In the first embodiment, the analysis processing unit 22A is configured to generate a 32-dimensional meaning vector. The analysis processing unit 22A may use the trained model trained in two stages of pre-learning and fine tuning for natural language processing. It should be noted that what is processed by the analysis processing unit 22A is "information", but in the present specification, the fact that it is "information” is omitted, for example, "claims", “claims", and “claim elements”. There is.
  • the degree of coincidence in the present modification 1 indicates that the vectors are similar to each other as it is closer to 0, and that the vectors are not similar to each other as it is closer to 1. That is, the closer the degree of agreement is to 0, the less the semantic deviation between the vectors is, and the closer it is to 1, the greater the semantic deviation between the vectors is. When the degree of coincidence is 0, it means that the two semantic vectors completely match.
  • the analysis processing unit 22A has a collection processing means 122a, an evaluation processing means 122b, and a construction processing means 22c.
  • the collection processing means 122a periodically collects rights-related information regarding the target right through API or the like.
  • the collection processing means 122a collects information related to inventions or devices all over the world from the outside as information for analyzing the validity of each right.
  • Information related to an invention or invention includes information on non-patent documents as well as publications on patents or utility models. As mentioned above, non-patent documents include various technical papers / technical reports, technical standards, websites of companies / research institutes / universities, articles / catalogs on the Web, blogs, SNS, YouTube (registered trademark), etc. Contains information.
  • invention-related information the information related to the invention or the invention is also referred to as "invention-related information”.
  • the information in the publications relating to patents or utility models for which patent classification has already been granted is also referred to as “classified information”.
  • the information of the non-patent document to which the patent classification is not assigned is also referred to as “unclassified information”.
  • the collection processing means 122a stores the collected invention-related information in the collection database unit 24 or the like.
  • the collection processing means 122a has a function of collecting information on patent classifications such as CPC or IPC, and constructing a classification database 4a in a storage unit 23 or a collection database unit 24 or the like based on the collected patent classification information.
  • FIG. 20 shows an example in which the classification database 4a is constructed in the collection database unit 24.
  • the classification code is associated with hierarchical data which is information on the hierarchy of the classification code and explanatory data which is information on the explanation of the classification code.
  • FIG. 21 is a table illustrating the outline of the classification database 4a generated by the collection processing means 122a.
  • the collection processing means 122a collects patent classification information from the information providing server group 300 and the like.
  • the patent classification information is information in which at least the classification code, the hierarchical data, and the explanatory data are associated with each other, as in the example in the thick frame of FIG.
  • the hierarchical data may be obtained by converting the hierarchical information for each classification code collected from the outside into information that can be easily processed by the collection processing means 122a.
  • the classification codes are indicated by P1 to PM ( M is the total number of classification codes in the patent classification), the hierarchy of the hierarchical data is illustrated by numbers, and the characters of the explanatory data are illustrated by a plurality of white circles.
  • the hierarchical structure of the classification code is not limited to three levels, and an arbitrary number of layers is set according to the patent classification.
  • the collection processing means 122a generates a classification vector, which is a semantic vector corresponding to each of the explanatory data, by vectorizing each of the explanatory data included in the patent classification information collected from the outside by natural language processing. Then, the collection processing means 122a generates a classification database 4a by associating the hierarchical data and the classification vector for each classification code included in the patent classification information.
  • FIG. 21 shows an example in which the classification database 4a includes explanatory data for each classification code, but the present invention is not limited to this.
  • the collection processing means 122a may delete the explanatory data that has been converted into the classification vector, and generate the classification database 4a composed of the classification code, the hierarchical data, and the classification vector.
  • the collection processing means 122a may have a classification assigning function of assigning classification data corresponding to the classification code to each of the unclassified information.
  • the collection processing means 122a generates an unknown vector, which is a semantic vector corresponding to the unclassified information, by vectorizing a part or all of the unclassified information by natural language processing.
  • the unclassified information which is the information of the non-patent document
  • the data to be classified to be vectorized by the collection processing means 122a can be adjusted according to the type and content of the non-patent document and can be changed as appropriate.
  • the collection processing means 122a compares the generated unknown vector with each classification vector in the classification database 4a, and identifies the classification vector having the highest semantic similarity to the unknown vector. Then, the collection processing means 122a stores the unclassified information corresponding to the generated unknown vector in association with the specified classification vector and the classification data which is at least one of the classification codes corresponding to the classification vector. That is, for example, the collection processing means 122a may store the specified classification vector in association with the unclassified information corresponding to the generated unknown vector. As a result, the unclassified information is substantially given a classification code. Alternatively, the collection processing means 122a may store the unclassified information corresponding to the generated unknown vector in association with the classification code corresponding to the specified classification vector. However, the collection processing means 122a may store both the specified classification vector and the classification code corresponding to the classification vector in association with the unclassified information corresponding to the generated unknown vector.
  • the evaluation processing means 122b includes a translation processing means 221, an extraction processing means 225, a matching degree processing means 226, and a rating processing means 227.
  • the translation processing means 221 performs translation processing on the rights-related information and the invention-related information.
  • the translation processing means 221 executes a translation process unified into a common language, similarly to the translation processing means 121 described above.
  • the extraction processing means 225 extracts the invention-related information published before the filing date of the target right from the plurality of invention-related information collected by the collection processing means 122a.
  • the information related to the invention or the invention which is the information related to the invention published before the filing date of the subject right, is also referred to as "previous information".
  • the date information includes provisions that the invention-related information related to the subject right published before the filing date is treated as if the novelty of the invention-related information is not lost by the publication (exception provision for loss of novelty, etc.). ) Shall not include the invention-related information when the applicant, etc. of the subject right has received the application.
  • the extraction processing means 225 is configured to exclude the invention-related information to which the above-mentioned provision is applied from the previous-day information by collating the document corresponding to the above-mentioned provision in the information regarding the application progress of the target right with the invention-related information. It is good to do.
  • the extraction processing means 225 may have a function of further narrowing down the day-ahead information based on predetermined conditions. That is, the extraction processing means 225 may extract a plurality of day-ahead information used for analysis of the validity of the target right from all the day-ahead information for each of the target rights.
  • the extraction processing means 225 vectorizes the claims of the target right, claim 1, part or all of the specification, abstract, or the whole sentence by natural language processing, and generates a sentence vector which is a meaning vector.
  • the generated sentence vector is associated with the target right and stored.
  • the extraction processing means 225 executes the generation of the sentence vector and the associative processing for all the target rights (all the rights to be analyzed). Further, the extraction processing means 225 acquires a classification code from each of the classified information, and by comparing the acquired classification code with the classification database 4a, the classification vector corresponding to the classification code is acquired. Then, the extraction processing means 225 stores the classified information in association with the classification vector corresponding to the classification code attached to the classified information. As a result, a sentence vector is associated with each target right, and a classification vector is associated with each of the classified information.
  • the extraction processing means 225 compares the sentence vector associated with the target right with the classification vector associated with each classified information, and the sentence matching degree, which is the degree of matching between them, is classified to be equal to or less than the sentence threshold. Extract the information as day-to-day information for rights validity analysis.
  • the collection processing means 122a associates a classification vector or the like with each unclassified information by the classification assigning function
  • the extraction processing means 225 sets a sentence vector associated with the target right and a classification vector associated with each unclassified information.
  • unclassified information in which the sentence matching degree, which is the matching degree, is equal to or less than the sentence threshold is extracted as the day-ahead information for the validity analysis of the target right.
  • the sentence threshold is preset and can be changed as appropriate.
  • the extraction processing means 225 acquires the classification code attached to the target right, and by comparing the acquired classification code with the classification database 4a, the extraction processing means 225 acquires the classification vector corresponding to the classification code.
  • the extraction processing means 225 stores the target right in association with a classification vector corresponding to the classification code attached thereto.
  • the collection processing means 122a executes the acquisition and association processing of the classification vector for all the target rights. Similar to the above, the extraction processing means 225 executes the classification vector association processing for each of the plurality of classified information.
  • the extraction processing means 225 compares the classification vector associated with the target right with the classification vector associated with each classified information, and the classification match degree, which is the degree of matching between them, is equal to or less than the classification threshold.
  • the classified information is extracted as the day-to-day information for the validity analysis of the target right.
  • the collection processing means 122a associates the classification vector or the like with each unclassified information by the classification assigning function
  • the extraction processing means 225 sets the classification vector associated with the target right and the classification vector associated with each unclassified information. By comparison, unclassified information in which the degree of classification agreement between these is equal to or less than the classification threshold is extracted as day-to-day information for validity analysis of the target right.
  • the classification threshold is preset and can be changed as appropriate.
  • the concordance processing means 226 contains one or more claim elements (referred to as constituent requirements, constituent elements, invention-specific matters, etc.) of the claims in the subject right relating to the patent or utility model to be analyzed. Convert to the first vector, which is a semantic vector. That is, the concordance processing means 226 decomposes one or more claims in the claims of each target right into claim elements. Then, the matching degree processing means 226 generates and stores the first vector for each claim element by vectorizing the claim element by natural language processing. Depending on the structure of the claim and the method of decomposition, there may be one claim element in the claim. The matching degree processing means 226 performs decomposition processing of all claims and generation processing of the first vector for all the target rights, and stores the generated first vector in association with each claim element.
  • the matching degree processing means 226 performs decomposition processing of all claims and generation processing of the first vector for all the target rights, and stores the generated first vector in association with each claim element.
  • the matching degree processing means 226 converts a part or all of the plurality of day-ahead information extracted by the extraction processing means 225 into a second vector which is a meaning vector for each divided data. That is, the matching degree processing means 226 divides the division target information, which is a part or all of the day-ahead information, into a plurality of division data according to predetermined conditions, and vectorizes each of the division data by natural language processing. A second vector for each divided data is generated and stored.
  • the matching degree processing means 226 may use, for example, a description in the day-ahead information as the division target information.
  • the specification includes the contents of other documents (claims, abstract, etc.) in principle, it is possible to improve the efficiency of processing by making the information to be divided into the specification.
  • a condition for dividing the day-ahead information for example, a condition such as "divide for each sentence" can be preferably used.
  • the divided data corresponds to one sentence (in the case of Japanese, from the beginning to the kuten).
  • the degree of agreement based on the cosine similarity between the two vectors it is possible to specify the position in the previous information of the description having a relatively high semantic relevance to the claim element. can.
  • the agreement degree processing means 226 obtains the total degree of agreement, which is the degree of agreement between the claim element of the claim in the target right and each of the previous information by mutual comparison between each first vector and each second vector. More specifically, the agreement degree processing means 226 compares the first vector with the plurality of second vectors for each day information regarding the target right, and is the degree of agreement between the first vector and each second vector. Find the degree of division agreement. If the division match degree is equal to or less than the comparison threshold value, the match degree processing means 226 sets a relation flag indicating that the relevance between the claim element and the division data is relatively high in association with the division coincidence degree. You may do so.
  • the agreement degree processing means 226 uses the division agreement between a certain first vector and all the second vectors corresponding to the certain day-ahead information to obtain the claim element corresponding to the first vector and the day-ahead information. Find the total degree of agreement, which is the degree of agreement of. If the obtained total degree of agreement is equal to or less than the total threshold value, the agreement degree processing means 226 sets a match flag indicating that the claim element and the day-ahead information are relatively highly related in association with the total degree of agreement. You may do so.
  • FIG. 22 is a table illustrating various data corresponding to the claim elements in the claim.
  • the extraction processing means 225 has extracted N pieces of day-ahead information ( N is an arbitrary natural number), and the codes D 1 to DN are associated with these.
  • D 1 to DN correspond to the identification number of the day-ahead information.
  • the "k” and “j" attached to the "d" indicating the divided data are expedient symbols, and indicate that the divided target information of the plurality of day-ahead information D 1 to DN is divided into the same number of divided data. It doesn't mean anything.
  • the related flag column is just an example showing that there is a division match degree (white circle in the figure) in which the relation flag is set and a division match degree (x) in which the relation flag is not set.
  • the position of x has no meaning.
  • the matching degree processing means 226 acquires various information as shown in FIG. 22 or obtains it by calculation for all the claim elements in the claims of the target right, and stores them in the storage unit 23, the output database unit 25, or the like. ..
  • FIG. 23 is a table exemplifying the total degree of agreement between the claim element of the target right and the plurality of day-ahead information for each claim element. It is an example of a part of the database.
  • the concordance degree processing means 226 has a function of constructing a concordance degree database in which the total concordance degree of the claim elements of all the target rights and the information before each day is arranged.
  • FIG. 23 shows an example in which the claims of the subject right have six claims. Of each claim illustrated in FIG. 23, claim 1 is decomposed into seven claim elements, claims 2 to 5 are processed as a claim consisting of one claim element, and claim 6 is decomposed into five claim elements. .. In FIG.
  • the frame satisfying the condition that the match flag is set that is, the frame having the total degree of match of 0.20 or less is shown as a thick line.
  • D 1 to D 7 are illustrated as a plurality of day-ahead information, but the agreement degree processing means 226, in principle, obtains the total degree of agreement of all the day-ahead information.
  • the match degree processing means 226 identifies the main related information Da, which is the day-ahead information having the highest semantic similarity to the target right, based on the total match degree obtained for each day-ahead information. For example, the matching degree processing means 226 uses the day-ahead information having the largest number of claim elements whose total matching degree is equal to or less than the total threshold value as the main related information Da for a certain claim. When there is a plurality of day-ahead information having the largest number of claim elements whose total degree of agreement is equal to or less than the total threshold value, one main related information Da is selected from the plurality of day-ahead information based on the total degree of agreement and the state of the match flag. It may be specified, or a plurality of main related information Das may be specified.
  • the matching degree processing means 226 may select one or more days ago information having a relatively high semantic relevance to the specified main related information Da as the sub related information. More specifically, the matching degree processing means 226 selects one or a plurality of days ago information associated with the classification vector whose degree of agreement with the classification vector associated with the main related information Da is equal to or less than the sub-threshold as the sub-related information Db. May be good.
  • the sub-threshold is preset and can be changed as appropriate.
  • the classification vector associated with the main related information Da is a classification vector corresponding to the classification code assigned to the main related information Da when the main related information Da is classified information.
  • the main related information Da is unclassified information, it is a classification vector corresponding to the classification code associated with the main related information Da or a classification vector directly associated with the main related information Da. ..
  • the "relationship in the technical field" between the main reference and the sub-reference is known.
  • the sub-related information Db if the day-ahead information having a relatively high semantic relevance between the classification vectors with the main related information Da is extracted as the sub-related information Db, the sub-related information can be obtained in the main related information Da. Since the ease of arriving at the combination of Db is increased, the reliability of the rating score (individual score and total score) based on the main related information Da and one or a plurality of sub-related information Db is increased. Furthermore, the accuracy of the rating score can be further improved by adjusting the classification vector and the sub-threshold value so that the hierarchy of the patent classification is approximated to a certain depth between the main related information Da and the sub related information Db. can.
  • the rating processing means 227 obtains a rating score that is an index of the effectiveness of each of the plurality of target rights based on each total degree of matching obtained by the matching degree processing means 226.
  • the rating processing means 227 of the present modification 1 obtains an individual score as an index of the validity of the claim for each claim and a total score as an index of the validity of the target right for each target right. It is configured. More specifically, the rating processing means 227 uses the total degree of agreement between one or more claim elements in a claim and the primary related information Da and the one or more sub-related information Db to provide an individual score for each claim. And the total score for each target right.
  • the rating processing means 227 may obtain, for example, the overall ranking, the ranking in the technical field to which the invention or the invention belongs, or the ranking in a certain period to which the filing date belongs. .. A certain period can be set arbitrarily.
  • the rating processing means 227 is, for example, "AAA”, “AA”, “A”, “BBB”, “BB”, “B”, “CCC”, “CC”, “C”, and “D” based on the above ranking.
  • An overall score indicating a gradual evaluation may be obtained.
  • the rating processing means 227 stores information such as an individual score and a total score in the storage unit 23 or the output database unit 25 in association with the target right.
  • the rating processing means 227 may obtain an individual score using all the total concordances associated with the claim.
  • the total degree of agreement associated with a claim is, for example, the total degree of agreement between one or more claim elements of the claim and each of the main related information Da and all the sub-related information Db.
  • the rating processing means 227 may obtain the average of all the total concordances associated with the complaint as an individual evaluation value, and obtain an individual score based on the obtained individual evaluation value. Further, the rating processing means 227 may obtain the standard deviation of all the total concordances associated with the complaint as an individual evaluation value, and obtain an individual score based on the obtained individual evaluation value. For example, the rating processing means 227 can obtain the individual score step by step by comparing the individual evaluation value with the plurality of threshold values.
  • the rating processing means 227 may select a specified number of sub-related information Dbs according to predetermined selection conditions as long as the number of sub-related information Dbs corresponding to a certain claim is larger than the specified number.
  • the specified number is a number set as the number of sub-related information Db used in the calculation of the individual score.
  • As the selection condition a condition that the number of match flags is large, a condition that the match flag is set for the claim element for which the match flag is not set in the main related information Da, or a condition that combines these can be adopted. ..
  • the rating processing means 227 obtains and obtains, as an individual evaluation value, the average of the total degree of agreement associated with the previous day information (main related information Da and the specified number of sub related information Db) narrowed down by the selection conditions for each claim.
  • the individual score may be obtained based on the individual evaluation value.
  • the rating processing means 227 may obtain the standard deviation of the total degree of agreement associated with the day-ahead information narrowed down by the selection conditions as an individual evaluation value, and obtain an individual score based on the obtained individual evaluation value.
  • FIG. 24 assuming a designated number “4” and a total threshold value “0.18”, the total degree of agreement between the claim element of a certain claim and a plurality of selected day-ahead information is illustrated.
  • claim 1 divided into seven claim elements is illustrated as a claim, “D 1 ” is exemplified as the main related information Da, and “D 2 to D 5 ” is exemplified as the sub related information Db. ing.
  • a frame satisfying the condition that the match flag is set that is, a frame having a total degree of match of 0.18 or less is shown as a thick line.
  • the day-to-day related documents that lack the elements that deny novelty and inventive step are excluded from the calculation target, and the average value or standard deviation of the total degree of agreement associated with the narrowed-down day-to-day information is obtained. Then, the accuracy of the individual score can be improved.
  • the rating processing means 227 obtains the ratio of the number of matching flags to the product of the number of claim elements and the total number of day-to-day information extracted by the extraction processing means 225 as an individual evaluation value for a certain claim, and also obtains the obtained individual evaluation value. You may also ask for an individual score. If the rating processing means 227 has more sub-related information Db corresponding to a certain claim than the designated number, the rating processing means 227 may select the designated number of sub-related information Db according to the selection conditions.
  • the rating processing means 227 obtains the ratio of the number of matching flags to the product of the number of claim elements and the total number of the main related information Da and each sub related information Db as an individual evaluation value, and obtains the individual evaluation.
  • An individual score may be obtained based on the value.
  • FIG. 25 is an explanatory diagram in which each total degree of agreement in FIG. 24 is arranged according to whether or not the match flag is set, and various settings and the like are the same as in FIG. 24.
  • a circle is added to the column of the day-ahead information in which the match flag is set, and a cross is added to the column of the day-ahead related document in which the match flag is not set.
  • the rating processing means 227 may obtain an individual score for each claim by stepwise performing a determination process relating to the presence or absence of novelty and a determination process relating to the presence or absence of inventive step.
  • a claim without novelty is less effective than a claim without an inventive step.
  • the collection processing means 122a generates the classification database 4a, and the matching degree processing means 226 identifies the main related information Da and extracts the sub related information Db.
  • the fact that the total degree of agreement between a certain claim element and the day-ahead information is equal to or less than the total threshold value is expressed as "the day-ahead information satisfies the claim element".
  • the fact that the total degree of agreement between a certain claim element and the day-ahead information is larger than the total threshold value is expressed as "the claim element is novel”. It will be described with reference to FIGS. 24 and 26 as appropriate.
  • the rating processing means 227 sets the unsatisfied claim element as "how many pre-date information satisfying all the claim elements" and "when there is no pre-date information satisfying all the claim elements".
  • the individual score is obtained based on a criterion such as "whether it is satisfied by how many other day-ahead information is satisfied, or is it not satisfied by a combination of a plurality of other day-ahead information".
  • FIG. 24 illustrates a situation in which the condition (2) is satisfied. That is, the day-to-day information D1 illustrated in FIG. 24 satisfies all the claim elements in one claim. Claims that meet condition (2) are given a relatively high individual score in the absence of novelty. A claim satisfying the condition (1) is given an individual score lower than that of the claim satisfying the condition (2). The same individual score may be uniformly given to the claims satisfying the condition (1), and the lower the individual score is given as the number of days before information satisfying all the claim elements increases. May be good.
  • the rating processing means 227 may obtain the individual evaluation value indicating the validity of the claim by using, for example, the total degree of agreement associated with the day-to-day information satisfying all the claim elements. As the individual evaluation value, the average or standard deviation of the total degree of agreement is assumed. Such individual evaluation values usually differ even between claims having the same individual score. Therefore, the accuracy of the effectiveness rating can be improved by using the individual evaluation value for the calculation of the total score or the like.
  • FIG. 26 illustrates a situation in which the condition (3) is satisfied. That is, the pre-date information D 1 illustrated in FIG. 26 does not satisfy only one claim element (1e) in the claim, but the claim element (1e) is complemented by the pre-date information D 2 or D 3 . That is, the total degree of agreement between the claim element (1e) and the previous information D 2 and D 3 is 0.18 or less.
  • FIG. 27 illustrates a situation in which the condition (7) is satisfied. That is, the pre-date information D 1 illustrated in FIG. 27 does not satisfy the claim elements (1d) and (1f), but the claim element (1d) is complemented by the pre-date information D 3 or D 5 and the claim element (1f). ) Is complemented by the previous information D2.
  • the above conditions (1) to (9) are merely examples, and the individual score is further subdivided based on the number of new claim elements, the number of previous information that can complement the claim elements, the total degree of agreement, and the like. Can be transformed into.
  • the rating processing means 227 obtains the individual score, for example, the average or standard deviation of the total degree of agreement associated with the day-to-day information used in the calculation of the individual score may be obtained as the individual evaluation value.
  • the individual evaluation values differ even among claims having the same individual score. Therefore, the accuracy of the effectiveness rating can be improved by using the individual evaluation value for the calculation of the total score or the like.
  • the construction processing means 22c of the first modification 1 has individual scores and total scores for each of the plurality of target rights in the output database unit 25 based on the information stored in the storage unit 23 and the collection database unit 24.
  • a database 5a that manages the above is constructed.
  • the information in the storage unit 23 also includes information stored by the collection processing means 22a and the evaluation processing means 122b.
  • the collection processing means 122a stores the difference in the rights-related information of each country in the storage unit 23 or the like. Rights-related information also includes applicable rights.
  • the evaluation processing means 122b uses the above difference to obtain a rating score or the like related to the added target right and stores it in the storage unit 23 or the like.
  • the evaluation processing means 122b updates the rating score and the like related to the target right in which the claim is corrected or the right holder is changed based on the above difference.
  • the construction processing means 22c updates the database of the output database unit 25 based on the information added or updated by the evaluation processing means 122b, and the information processing means 32a updates the database 5a based on the database. do.
  • the data providing device 30 has a rating score corresponding to an external request, that is, of the individual score and the total score, from the database 5a that manages the individual score and the total score of each of the plurality of target rights obtained by the rating processing means 227. At least one is extracted and provided.
  • the analysis processing unit 22A can be configured by an arithmetic unit such as a CPU or GPU, and a data analysis program P10 that cooperates with such an arithmetic unit to realize the above-mentioned and the following various functions. That is, the data analysis program P10 is a program for causing the analysis processing unit 22A and the storage unit 23 as computers to function as the collection processing means 122a, the evaluation processing means 122b, and the construction processing means 22c.
  • the collection processing means 122a collects patent classification information from the outside, and constructs, for example, a basic database including each data shown in the thick frame of FIG. 21 (step S11).
  • the collection processing means 122a reads out the explanatory data in the basic database, and generates a classification vector from the read explanatory data by natural language processing.
  • the collection processing means 122a stores the generated classification vector in association with the classification code corresponding to the explanatory data (step S12).
  • the collection processing means 122a executes the process of step S12 for all the explanatory data in the basic database (step S13 / No, step S12).
  • the collection processing means 122a constructs the classification database 4a by executing the process of step S12 for all the explanatory data (step S13 / Yes).
  • the collection processing means 122a may perform the processing of step S11 and the processing of steps S12 and S13 in parallel.
  • the collection processing means 122a acquires unclassified information which is information of a non-patent document among the day-ahead information (step S21).
  • the collection processing means 122a extracts the classification target data from the unclassified information (step S22).
  • the collection processing means 122a generates an unknown vector by converting the classification target data into a meaning vector (step S23). If the collection processing means 122a targets all of the unclassified information for vectorization by natural language processing, step S22 is unnecessary.
  • the collection processing means 122a compares the generated unknown vector with each classification vector in the classification database 4a, and obtains an unknown degree of agreement, which is the degree of agreement between the unknown vector and each classification vector (step S24). ).
  • the collection processing means 122a identifies the classification vector having the smallest unknown coincidence with the unknown vector (step S25).
  • the collection processing means 122a associates the unclassified information corresponding to the unknown vector with the classification vector specified in step S25 and the classification data which is at least one of the classification codes corresponding to the classification vector. It is memorized (step S26).
  • unclassified information can be handled in the same manner as classified information. That is, the unclassified information can be the target of the main related information Da and the sub related information Db by the processing of associating the classified data.
  • the matching degree processing means 226 extracts the claims from the target right (step S31).
  • the matching degree processing means 226 extracts claim 1 from the extracted claims and performs decomposition processing on claim 1. That is, the matching degree processing means 226 decomposes claim 1 for each claim element according to preset decomposition conditions.
  • the decomposition conditions may be individually set for each claim according to the superiority of the claim, the category of the claim, and the like (step S32).
  • the matching degree processing means 226 converts one claim element into the first vector (step S33). Further, the matching degree processing means 226 acquires one day's advance information (step S34). Then, the matching degree processing means 226 vectorizes the division target information such as the description in the day-ahead information on a sentence-by-sentence basis, and generates a second vector, which is a meaning vector, for each sentence (step S35).
  • the matching degree processing means 226 obtains the division matching degree which is the matching degree between the first vector and each of the second vectors, and associates the obtained division matching degree with the sentence corresponding to each second vector. It is memorized (step S36). Next, the matching degree processing means 226 determines whether or not the division matching degree is equal to or less than the comparison threshold value for all the obtained division matching degrees (step S37). If the division agreement degree is equal to or less than the comparison threshold value (step S37 / Yes), the agreement degree processing means 226 indicates that the claim element and the sentence have a high semantic relationship in association with the division agreement degree. The relevant flag is set to indicate (step S38). On the other hand, if the degree of coincidence processing means 226 is larger than the comparison threshold value (step S37 / No), the process proceeds to the process of step S39.
  • the matching degree processing means 226 When the matching degree processing means 226 completes the calculation of the division matching degree between the first vector and all the second vectors of the day-ahead information and the determination processing for all the division matching degrees (steps S36 to S38), the matching degree processing means 226 obtains the result. Based on all the split matches, the total match between the claim element and the previous information is calculated. For example, the concordance processing means 226 may use the average or standard deviation of the divisional concordances, which is equal to or less than the contrast threshold value, as the total concordance. The matching degree processing means 226 may extract a specified number of divided matching degrees from the divided matching degrees that are equal to or less than the contrast threshold value, and use the average or standard deviation of the extracted division matching degrees as the total matching degree.
  • the concordance processing means 226 may set the smallest division concordance, which is equal to or less than the contrast threshold value, as the total concordance. Then, the matching degree processing means 226 stores the obtained total matching degree in association with the claim element and the day-ahead information (step S39).
  • the matching degree processing means 226 determines whether or not the obtained total matching degree is equal to or less than the total threshold value (step S40). If the total degree of agreement is equal to or less than the total threshold value (step S40 / Yes), the agreement degree processing means 226 indicates that the claim element and the day-ahead information are highly semantically related in association with the total degree of agreement. A match flag is set (step S41). On the other hand, if the total degree of agreement 226 is larger than the total threshold value (step S40 / No), the agreement degree processing means 226 shifts to the process of step S42.
  • the match degree processing means 226 shifts to step S34 if there is unprocessed day-ahead information among the plurality of day-ahead information extracted by the extraction processing means 225 (step S42 / Yes). That is, the match degree processing means 226 executes a series of processes from step S34 to step S41 for all the day-ahead information.
  • the match degree processing means 226 determines whether or not the claim 1 has an unprocessed claim element, that is, the unprocessed first first with respect to the claim 1. It is determined whether or not the vector exists (step S43).
  • the comparison determination process refers to a series of processes of steps S36 to S41 in FIG. 30, or a process similar to the process. If the unprocessed first vector does not exist (step S43 / No), the matching degree processing means 226 shifts to the processing of step S45.
  • the matching degree processing means 226 performs a comparison determination process between the first vector and a plurality of second vectors for all the previous information. .. If there are a plurality of unprocessed first vectors, the matching degree processing means 226 executes comparison determination processing for all the first vectors. As a result, the matching degree processing means 226 completes the derivation of the total matching degree associated with each combination of all the claim elements of claim 1 and all the previous information (step S44).
  • the matching degree processing means 226 identifies the main related information Da, which is the pre-date information presumed to be the closest to the claim 1.
  • the main related information Da is the prior art that is the center of the construction of logic that denies novelty or inventive step. In Japan, it is called “prior art”, and in Europe, it is called “Closest Prior Art”. Corresponds to.
  • the match degree processing means 226 sets, for example, the day-ahead information having the largest number of match flags as the main related information Da (step S45).
  • the matching degree processing means 226 determines whether or not there is an unprocessed claim in the target right (step S46), and if there is no unprocessed claim (step S46 / No), in step S49. Move to processing. On the other hand, if there is an unprocessed claim (step S46 / Yes), the matching degree processing means 226 performs decomposition processing on the unprocessed claim and converts the claim element into the first vector (step S47). Then, the matching degree processing means 226 performs a comparison determination process between all the generated first vectors and each second vector of the main related information Da (step S48), and proceeds to the process of step S46.
  • the matching degree processing means 226 collects one or a plurality of sub-related information Dbs that are semantically related to the main related information Da. Select from the information of the day before.
  • the sub-related information Db can construct a logic that denies the inventive step by combining with the main related information Da.
  • the matching degree processing means 226 obtains the matching degree between the classification vector attached to the main related information Da and the classification vector attached to the day-ahead information, and the day-ahead information in which the obtained matching degree is equal to or less than the sub-threshold value. Is selected as the sub-related information Db.
  • the match degree processing means 226 may select the sub-related information Db up to a preset designated number. In this case, the matching degree processing means 226 may be selected in order from the sub-related information Db, which is presumed to be more useful from the viewpoint of denying the inventive step. For example, the matching degree processing means 226 preferentially sets the day-ahead information in which the matching flag is set for the claim element in which the matching flag is not set in the main related information Da as the sub-related information Db for each claim element of the claim 1. You may choose. However, the matching degree processing means 226 gives priority to the previous information in which the matching flag is set for the claim element in which the matching flag is not set in the main related information Da for each claim element of all the claims as the sub-related information Db. May be selected (step S49).
  • the matching degree processing means 226 performs a comparison determination process of all the first vectors of the lower claims (claims 2 and below) and the plurality of second vectors of each sub-related information Db. As a result, the calculation of the total degree of agreement between each claim element in the target right and the main related information Da and all the sub-related information Db is completed, and the matching degree database as illustrated in FIG. 23 is constructed. (Step S50).
  • the rating processing means 227 obtains an individual score for each claim based on the total degree of agreement between each claim element in the target right and the main related information Da and all the sub related information Db.
  • the rating processing means 227 may obtain the individual evaluation value of the claim by any of the above-mentioned methods and obtain the individual score from the magnitude of the obtained individual evaluation value (“operation based on the average or standard deviation of the total degree of agreement”. See “Operations based on the percentage of match flags").
  • a score table in which a plurality of numerical ranges corresponding to the individual evaluation values and a plurality of individual scores are associated with each other may be stored in the storage unit 23 or the like.
  • the rating processing means 227 may obtain the individual score by comparing the obtained individual evaluation value with the score table.
  • a plurality of individual scores set stepwise and a plurality of threshold values corresponding to the numerical boundaries between the individual scores are stored in the storage unit 23 or the like, and the individual evaluation value obtained by the rating processing means 227 is obtained.
  • the individual score may be obtained from the comparison process between the threshold value and the threshold value.
  • the rating processing means 227 may directly obtain the individual score as in the above-mentioned "calculation of the individual score by the stepwise evaluation of novelty and inventive step" (step S51).
  • the rating processing means 227 obtains a provisional score, which is a provisional total score.
  • the rating processing means 227 may use the individual score as it is as a provisional score when there is only one claim in the claims.
  • the rating processing means 227 may use the highest individual score as the provisional score when a plurality of claims are present in the claims.
  • the rating processing means 227 may quantify all the individual scores and obtain a provisional score by arithmetic processing using each of the quantified values. In this case, it is advisable to assign a numerical value for conversion to each of the individual scores set in stages.
  • the provisional score may be obtained by threshold processing or the like for the calculated value obtained from each value obtained by quantifying all the individual scores (step S52).
  • the evaluation processing means 122b executes a series of processes of steps S31 to S52 for the target right as long as the unprocessed target right exists (step S53 / Yes). That is, the matching degree processing means 226 executes a series of processes of steps S31 to S52 for all the target rights, and obtains and stores the individual score and the provisional score for each of the target rights.
  • the rating processing means 227 completes the derivation process of the individual score and the provisional score for each of the target rights (step S53 / No)
  • the rating processing means 227 compares the provisional scores of each of the target rights with each other to each of the target rights. Adjust the provisional score to find the overall score that indicates the relative effectiveness of the eligible rights.
  • the rating processing means 227 corrects the provisional score as necessary, but the provisional score and the total score may match.
  • the rating processing means 227 may obtain an overall score indicating the relative effectiveness of all subject rights in a group classified according to predetermined conditions.
  • the overall score may indicate the relative effectiveness of the subject right in the technical field to which the invention or invention belongs, and may indicate the relative effectiveness of the subject right in any period to which the filing date belongs. It may be shown (step S54).
  • the evaluation processing means 122b ranks the target rights for which claims have been corrected and the added target rights based on the differences in the rights-related information of each country in the world. Performs calculations such as scores. At that time, the evaluation processing means 122b executes the minimum update processing based on the changes, such as updating only the individual score of the claim for which the correction or the like has been made. Then, the evaluation processing means 122b executes a relative adjustment of each total score in order to achieve consistency among all the target rights or among a plurality of target rights based on a predetermined categorization. Next, the construction processing means 22c updates the database of the output database unit 25 based on the information added / changed by the evaluation processing means 122b, and the information processing means 32a uses the database 5a based on the database. Update.
  • the processing for complaints (steps S31 to S33) and the processing for date information (steps S34 and S35) may be performed in a different order or in parallel.
  • the matching degree processing means 226 combines two or more sentences into one second vector. It may be converted.
  • the number of sentences to be vectorized does not need to be unified for each day-before information, and the number of sentences to be combined may be determined according to, for example, the length of one sentence.
  • the match degree processing means 226 may set only one of the related flag and the match flag, and may not perform the process of setting both.
  • the rating processing means 227 may omit the processing of step S52 for obtaining the provisional score.
  • the rating processing means 227 obtains a comprehensive evaluation value as an index of the effectiveness of the target right based on each total degree of matching obtained by the matching degree processing means 226, and also obtains a comprehensive evaluation value for each target right.
  • the total score for each target right may be obtained by relative comparison of.
  • the rating processing means 227 may obtain the total score by an operation using the individual evaluation value, may be obtained by an operation using the total degree of agreement, and may be an operation using both the individual evaluation value and the total degree of agreement. May be obtained by.
  • the individual evaluation value may be used as it is as the comprehensive evaluation value.
  • the analysis processing unit 22A of the present modification 1 aims to obtain an individual score for each claim and a total score for each target right, and is appropriately configured and processed within a range in which the purpose can be achieved. May be changed.
  • FIG. 32 is a flowchart illustrating the flow of one claim as an analysis target until the individual score of the claim is derived.
  • the evaluation processing means 122b extracts each day's previous information from the main related information Da specified in step S45 of FIG. 31 and the sub related information Db selected in step S49 of FIG. 31 and executes the following processing. do.
  • the evaluation processing means 122b determines whether or not an invalidation trial has been requested for the claim to be analyzed.
  • the information indicating that a trial for invalidation has been requested for the claim is previously collected by the collection processing means 122a as rights-related information or invention-related information from the outside and stored in the collection database unit 24 or the like (step S61). .. If an invalidation trial is requested for the claim (step S61 / Yes), the evaluation processing means 122b sets the individual score of the claim to "D" (step S62). If the claim is not requested for invalidation trial (step S61 / No), the evaluation processing means 122b determines whether or not there is pre-date information satisfying all the claim elements, that is, at least one pre-date information is all claim elements. Is determined (step S63).
  • the evaluation processing means 122b determines the individual score according to the number of day-to-day information satisfying all the claim elements (step S64). ).
  • the rating processing means 227 is adapted to give an individual score of "CCC" or less to the claim when there is day-to-day information satisfying all the claim elements. In this modification 1, no novelty is associated with "CCC” or less. More specifically, the evaluation processing means 122b sets the individual score of the claim to "C" when there are three or more day-before information satisfying all the claim elements (step S65).
  • the individual score of the claim is set to “CC” (step S66).
  • the evaluation processing means 122b sets the individual score of the claim to "CCC" when there is only one day-ahead information satisfying all the claim elements (step S67). Then, the evaluation processing means 122b obtains an individual evaluation value based on, for example, the total degree of agreement associated with the day-ahead information satisfying all the claim elements and the number of the day-ahead information (step S68).
  • the evaluation processing means 122b When the evaluation processing means 122b does not have the date information that satisfies all the claim elements (step S63 / No), the evaluation processing means 122b has the date information that does not satisfy only one claim element, that is, the date information that makes only one claim element new. Is present or not (step S69). If there is day-to-day information that does not satisfy only one claim element (step S69 / Yes), the evaluation processing means 122b can complement the day-to-day information, that is, the day-to-day information that satisfies the claim element that is not satisfied by the day-to-day information. Is determined (step S70). Here, the day-ahead information that does not satisfy only one claim element is referred to as "main related information".
  • the evaluation processing means 122b sets the individual score of the claim to "B" (step S71) if there is day-before information that satisfies the claim element that is not satisfied by the main related information (step S70 / Yes). Then, the evaluation processing means 122b uses, for example, the total degree of agreement associated with one or more main related information and the total degree of agreement associated with one or a plurality of days ago information that can complement the main related information, and is used as an individual evaluation value. (Step S68). If there is no previous information that satisfies the claim element that is not satisfied by the main related information (step S70 / No), the evaluation processing means 122b assigns an individual score of "A" or higher to the claim.
  • FIG. 32 shows an example in which the individual score of the claim is set to “A” (step S70). Then, the evaluation processing means 122b obtains an individual evaluation value using, for example, the total degree of agreement associated with one or a plurality of main related information (step S68).
  • the evaluation processing means 122b determines whether or not there is pre-day information that can complement the main-related information independently, that is, pre-day information that independently satisfies all of the plurality of claim elements that are not satisfied by the main-related information (step S73). ..
  • the evaluation processing means 122b sets the individual score of the claim to "BB" if there is a plurality of day-to-day information that can complement the main related information independently (step S73 / Yes, step S74 / Yes) (step S75).
  • the evaluation processing means 122b sets the individual score of the claim to "BBB” if there is only one day-ahead information that can complement the main related information independently (step S74 / No) (step S76). Then, the evaluation processing means 122b obtains an individual evaluation value using, for example, the total degree of agreement associated with the main-related information and the day-ahead information that can complement the main-related information independently (step S68).
  • the evaluation processing means 122b determines whether or not the main-related information can be complemented by a plurality of day-ahead information.
  • the state in which the main related information can be complemented by a plurality of day-ahead information means that there is a day-ahead information that satisfies at least one of a plurality of claim elements that are not satisfied by the main-related information, and such day-ahead information is combined. If so, it means that all of the plurality of claim elements that are not satisfied by the main related information are satisfied (step S77).
  • the evaluation processing means 122b can complement the main related information with a plurality of days ago information (step S77 / Yes)
  • the individual score of the claim is set to "BBB" (step S78).
  • the evaluation processing means 122b obtains an individual evaluation value by using, for example, the main-related information and the total degree of agreement associated with the information of a plurality of days ago that can complement the main-related information (step S68).
  • the evaluation processing means 122b assigns an individual score of "A" or more to the claim.
  • the main related information cannot be complemented by a combination of a plurality of days ago information, which of "A", "AA”, and "AAA” is set as the individual score is determined by, for example, the following conditions.
  • condition (a) If the condition (a) is satisfied, "A” or “AA” may be given to the claim. Whether to set it to “A” or “AA” may be determined by the number of unsatisfied claim elements in the main related information, the number of claim elements that can be complemented by a combination of a plurality of days ago information, and the like. If the condition (b) is satisfied, "AAA” may be given to the claim.
  • the rating processing means 227 determines the individual score for a certain claim by using the total degree of agreement associated with the main related information and the total degree of agreement associated with all or part of the day-ahead information associated with the claim. good.
  • the rating processing means 227 when the sub-related information Db is narrowed down by the selection condition, the ratio of the number of matching flags to the product of the number of claim elements and the total number of day-before information extracted by the extraction processing means 225. May be obtained as an individual evaluation value.
  • the second threshold value which is the boundary between "AA” and “AAA"
  • the rating processing means 227 may determine the individual score by comparing the obtained individual evaluation value with at least one of the first threshold value and the second threshold value (step S79).
  • the evaluation processing means 122b obtains an individual score for one or more claims included in each target right by a series of processing of steps S61 to S79 in the same manner as described above.
  • steps S61 to S79 in the same manner as described above.
  • the data analyzer 20A in the first modification converts one or more claim elements of the claims in the target right into the first vector which is a meaning vector, and a part or all of each of the plurality of day-ahead information. It has a matching degree processing means 226 that converts each of the divided data into a second vector which is a meaning vector.
  • the concordance processing means 226 obtains the total concordance, which is the concordance between the claim element of the claim in the target right and each of the previous information, by mutual comparison between each first vector and each second vector.
  • the data analysis device 20A has a rating processing means 227 that obtains an individual score as an index of the validity of the claim based on each total degree of matching obtained by the matching degree processing means 226.
  • Rating processing means 227 uses individual scores for all target rights to determine a total score that indicates the relative validity of the rights among the plurality of target rights.
  • the total degree of agreement based on the comparison between the semantic vectors reflects the semantic relationship between the claim element and the date information
  • the individual score and the total score can be obtained based on the total degree of agreement. , Accurate rating can be realized.
  • the rating processing means 227 obtains a comprehensive evaluation value based on each total degree of agreement obtained by the matching degree processing means 226, and also compares the comprehensive evaluation values of the plurality of target rights with each other to compare the total evaluation values among the plurality of target rights. An overall score indicating the validity of the relative rights may be calculated. Even in this way, it is possible to realize a highly accurate rating. In such a configuration, the rating processing means 227 may obtain an individual score based on each total matching degree obtained by the matching degree processing means 226. Here, a trial for invalidation or an opposition can be filed for each claim. In other words, whether a right is valid or invalid is determined for each claim. Therefore, there is a certain need for the validity of each claim as well as the validity of each target right. In this respect, the rating processing means 227 has a function of obtaining an individual score for each claim of a certain target right. Therefore, more practical information can be provided.
  • the matching degree processing means 226 is based on the total degree of matching between the claim element associated with the claim of the target right and the day-ahead information, and is the main association which is the day-ahead information having the highest semantic similarity to the claim. Identify information Da. Then, the matching degree processing means 226 selects one or a plurality of days ago information having a relatively high semantic relevance to the specified main related information Da as the sub related information Db. That is, the matching degree processing means 226 sub-associates the day-ahead information other than the main-related information Da with the classification vector whose degree of coincidence with the classification vector associated with the main-related information Da is less than or equal to the sub-threshold. Select as information Da.
  • the rating processing means 227 uses the total degree of agreement, which is the degree of agreement between the claim and each of the main related information Da and one or a plurality of the sub-related information Db, to obtain the individual score of the claim. That is, since the sub-related information Db is the day-ahead information that can be relatively easily combined with the main related information Da, the accuracy of the individual score based on the total degree of agreement is improved, and therefore the reliability regarding the validity of the target right is improved. High information can be provided.
  • the data analyzer 20A has a collection processing means 122a that generates a classification vector corresponding to each of the explanation data by vectorizing each of the explanation data of the classification code included in the patent classification information by natural language processing. ..
  • the collection processing means 122a generates a classification database 4a by associating the hierarchical data with the generated classification vector for each classification code. Therefore, the extraction processing means 225 can utilize the classification database 4a for narrowing down the day-ahead information. Further, the matching degree processing means 226 can utilize the classification database 4a for specifying the main related information Da and selecting the sub related information Db.
  • the collection processing means 122a may generate an unknown vector corresponding to the unclassified information by vectorizing a part or all of the unclassified information in the previous day information by natural language processing.
  • the collection processing means 122a may compare the generated unknown vector with each classification vector in the classification database 4a, and identify the classification vector having the highest semantic similarity to the unknown vector. Then, the collection processing means 122a may store the unclassified information corresponding to the generated unknown vector in association with at least one of the specified classification vector and the classification code corresponding to the classification vector. In this way, the unclassified information, that is, the information of the non-patent document can be treated in the same line as the classified information, so that the extraction processing means 225 narrows down the date information and the matching degree processing means 226 sub-related information.
  • the range of the Db selection process can be expanded. That is, since the range of the date information used for comparison with the claim element can be expanded with high accuracy, a highly accurate effectiveness rating for each target right can be realized.
  • the matching degree processing means 226 compares the classification code assigned to the main related information Da with the classification database 4a and obtains the classification vector corresponding to the classification code. As a result, the matching degree processing means 226 uses the day-ahead information other than the main-related information Da as the sub-related information to which the classification vector whose degree of coincidence with the classification vector of the main-related information Da is equal to or less than the sub-threshold is associated. It can be selected as Da.
  • the matching degree processing means 226 generates the first vector from the claim element and the second vector from the divided data by natural language processing based on the Transformer system encoder.
  • the natural language processing by the matching degree processing means 226, a method using morphological analysis may be used, but by using the natural language processing based on the Transformer system encoder for the conversion to the meaning vector, between the two vectors. Semantic similarity can be obtained more accurately.
  • the collection processing means 122a may generate a classification vector and an unknown vector by natural language processing based on a Transformer-based encoder.
  • the data management system 10 of the present modification 1 manages the individual score and the total score of the data analysis device 20A including the matching degree processing means 226 and the rating processing means 227, and the plurality of target rights obtained by the rating processing means 227. It has a data providing device 30 that extracts and provides at least one of an individual score and a total score corresponding to an external request from the database 5a. That is, when the data providing device 30 receives a data request, it is not necessary to perform a process for evaluating the validity of the right, so that wasteful use of the processing unit and the memory is suppressed and the target right is valid. Information about sex can be provided promptly. Further, the database 5a stores information such as a rating score obtained by the rating processing means 227. Therefore, the user can quickly and accurately select the right that meets his / her needs by visually recognizing the rating score associated with each right on the screen as shown in FIGS. 11 to 13, for example. ..
  • the configuration and operation of the data providing system 100 in the second modification will be described with reference to FIG. 25.
  • the data providing system 100 of the present modification 2 is based on the same premise as the above-mentioned modification 1, and the analysis processing unit 22B of the data analysis device 20B obtains the previous information based on the search report that is open to the public. It is characterized in that it has a function to extract separately. Since the overall configuration and operation of the data providing system 100 are the same as those of the above examples and the modified examples 1 described with reference to FIGS. 1 to 19, the same reference numerals are given to the configurations equivalent thereto. The explanation will be omitted.
  • the evaluation processing means 222b in the analysis processing unit 22B of the present modification 2 includes the search learning means 328, the document estimation means 329, and the rating processing means 327 together with the functional configurations of the evaluation processing means 122b of the modification 1.
  • the search learning means 328 generates the literature estimation model M11 by machine learning based on the search report included in each right-related information.
  • the document estimation model M11 is a trained model for inputting data based on the scope of claims for the target right and outputting day-ahead information having a relatively high semantic relevance to the target right. Since the document estimation model M11 is generated based on the search report, the day-to-day information output by the document estimation model M11 is the patent document or non-patent document described in the search report.
  • the search learning means 328 includes a so-called X document or Y document identification number (application number or publication number, etc.) in a plurality of search reports and one or more claims associated with the X document or Y document.
  • X document is a document particularly related to the associated claim, and it is judged that the invention is not novel or inventive step only in the document.
  • the Y document is considered to be a document particularly related to the associated claim and considered to be inventive due to a combination of the document and one or more other documents that is obvious to those skilled in the art. ing.
  • the search learning means 328 constructs the document estimation model M11 by machine learning using the claim or claim element as the training data (training data) and the identification number of the X document or the Y document as the correct answer label. More specifically, the search learning means 328 uses information obtained by subjecting a claim or a claim element to natural language processing as learning data. As natural language processing, a method of converting to a meaning vector, a method using morphological analysis, or the like can be used.
  • the document estimation means 329 is a document estimation model generated based on the information of the range of claims included in the search report and the information of the documents used as a reference for refusal, based on the information based on the scope of claims in the subject right. It is input to M11 and presumes the literature that is used as a reference for the refusal of the target right.
  • the document estimation means 329 generates input data by performing natural language processing on the claims or claim elements of the target rights for a plurality of preset target rights. Then, the document estimation means 329 inputs the generated input data to the document estimation model M11, and outputs the identification number of one or a plurality of days ago information or the information indicating that there is no corresponding document.
  • the document estimation means 329 may output related documents by the document estimation model M11 for all claims or all claim elements in the target right.
  • the document estimation means 329 may output the related documents by the document estimation model M11 for all the target rights, and the related documents by the document estimation model M11 for the target rights satisfying the preset conditions. Output processing may be performed.
  • the rating processing means 327 reflects the information of the document estimated by the document estimation means 329 in at least one of the individual score and the total score.
  • the rating processing means 327 may obtain the total score of each target right based on the comprehensive evaluation value of all the target rights and the output result by the document estimation means 329. For example, if the day-ahead information obtained by the document estimation means 329 exists in the day-ahead information extracted by the main related information Da or the sub-related information Db, the rating processing means 327 is a total match of the day-ahead information. After adjusting by weighting or the like so that the degree is lowered, the comprehensive evaluation value of the target right may be obtained again.
  • the rating processing means 327 sub-associates the day-ahead information. It may be added as information Db. In this case, the rating processing means 327 will obtain a new comprehensive evaluation value of the target right by using the total degree of agreement related to the day-ahead information obtained by the document estimation means 329.
  • the rating processing means 327 may obtain an individual score for each claim based on the individual evaluation value of each claim and the output result by the document estimation means 329. In this case, the rating processing means 327 may obtain the individual evaluation value by the same method as the comprehensive evaluation value.
  • the analysis processing unit 22B can be configured by an arithmetic unit such as a CPU or GPU, and a data analysis program P11 that cooperates with such an arithmetic unit to realize the above-mentioned and the following various functions. That is, the data analysis program P11 is a program for causing the analysis processing unit 22B and the storage unit 23 as computers to function as the collection processing means 122a, the evaluation processing means 222b, and the construction processing means 22c. Other configurations, alternative configurations, operations, and the like are the same as those of the above-described modification 1.
  • the data analyzer 20B in the second modification uses the input data based on the claim range in the target right as the information of the document included in the search report as a reference for the information refusal of the claim range. It has a document estimation means 329 for estimating a document which is input to the document estimation model M11 generated based on the above and is used as a reference for refusal of the target right. Then, the rating processing means 327 is configured to reflect the information of the document estimated by the document estimation means 329 in at least one of the individual score and the total score.
  • the day-to-day information that is closely related to the target right, which is leaked in the selection process of the day-to-day information by the extraction processing means 225 or the matching degree processing means 226, is extracted and reflected in the rating score. Can be done.
  • the day-ahead information extracted by the document estimation means 329 can be weighted to adjust the total degree of agreement, and each evaluation value can be corrected by the adjustment. Therefore, the accuracy of the individual score and the total score as the rating score can be improved.
  • the analysis processing unit 22B may be configured without providing the search learning means 328, and the document estimation means 329 may use an externally generated document estimation model M11. Other effects and the like are the same as those of the above-described modification 1.
  • ⁇ Modification example 3> The configuration and operation of the data providing system 100 in the third modification will be described with reference to FIG. 26.
  • the data providing system 100 of the third modification is based on the same premise as the first modification described above, and the analysis processing unit 22C of the data analyzer 20C is open to the public regarding the reasons for refusal (notice of reasons for refusal). ⁇ Based on the decision of refusal, etc.), each target right has a function to estimate the possibility of including the reason for invalidation of the description deficiency. Since the overall configuration and operation of the data providing system 100 are the same as those of the above examples and the modified examples 1 described with reference to FIGS. 1 to 19, the same reference numerals are given to the configurations equivalent thereto. The explanation will be omitted.
  • the evaluation processing means 322b in the analysis processing unit 22C of the modification example 3 includes the deficiency learning means 428, the deficiency estimation means 429, and the rating processing means 427 together with the functional configurations of the evaluation processing means 122b of the modification 1.
  • the deficiency learning means 428 generates the description deficiency estimation model M21 by machine learning based on the notice of reasons for refusal relating to the deficiency and the scope of claims relating to the application to which the notice of reasons for refusal is notified.
  • the deficiency in description means a violation of support requirements, a violation of clarity requirements, a violation of enablement requirements, and the like.
  • the notice of reasons for refusal including violation of support requirements includes, for example, "Article 36, Paragraph 6, Item 1" in Japan, “Art.84” in Europe, and “112 (a)” in the United States.
  • the combination of letters and numbers is included.
  • the notice of reasons for refusal including violation of the clarity requirement includes, for example, “Article 36, Paragraph 6, Item 2" in Japan, “Art.84” in Europe, and “112 (b)” in the United States. Includes combinations of letters and numbers.
  • the notice of reasons for refusal including violation of enablement requirements includes, for example, "Article 36, Paragraph 4, Item 1" in Japan, “Art.83” in Europe, and “112 (a)” in the United States. Includes combinations of letters and numbers.
  • Such information indicating the article number corresponding to the description deficiency is called “deficiency article data”.
  • the deficiency learning means 428 extracts a plurality of notices of reasons for refusal including deficiency clause data, and extracts an identification number related to the application from each of the extracted notices of reasons for refusal. In addition, the deficiency learning means 428 acquires the claims related to the application based on the extracted identification number. Then, the deficiency learning means 428 executes the generation / update process of the description deficiency estimation model M21 by machine learning using the claim or the claim element as the learning data and the information indicating that the description is deficient as the correct answer label. More specifically, the deficiency learning means 428 uses information obtained by subjecting a claim or a claim element to natural language processing as learning data.
  • the description deficiency estimation model M21 is a trained model for inputting data based on the claims of the target right and outputting the deficiency ratio, which is the ratio of the target right having a reason for invalidation related to the description deficiency.
  • the description deficiency estimation model M21 has a function of outputting a deficiency ratio for each claim.
  • the deficiency presuming means 429 provides information based on the scope of claims in the subject right based on the deficiency text data indicating the identification number of the application and the text number corresponding to the description deficiency contained in the document relating to the reason for refusal. It is input to the deficiency estimation model M21 to obtain the deficiency ratio, which is the ratio in which the target right has a reason for invalidation related to the description deficiency.
  • the deficiency estimation means 429 generates input data by subjecting a claim or claim element of the target right to natural language processing for a plurality of preset target rights. From the viewpoint of processing accuracy, the deficiency estimation means 429 may perform natural language processing based on a Transformer-based encoder.
  • the deficiency estimation means 429 inputs the generated input data into the description deficiency estimation model M21 to obtain and store the target right and the deficiency ratio of the claim.
  • the deficiency estimation means 429 may perform deficiency ratio estimation processing by the description deficiency estimation model M21 for all claims or all claim elements in the target right.
  • the deficiency estimation means 429 may perform estimation processing of the deficiency ratio by the description deficiency estimation model M21 for all the target rights.
  • the rating processing means 427 reflects the deficiency ratio determined by the deficiency estimation means 429 in at least one of the individual score and the total score.
  • the rating processing means 427 may add a total adjustment value based on the deficiency ratio to the comprehensive evaluation value of each target right.
  • the total adjustment table may be formed so that the total adjustment value decreases as the deficiency ratio increases.
  • the total adjustment value may be a positive value, a negative value, or a combination thereof.
  • a graph or function that associates the deficiency ratio with the total adjustment value may be used.
  • the rating processing means 427 can obtain the total adjustment value by comparing the deficiency ratio obtained by the deficiency estimation means 429 with the total adjustment table or the like.
  • the total adjustment value may be added to the comprehensive evaluation value only for the target rights whose deficiency ratio is equal to or higher than the preset deficiency threshold.
  • the rating processing means 327 may add an individual adjustment value based on the deficiency ratio to the individual evaluation value of each claim.
  • the rating processing means 427 may add an individual adjustment value based on the deficiency ratio to the individual evaluation value of each claim.
  • the individual adjustment table may be formed so that the individual adjustment value becomes smaller as the deficiency ratio increases.
  • the individual adjustment value may be a positive value, a negative value, or a combination thereof.
  • a graph or function that associates the deficiency ratio with the individual adjustment value may be used.
  • the rating processing means 427 can obtain the individual adjustment value by comparing the deficiency ratio obtained by the deficiency estimation means 429 with the individual adjustment table or the like.
  • the individual adjustment value may be added to the individual evaluation value only for the claims whose deficiency ratio is equal to or higher than the preset deficiency threshold.
  • the analysis processing unit 22C can be configured by an arithmetic unit such as a CPU or GPU and a data analysis program P21 that cooperates with such an arithmetic unit to realize the above-mentioned and the following various functions. That is, the data analysis program P21 is a program for causing the analysis processing unit 22C and the storage unit 23 as computers to function as the collection processing means 122a, the evaluation processing means 322b, and the construction processing means 22c. Other configurations, alternative configurations, operations, and the like are the same as those of the above-described modification 1.
  • the data analyzer 20C in the third modification shows the information based on the scope of the claim in the target right, the identification number of the application included in the document relating to the reason for refusal, and the article number corresponding to the deficiency. It has a deficiency estimation means 429 for inputting into the description deficiency estimation model M21 generated based on the text data and calculating the deficiency ratio regarding the target right. Then, the rating processing means 327 is configured to reflect the deficiency ratio obtained by the deficiency estimation means 429 in at least one of the individual score and the total score.
  • the data analyzer 20C it is possible to perform the validity rating of the target right in consideration of not only the violation of novelty and the violation of inventive step but also the reason for invalidation regarding the deficiency of description such as the violation of clarity. It is possible to improve the accuracy and reliability of the individual score and the total score of.
  • the rating processing means 327 obtains a deficiency score corresponding to at least one of the target right and the claim as one of the rating scores based on the deficiency ratio obtained by the deficiency estimation means 429, and stores it in the output database unit 25. May be good. Since the deficiency score can be provided to the outside as information indicating the effectiveness from the viewpoint of the description deficiency, it is possible to meet the needs such as wanting to distinguish between the novelty and inventive step and the description deficiency.
  • the analysis processing unit 22C may be configured without providing the deficiency learning means 428, and the deficiency estimation means 429 may use an externally generated description deficiency estimation model M21. Other effects and the like are the same as those of the above-described modification 1.
  • the data analyzer 20C may include the characteristic configuration of the modification 2. That is, the evaluation processing means 322b may be configured to include the document estimation means 329. In this case, the document estimation model M11 is stored in the storage unit 23 or the like.
  • the rating processing means 327 may reflect the information of the document estimated by the document estimating means 329 and the deficiency ratio obtained by the deficiency estimating means 429 in the rating score of each target right.
  • the evaluation processing means 322b may be configured to include the search learning means 328.
  • the information processing means 32a in the provision processing unit 32 of the present modification 4 has an estimated amount calculation function for obtaining an estimated cost cut amount for each right holder.
  • the estimated cost cut amount is a calculated amount based on the rating score, and is an estimated amount of pension cost that can be reduced if a part or all of the existing rights are waived.
  • FIG. 35 is an example of a cost cut table in which the rating score and the weighting coefficient are associated with each other.
  • the cost cut table is structured so that the weighting coefficient gradually increases as the rating score goes from high to low.
  • the cost cut table is table information stored in the storage unit 33 or the like, and the rating score and the weighting coefficient can be changed as appropriate.
  • the storage unit 33 stores, for example, a cost cut table that differs for each jurisdiction.
  • FIG. 35 shows an example in which the rating score is set in nine stages of "AAA”, “AA”, “A”, “BBB”, “BB”, “B”, “CCC”, “CC”, and “C” in order from the top. ..
  • the weighting coefficient in FIG. 35 is merely an example. That is, the weighting coefficient can be arbitrarily set and adjusted.
  • the information processing means 32a adds up the sum of the pension amounts corresponding to the remaining period of one right multiplied by the weighting coefficient corresponding to the rating score given to the right for all the rights of the right holder. To obtain the estimated cost cut amount.
  • the information processing means 32a obtains a weighting coefficient corresponding to the rating score by comparing the rating score given to the right with the cost cut table.
  • the information processing means 32a stores the obtained estimated cost cut amount and information for reducing the estimated cost cut amount in the database in the providing database unit 35. Information for reducing the estimated cost cut is information on rights to be abandoned.
  • the information processing means 32a reads the cost cut information related to the request from the database in the providing database unit 35 and provides it to the user.
  • the information processing means 32a may store the cost cut information in the storage unit 23.
  • the information processing means 32a may obtain the estimated cost cut amount based on a predetermined lower one or a plurality of rating scores. That is, the information processing means 32a sums up the total amount of pensions according to the remaining period of the rights to which, for example, "C", "CC”, or "C” is granted among the rights of a certain right holder, by the number of rights. You may find the estimated cost cut amount with.
  • the information processing means 32a may perform calculation processing of the estimated cost cut amount by using the information of the elapsed time from the application of the right. That is, the information processing means 32a may obtain the estimated cost cut amount by each of the above methods for the right for which a predetermined period has passed from the application, such as the right for which 10 years or more have passed since the application.
  • the information processing means 32a may obtain the estimated cost cut amount by each of the above methods according to the instruction by the user. That is, when the user designates the right holder and at least one of the rating scores via the information terminal 40, the information processing means 32a may obtain the estimated cost cut amount by each of the above methods. Further, the information processing means 32a uses the above methods to cut costs when the user specifies the right holder, at least one of the rating scores, and the elapsed time from the application via the information terminal 40. You may ask for a fixed amount.
  • the information processing means 32a of the present modification 4 obtains the estimated cost cut amount by at least one of the above methods, and provides the cost cut information to the user via the information terminal 40. ing. Therefore, the user can quickly know the cost reduction method and the reduction amount without performing any specialized calculation, and thus can perform economical and useful intellectual property management.
  • the estimated amount calculation function may be provided in, for example, the construction processing means 22c of the analysis processing unit 22.
  • the construction processing means 22c may store the obtained cost cut information in the database in the output database unit 25.
  • the information processing means 32a can store the cost cut information in the database in the providing database unit 35, and can appropriately provide the cost cut information to the user.
  • the configuration of the modified example 4 may be applied to the configurations of the modified examples 1 to 3 described above.
  • Embodiment 2 With reference to FIGS. 36 to 40, a configuration example relating to the data providing system and its surrounding environment in the second embodiment will be described with reference to particular differences from the first embodiment described above.
  • the data providing system of the second embodiment is characterized in that the number of products sold is limited.
  • the same reference numerals are used for the same configuration as the data providing system of the first embodiment described above, and the description thereof will be omitted.
  • the data providing device 130 includes a communication unit 31, a providing processing unit 132, a storage unit 33, and a providing database unit 35.
  • the storage unit 33 stores various data related to the provision of validity data and the like, in addition to the operation program of the provision processing unit 132 such as the data provision program P20.
  • the data providing program P20 is for causing the computer mounted on the data providing device 130 to function as the information processing means 132a, the determination processing means 132b, and the selection processing means 132c, which will be described later.
  • the providing processing unit 132 has an information processing means 132a, a determination processing means 132b, and a selection processing means 132c.
  • the determination processing means 132b determines whether or not the number of provided rights related to the provided validity data is less than the preset limit number.
  • the limited number is set to a natural number of 1 or more and stored in the storage unit 33 or the like. Since the effectiveness data is also a target product for sale, the number of offers is also referred to as the "number of sales" hereafter.
  • the selection processing means 132c selects one or a plurality of resale destinations from the registered users in response to the resale request of the validity data.
  • the information processing means 132a is constructed based on information related to a plurality of industrial property rights, and is effective data corresponding to an external request from a database containing validity data related to the validity of each of the plurality of industrial property rights. Is extracted and provided.
  • the determination processing means 132b determines that the number of sales is equal to or greater than the limit number
  • the information processing means 132a provides information that cannot be provided to the effect that the validity data corresponding to the industrial property right related to the determination cannot be provided. It is transmitted to the information terminal 40.
  • the information processing means 132a has a function of managing the number of sales by executing an increase / decrease process of the number of sales in the storage unit 33.
  • the information processing means 132a has a function of transmitting resale consultation information to the information terminal 40 related to the sales destination of the validity data when there is an application for resale of the validity data. Further, when the information terminal 40 relating to the sales destination of the validity data requests resale of the validity data, the information processing means 132a provides information corresponding to one or a plurality of resale destinations selected by the selection processing means 132c. It has a function of transmitting sales promotion information to the terminal 40 to consult the purchase.
  • the other configuration of the information processing means 132a is the same as that of the information processing means 32a of the first embodiment described above.
  • the determination processing means 132b determines whether or not the number of products sold is less than the limit number (step S302). If the number of sales is equal to or greater than the limited number (step S302 / No), the provision processing unit 32 transmits a purchase non-purchase notification to the information terminal 40. As a result, the information terminal 40 notifies the user of the information that the designated product cannot be purchased via the terminal display unit 47 or the notification unit (step S303). On the other hand, if the number of products sold is less than the limit (step S302 / Yes), the provision processing unit 32 transmits a purchase availability notification to the information terminal 40 (step S304).
  • the provision processing unit 32 waits for a purchase request from the information terminal 40 (step S305 / No, step S306 / No) until the permissible time elapses, and when the purchase request is transmitted from the information terminal 40 (step S305). / Yes), a payment request is transmitted to the payment server 600 (step S307). On the other hand, if the purchase request is not transmitted from the information terminal 40 until the permissible time elapses (step S305 / No, step S306 / Yes), the provision processing unit 32 transmits an error signal to the information terminal 40. .. As a result, the information terminal 40 notifies the user of the timeout via the terminal display unit 47 or the notification unit (step S308).
  • the provision processing unit 32 waits for the payment notification from the payment server 600 (step S309 / No, step S310 / No) until the waiting time elapses, and when the payment notification is transmitted from the payment server 600 (step S309). / Yes), the product related to the purchase is provided to the information terminal 40 (step S311). Then, the providing processing unit 32 increments the number of sales of the product (step S312).
  • step S309 / No, step S310 / Yes the provision processing unit 32 transmits an error signal to the information terminal 40. ..
  • the information terminal 40 notifies the user of the time-out via the terminal display unit 47 or the notification unit (step S313).
  • the information terminal 40A is an information terminal 40 used by a user who has purchased a product to be resold
  • the information terminal 40B is an information terminal 40 used by a user who has not purchased the product to be resold.
  • the user of each information terminal 40 is logged in to the system of the data providing device 30 via the initial screen G1 or the like.
  • the terminal processing unit 42 of the information terminal 40B receives the resale application by the user (step S401)
  • the terminal processing unit 42 transmits the resale application information to the data providing device 30 (step S402).
  • the selection processing means 132c selects one or more consultation destinations based on the resale application information (step S403). Then, the selection processing means 132c transmits resale consultation information to the information terminal 40A which is the selected consultation destination (step S404).
  • the terminal processing unit 42 of the information terminal 40A displays an alert for resale consultation on the terminal display unit 47 or notifies the notification unit (step S405).
  • the terminal processing unit 42 causes the terminal display unit 47 to display detailed information about the resale consultation in response to the user's operation (step S406).
  • the terminal processing unit 42 receives the instruction to accept the resale consultation by the user (step S407), the terminal processing unit 42 transmits the acceptance information to the data providing device 30 (step S408).
  • the information processing means 132a When the information processing means 132a receives the acceptance information, it transmits the resale confirmation information to the information terminal 40B (step S409).
  • the terminal processing unit 42 of the information terminal 40B receives the purchase instruction from the user (step S410), the terminal processing unit 42 transmits the purchase request to the data providing device 30 (step S411).
  • the information processing means 132a executes the settlement process in the same manner as in steps S119 to S124 of FIG. 18 (step S412). Then, the data providing device 30 provides the product related to the user's purchase to the information terminal 40 (step S413).
  • the terminal processing unit 42 of the information terminal 40A receives the resale request instruction from the user (step S501), transmits the resale request information to the data providing device 30 (step S502).
  • the selection processing means 132c selects one or a plurality of resale destinations from the registered users according to the resale request information (step S503).
  • the information processing means 132a transmits sales promotion information to the information terminal 40B corresponding to one or a plurality of resale destinations selected by the selection processing means 132c (step S504).
  • the terminal processing unit 42 of the information terminal 40B displays an alert for sales promotion on the terminal display unit 47 or notifies the notification unit (step S505).
  • the terminal processing unit 42 causes the terminal display unit 47 to display detailed information about the resale request in response to the user's operation (step S506).
  • the terminal processing unit 42 receives the purchase instruction from the user (step S507), the terminal processing unit 42 transmits the purchase desired signal to the data providing device 30 (step S508), and the information processing means 132a transmits the resale possible notification to the information terminal 40A. (Step S509).
  • the terminal processing unit 42 of the information terminal 40A receives the resale instruction by the user (step S510), the resale execution request is transmitted to the data providing device 30 (step S511), and the selection processing means 132c informs the resale confirmation information. It is transmitted to the terminal 40B (step S512).
  • the terminal processing unit 42 of the information terminal 40B receives the purchase instruction from the user (step S513), the terminal processing unit 42 transmits the purchase request to the data providing device 30 (step S514).
  • the information processing means 132a executes the settlement process in the same manner as in steps S119 to S124 of FIG. 18 (step S515).
  • the data providing device 30 provides the product related to the user's purchase to the information terminal 40 (step S516). Other operations are the same as in the case of the first embodiment.
  • FIG. 37 shows an example in which the determination processing means 132b determines whether or not the number of sales is less than the limit number when the purchase request of the product from the information terminal 40 is received, but the present invention is not limited to this. ..
  • the number of products sold is incremented by the information processing means 132a at the timing when the product is purchased. At that time, the determination processing means 132b may determine whether or not the number of products sold is less than the limit number. Then, when the determination processing means 132b determines that the number of sales is equal to or greater than the limit number, the information processing means 132a provides information on the information terminal indicating that the product corresponding to the right related to the determination cannot be provided. It is good to provide to 40. Alternatively, the information processing means 132a includes information indicating that the sale of a specific product is not possible in the information on the screens related to the purchase of the product (user screen G2, basic screen G3, detail screen G4, list screen G5, etc.). You may.
  • the terminal processing unit 42 of the information terminal 40 can show the information that some products cannot be provided on the terminal display unit 47, as shown in FIG. 40, for example.
  • FIG. 40 as information indicating that the purchase of the product is impossible, a method of changing the mode of the bar graph is illustrated (see July to September in FIG. 40), but the purchase of the product is not limited to this. The fact that it is not possible may be indicated by characters, icons, or the like.
  • the terminal processing unit 42 may display, for example, an offer button W for applying for resale of the product, along with information indicating that the product cannot be purchased, on the display screen of the terminal display unit 47.
  • the data providing device 130 of the second embodiment extracts the effectiveness data corresponding to the external request from the database constructed in advance. Therefore, when the data providing device 130 receives a data request, it is not necessary to perform a process for evaluating the validity of the right, so that wasteful use of the processing unit and the memory can be suppressed, and the industrial property right can be obtained. Information on effectiveness can be provided promptly.
  • the provision processing unit 132 has a determination processing means 132b for determining whether or not the number of provisions (sales number) of the right to provide the validity data is less than the limit number. Then, when the determination processing means 132b determines that the number of provisions is equal to or greater than the limit number, the information processing means 132a transmits the unprovidable information to the information terminal 40. Therefore, the information terminal 40 can inform the user that a specific product cannot be purchased by the terminal display unit 47 (see FIG. 40) or the notification unit.
  • the determination processing means 132b may determine whether or not the number of validity data provided corresponding to the right is less than the limit number. Then, when the determination processing means 132b determines that the number of provisions is equal to or greater than the limit number, the information processing means 132a provides information that the determination processing means 132b cannot provide the validity data corresponding to the right related to the determination. It may be transmitted to the information terminal 40. Even in this way, the information terminal 40 can inform the user that the designated product cannot be purchased by the terminal display unit 47, the notification unit, or the like.
  • the information processing means 132a has a function of transmitting resale consultation information to the information terminal 40 related to the sales destination of the validity data when there is an application for resale of the validity data. Therefore, it is possible to effectively utilize information resources by encouraging users who have surplus products to resell them.
  • the selection processing means 132c may select all the sales destinations as the transmission destinations of the resale consultation information, and the resale consultation information based on the product ownership period, the action history, and the like. You may select the destination of.
  • the selection processing means 132c has a function of selecting one or a plurality of resale destinations from the registered users in response to the resale request of the validity data. Then, when the information terminal 40 related to the sales destination of the validity data requests resale of the validity data, the information processing means 132a provides information corresponding to one or a plurality of resale destinations selected by the selection processing means 132c. The sales promotion information to the effect that the purchase is consulted is transmitted to the terminal 40. Therefore, it is possible to meet the needs of both the resale source user and the resale destination user, and it is possible to effectively utilize information resources.
  • the resale processing of the validity data has been mainly described, but the data providing device 130 can also perform the resale processing of other products related to the industrial property right in the same manner as described above. ..
  • Other effects, alternative configurations, and the like are the same as in the first embodiment.
  • each of the configurations of the above-described modifications 1 to 4 can be applied to the data providing system 100 of the second embodiment.
  • FIG. 2 shows an example in which the data providing system 100 is composed of a data analysis device 20, a data providing device 30, and one or a plurality of information terminals 40, but the present invention is not limited thereto.
  • the data providing system 100 is composed of a data providing device 30 and one or a plurality of information terminals 40, and the data analysis device 20 may not be included.
  • FIG. 2 shows an example in which the data management system 10 is composed of two servers, but the present invention is not limited to this.
  • the data management system 10 may be configured by one server having both the configuration and function of the data analysis device 20 and the configuration and function of the data providing device 30. In this case, the data management system 10 may be configured without providing either the output database unit 25 or the provision database unit 35.
  • the analysis processing unit 22 may be configured without providing the translation processing means 121. However, it is possible to construct a highly accurate and diverse data management system 10 by executing the learning phase and the estimation phase after unifying the languages of the core data by the translation processing means 121. Further, the analysis processing unit 22 may be configured without providing the pretreatment means 122. However, if the pretreatment means 122 is provided, the accuracy of machine learning can be improved, and a highly reliable product can be provided. In each of the above embodiments, an example in which the rating score is set to 7 levels or 9 levels is shown, but the rating score is not limited to this, and any number of levels can be set.
  • each display screen of the terminal display unit 47 has been described by exemplifying FIGS. 4 to 17 and 40.
  • the mode of each display screen is not limited to the mode of each of the above figures, and each part of the display screen is described. Can be selected as appropriate.
  • each display screen may adopt a drop-down type UI instead of the manually input input field, and may adopt a drum roll type UI or the like instead of the drop-down type UI. ..
  • the data providing system 100 may be configured to provide a difference in the amount of information to be provided between the charged user and the non-charged user. It should be noted that which information is to be charged can be arbitrarily set and changed.
  • the analysis processing unit 22A shows an example of generating a 32-dimensional meaning vector, but the dimension of the meaning vector is not limited to this.
  • the method of obtaining the degree of agreement by subtracting the cosine similarity from 1 has been described, but the present invention is not limited to this, and the cosine similarity may be directly used as the degree of agreement.
  • 4a classification database 5a database, 10 data management system, 20, 20A to 20C data analyzer, 21 communication unit, 22, 22A to 22C analysis processing unit, 22a, 122a collection processing means, 22b, 122b, 222b, 222b evaluation Processing means, 22c construction processing means, 23 storage unit, 24 collection database unit, 25 output database unit, 30, 130 data providing device, 31 communication unit, 32, 132 providing processing unit, 32a, 132a information processing means, 33 Storage unit, 35 Database unit for provision, 40, 40A, 40B Information terminal, 41 terminal communication unit, 42 terminal processing unit, 43 terminal storage unit, 46 terminal input unit, 47 terminal display unit, 47a search unit, 100 data providing system , 121, 221 translation processing means, 122 preprocessing means, 123 learning processing means, 124 estimation processing means, 132b judgment processing means, 132c selection processing means, 225 extraction processing means, 226 matching degree processing means, 227, 327, 427 ratings.
  • Processing means 328 search learning means, 329 document estimation means, 428 deficiency learning means, 429 deficiency estimation means, 500 information providing server group, 600 payment server, A search unit, A1 input field, A2 search button, B ranking indicator, B1 rating button, B2 ESG button, C dashboard section, D1 1st rating section, D2 2nd rating section, E1 designation button, E2 confirmation button, E3 purchase button, G1 initial screen, G2 user screen, G3 basic screen, G4 Details screen, G5 list screen, G6 right holder screen, G7 right holder screen, G8 ESG general screen, G9 ESG individual screen, G10 inventor screen, Gx purchase screen, H payment method section, J1 notification column, J2 unique information section, K1 1st data, K2 2nd data, K3 list display section, K4 period specification field, L login button, L1 individual evaluation section, L2 sort instruction section, L3 publication button, L4 list section, L5 document section, L6 progress information section, L7 Inventor Information Department,

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

データ管理システムは、複数の権利に関連する情報をもとに構築され、各権利それぞれの有効性データを管理するデータベースから、外部要求に対応する有効性データを抽出し提供するデータ提供装置を有する。有効性データは、複数の権利間での相対的な有効性を示す格付けスコアを含む。データ管理システムは、複数の権利それぞれの有効性を推定するデータ分析装置を有する。テータ分析装置は、複数の権利それぞれの格付けスコアを管理する上記のデータベースを構築する機能を有する。データ提供システムは、例えばデータ提供装置と1又は複数の情報端末とにより構成される。

Description

データ提供装置、システム、プログラム、方法、データ分析装置、データ管理システム、方法、及び記録媒体
 本発明は、産業財産権の有効性に関する情報を提供するためのデータ提供装置、データ分析装置、データ管理システム、データ提供システム、データ提供プログラム、記録媒体、データ提供方法、及びデータ管理方法に関する。
 特許は、審査等において、人の手により先行技術が調査され、特許性が評価されたものである。したがって、特許性の調査には漏れがあることも少なくなく、特許は、有効性が不明確な状態で設定登録されているのが実情である。意匠権や商標権等の他の産業財産権も、人の手によって調査されるため、特許と同様、有効性の不明確さがつきまとう。
 こうした中、産業財産権の権利所有者(権利者)は、他社への提訴前や自己の権利の存続要否の判断時等において、権利の客観的な有効性について知りたいと考える。一方、第三者は、実施又は使用に際して、障害となり得る権利の存否と共に、該権利の有効性が知りたいと考える。加えて、第三者は、他人から警告書が届いた場合等において、無効資料調査の必要が生じる。
 ところで、権利の有効性は、弁理士による鑑定等を通じて知ることができる。ただし、鑑定等は、人の手によって行われ、検索式の構築及び先行文献の吟味などに手間と時間がかかり、コストがかさむ。そこで、従来から、権利の有効性を自動的に導出するシステムが開発されている(例えば、特許文献1参照)。特許文献1の特許有効性評価装置は、指定された特許と公知技術とを照合し、該特許における要素と合致する要素を有する公知技術を抽出するようになっている。
特開2005-332330号公報
 しかしながら、特許文献1の特許有効性評価装置は、ユーザによる特許の指定を受けたときに、指定された特許の有効性を評価するための処理を開始するようになっている。よって、CPU等の処理部やメモリなどのリソースを逐一活用する必要が生じ、産業財産権の有効性に関する情報をユーザへ提供するまでに多くの時間がかかる。そのため、処理部やメモリの無駄な使用を抑制し、産業財産権の有効性に関する情報を迅速に提供するシステムが望まれている。
 本発明は、上述のような課題を解決するためになされたものであり、処理部やメモリの無駄な使用を抑制し、産業財産権の有効性に関する情報を迅速に提供するためのデータ提供装置、データ分析装置、データ管理システム、データ提供システム、データ提供プログラム、データ分析プログラム、記録媒体、データ提供方法、及びデータ管理方法を提供することを目的とする。
 本発明の一態様に係るデータ提供装置は、複数の産業財産権に関連する情報をもとに構築され、複数の産業財産権それぞれの有効性に係る有効性データを管理するデータベースから、外部の要求に対応する有効性データを抽出して提供する提供処理部を備え、有効性データは、複数の産業財産権の間での相対的な有効性を示す格付けスコアを含むものである。
 本発明の一態様に係るデータ管理システムは、複数の産業財産権に関連する情報を用いて複数の産業財産権それぞれの有効性を推定するデータ分析装置と、上記のデータ提供装置と、を有し、データ分析装置は、外部から収集した複数の産業財産権に関連する情報のそれぞれに含まれるコアデータに対し、共通言語に統一化する翻訳処理を施して翻訳データを生成する翻訳処理手段と、翻訳データに基づく学習用データを用いた機械学習により、有効性データを求めるための推定モデルを生成する学習処理手段と、を有するものである。
 本発明の一態様に係るデータ分析装置は、分析対象とされている特許又は実用新案に係る対象権利におけるクレームの1又は複数のクレーム要素を意味ベクトルである第1ベクトルに変換すると共に、発明又は考案に関連する情報であって対象権利の出願日よりも前に公開された複数の日前情報それぞれの一部又は全部を分割した分割データごとに意味ベクトルである第2ベクトルに変換し、各第1ベクトルと各第2ベクトルとの相互比較により、対象権利におけるクレームのクレーム要素と各日前情報それぞれとの一致度である総一致度を求める一致度処理手段と、一致度処理手段により求められた各総一致度に基づいてクレームの有効性の指標となる個別スコアを求める格付処理手段と、を有し、格付処理手段は、全ての対象権利についての個別スコアを用いて、複数の対象権利間での相対的な権利の有効性を示す総合スコアを求めるものである。
 本発明の一態様に係るデータ管理システムは、上記のデータ分析装置と、格付処理手段により求められた複数の対象権利それぞれの個別スコア及び総合スコアを管理するデータベースから、外部の要求に対応する個別スコア及び総合スコアのうちの少なくとも1つを抽出して提供するデータ提供装置と、を有するものである。
 本発明の一態様に係るデータ提供システムは、上記のデータ提供装置と、データ提供装置と通信可能な情報端末と、を有し、提供処理部は、有効性データを含む画面の情報を情報端末に提供するものであり、情報端末は、データ提供装置から提供された画面の情報を表示する表示部を有するものである。
 本発明の一態様に係るデータ提供システムは、上記のデータ管理システムと、データ提供装置と通信可能な情報端末と、を有し、提供処理部は、有効性データを含む画面の情報を情報端末に提供するものであり、情報端末は、データ提供装置から提供された画面の情報を表示する表示部を有するものである。
 本発明の一態様に係るデータ提供プログラムは、データ提供装置に搭載されたコンピュータを、複数の産業財産権に関連する情報をもとに構築され、複数の産業財産権それぞれについての各産業財産権の間での相対的な有効性を示す格付けスコアを含む有効性データを管理するデータベースから、外部の要求に対応する有効性データを抽出して提供する情報処理手段、として機能させるためのものである。
 本発明の一態様に係る記録媒体は、上記のデータ提供プログラムを記録したコンピュータ読み取り可能な記録媒体である。
 本発明の一態様に係るデータ分析プログラムは、データ分析装置に搭載されたコンピュータを、外部から収集した複数の産業財産権に関連する情報のそれぞれに含まれるコアデータに対し、共通言語に統一化する翻訳処理を施して翻訳データを生成する翻訳処理手段、及び、翻訳データに基づく学習用データを用いた機械学習により、複数の産業財産権それぞれについての各産業財産権の間での相対的な有効性を示す格付けスコアを含む有効性データを求めるための推定モデルを生成する学習処理手段、として機能させるためのものである。
 本発明の一態様に係る記録媒体は、上記のデータ分析プログラムを記録したコンピュータ読み取り可能な記録媒体である。
 本発明の一態様に係るデータ提供方法は、ネットワークを介して情報端末から1又は複数の産業財産権の指定を受け付け、複数の産業財産権に関連する情報をもとに構築されたデータベースであって、複数の産業財産権それぞれについての各産業財産権の間での相対的な有効性を示す格付けスコアを含む有効性データを管理するデータベースから、指定に係る産業財産権に対応する有効性データを抽出し、抽出した有効性データを情報端末に提供するようになっている。
 本発明の一態様に係るデータ管理方法は、外部から収集した複数の産業財産権に関連する情報のそれぞれに含まれるコアデータに対し、共通言語に統一化する翻訳処理を施して翻訳データを生成し、生成した翻訳データに基づく学習用データを用いての機械学習により、複数の産業財産権それぞれについての各産業財産権の間での相対的な有効性を示す格付けスコアを含む有効性データを求めるための推定モデルを生成するようになっている。
 本発明によれば、外部の要求に対応する有効性データを予め構築されたデータベースから抽出することから、要求を受けた際には、権利の有効性を評価するための処理を行う必要がない。そのため、処理部やメモリの無駄な使用を抑制し、産業財産権の有効性に関する情報を迅速に提供することができる。
本発明の実施の形態1に係るデータ提供システム及びその周辺構成を例示したブロック図である。 図1のデータ管理システムの機能的な構成を例示したブロック図である。 図1の情報端末の機能的な構成を例示したブロック図である。 図1の情報端末に表示される初期画面を概略的に例示した説明図である。 図1の情報端末に表示されるユーザ画面を概略的に例示した説明図である。 図1の情報端末に表示される基本画面を概略的に例示した説明図である。 図1の情報端末に表示される詳細画面を概略的に例示した説明図である。 図1の情報端末に表示される購入画面を概略的に例示した説明図である。 図1の情報端末に表示される一覧画面を概略的に例示した説明図である。 図1の情報端末に表示される基本画面の他の例を概略的に示す説明図である。 図1の情報端末に表示される権利者画面を概略的に例示した説明図である。 図1の情報端末に表示される権利画面を概略的に例示した説明図である。 図1の情報端末に表示される権利者画面の他の例を概略的に示す説明図である。 図1の情報端末に表示されるユーザ画面の他の例を概略的に示す説明図である。 図1の情報端末に表示されるESG全般画面を概略的に例示した説明図である。 図1の情報端末に表示されるESG個別画面を概略的に例示した説明図である。 図1の情報端末に表示される発明者画面を概略的に例示した説明図である。 図1のデータ提供システムによるデータ提供方法のうち、ユーザが産業財産権に関する商品を購入する際の動作を例示したシーケンスチャートである。 図1のデータ提供システムによるデータ提供方法のうち、ユーザが購入済みの商品を閲覧する際の動作を例示したシーケンスチャートである。 本発明の実施の形態1の変形例1に係るデータ分析装置の機能的な構成を例示したブロック図である。 図20の収集処理手段が生成する分類用データベースの概要を例示した説明図である。 クレームのクレーム要素に対応する種々のデータを例示した表である。 図20の評価処理手段が求める、各クレーム要素と複数の発明関連情報との間の総一致度を例示した表である。 図20の評価処理手段が求める、あるクレームのクレーム要素と複数の発明関連情報との間の総一致度を例示した表である。 図24の各総一致度を一致フラグが立っているか否かにより整理した説明図である。 図20の評価処理手段が「新規性なし」に対応する個別スコアを付与するクレームの状況例を示す表である。 図20の評価処理手段が「進歩性なし」に対応する個別スコアを付与するクレームの状況例を示す表である。 本発明の実施の形態1の変形例1に係るデータ管理方法のうち、分類用データベースを生成する動作の流れを例示したフローチャートである。 本発明の実施の形態1の変形例1に係るデータ管理方法のうち、非特許文献の情報に分類データを付与する動作の流れを例示したフローチャートである。 本発明の実施の形態1の変形例1に係るデータ管理方法のうち、あるクレーム要素と各発明関連情報との総一致度の演算に関する動作の流れを例示したフローチャートである。 本発明の実施の形態1の変形例1に係るデータ管理方法のうち、対象権利の総合スコアの演算に関する動作の流れを例示したフローチャートである。 本発明の実施の形態1の変形例1に係るデータ管理方法のうち、図20の評価処理手段による、1つのクレームの個別スコアを求める動作の流れを例示したフローチャートである。 本発明の実施の形態1の変形例2に係るデータ分析装置の機能的な構成を例示したブロック図である。 本発明の実施の形態1の変形例3に係るデータ分析装置の機能的な構成を例示したブロック図である。 本発明の実施の形態1の変形例4に係るデータ提供装置等に格納されるコストカットテーブルを例示した説明図である。 本発明の実施の形態2に係るデータ提供システムにおけるデータ管理装置の機能的な構成例を示すブロック図である。 本発明の実施の形態2に係るデータ提供方法のうち、ユーザが産業財産権に関する商品を購入する際の動作を例示したフローチャートである。 本発明の実施の形態2に係るデータ提供方法のうち、購入不可の状態の商品の転売依頼に対して、該商品の販売先の情報端末へオファーを出して転売を仲介する際の動作を例示したシーケンスチャートである。 本発明の実施の形態2に係るデータ提供方法のうち、商品の販売先の情報端末からの要求に応じてデータ提供装置が該商品の転売を中継する際の動作を例示したシーケンスチャートである。 本発明の実施の形態2に係るデータ提供システムにおいて、情報端末に表示される詳細画面を概略的に例示した説明図である。
実施の形態1.
 図1を参照して、本実施の形態1におけるデータ提供システム及びその周辺環境に係る構成例について説明する。図1に示すように、データ提供システム100は、データ管理システム10と、1又は複数の情報端末40と、により構成されている。データ管理システム10は、情報提供サーバ群500から複数の産業財産権に関連する情報を収集し、複数の産業財産権それぞれの有効性等を求めるための演算処理を行うことで、種々の有意な情報を求めて管理するものである。
 ここで、産業財産権とは、知的財産権のうちの、特許権、実用新案権、意匠権、及び商標権のことである。産業財産権には、権利内容、権利者、発明者又は考案者などの他、出願経過に関する情報や、審査等の内容を示す情報などが紐付けられている。審査等の内容を示す情報には、例えば、サーチ会社の検索報告書や、審査官等による検索処理や審査等を示す情報が含まれる。つまり、産業財産権に関連する情報は、産業財産権に紐付けられた上記のような情報のことである。以降では、産業財産権に関連する情報のことを「権利関連情報」ともいい、産業財産権のことを単に「権利」ともいう。
 ここで、産業財産権とは、知的財産権のうちの、特許権、実用新案権、意匠権、及び商標権のことである。産業財産権には、権利内容、権利者、発明者又は考案者などの他、出願経過に関する情報や、審査等の内容を示す情報などが紐付けられている。審査等の内容を示す情報には、例えば、サーチ会社の検索報告書や、審査官等による検索処理や審査等を示す情報が含まれる。本実施の形態1において、産業財産権に関連する情報は、産業財産権に紐付けられた上記のような情報の他、各種の技術論文・技報、SNS(social networking service)などの情報のうち、ネットワークNを介して取得可能で且つ産業財産権と関わりのあるものを含む。以降では、産業財産権に関連する情報のことを「権利関連情報」ともいい、産業財産権のことを単に「権利」ともいう。
 データ管理システム10は、データ分析装置20と、データ提供装置30と、を有している。データ分析装置20と、データ提供装置30と、情報端末40と、情報提供サーバ群500と、決済サーバ600とは、インターネットなどのネットワークNを介して通信可能に接続されている。
 情報提供サーバ群500は、例えばAPI(Application Programming Interface)を通じて権利関連情報を提供する世界各国のサーバ等のことである。情報提供サーバ群500を構成する各サーバでは、1つの権利に対し、1つのデータセットである権利関連情報が紐付けられている。決済サーバ600は、クレジットカードや電子マネーの決済代行会社等が運用するサーバであり、ネットワークNには通常、複数の決済サーバ600が接続されている。データ提供装置30は、情報端末40にて指定された決済方法に対応する決済サーバ600と通信することにより、該情報端末40のユーザの決済処理を実行する。
 データ分析装置20は、情報提供サーバ群500から収集した複数の権利関連情報をもとに、各権利それぞれの有効性を解析し、解析の結果と、解析結果導出の根拠となった情報などを、解析に係る権利に紐付けて格納するものである。データ分析装置20は、クラウドコンピューティングに基づくクラウドサーバ、もしくは物理サーバ、又はこれらを組み合わせたシステムなどにより構成される。
 データ提供装置30は、複数の権利関連情報をもとに構築され、各権利それぞれの有効性に係る有効性データを管理するデータベース5aから、外部の要求に対応する有効性データ等の情報を抽出して提供するものである。本実施の形態1において、情報の「提供」とは、提供用データベース部35内のデータベース5aにおける一部又は全部の情報へのアクセス権限を与えることである。
 データ提供装置30は、アクセスを要求してきた情報端末40に対して公開情報を提供すると共に、所定の料金の支払いを行ったユーザの情報端末40に対しては、一部又は全部の非公開情報をさらに提供するようになっている。ここで、公開情報とは、料金の支払い如何にかかわらず、ユーザに対して一般公開している情報である。非公開情報とは、会社単位、期間単位、もしくは権利単位等での購入処理を行ったユーザ、又はグレードアップ等の公開制限を解除する手続きを行ったユーザに対して提供する情報のことである。データ提供装置30は、クラウドコンピューティングに基づくクラウドサーバ、もしくは物理サーバ、又はこれらを組み合わせたシステムなどにより構成される。
 データ提供システム100は、ユーザが購入した情報を情報端末40にダウンロードさせる構成を採ってもよい。その際、データ提供装置30は、ハッシュ関数を用いてタイムスタンプを付与するようにするとよい。また、データ提供システム100においてユーザが購入した情報は、MICROSOFT EXCEL(登録商標)のXLSファイル、CSV(Comma-Separated Values)ファイル、テキストファイルなどのデータファイルで提供してもよく、紙媒体にプリントアウトして提供してもよい。
 情報端末40は、ユーザの要求に応じてデータ提供装置30と通信し、有効性データ等の情報を取得してユーザに提供するものである。情報端末40は、ユーザの操作に応じて、データ提供装置30が提供するWebサイトへのアクセスやログインなどを行うと共に、Webサイト内の種々の情報を表示し、権利に紐付けられた情報の取引等に関する処理を行う。
 次に、図2を参照して、データ管理システムの機能的な構成例について説明する。図2に示すように、データ分析装置20は、通信部21と、分析処理部22と、記憶部23と、収集用データベース部24と、出力用データベース部25と、を有している。通信部21は、分析処理部22がネットワークNに接続された機器等との間で有線又は無線による通信を行うためのインタフェースである。
 記憶部23は、データ分析プログラムP1などの分析処理部22の動作プログラムの他、有効性データなどの生成、更新、及び管理に関連する種々のデータを記憶する。また、記憶部23には、学習用データを用いた機械学習により生成される推定モデルM1が格納される。記憶部23は、RAM(Random Access Memory)及びROM(Read Only Memory)、フラッシュメモリ等のPROM(Programmable ROM)、SSD(Solid State Drive)、又はHDD(Hard Disk Drive)等により構成することができる。
 収集用データベース部24は、分析処理部22により収集された権利関連情報などを格納する記憶装置である。収集用データベース部24は、RAM及びROM、フラッシュメモリ等のPROM、SSD、又はHDD等により構成される。出力用データベース部25は、権利ごとに有効性データ等の情報が整理されたデータベースを格納する記憶装置である。出力用データベース部25は、RAM及びROM、フラッシュメモリ等のPROM、SSD、又はHDD等により構成される。
 分析処理部22は、外部から収集するデータセットである権利関連情報を用いて推定モデルM1を生成するものである。ここで、権利関連情報は、推定モデルM1を生成する際に必要となるコアデータと、補助的あるいは付随的なデータである補助データと、を含んでいる。産業財産権が特許権の場合、コアデータには、クレーム(請求項)の情報、拒絶理由通知書、サーチ会社の検索報告書などが含まれる。分析処理部22は、コアデータと推定モデルM1とを用いて有効性データ等の情報を生成し、権利ごとに有効性データ等の情報を整理することにより出力用データベース部25にデータベースを構築するものである。分析処理部22は、学習フェーズにおいて、権利関連情報に含まれるコアデータを学習対象データとして用い、推定フェーズにおいて、権利関連情報に含まれるコアデータを分析対象データとして用いる。
 より具体的に、分析処理部22は、収集処理手段22aと、評価処理手段22bと、構築処理手段22cと、を有している。収集処理手段22aは、API等を通じて権利関連情報を定期的に収集するものである。収集処理手段22aは、世界中の特許文献、意匠公報、商標公報、非特許文献などのデータを収集する。非特許文献には、各種の技術論文・技報、技術標準、企業・研究機関・大学等のWebサイト、Web上の記事・カタログ、ブログ、SNS、YouTube(登録商標)などの情報が含まれ、拒絶理由通知等において引用されたものに限らない。収集処理手段22aが収集するデータには、複数の権利関連情報が含まれる。収集処理手段22aは、収集した複数の権利関連情報を含む種々のデータのうちの一部又は全部に対し、情報の区切りの整理やファイル形式の整備などを施して正規化する機能を有している。
 評価処理手段22bは、産業財産権の有効性に関する事項を評価するものである。評価処理手段22bは、収集処理手段22aが収集した権利関連情報以外のデータを、学習対象データとして用いてもよく、分析対象データとして用いてもよい。評価処理手段22bは、翻訳処理手段121と、前処理手段122と、学習処理手段123と、推定処理手段124と、を有している。翻訳処理手段121は、学習対象データ又は分析対象データを予め設定された共通言語に統一化するものである。以降では、学習対象データと分析対象データとを区別せずに用いる場合、これらを「対象データ」と総称する。すなわち、翻訳処理手段121は、権利関連情報ごとに対象データを抽出し、抽出した対象データが共通言語以外の言語で構成されていれば、該対象データを共通言語に翻訳して翻訳データを生成する。翻訳処理手段121は、対象データが共通言語を含んでいても、対象データの一部に共通言語以外の言語が含まれていれば、その対象データに翻訳処理を施して翻訳データを生成する。一方、翻訳処理手段121は、権利関連情報から抽出した対象データの全体が共通言語で構成されていれば、該対象データに対して何ら処理を施さない。以降では、共通言語に統一化された学習対象データのことを学習翻訳データとし、共通言語に統一化された分析対象データのことを分析翻訳データとし、これらを「翻訳データ」と総称する。本実施の形態1では、共通言語として英語を採用しているが、他の言語を共通言語として採用してもよい。
 前処理手段122は、学習翻訳データに解析処理を施すことにより、推定モデルM1の訓練に用いる学習用データを生成する。前処理手段122は、分析翻訳データに解析処理を施すことにより、権利の格付けなどを推定するために推定モデルM1の入力とする分析用データを生成する。
 より具体的に、前処理手段122は、翻訳データに対し、形態素解析などの自然言語処理を施すテキスト解析機能を有している。形態素解析とは、自然言語で書かれた翻訳データを、言語上の最小単位である形態素に分割し(分かち書きし)、各形態素のそれぞれの品詞や変化などを判別することである。すなわち、前処理手段122は、翻訳データから分割した各形態素のそれぞれに、動詞、名詞、形容詞などの品詞の情報を付して分散表現に変換することにより学習用データ及び分析用データを生成し、生成した学習用データ及び分析用データを記憶部23に記憶させる。前処理手段122は、各形態素のそれぞれに変換処理を施す際、機械学習の鍵となるキー情報を抽出するようにしてもよく、さらに、抽出したキー情報に対して重み付けなどの処理を行ってもよい。
 特に産業財産権が特許権の場合、前処理手段122が、クレームに係る翻訳データを分解して学習用データ及び分析用データを生成し、学習処理手段123が、学習用データを用いて推定モデルM1を生成し更新するようにしてもよい。これにより、推定モデルM1は、分解した各文言と一致する又は近似する文言を含む技術情報を精度よく抽出する学習済みモデルとなる。学習処理手段123は、クレームに係る翻訳データから分解により小分けされた文言と、推定処理手段124によって抽出された技術情報とを組み合わせた情報を教師データとして用いることにより、推定モデルM1の生成・更新処理を行ってもよい。
 また、前処理手段122は、文言を組み合わせたフレーズのパターンを生成し、生成したフレーズパターンごとに技術情報を紐付けるようにしてもよい。そして、学習処理手段123は、フレーズパターンと技術情報とを組み合わせた情報を教師データとして用いることにより推定モデルM1の生成・更新処理を行ってもよい。これにより、推定モデルM1は、技術情報に関連するフレーズパターンの抽出、あるいはフレーズパターンに関連する技術情報の抽出などの処理を精度よく行う学習済みモデルとなる。
 前処理手段122は、翻訳データの中から不要データを削除するような比較的簡易な解析処理により学習用データ又は分析用データを生成してもよい。不要データとは、例えば数値、改行、又は記号などの、推定モデルM1の訓練及び該モデルを用いた演算にとって重要度の低い文字などのことである。
 ところで、産業財産権が意匠権又は商標権の場合は、コアデータに画像データが含まれることが多くなる。そのため、前処理手段122は、コアデータに含まれる画像データに解析処理を施して学習用データ又は分析用データを生成する画像解析機能を有するようにしてもよい。この場合、前処理手段122は、例えば、画像データとしての意匠の図面の情報、商標のロゴの情報、及び商標の文字の情報などに画像解析処理を施す。もっとも、特許権及び実用新案権の場合でも、図面の類否を権利の有効性の判断材料として用いることができる。すなわち、前処理手段122は、テキスト解析機能と画像解析機能との双方を有していてもよく、テキスト解析機能及び画像解析機能のうちの何れか一方を有していてもよい。
 学習処理手段123は、学習用データに基づく機械学習により推定モデルM1を生成する。推定モデルM1は、権利の有効性に関する有効性データを出力するための学習済モデルである。本実施の形態1における有効性データは、権利の有効性の指標となる格付けを示す格付けスコアと、格付けスコアの生成の根拠とされた情報と、を含んでいる。格付けスコアは、権利の有効性を数値化もしくは符号化したものであり、権利の有効性の指標となる情報である。本実施の形態1の格付けスコアは、複数の産業財産権それぞれについて、各産業財産権の間での相対的な有効性を示すものである。推定モデルM1は、格付けスコアとして、請求の範囲におけるクレームの有効性の指標となる個別スコア、及び産業財産権の有効性の指標となる総合スコアのうちの少なくとも一方を出力するよう構成されている。
 有効性データは、権利維持に対するコストパフォーマンスの高さを示す年金コスト情報を含むようにしてもよい。産業財産権が特許権であれば、有効性データは、特許権の有効性に関連する技術情報を含む。以降では、特許権の有効性に関連する技術情報のことを、単に「技術情報」ともいう。技術情報は、格付けスコアの導出の根拠となった技術情報、及び特許権の無効化資料を含む。産業財産権が特許権又は意匠権の場合、有効性データは、特許権、実用新案権、又は意匠権をESGの観点から評価した指標値であるESGスコアを含むようにしてもよい。
 産業財産権が商標権であれば、有効性データは、商標権に係る商標との類似度が予め設定された閾値以上の先行商標の情報である先行商標データを含む。先行商標には、先行登録商標の他、先行出願商標も含まれる。産業財産権が意匠権であれば、有効性データは、意匠権に係る意匠との類似度が予め設定された閾値以上の公知意匠の情報である公知意匠データを含む。
 ここで、学習処理手段123による推定モデルM1の更新処理について簡潔に説明する。すなわち、収集処理手段22aは、情報提供サーバ群500から逐次又は所定のタイミングで世界各国の権利関連情報を収集し、収集した権利関連情報を記憶部23又は収集用データベース部24に記憶させる。翻訳処理手段121は、逐次又は所定のタイミングで、記憶部23等に追加された権利関連情報のコアデータに翻訳処理を施して翻訳データを生成し、生成した翻訳データを記憶部23等に記憶させる。前処理手段122は、翻訳データに対し、逐次又は所定のタイミングで上記の解析処理を施して学習用データを生成し、生成した分析用データを記憶部23等に記憶させる。そして、学習処理手段123は、設定されたタイミングで、記憶部23等に新たに蓄積された学習用データを用いて推定モデルM1のパラメータなどを適宜チューニングし、推定モデルM1の更新処理を実行する。学習処理手段123は、上記各手段と連携して、1日ごと又は1週間ごと等の任意の更新期間ごとに、推定モデルM1の更新処理を実行するとよい。
 本実施の形態1において、学習処理手段123は、DNN(Deep Neural Network)を用いた教師あり学習により推定モデルM1を生成するようになっている。学習処理手段123は、教師なし学習又は半教師あり学習により推定モデルM1を生成するものであってもよい。学習処理手段123は、GBDT (Gradient Boosting Decision Tree)を用いた機械学習により推定モデルM1を生成してもよい。学習処理手段123は、キャラクタレベルCNNを用いた機械学習により推定モデルM1を生成してもよい。加えて、学習処理手段123は、線形回帰、ロジスティック回帰、又は決定木などの回帰の手法により推定モデルM1を生成するものであってよい。さらに、学習処理手段123は、ランダムフォレスト又はサポートベクターマシンなどの分類の手法により推定モデルM1を生成するものであってよい。もっとも、学習処理手段123は、上述した複数の機械学習を組み合わせた手法により推定モデルM1を生成してもよい。
 推定処理手段124は、分析用データを推定モデルM1の入力として、該分析用データに対応する有効性データ等の情報を求めるものである。推定処理手段124は、複数の産業財産権それぞれについての各産業財産権の間での相対的な有効性を示す有効性データを求める。例えば、推定処理手段124は、複数の産業財産権それぞれにつき、各産業財産権の間での相対的な格付けスコアを求める。そして、推定処理手段124は、推定モデルM1によって求めた有効性データ等の情報を記憶部23等に逐次格納するようになっている。その際、推定処理手段124は、求めた有効性データ等の情報を、推定モデルM1の入力とした分析用データの元データである権利関連情報に紐付けて記憶部23又は出力用データベース部25に記憶させる。
 また、推定処理手段124は、有効性データ以外の情報として、後述する全期間、第1期間、第2期間、第3期間、ユーザによる指定期間などの各期間に応じた、格付けスコア、ESGスコア、年金コスト情報などを求めることができる。推定処理手段124が求める情報など、出力用データベース部25及び提供用データベース部35に格納される情報の一部又は全部は、ユーザへの販売対象又は提供対象となる。そのため、以降では、有効性データなどの出力用データベース部25及び提供用データベース部35に格納される情報のうち、ユーザへの販売又は提供の対象となる情報を、産業財産権に関する商品、もしくは単に「商品」ともいう。商品の価格は、例えば、1つの権利に関する情報の単価に対し、権利の数を乗じたものとなる。もっとも、法域ごとに単価を変更してもよく、格付けスコア等に応じて単価を変更してもよい。
 構築処理手段22cは、記憶部23及び収集用データベース部24に記憶されている情報をもとに、出力用データベース部25内のデータベースを構築するものである。記憶部23に記憶されている情報には、収集処理手段22a、翻訳処理手段121、前処理手段122、学習処理手段123、及び推定処理手段124が格納した情報も含まれる。
 本実施の形態1において、出力用データベース部25内のデータベースは、アカウントテーブル、権利者テーブル(会社テーブルなど)、人物テーブル(発明者テーブルなど)、権利テーブル(特許テーブル、意匠テーブル、商標テーブルなど)、統計テーブル、及び金融テーブルを含んで構成されている。
 アカウントテーブルは、ユーザごとの、メールアドレス、ID、パスワード、購入履歴、アクティビティログ、個人情報などを含む。個人情報は、国籍、法人名、住所、氏名、連絡先、電話番号などを含む。権利者テーブルは、権利者ごとの、基本情報、関連人物情報、履歴情報、格付けスコア・ESGスコアなどのスコア情報、統計情報などを含む。関連人物情報は、権利者、発明者、代理人などの情報を含む。履歴情報は、出願日、各種手続の申請日、登録日、係争の日時などの情報を含む。統計情報は、時系列に沿って整理されたスコア情報の履歴などを含む。
 人物テーブルは、発明者等の人物ごとの、基本情報、履歴情報、スコア情報、統計情報などを含む。権利テーブルは、全ての権利についての、基本情報、履歴情報、スコア情報、統計情報、翻訳データ、関連情報などを含む。権利テーブルは、特許権を管理する特許テーブル、実用新案権を管理する実案テーブル、意匠権を管理する意匠テーブル、及び商標権を管理する商標テーブルのうちの少なくとも1つを含んでいる。特許テーブルの関連情報は、類似技術の情報や無効化資料などを含む。
 統計テーブルは、権利者ごとの権利の取得数・格付けスコア・ESGスコアなどのランキング情報や、権利ごとの格付けスコア・ESGスコアなどのランキング情報を含んでいる。また、統計テーブルは、権利ごとの将来的な見通しに関するIP(intellectual property)ランドスケープ情報を含む。IPランドスケープ情報は、権利維持に対するコストパフォーマンスの高さを示す年金コスト情報を含む。金融テーブルは、決済に関連する情報を含む。
 分析処理部22は、CPU(Central Processing Unit)又はGPU(Graphics Processing Unit)などの演算装置と、こうした演算装置と協働して上記の各種機能を実現させるデータ分析プログラムP1とにより構成することができる。すなわち、データ分析プログラムP1は、コンピュータとしての分析処理部22及び記憶部23を、収集処理手段22a、評価処理手段22b、及び構築処理手段22cとして機能させるためのプログラムである。
 データ提供装置30は、通信部31と、提供処理部32と、記憶部33と、提供用データベース部35と、を有している。通信部31は、提供処理部32がネットワークNに接続された機器等との間で有線又は無線による通信を行うためのインタフェースである。記憶部33は、データ提供プログラムP2などの提供処理部32の動作プログラムの他、有効性データなどの提供に関連する種々のデータを記憶する。記憶部23は、RAM及びROM、フラッシュメモリ等のPROM、SSD、又はHDD等により構成することができる。
 提供処理部32は、情報端末40からの要求に応じて、提供用データベース部35内の情報を該情報端末40に提供するものである。提供処理部32は、複数の権利関連情報をもとに構築され、各権利それぞれの有効性に係る有効性データを含むデータベース5aから、外部の要求に対応する有効性データを抽出して提供する情報処理手段32aを備えている。
 情報処理手段32aは、出力用データベース部25と提供用データベース部35との間の同期処理を実行する。本実施の形態1において、提供用データベース部35内のデータベース5aは、出力用データベース部25内のデータベースと同様、アカウントテーブル、権利者テーブル、人物テーブル、権利テーブル、統計テーブル、及び金融テーブルを含んで構成されている。また、情報処理手段32aは、データベース5aを最適化する機能を有している。
 情報処理手段32aは、情報端末40において1又は複数の権利が指定された場合、該権利に対応する有効性データを情報端末40に提供するものである。情報処理手段32aは、情報端末40において、複数の産業財産権と共に格付けスコアに基づく並べ方が指定された場合、各産業財産権それぞれに対応する有効性データを、指定された並べ方により整理して提供するものである。
 情報処理手段32aは、情報端末40において権利者及び期間が指定された場合、該権利者の該期間内の権利に対応する有効性データを情報端末40に提供するものである。情報処理手段32aは、情報端末40において、権利者及び期間と共に格付けスコアに基づく並べ方が指定され、かつ該期間内に複数の産業財産権が含まれる場合、該権利者の該期間内の各産業財産権それぞれに対応する有効性データを、指定された並べ方により整理して提供するものである。
 情報処理手段32aは、情報端末40において、権利者及び期間と共に格付けスコアのうちの少なくとも1つが指定された場合、該権利者の該期間内の、指定された格付けスコアが付与された産業財産権に対応する有効性データを提供するものである。情報処理手段32aは、情報端末40において、権利者と共に格付けスコアのうちの少なくとも1つが指定された場合、該権利者の、指定された格付けスコアが付与された1又は複数の産業財産権の情報を選択可能に提供してもよい。
 情報処理手段32aは、情報端末40において権利者が指定された場合、該権利者の第1期間における権利を第1期間よりも短い第2期間ごとに整理した第1元データを情報端末40に提供するようにしてもよい。また、情報処理手段32aは、情報端末40において第2期間が指定された場合、該権利者の第2期間における権利を第2期間よりも短い第3期間ごとに整理した第2元データを情報端末40に提供するようにしてもよい。そして、情報処理手段32aは、情報端末40において第3期間が指定された場合、第3期間における権利に対応する有効性データを情報端末40に提供するようにしてもよい。
 第1元データは、第2期間全体での格付けスコアを含むようにするとよい。第1元データは、第2期間全体でのESGスコア及び年金コスト情報のうちの少なくとも1つを含むようにしてもよい。第2元データは、第3期間全体での格付けスコアを含むようにするとよい。第2元データは、第3期間全体でのESGスコア及び年金コスト情報のうちの少なくとも1つを含むようにしてもよい。
 情報処理手段32aは、情報端末40において発明者が指定された場合、該発明者の評価指数の情報を情報端末40に提供するものである。情報処理手段32aは、複数の技術情報を含む有効性データについて、該有効性データに係る特許権との関連度合いが高い順にデータベース5a内の各技術情報を並べ替える機能を有している。情報処理手段32aは、複数の先行商標データを含む有効性データについて、該有効性データに係る商標との類似度が高い順にデータベース5a内の各先行商標データを並べ替える機能を有している。情報処理手段32aは、複数の公知意匠データを含む有効性データについて、該有効性データに係る意匠との類似度が高い順にデータベース5a内の各公知意匠データを並べ替える機能を有している。
 提供処理部32は、CPU又はGPUなどの演算装置と、こうした演算装置と協働して上記の各種機能を実現させるデータ提供プログラムP2とにより構成することができる。すなわち、データ提供プログラムP2は、コンピュータとしての提供処理部32及び記憶部33を、情報処理手段32aとして機能させるためのプログラムである。
 提供用データベース部35は、権利ごとに有効性データ等の情報が整理されたデータベース5aを格納する記憶装置である。本実施の形態1において、提供用データベース35部内のデータベース5aは、出力用データベース部25内のデータベースに対し、最適化等の所定の処理が施されたものである。なお、データベース5aは、出力用データベース部25内のデータベースと同じものであってもよい。提供用データベース部35は、RAM及びROM、フラッシュメモリ等のPROM、SSD、又はHDD等により構成される。
 ここで、データベースのアップデートについて説明する。収集処理手段22aは、情報提供サーバ群500から逐次又は所定のタイミングで世界各国の権利関連情報を収集し、収集した権利関連情報を記憶部23又は収集用データベース部24に記憶させる。具体的には、収集処理手段22aは、世界各国の権利関連情報における差分、つまり、世界各国の権利関連情報のうちの、前回の収集時よりも増加した情報、及び前回の収集時以降に変更された情報を記憶部23等に記憶させる。評価処理手段22bは、上記差分を用いて有効性データ等の情報を追加的に求め、あるいは更新する。構築処理手段22cは、評価処理手段22bが追加し、あるいは更新した有効性データ等の情報をもとに、出力用データベース部25のデータベースをアップデートする。情報処理手段32aは、出力用データベース部25のデータベースをもとに、データベース5aをアップデートする。
 次に、図3を参照して、情報端末40の機能的な構成例について説明する。図3に示すように、情報端末40は、端末通信部41と、端末処理部42と、端末記憶部43と、端末入力部46と、端末表示部47と、を有している。端末通信部41は、端末処理部42がネットワークNに接続された機器等との間で有線又は無線による通信を行うためのインタフェースである。端末記憶部43には、端末処理部42の動作プログラムの他、種々の情報が記憶される。端末記憶部43は、RAM及びROM、フラッシュメモリ等のPROM、SSD、又はHDD等により構成される。
 端末処理部42は、端末入力部46を介してデータの表示もしくは切替の要求を受けたとき、又はデータ提供装置30からの情報提供があったとき、端末表示部47に文字や画像等を表示させ、又は端末表示部47の表示情報の一部又は全部を切り替える。端末処理部42は、CPU又はGPUなどの演算装置と、こうした演算装置と協働して上記の各種機能を実現させる動作プログラムとにより構成することができる。
 端末入力部46は、例えば、キーボードと、マウス又はトラックボールなどのポインティングデバイスと、を含んで構成される。端末入力部46は、ユーザによる入力操作を受け付け、受け付けた入力操作に応じた操作信号を端末処理部42へ送信する。端末表示部47は、例えば液晶ディスプレイ(LCD:Liquid Crystal Display)からなり、端末処理部42からの指示により種々の情報を表示する。なお、情報端末40は、端末入力部46及び端末表示部47の代わりに、文字又は画像等を表示する表示パネルと、該表示パネルに積層されてタッチ操作を検出する検出手段と、を含むタッチパネルを有していてもよい。もっとも、情報端末40は、タッチパネルと、マウス又はキーボード等とを併せ持つものであってもよい。情報端末40は、音又は音声を報知する報知部、発光素子を含んで構成された発光部などを有していてもよい。
[商品の購入]
 次に、図4~図10を参照して、ユーザによる商品の購入に関連する構成及び表示画面について説明する。各図で共通する構成については同一の符号を用い、重複する説明は省略する。ユーザが情報端末40を介してデータ提供装置30のWebサイトにアクセスすると、情報端末40の端末表示部47には、例えば図4のような初期画面G1が表示される。
 図4に例示する初期画面G1は、ログインボタンLと、登録ボタンXと、検索部Aと、ランキング指示部Bと、を有している。登録ボタンXは、ユーザの操作に応じてユーザ情報を登録するための登録画面(図示せず)を表示させる仮想ボタンである。ログインボタンLは、ユーザの操作に応じてログイン画面(図示せず)を表示させるための仮想ボタンである。すなわち、端末処理部42は、データ提供装置30との連携により、登録画面及びログイン画面を端末表示部47に表示させ、ユーザ登録及びログインに関する操作を受け付ける機能を有している。
 検索部Aは、入力欄A1と、検索ボタンA2と、を有している。入力欄A1は、キーボード等を介して文字等を入力する欄である。入力欄A1には、会社名などの組織名や個人名などが入力される。検索ボタンA2は、入力欄A1に入力された情報についての検索をデータ提供装置30に要求するための仮想ボタンである。なお、図4では、入力対象を示す文字として「会社名」が表示された検索部47aを例示しているが、これに限定されず、検索部47aには、「会社名」の代わりに「権利者」などが表示されてもよい。
 ランキング指示部Bは、ユーザの操作に応じて画面を遷移させたり、サブウインドウを表示させたりするための1又は複数の仮想ボタンにより構成される。図4では、ランキング指示部Bが、権利者の格付けスコアのランキングを示す格付け画面(図示せず)を表示させるための格付けボタンB1と、権利者のESGスコア(環境(Environment)、社会(Social)、ガバナンス(Governance))のランキング等を示すESG画面(後述する図15等)を表示させるためのESGボタンB2と、を含む例を示している。すなわち、端末処理部42は、データ提供装置30との連携により、格付け画面及びESG画面を端末表示部47に表示させる機能を有している。
 ユーザがログイン画面を介してログイン処理を完了すると、端末処理部42は、データ提供装置30との連携により、例えば図5のようなユーザ画面G2を端末表示部47に表示させる。ユーザ画面G2は、初期画面G1と同様、検索部Aと、ランキング指示部Bと、を有している。また、ユーザ画面G2は、ユーザ名表示部Uと、ログアウトボタンYと、を有している。ユーザ名表示部Uには、ログインしたユーザを示す情報が表示される。ログアウトボタンYは、ユーザがログアウトするための仮想ボタンである。
 ユーザ画面G2は、購入済みの商品を呼び出すための呼出部Z1を有している。図5では、ドロップダウン式又はコンボボックス式のUI(User Interface)である呼出部Z1を例示している。すなわち、図5の呼出部Z1は、ユーザにより選択された商品又は入力された商品が表示される表示欄Zaと、権利者又は権利のリストを表示させるための展開ボタンZbと、権利者又は権利のリストを示すリスト部Zcと、を有している。呼出部Z1は、リスト部Zcにマウスカーソルなどを当てると権利のリストが選択可能に表示される態様としてもよい。もっとも、呼出部Z1の態様は、図5の例に限定されない。例えば、呼出部Z1は、リスト部Zcに購入済みの商品の一覧が表示される態様としてもよい。また、呼出部Z1は、権利者の選択と権利の選択とを順次行える機能を持たせてもよい。さらに、呼出部Z1は、ドロップダウン式等ではなく、権利者、商品、又は権利などが単純に一覧表示される態様としてもよい。
 図5に例示するユーザ画面G2は、ダッシュボード部Cを有している。ダッシュボード部Cは、グラフや表などのように、種々のデータを可視化した情報を含んで構成される。端末処理部42は、データ提供装置30との連携により、ダッシュボード部Cに、ログインしたユーザの嗜好に合った情報を表示するとよい。加えて、図5に例示するユーザ画面G2は、ユーザの個人情報、検索履歴、及び購入履歴等をもとに生成された情報が表示されるお知らせ欄J1を有している。
 図4のような初期画面G1又は図5のようなユーザ画面G2において、入力欄A1に権利者名が入力され、検索ボタンA2が押下されると、端末処理部42は、データ提供装置30との連携により、例えば図6のような基本画面G3を端末表示部47に表示させる。基本画面G3は、権利者の第1期間における権利の登録件数を、第1期間よりも短い第2期間ごとに整理した第1データK1を含んで構成される。第1データK1は、端末処理部42が第1元データをもとに表示させる情報である。
 図6に例示する第1データK1は、横軸に西暦をとり、縦軸に登録件数をとった棒グラフを有している。図6では、第1期間として、権利者が最初に権利を取得した年から現在までの期間(全期間)が採用された例を示している。もっとも、第1期間は、全期間に限らず、予め設定された任意の期間であってよい。同様に、図6では、第2期間が1年の例を示しているが、これに限らず、第2期間は、予め設定された任意の期間であってよい。
 本実施の形態1の第1データK1は、第2期間ごとの格付けスコアを示す第1格付け部D1を有している。端末処理部42は、第1期間における最後の第2期間が終了していない場合、図6に破線で示すように、該第2期間の最終的な登録件数の推測値を示してもよい。端末処理部42は、端末入力部46を介して、1又は複数の第2期間の選択及び指定を受け付けるようになっている。図6では、第2期間として2012年が選択された例を示している。もっとも、第2期間の指定の方法、及び指定された第2期間の表示態様は、図6の例に限らず、適宜変更することができる。また、図6の基本画面G3は、1又は複数の第2期間の指定を受け付けるための指定ボタンE1を有している。
 図6のような基本画面G3において、1又は複数の第2期間が選択され、指定ボタンE1の押下により指定されると、端末処理部42は、データ提供装置30との連携により、例えば図7のような詳細画面G4を端末表示部47に表示させる。詳細画面G4は、権利者の第2期間における権利の登録件数を、第2期間よりも短い第3期間ごとに整理した第2データK2を含んで構成される。第2データK2は、端末処理部42が第2元データをもとに表示させる情報である。
 図7に例示する第2データK2は、横軸に月をとり、縦軸に登録件数をとった棒グラフを有している。図7では、第2期間を図6に対応づけて1年とし、第3期間が1ヵ月である例を示している。もっとも、第3期間は、1ヶ月に限らず、予め設定された任意の期間であってよい。
 本実施の形態1の第2データK2は、第3期間ごとの格付けスコアを示す第2格付け部D2を有している。端末処理部42は、端末入力部46を介して、1又は複数の第2期間の選択及び指定を受け付けるようになっている。図7では、第2期間として6月が指定された例を示している。もっとも、第3期間の指定の方法、及び指定された第3期間の表示態様は、図7の例に限らず、適宜変更することができる。また、図7の詳細画面G4は、1又は複数の第3期間の指定を受け付けるための確認ボタンE2を有している。
 図7のような詳細画面G4において、例えばグラフ上で選択された1又は複数の第3期間が、確認ボタンE2の押下により指定されると、端末処理部42は、データ提供装置30との連携により、例えば図8のような購入画面Gxを端末表示部47に表示させる。購入画面Gxは、購入する情報の内容を示す内容欄Pと、購入金額を示す金額欄Qと、を有している。また、購入画面Gxは、決済を行うための購入ボタンE3を有している。購入画面Gxは、1又は複数の決済方法を示す決済方法部Hを有していてもよい。
 端末処理部42は、詳細画面G4において1又は複数の第3期間が選択され、確認ボタンE2が押下されたとき、データ提供装置30との連携により、図9のような一覧画面G5を表示させてもよい。図9に例示する一覧画面G5は、ユーザにより選択された期間を示す期間表示部Tを有している。また、一覧画面G5は、選択ボックスS1と権利番号欄S2との組み合わせを含んで構成された一覧表示部K3を有している。一覧表示部K3は、ユーザが選択ボックスS1にカーソルを合わせてマウスのクリック等を行うことにより、権利番号欄S2に記載の権利の選択又は解除を行うためのものである。図9では、一覧表示部K3が、権利に関する補足情報を表示する備考欄S3を含む例を示している。端末処理部42は、一覧表示部K3に表示させる権利の数が設定数よりも多い場合、一覧表示部K3をスクロール形式等で表示させてもよい。
 上記の説明では、詳細画面G4から一覧画面G5に移行する例を示したが、これに限定されない。例えば、端末処理部42は、基本画面G3から一覧画面G5に移行させるようにしてもよい。また、ユーザ画面G2は、図10のように、期間を指定するための期間指定欄K4を有していてもよい。この場合、端末処理部42は、入力欄A1に権利者名が入力され、期間指定欄K4に期間の情報が入力され、検索ボタンA2が押下されると、データ提供装置30との連携により、一覧画面G5を端末表示部47に表示させてもよい。また、端末処理部42は、指定された期間の長さに応じてグラフ等を調整した基本画面G3又は詳細画面G4を端末表示部47に表示させてもよい。
[定期購入機能・逐次購入機能]
 上記においては、ユーザが商品を都度購入する例を示したが、これに限定されない。データ提供装置30は、定期購入機能及び逐次購入機能のうちの少なくとも一方を有していてもよい。定期購入機能とは、定期購入の申し込みを行ったユーザに対し、1週間、10日間、1ヶ月、半年、1年など、任意の期間ごとに商品を提供する機能である。逐次購入機能とは、逐次購入の申し込みを行ったユーザに対し、産業財産権が登録され、該産業財産権に対応する有効性データ等がデータベース5aに格納されたタイミングで、申し込みに係る商品を提供する機能である。
[購入済み商品の閲覧]
 次に、図5及び図11~図14を参照して、ユーザによる購入済み商品の閲覧に関連する構成及び表示画面について説明する。上述した各図と同等の構成については同一の符号を用いて説明は省略する。ユーザが図5のようなユーザ画面G2の呼出部Z1を介して「権利者」を指定すると、端末処理部42は、データ提供装置30との連携により、例えば図11のような権利者画面G6を端末表示部47に表示させる。
 図11に例示する権利者画面G6は、総合評価部Loと、個別評価部L1と、ソート指示部L2と、を有している。総合評価部Loは、権利者による全ての権利の総合評価が表示される箇所である。図11では、総合評価部Lo及び個別評価部L1に、権利者の格付けスコアと、ESGスコアと、年金コスト情報とが表示される例を示している。なお、図11等では、年金コスト情報のことを年金コスパと表現している。ソート指示部L2は、個別評価部L1の各項目のそれぞれに対応づけられた仮想ボタンを有している。すなわち、ソート指示部L2は、格付けスコアが高い順に個別評価部L1を並び替えるための格付け優先キーLaと、ESGスコアが高い順に個別評価部L1を並び替えるためのESG優先キーLbと、年金コスト情報が高い順に個別評価部L1を並び替えるための年金優先キーLcと、を有している。図11では、格付けスコアが高い順に個別評価部L1がソートされた例を示している。
 図11のような権利者画面G6において、例えばリンクの貼られた権利番号がクリックされる等により「権利」が指定されると、端末処理部42は、データ提供装置30との連携により、図12のような権利画面G7を端末表示部47に表示させる。また、端末処理部42は、ユーザが図5のようなユーザ画面G2の呼出部Z1を介して「権利」を指定した場合、図11のような権利者画面G6を経由せずに、図12のような権利画面G7を端末表示部47に表示させる。
 図12に例示する権利画面G7は、公報ボタンL3と、一覧部L4と、資料部L5と、経過情報部L6と、発明者情報部L7と、を有している。公報ボタンL3は、権利の内容を示す公報を表示させるための仮想ボタンである。一覧部L4は、個別評価部L1と同様に権利のスコアを示す部分である。資料部L5は、格付けスコアの算出に関連する文献の情報を示す部分である。経過情報部L6は、権利の取得及び維持等に関する経過情報を示す部分である。発明者情報部L7は、特許権に係る発明の発明者の情報を示す部分である。
 端末処理部42は、ユーザが図5のようなユーザ画面G2の呼出部Z1を介して「権利者」を指定した場合、データ提供装置30との連携により、例えば図13のような権利者画面G6を端末表示部47に表示させてもよい。図13の権利者画面G6は、公報部Q1と、詳細一覧部Q2と、選択部Q3と、を有している。公報部Q1は、権利の内容を示す公報を表示させるための仮想ボタンとして機能すると共に、マウスカーソルを合わせることにより、詳細一覧部Q2を表示させるものである。選択部Q3は、詳細一覧部Q2に優先表示させるスコアを選択させるためのものである。図13では、ドロップダウン式のUIである選択部Q3を例示している。すなわち、選択部Q3は、ユーザにより選択されたスコアが表示される表示欄Qaと、詳細一覧部Q2への表示対象となるスコアのリストを表示させるための展開ボタンQbと、スコアのリストを示すリスト部Qcと、を有している。詳細一覧部Q2は、選択部Q3で選択されたスコアを表示させるスコア部Qxと、関連文献の一覧を示す文献リスト部Qyと、本権利と関連文献との関連度合いを示す関連度表示部Qzと、を有している。
 端末処理部42は、ユーザがログイン画面を介してログイン処理を完了した際、データ提供装置30との連携により、例えば図14のようなユーザ画面G2を端末表示部47に表示させてもよい。図14に例示するユーザ画面G2は、入力欄A1、検索ボタンA2、スコア指定部Z2、順序指定部Z3、及び件数部Zoにより構成された絞り込み部Azを有している。スコア指定部Z2は、格付けスコア、ESGスコア、及び年金コスト情報などのうちの1つを選定するためのものであり、表示欄Zdと、展開ボタンZeと、リスト部Zfと、を有している。展開ボタンZeは、リスト部Zfを表示させるための仮想ボタンであり、リスト部Zfには、展開ボタンZeへの操作に連動して、ユーザに選定させるための情報が表示される。表示欄Zdには、リスト部Zfの中から選定された文字等が表示される。
 順序指定部Z3は、スコア指定部Z2において選定された情報について、上位のものから並べるか、下位のものから並べるかを指定させるためのものであり、表示欄Zkと、展開ボタンZmと、リスト部Znと、を有している。展開ボタンZmは、リスト部Znを表示させるための仮想ボタンであり、リスト部Znには、展開ボタンZmへの操作に連動して、ユーザに選定させるための情報が表示される。表示欄Zkには、リスト部Znの中から選定された文字等が表示される。件数部Zoは、件数に対応する数値を入力する欄である。
 ここで、スコア指定部Z2において格付けスコアが選定され、順序指定部Z3において「上位」又は「下位」が指定される操作は、格付けスコアに基づく並べ方が指定される操作に相当する。例えば、入力欄A1において「Z社」が指定され、スコア指定部Z2において「格付けスコア」が選定され、順序指定部Z3において「上位」が指定され、件数部Zoに「15」が入力されて、検索ボタンA2が押下されたとする。すると、端末処理部42は、データ提供装置30との連携により、X社の産業財産権の情報を、格付けスコアの上位から順番に15件一覧表示させる。
 絞り込み部Azは、件数部Zoに代えて、もしくは件数部Zoと共に、期間の指定を受け付ける期間指定欄(図示せず)を有していてもい。この期間指定欄は、図10の期間指定欄K4と同様の態様であってよい。もっとも、絞り込み部Azは、順序指定部Z3及び件数部Zoのうちの少なくとも一方を有しない構成としてもよい。
 また、絞り込み部Azは、順序指定部Z3の代わりに、格付けスコアのうちの少なくとも1つを選定するためのスコア選定部(図示せず)を有していてもよい。例えば、入力欄A1において「権利者」が指定され、スコア選定部において格付けスコアのうちの少なくとも1つが選定されたとする。この場合、端末処理部42は、データ提供装置30との連携により、指定された権利者の、選定された格付けスコアが付与された1又は複数の産業財産権の情報を端末表示部47に選択可能な態様で表示させるとよい。例えば、格付けスコアが、上位から順に「AAA」「AA」「A」「BB」「B」「CC」「C」という7段階で設定されているとする。かかる設定において、ユーザは、上記の7段階の格付けスコアのうちの少なくとも1つを選定することができる。ユーザが少なくとも1つの格付けスコアを選定すると、端末処理部42は、データ提供装置30との連携により、選定された1又は複数の格付けスコアが付与された1又は複数の産業財産権の情報を選択可能に端末表示部47に表示させる。
[ESG表示]
 次に、図15及び図16を参照して、ユーザによるESGに関する情報の確認に関連する構成及び表示画面について説明する。上述した各図と同等の構成については同一の符号を用いて説明は省略する。例えば、ユーザにより図4の初期画面G1又は図5もしくは図10のユーザ画面のESGボタンB2が押下されると、端末処理部42は、データ提供装置30との連携により、図15のようなESG全般画面G8を端末表示部47に表示させてもよい。
 図15のESG全般画面G8は、権利者単位で週ごとにESG関連特許の数を積算してグラフ化した比較データR1と、ESG関連特許の数についてのランキングを示すランキング部R2と、を有している。比較データR1は、例えば特許公報の発行日を基準として整理される。ESG全般画面G8では、例えばランキング部R2の各欄が、権利者の選定を受け付ける仮想ボタンとして機能する。ユーザによりランキング部R2の1つの欄がクリック等されると、端末処理部42は、データ提供装置30との連携により、図16のようなESG個別画面G9を端末表示部47に表示させてもよい。
 図16に例示するESG個別画面G9は、ESGスコアの算出に関連する複数の指標についての個別評価を示す詳細分析欄R3を有している。図16では、ESGスコアの算出に関連する複数の指標として、Environment、Social、Governance、キーワードスコア、新規性スコア、特許件数、及び総合スコアを例示しているが、これに限定されない。ESGスコアの算出に関連する複数の指標は、適宜取捨選択することができる。
[発明者情報]
 次に、図17を参照して、ユーザによる発明者の情報の確認に関連する構成及び表示画面について説明する。上述した各図と同等の構成については同一の符号を用いて説明は省略する。ユーザにより発明者の情報が要求された場合、端末処理部42は、データ提供装置30との連携により、図17のような発明者画面G10を端末表示部47に表示させてもよい。例えば、端末処理部42は、図5のようなユーザ画面G2に、発明者名の入力と発明者の情報の要求を行うための発明者検索欄を表示させてもよい。また、図12の発明者情報部L7に記載された発明者名にリンクを貼っておき、ユーザが発明者名をクリックしたとき、該発明者に対応する発明者画面G10を、端末処理部42が端末表示部47に表示させてもよい。
 図17に例示する発明者画面G10は、発明者が関わった特許権の情報が一覧表示される一覧表示部V1と、発明者の総合評価が示される評価部V2と、発明者の過去の経歴などを示す固有情報部J2と、を有している。図17の一覧表示部V1は、特許権ごとに、関係情報、格付けスコア、年金コスト情報、及びESGスコアが表示されるようになっている。関係情報とは、筆頭発明者であるか否かなど、権利に対する寄与度を示す情報などが表示される。評価部V2には、有効性の高い特許の比率、特許出願の件数、特許権の登録件数、発明者の出願が拒絶理由通知等で引用された数(被引用数)などの情報が表示される。評価部V2には、一覧表示部V1の各項目についての発明者の総合評価が示されてもよい。
 次に、図18のシーケンスチャートを参照して、本実施の形態1のデータ提供方法のうち、ユーザが産業財産権に関する商品を購入する際の動作例について説明する。ここでは、ユーザが初期画面G1等を経てデータ提供装置30のシステムにログインしていることを前提とする。
 情報端末40において、端末処理部42は、端末入力部46を介してデータ提供装置30が提供するWebサイトへのアクセスの指示を受け付けると(ステップS101)、該Webサイトへのアクセス要求をデータ提供装置30へ送信する(ステップS102)。データ提供装置30において提供処理部32は、ユーザ画面の情報を情報端末40に提供し(ステップS103)、端末処理部42は、例えば図5のようなユーザ画面G2を端末表示部47に表示させる(ステップS104)。
 端末処理部42は、ユーザ画面G2を通じて権利者の指定を受け付けると(ステップS105)、指定された権利者の情報をデータ提供装置30へ送信する(ステップS106)。提供処理部32は、権利者情報に対応する基本画面の情報を情報端末40に提供する(ステップS107)。そして、端末処理部42は、例えば図6のよう基本画面G3を端末表示部47に表示させる(ステップS108)。
 端末処理部42は、基本画面G3を通じて第2期間の指定を受け付けると(ステップS109)、指定された1又は複数の第2期間を示す指定情報をデータ提供装置30へ送信する(ステップS110)。提供処理部32は、指定情報に対応する詳細画面の情報を情報端末40に提供する(ステップS111)。そして、端末処理部42は、例えば図7のよう詳細画面G4を端末表示部47に表示させる。提供処理部32は、複数の第2期間を示す指定情報が送信された場合、各第2期間に対応する詳細画面G4を切替可能に表示させてもよく、指定に係る全ての第2期間に対応する画像データを詳細画面G4に含めてもよい(ステップS112)。
 端末処理部42は、詳細画面G4を通じて第3期間の指定を受け付けると(ステップS113)、指定された1又は複数の第3期間を示す最終指定情報をデータ提供装置30へ送信する(ステップS114)。提供処理部32は、最終指定情報を反映した購入画面の情報を情報端末40に提供する(ステップS115)。そして、端末処理部42は、例えば図8のような購入画面Gxを端末表示部47に表示させる(ステップS116)。
 端末処理部42は、ユーザの購入ボタンE3の押下等により購入の指示を受け付けると(ステップS117)、データ提供装置30へ購入要求を送信する(ステップS118)。すると、提供処理部32は、決済サーバ600に決済を依頼する(ステップS119)。決済サーバ600は、購入する商品の内容及び支払金額を含む確認情報を情報端末40に送信する(ステップS120)。端末処理部42は、確認情報に基づく確認画面(図示せず)を端末表示部47に表示させる(ステップS121)。
 端末処理部42は、確認画面を通じて支払の指示を受け付けると(ステップS122)、決済サーバ600に支払いを依頼する(ステップS123)。決済サーバ600は、決済処理を実行し、決済の完了を示す決済通知をデータ提供装置30へ送信する(ステップS124)。そして、データ提供装置30は、ユーザの購入に係る商品を情報端末40に提供する(ステップS125)。すなわち、上記一連の各工程により、ユーザは、購入した商品に係る情報へのアクセス権限を取得したため、情報端末40を介していつでも該商品に係る情報を閲覧することができる。
 次に、図19のシーケンスチャートを参照して、本実施の形態1のデータ提供方法のうち、ユーザが購入済みの商品を閲覧する際の動作例について説明する。ここでは、ユーザが初期画面G1等を経てデータ提供装置30のシステムにログインしていることを前提とする。図18と同様の工程には同じステップ番号を用いて説明は省略する。
 データ提供装置30及び情報端末40は、図18の例と同様にステップS101~S104の処理を実行する。次いで、ユーザが、例えば図5の呼出部Zを介して購入済み商品の呼び出しを指示すると(ステップS201)、端末処理部42は、指示に係る商品の呼出要求をデータ提供装置30へ送信する(ステップS202)。
 ここでは、便宜上、ステップS201においてユーザが権利者を指定したケースを想定する。この場合、提供処理部32は、指定に係る権利者についての権利者画面の情報を情報端末40へ送信する(ステップS203)。すると、端末処理部42は、例えば図11又は図13のよう権利者画面G6を端末表示部47に表示させる(ステップS204)。
 端末処理部42は、権利者画面G6を通じて権利の指定を受け付けると(ステップS205)、指定された権利を示す権利情報をデータ提供装置30へ送信する(ステップS206)。提供処理部32は、権利情報に対応する権利画面の情報を情報端末40に提供する(ステップS207)。これにより、端末処理部42は、例えば図12のよう権利画面G7を端末表示部47に表示させる(ステップS208)。
 以上のように、本実施の形態1のデータ提供装置30は、外部の要求に対応する有効性データを予め構築されたデータベース5aから抽出するようになっている。よって、データ提供装置30は、データの要求を受けた際に、権利の有効性を評価するための処理を行う必要がないため、処理部やメモリの無駄な使用を抑制し、産業財産権の有効性に関する情報を迅速に提供することができる。また、有効性データは、複数の産業財産権の間での相対的な有効性を示す格付けスコアを含んでいる。すなわち、提供用データベース部35内のデータベース5aには、推定処理手段124によって求められた格付けスコアを含む有効性データが格納されている。そのため、ユーザは、例えば図11~図13のような画面上において、各権利に紐付けられた格付けスコアを視認することにより、自己のニーズに合致した権利を迅速かつ的確に選定することができる。
 ところで、産業財産権の有効性を適切に評価するためには、高度な専門性が必要となる。この点、データ提供システム100は、データ提供装置30と情報端末40とを有している。そして、提供処理部32は、有効性データを含む画面の情報を情報端末40に提供するものであり、情報端末40は、データ提供装置30から提供された画面の情報を表示する端末表示部47を有している。よって、情報端末40を使用するユーザは、専門性を要することなく、産業財産権に関する有用な情報を得ることができる。
 推定処理手段124は、権利者ごとに、全期間、第1期間、第2期間、第3期間などの期間単位での格付けスコアを求めるようにしてもよい。そして、構築処理手段22cが、各期間に対応する格付けスコアをデータベースに反映させるとよい。これにより、情報処理手段32aは、各期間に対応する格付けスコアを情報端末40に提供することができる。よって、ユーザは、例えば図6、図7、図11、図13のような画面上において、各期間に対応する格付けスコアを確認することができるため、権利者の選択や期間の選択を迅速かつ的確に行うことができる。
 産業財産権が特許権の場合、有効性データは、特許権の有効性に関連する技術情報を含むようにするとよい。この場合、データベース5aには、格付けスコアに1又は複数の技術情報が紐付けられた有効性データが格納される。このようにすれば、情報端末40は、例えば図12又は図13のような画面上において、特許権に関連する技術情報を格付けスコアに紐付けて示すことができる。よって、ユーザは、格付けスコアの根拠となった文献などを速やかに確認することができる。
 ところで、近年は、ESGの観点を経営に活かし、企業の安定的かつ長期的な成長を図ろうとする取り組みが世界中に広まっている。そして、知財戦略にも、ESGの観点が採り入れられている。この点、有効性データは、特許権をESGの観点から評価した指標値であるESGスコアを含めて構成することができる。よって、ユーザは、例えば図11~図17のような画面上において、権利ごとのESGスコアを確認することができるため、ESGに力を入れている企業等を一見して把握することができ、商品の選択に活かすことができる。推定処理手段124は、権利者ごとに、全期間、第1期間、第2期間、第3期間などの期間単位でのESGスコアを求めるようにしてもよい。そして、構築処理手段22cが、各期間に対応するESGスコアをデータベースに反映させるとよい。これにより、情報処理手段32aは、各期間に対応するESGスコアを情報端末40に提供することができる。よって、ユーザは、例えば図11、図13~図17のような画面上において、各期間に対応するESGスコアを確認し、権利者の選択等に活かすことができる。
 有効性データは、権利維持に対するコストパフォーマンスの高さを示す年金コスト情報を含んでいてもよい。このようにすれば、例えば図11~図13のような画面上において、産業財産権の年金コスト情報をユーザに視認させることができるため、ユーザは、該権利を維持すべきか否かを容易に判断することができる。推定処理手段124は、権利者ごとに、全期間、第1期間、第2期間、第3期間などの期間単位での年金コスト情報を求めるようにしてもよい。そして、構築処理手段22cが、各期間に対応する年金コスト情報をデータベースに反映させるとよい。これにより、情報処理手段32aは、各期間に対応する年金コスト情報を情報端末40に提供することができる。よって、ユーザは、例えば図11~図13のような画面上において、各期間に対応する年金コスト情報を確認し、権利者の評価や選択等に活かすことができる。
 有効性データは、商標権に係る商標との類似度が閾値以上の先行商標の情報である先行商標データを含んでいてもよい。このようにすれば、特許権の場合と同様、例えば図12又は図13のような画面上において、商標権に関連する先行商標データを格付けスコアに紐付けて示すことができる。よって、ユーザは、格付けスコアの根拠となった先行商標データを速やかに確認することができ、商標権の無効性などを検討することができる。
 有効性データは、意匠権に係る意匠との類似度が閾値以上の公知意匠の情報である公知意匠データを含んでいてもよい。このようにすれば、特許権の場合と同様、例えば図12又は図13のような画面上において、意匠権に関連する公知意匠データを格付けスコアに紐付けて示すことができる。よって、ユーザは、格付けスコアの根拠となった公知意匠データを速やかに確認することができ、意匠権の有効性などを検討することができる。
 提供処理部32は、複数の技術情報を含む有効性データについて、該有効性データに係る特許権との関連度合いが高い順にデータベース5a内の各技術情報を並べ替える機能を有している。関連度合いは、特許権に係るクレームの文言と技術情報の文言とがどの程度一致又は近似しているかを示す指標値である。提供処理部32は、複数の先行商標データを含む有効性データについて、該有効性データに係る商標との類似度が高い順にデータベース5a内の各先行商標データを並べ替える機能を有している。提供処理部32は、複数の公知意匠データを含む有効性データについて、該有効性データに係る意匠との類似度が高い順にデータベース5a内の各公知意匠データを並べ替える機能を有している。このようにすれば、情報端末40は、データのソート処理を別途行うことなく、図11~図13のような画面上にソートされたデータを表示させることができ、ユーザの確認作業の効率化を図ることができる。
 提供処理部32は、情報端末40において1又は複数の権利が指定された場合、該権利に対応する有効性データを提供する。よって、ユーザは、産業財産権に関する商品を1点単位で選択して購入することができ、必要十分なデータを取得することができる。提供処理部32は、情報端末40において権利者及び期間が指定された場合、該権利者の該期間内の権利に対応する有効性データを提供する。よって、ユーザは、細かな選択を行うことなく、ニーズに合った期間単位で商品を迅速に購入することができる。
 提供処理部32は、情報端末40において発明者が指定された場合に、該発明者の評価指数の情報を提供してもよい。このようにすれば、ユーザは、例えば図17のような画面上において、発明者のランクや貢献度などを確認することができ、ヘッドハンティングなどに活用することができる。また、提供処理部32は、情報端末40において発明者が指定された場合に、該発明者の固有情報を提供してもよい。このようにすれば、ユーザは、例えば図17のような画面上において固有情報部J2を確認することにより、発明者の経歴や共同発明者などを知ることができ、人材発掘などに活かすことができる。
 提供処理部32は、情報端末40において1又は複数の権利が指定された場合、該権利に対応する有効性データを提供する。よって、ユーザは、産業財産権に関する商品を1点単位で選択して購入することができ、必要十分なデータを取得することができる。提供処理部32は、情報端末40において権利者及び期間が指定された場合、該権利者の該期間内の権利に対応する有効性データを提供する。よって、ユーザは、細かな選択を行うことなく、ニーズに合った期間単位で商品を迅速に購入することができる。
 提供処理部32は、情報端末40において権利者が指定された場合、該権利者の第1期間における権利を第2期間ごとに整理した第1元データを提供してもよい。第1元データは、情報端末40側で第1データK1として表示される。また、提供処理部32は、情報端末40において第2期間が指定された場合、該権利者の第2期間における権利を第3期間ごとに整理した第2元データを提供してもよい。第2元データは、情報端末40側で第2データK2として表示される。さらに、提供処理部32は、情報端末40において第3期間が指定された場合、第3期間における権利に対応する有効性データを提供するとよい。このようにすれば、ユーザは、直感的で簡易な操作により選択期間を狭めつつ、ニーズに合った期間を選定することができるため、ユーザビリティーの向上を図ることができる。例えば、図6又は図7のように、情報端末40が各期間に対応づけて格付けスコアなどを表示するように構成すれば、ユーザの期間選択の利便性の向上を図ることができる。
 提供処理部32は、情報端末40において発明者が指定された場合に、該発明者の評価指数の情報を提供してもよい。このようにすれば、ユーザは、例えば図17のような画面上において、発明者のランクや貢献度などを確認することができ、ヘッドハンティングなどに活用することができる。また、提供処理部32は、情報端末40において発明者が指定された場合に、該発明者の固有情報を提供してもよい。このようにすれば、ユーザは、例えば図17のような画面上において固有情報部J2を確認することで、発明者の経歴や共同発明者などを知ることができ、人材発掘などに活かすことができる。
 データ管理システム10において、データ分析装置20は、権利関連情報に含まれるコアデータに対し翻訳処理を施して翻訳データを生成する翻訳処理手段121と、翻訳データに基づく学習用データを用いた機械学習により推定モデルM1を生成する学習処理手段123と、を有している。そのため、言語の違いによる推定精度の低下を防ぐと共に、言語の統一化により、機械学習用のデータ量を実質的に増やすことができる。そのため、格付けスコアなどの精度向上を図ると共に、有効性データなどの商品の信頼性を高めることができる。すなわち、データ管理システム10によれば、世界中の特許等の権利について、どのような関連資料が存在するかを精度よく示すことができる。
 また、データ分析装置20は、翻訳データに解析処理を施して学習用データを生成する前処理手段122を有している。よって、コアデータの特徴を精度よく分析することができる。加えて、前処理手段122は、翻訳データに解析処理を施して分析用データを生成する。そして、データ分析装置20は、前処理手段122において生成された分析用データを推定モデルM1の入力として有効性データなどを求める推定処理手段124を有している。よって、推定モデルM1により、精度のよい推定結果などを得ることができる。
<変形例1>
 図20~図32を参照して、実施の形態1の変形例1におけるデータ提供システム100の構成及び動作について説明する。本変形例1のデータ提供システム100は、産業財産権のうちの特許権及び実用新案権に特化した処理を行うよう構成されており、外部から収集するデータ中の自然言語をベクトル化して解析する機能を備えたデータ分析装置20Aを有している。データ提供システム100の全体的な構成及び動作は、図1~図19を参照して説明した上記の例と同様であるため、同等の構成については同一の符号を付して説明は省略する。
 図20を参照して、データ分析装置20Aの機能的構成について説明する。データ分析装置20Aは、分析対象とされている権利に対し格付処理を行うものである。以下、分析対象とされている権利のことを「対象権利」ともいう。つまり、データ分析装置20Aは、各対象権利それぞれの請求の範囲(特許請求の範囲又は実用新案登録請求の範囲など)を分析することにより、各クレーム及び各対象権利の有効性に係るレーティングを実行する。本変形例1では、世界中の特許権及び実用新案権が分析対象とされる。通常、更新期間が経過するタイミングで分析対象が増加する。データ分析装置20Aは、更新期間の経過により増加した対象権利に対しても逐次格付処理を実行する。データ分析装置20Aは、複数の対象権利それぞれの有効性を分析する分析処理部22Aを有している。
 分析処理部22Aは、文章を自然言語解析によりベクトル化して意味ベクトルを生成する機能を有している。例えば、分析処理部22Aは、BERT(Bidirectional Encoder Representations from Transformers)などのTransformer系のエンコーダ(encoder)に基づく自然言語処理により、文章の意味ベクトルへのベクトル化を実行する。本実施の形態1において、分析処理部22Aは、32次元の意味ベクトルを生成するよう構成されている。分析処理部22Aは、事前学習とファインチューニングとの2段階で学習させた学習済モデルを自然言語処理に用いるようにしてもよい。なお、分析処理部22Aが処理するものは「情報」であるが、本明細書では、例えば「請求の範囲」「クレーム」「クレーム要素」のように、「情報」である旨を省略することがある。
 分析処理部22Aは、生成する種々の意味ベクトル間の一致度を、コサイン類似度を用いることにより、0~1の範囲で求める。より具体的に、分析処理部22Aは、1から、2つのベクトル間のコサイン類似度を減ずることにより、2つのベクトル間の一致度を求めるようになっている(2ベクトル間のコサイン類似度を「cosθ」とした場合、「一致度=1-cosθ」と表せる。)。ここで、コサイン類似度には、ベクトル同士の成す角度の近さが現れるため、類似する2つのベクトルほど、これらの間のコサイン類似度は1に近づく。よって、本変形例1における一致度は、0に近いほどベクトル同士が類似することを示し、1に近いほどベクトル同士が類似しないことを示す。つまり、一致度は、0に近いほどベクトル同士の意味上のぶれが少ないことを示し、1に近いほどベクトル同士の意味上のぶれが大きいことを示す。なお、一致度が0の場合は、2つの意味ベクトルが完全に一致することを意味する。
 分析処理部22Aは、収集処理手段122aと、評価処理手段122bと、構築処理手段22cと、を有している。収集処理手段122aは、API等を通じて、対象権利に関する権利関連情報を定期的に収集する。また、収集処理手段122aは、各権利の有効性を分析するための情報として、世界中の発明又は考案に関連する情報を外部から収集する。発明又は考案に関連する情報は、特許又は実用新案に関する公報の他、非特許文献の情報を含む。非特許文献には、上述した通り、各種の技術論文・技報、技術標準、企業・研究機関・大学等のWebサイト、Web上の記事・カタログ、ブログ、SNS、YouTube(登録商標)などの情報が含まれる。以下、発明又は考案に関連する情報のことを「発明関連情報」ともいう。発明関連情報のうちで、既に特許分類が付与されている特許又は実用新案に関する公報の情報のことを「分類済情報」ともいう。これに対し、発明関連情報のうちで、特許分類が付与されていない非特許文献の情報のことを「未分類情報」ともいう。収集処理手段122aは、収集した発明関連情報を収集用データベース部24などに格納する。
 収集処理手段122aは、CPC又はIPCなどの特許分類の情報を収集し、収集した特許分類の情報をもとに、記憶部23又は収集用データベース部24などに分類用データベース4aを構築する機能を有している。図20では、収集用データベース部24内に分類用データベース4aが構築される例を示している。特許分類は、複数の分類コードが階層構造により整理されており、各分類コードには説明文が紐付けられている。より具体的に、分類コードには、該分類コードの階層の情報である階層データと、該分類コードの説明文の情報である説明データとが紐付けられている。
 図21は、収集処理手段122aが生成する分類用データベース4aの概要を例示した表である。収集処理手段122aは、情報提供サーバ群300等から特許分類の情報を収集する。特許分類の情報は、図21の太枠内の例のように、少なくとも分類コードと階層データと説明データとが紐付けられた情報である。階層データは、外部から収集する分類コードごとの階層の情報を、収集処理手段122aが処理しやすい情報に変換したものであってもよい。図21では、分類コードをP~P(Mは特許分類における分類コードの総数)で示し、階層データの階層を数字で例示し、説明データの文字を複数の白丸で例示している。もっとも、分類コードの階層構造は、3段階に限らず、特許分類によって任意の階層数が設定されている。
 収集処理手段122aは、外部から収集する特許分類の情報に含まれる説明データそれぞれを自然言語処理によりベクトル化することで、説明データそれぞれに対応する意味ベクトルである分類ベクトルを生成する。そして、収集処理手段122aは、特許分類の情報に含まれる各分類コードごとに、階層データと分類ベクトルとを紐付けて分類用データベース4aを生成する。図21では、分類用データベース4aが各分類コードそれぞれの説明データを含む例を示しているが、これに限定されない。収集処理手段122aは、分類ベクトルへの変換処理を終えた説明データを削除し、分類コードと階層データと分類ベクトルとにより構成された分類用データベース4aを生成してもよい。
 収集処理手段122aは、各未分類情報のそれぞれに、分類コードに対応する分類データを付与する分類付与機能を有していてもよい。この場合、収集処理手段122aは、未分類情報の一部又は全部を自然言語処理によりベクトル化することで、該未分類情報に対応する意味ベクトルである未知ベクトルを生成する。非特許文献の情報である未分類情報のうち、収集処理手段122aがベクトル化の対象とする分類対象データは、非特許文献の種類及び内容に応じて調整され、適宜変更することができる。
 また、収集処理手段122aは、生成した未知ベクトルと、分類用データベース4a内の各分類ベクトルとを比較し、該未知ベクトルと意味上の類似性が最も高い分類ベクトルを特定する。そして、収集処理手段122aは、生成した未知ベクトルに対応する未分類情報に、特定した分類ベクトル及び該分類ベクトルに対応する分類コードのうちの少なくとも1つである分類データを紐付けて記憶させる。すなわち、例えば、収集処理手段122aは、生成した未知ベクトルに対応する未分類情報に対し、特定した分類ベクトルを紐付けて記憶させてもよい。これにより、未分類情報には、実質的に分類コードが付与される。あるいは、収集処理手段122aは、生成した未知ベクトルに対応する未分類情報に、特定した分類ベクトルに対応する分類コードを紐付けて記憶させてもよい。もっとも、収集処理手段122aは、生成した未知ベクトルに対応する未分類情報に、特定した分類ベクトルと、該分類ベクトルに対応する分類コードとの双方を紐付けて記憶させてもよい。
 評価処理手段122bは、翻訳処理手段221と、抽出処理手段225と、一致度処理手段226と、格付処理手段227と、を有している。翻訳処理手段221は、権利関連情報及び発明関連情報に翻訳処理を施すものである。翻訳処理手段221は、上述した翻訳処理手段121と同様、共通言語に統一化する翻訳処理を実行する。
 抽出処理手段225は、対象権利の出願日よりも前に公開された発明関連情報を、収集処理手段122aが収集した複数の発明関連情報の中から抽出するものである。以下、発明又は考案に関連する情報であって、対象権利の出願日よりも前に公開された発明関連情報のことを「日前情報」ともいう。日前情報には、出願日よりも前に公開された対象権利に係る発明関連情報について、その公開によっては該発明関連情報の新規性が喪失しないものとして取り扱われる規定(新規性喪失の例外規定など)の適用を、該対象権利の出願人等が受けている場合における、その発明関連情報を含まないようにするとよい。この場合、抽出処理手段225は、対象権利の出願経過に関する情報における上記規定に対応する書類と発明関連情報との照合処理により、上記規定の適用対象の発明関連情報を日前情報から除外するよう構成するとよい。抽出処理手段225は、予め決められた条件に基づいて日前情報をさらに絞り込む機能を有していてもよい。つまり、抽出処理手段225は、各対象権利のそれぞれについて、全ての日前情報の中から、該対象権利の有効性の分析に用いる複数の日前情報を抽出するようにしてもよい。
〔文章ベクトルと分類ベクトルとの比較による日前情報の絞り込み〕
 例えば、抽出処理手段225は、対象権利の請求の範囲、クレーム1、明細書の一部もしくは全部、要約書、又は全文などを自然言語処理によりベクトル化し、意味ベクトルである文章ベクトルを生成し、生成した文章ベクトルを該対象権利に紐付けて記憶させる。抽出処理手段225は、全ての対象権利(分析対象とされている全ての権利)について、文章ベクトルの生成及び紐付け処理を実行する。また、抽出処理手段225は、各分類済情報のそれぞれから分類コードを取得し、取得した分類コードを分類用データベース4aに照らすことにより、該分類コードに対応する分類ベクトルを取得する。そして、抽出処理手段225は、各分類済情報に対し、これらに付された分類コードに対応する分類ベクトルを紐付けて記憶させる。これにより、各対象権利のそれぞれに文章ベクトルが紐付けられ、各分類済情報のそれぞれに分類ベクトルが紐付けられる。
 抽出処理手段225は、対象権利に紐付けられた文章ベクトルと、各分類済情報に紐付けられた分類ベクトルとを比較し、これらの一致度である文章一致度が文章閾値以下である分類済情報を、権利の有効性分析用の日前情報として抽出する。収集処理手段122aが分類付与機能により各未分類情報に分類ベクトル等を紐付けている場合、抽出処理手段225は、対象権利に紐付く文章ベクトルと、各未分類情報に紐付く分類ベクトルとを比較し、これらの一致度である文章一致度が文章閾値以下である未分類情報を、該対象権利の有効性分析用の日前情報として抽出する。文章閾値は、予め設定され、適宜変更することができる。
〔分類ベクトル同士の比較による日前情報の絞り込み〕
 抽出処理手段225は、対象権利に付されている分類コードを取得し、取得した分類コードを分類用データベース4aに照らすことにより、該分類コードに対応する分類ベクトルを取得する。抽出処理手段225は、該対象権利に対し、これに付された分類コードに対応する分類ベクトルを紐付けて記憶させる。収集処理手段122aは、全ての対象権利に対し、分類ベクトルの取得及び紐付け処理を実行する。抽出処理手段225は、上記同様、複数の分類済情報のそれぞれに対し、分類ベクトルの紐付け処理を実行する。
 そして、抽出処理手段225は、対象権利に紐付けられた分類ベクトルと、各分類済情報に紐付けられた分類ベクトルとを比較し、これらの一致度である分類一致度が分類閾値以下である分類済情報を、該対象権利の有効性分析用の日前情報として抽出する。収集処理手段122aが分類付与機能により各未分類情報に分類ベクトル等を紐付けている場合、抽出処理手段225は、対象権利に紐付く分類ベクトルと、各未分類情報に紐付く分類ベクトルとを比較し、これらの間の分類一致度が分類閾値以下である未分類情報を、該対象権利の有効性分析用の日前情報として抽出する。分類閾値は、予め設定され、適宜変更することができる。
 一致度処理手段226は、分析対象とされている特許又は実用新案に係る対象権利におけるクレームの1又は複数のクレーム要素(日本国では構成要件・構成要素・発明特定事項などと称される)を意味ベクトルである第1ベクトルに変換する。すなわち、一致度処理手段226は、各対象権利の請求の範囲における1又は複数のクレームをクレーム要素に分解する。そして、一致度処理手段226は、クレーム要素を自然言語処理によりベクトル化することで、クレーム要素ごとの第1ベクトルを生成して記憶させる。クレームの構成や分解の手法などによっては、クレームにおけるクレーム要素が1つとなる場合もある。一致度処理手段226は、全ての対象権利に対し、全てのクレームの分解処理と第1ベクトルの生成処理を行い、生成した第1ベクトルを各クレーム要素に紐付けて記憶させる。
 また、一致度処理手段226は、抽出処理手段225が抽出した複数の日前情報それぞれの一部又は全部を分割した分割データごとに意味ベクトルである第2ベクトルに変換する。すなわち、一致度処理手段226は、日前情報の一部又は全部である分割対象情報を所定の条件により複数の分割データに分割し、各分割データそれぞれを自然言語処理によりベクトル化することで、各分割データごとの第2ベクトルを生成するして記憶させる。日前情報が特許文献等の場合、一致度処理手段226は、例えば日前情報における明細書(description)を分割対象情報としてもよい。明細書には原則、他の書類(請求の範囲・要約書など)の内容も含まれるため、分割対象情報を明細書にすることで、処理の効率化を図ることができる。日前情報を分割する条件としては、例えば「一文ごとに分割する」といった条件を好適に用いることができる。この場合、分割データは、一文(日本語の場合は冒頭から句点まで)に相当する。このようにすれば、2つのベクトル間のコサイン類似度に基づく一致度を用いることにより、クレーム要素との意味上の関連性が相対的に高い記載の、日前情報中における位置を特定することができる。
 一致度処理手段226は、各第1ベクトルと各第2ベクトルとの相互比較により、対象権利におけるクレームのクレーム要素と、各日前情報それぞれとの一致度である総一致度を求める。より具体的に、一致度処理手段226は、対象権利について、日前情報ごとに、第1ベクトルと複数の第2ベクトルとの比較を行い、第1ベクトルと各第2ベクトルとの一致度である分割一致度を求める。一致度処理手段226は、分割一致度が対比閾値以下であれば、該分割一致度に紐付けて、クレーム要素と分割データとの間の関連性が相対的に高いことを示す関連フラグを立てるようにしてもよい。
 そして、一致度処理手段226は、ある第1ベクトルと、ある日前情報に対応する全ての第2ベクトルそれぞれとの間の分割一致度から、該第1ベクトルに対応するクレーム要素と該日前情報との一致度である総一致度を求める。一致度処理手段226は、求めた総一致度が総閾値以下であれば、該総一致度に紐付けて、クレーム要素と日前情報との関連性が相対的に高いことを示す一致フラグを立てるようにしてもよい。
 図22は、クレームにおけるクレーム要素に対応する種々のデータを例示した表である。図22では、抽出処理手段225がN個(Nは任意の自然数)の日前情報を抽出したことを前提とし、これらにD~Dの符号を対応づけている。なお、D~Dは、日前情報の識別番号に対応する。分割データを示す「d」に付した「k」「j」は、便宜的な記号であり、複数の日前情報D~Dの分割対象情報が同じ数の分割データに分割されることを意味するものではない。関連フラグの欄は、関連フラグが立っている分割一致度(図の白丸)もあれば、関連フラグが立っていない分割一致度(図の×)もあることを示す一例に過ぎず、白丸と×の位置に何ら意味はない。一致フラグの欄についても同様である。一致度処理手段226は、対象権利の請求の範囲における全てのクレーム要素について、図22のような種々の情報を取得し、あるいは演算により求め、記憶部23又は出力用データベース部25などに記憶させる。
 図23は、クレーム要素ごとの、複数の日前情報との総一致度を例示した表であり、これは、対象権利のクレーム要素と複数の日前情報との間の総一致度を整理した一致度データベースの一部を例示したものである。一致度処理手段226は、全ての対象権利のクレーム要素と各日前情報との総一致度を整理した一致度データベースを構築する機能を有している。図23では、対象権利の請求の範囲が6つのクレームを有する例を示している。図23に例示する各クレームのうち、クレーム1は7つのクレーム要素に分解され、クレーム2~クレーム5は1つのクレーム要素からなるクレームとして処理され、クレーム6は5つのクレーム要素に分解されている。図23では、総閾値「0.20」を前提とし、一致フラグが立つ条件を満たす枠、つまり総一致度が0.20以下の枠を太線としている。なお、図23では、複数の日前情報としてD~Dのみを例示しているが、一致度処理手段226は、原則として、全ての日前情報の総一致度を求める。
 一致度処理手段226は、日前情報ごとに求めた総一致度に基づき、対象権利との意味上の類似性が最も高い日前情報である主関連情報Daを特定する。例えば、一致度処理手段226は、あるクレームについて、総一致度が総閾値以下となるクレーム要素が最も多い日前情報を主関連情報Daとする。総一致度が総閾値以下となるクレーム要素が最も多い日前情報が複数ある場合、該複数の日前情報の中から、総一致度や一致フラグの状態などをもとに1つの主関連情報Daを特定してもよく、複数の主関連情報Daを特定してもよい。
 一致度処理手段226は、特定した主関連情報Daとの意味上の関連性が相対的に高い1又は複数の日前情報を副関連情報として選定してもよい。より具体的に、一致度処理手段226は、主関連情報Daに紐付く分類ベクトルとの一致度が副閾値以下の分類ベクトルが紐付く1又は複数の日前情報を副関連情報Dbとして選定してもよい。副閾値は、予め設定され、適宜変更することができる。ここで、主関連情報Daに紐付く分類ベクトルとは、主関連情報Daが分類済情報の場合、これに付与されている分類コードに対応する分類ベクトルのことである。一方、主関連情報Daが未分類情報の場合は、該主関連情報Daに紐付けられた分類コードに対応する分類ベクトル、又は該主関連情報Daに直接紐付けられた分類ベクトルのことである。
 ここで、進歩性(非自明性)が否定される方向に働く要素(動機付けの要素)として、主引例と副引例との間の「技術分野の関連性」が知られている。この点、上記のように、主関連情報Daとの間で分類ベクトル間の意味上の関連性が相対的に高い日前情報を副関連情報Dbとして抽出すれば、主関連情報Daに副関連情報Dbを組み合わせることの容易想到性が高まるため、主関連情報Da及び1又は複数の副関連情報Dbに基づく格付けスコア(個別スコア及び総合スコア)の信頼性が高まる。さらに、主関連情報Daと副関連情報Dbとの間で、特許分類の階層がある程度の深さで近似するように、分類ベクトル及び副閾値を調整すれば、格付けスコアの精度をさらに高めることができる。
 格付処理手段227は、一致度処理手段226により求められた各総一致度に基づいて、複数の対象権利それぞれの有効性の指標となる格付けスコアを求める。本変形例1の格付処理手段227は、格付けスコアとして、クレームの有効性の指標となる個別スコアをクレームごとに求めると共に、対象権利の有効性の指標となる総合スコアを対象権利ごとに求めるよう構成されている。より具体的に、格付処理手段227は、クレームにおける1又は複数のクレーム要素と、主関連情報Da及び1又は複数の副関連情報Dbとの間の総一致度を用いて、クレームごとの個別スコアと、対象権利ごとの総合スコアとを求める。
 格付処理手段227は、総合スコアとして、例えば、総合的な順位を求めてもよく、発明又は考案が属する技術分野における順位を求めてもよく、出願日が属する一定期間における順位を求めてもよい。一定期間は、任意に設定することができる。格付処理手段227は、上記のような順位などをもとに、例えば「AAA」「AA」「A」「BBB」「BB」「B」「CCC」「CC」「C」「D」のような段階的な評価を示す総合スコアを求めてもよい。格付処理手段227は、個別スコア及び総合スコアなどの情報を、該対象権利に紐付けて記憶部23又は出力用データベース部25に記憶させる。
〔総一致度の平均又は標準偏差に基づく演算〕
 格付処理手段227は、クレームに紐付く全ての総一致度を用いて個別スコアを求めてもよい。クレームに紐付く全ての総一致度とは、例えば、クレームの1又は複数のクレーム要素と、主関連情報Da及び全ての副関連情報Dbそれぞれとの間の総一致度のことである。格付処理手段227は、クレームに紐付く全ての総一致度の平均を個別評価値として求め、求めた個別評価値をもとに個別スコアを求めてもよい。また、格付処理手段227は、クレームに紐付く全ての総一致度の標準偏差を個別評価値として求め、求めた個別評価値をもとに個別スコアを求めてもよい。例えば、格付処理手段227は、個別評価値と複数の閾値との比較により、個別スコアを段階的に求めることができる。
 格付処理手段227は、あるクレームに対応する副関連情報Dbが指定数よりも多ければ、予め決められた選定条件により指定数の副関連情報Dbを選定してもよい。指定数は、個別スコアの演算に用いる副関連情報Dbの数として設定される数である。選定条件としては、一致フラグの数が多いという条件、主関連情報Daに一致フラグが立っていないクレーム要素に一致フラグが立っているという条件、又はこれらを組み合わせた条件などを採用することができる。この場合、格付処理手段227は、各クレームについて、選定条件により絞り込んだ日前情報(主関連情報Da及び指定数の副関連情報Db)に紐付く総一致度の平均を個別評価値として求め、求めた個別評価値をもとに個別スコアを求めてもよい。格付処理手段227は、各クレームについて、選定条件により絞り込んだ日前情報に紐付く総一致度の標準偏差を個別評価値として求め、求めた個別評価値をもとに個別スコアを求めてもよい。
 ここで、図24を参照して、日前情報の絞り込みについて視覚的に説明する。図24では、指定数「4」、総閾値「0.18」を前提とし、あるクレームのクレーム要素と、選定された複数の日前情報との間の総一致度を例示している。図24には、クレームとして、7つのクレーム要素に分割されたクレーム1を例示し、主関連情報Daとして「D」を例示し、副関連情報Dbとして「D~D」を例示している。なお、図24では、一致フラグが立つ条件を満たす枠、つまり総一致度が0.18以下の枠を太線にしている。このように、選定条件に基づき、新規性及び進歩性を否定する要素に乏しい日前関連文献を演算対象から除外し、絞り込んだ日前情報に紐付く総一致度の平均値又は標準偏差を求めるようにすれば、個別スコアの精度向上を図ることができる。
〔一致フラグの割合に基づく演算〕
 格付処理手段227は、あるクレームについて、クレーム要素の数と抽出処理手段225が抽出した日前情報の総数との積に対する一致フラグの数の割合を個別評価値として求め、求めた個別評価値をもとに個別スコアを求めるようにしてもよい。格付処理手段227は、あるクレームに対応する副関連情報Dbが指定数よりも多ければ、選定条件により指定数の副関連情報Dbを選定してもよい。そして、格付処理手段227は、該クレームについて、クレーム要素の数と主関連情報Da及び各副関連情報Dbの総数との積に対する一致フラグの数の割合を個別評価値として求め、求めた個別評価値をもとに個別スコアを求めてもよい。
 図25を参照して、一致フラグの割合に基づく個別評価値の演算処理について具体的に説明する。図25は、図24の各総一致度を一致フラグが立っているか否かにより整理した説明図であり、諸々の設定等は図24と同様である。図25では、各クレーム要素について、一致フラグが立っている日前情報の欄に丸を付し、一致フラグが立っていない日前関連文献の欄に×を付している。図25に例示するクレームの場合、クレーム要素の数と主関連情報Da及び各副関連情報Dbの総数との積は35(「白丸の総数」+「×の総数」=7×5)であり、一致フラグの数は15(白丸の総数)である。よって、個別評価値は「3/7」となる。
〔新規性と進歩性との段階的な評価による個別スコアの演算〕
 格付処理手段227は、新規性の有無に係る判定処理と、進歩性の有無に係る判定処理とを段階的に行うことにより、クレームごとの個別スコアを求めてもよい。かかる構成を採る場合、新規性のないクレームの方が、進歩性のないクレームよりも有効性が低い、という考えが前提となる。併せて、収集処理手段122aが分類用データベース4aを生成し、一致度処理手段226が主関連情報Daの特定と副関連情報Dbの抽出を行っていることが前提となる。以下、あるクレーム要素と日前情報との間の総一致度が総閾値以下であることを「日前情報がクレーム要素を充足する」と表現する。また、あるクレーム要素と日前情報との間の総一致度が総閾値よりも大きいことを「クレーム要素が新規的である」と表現する。適宜、図24及び図26を参照して説明する。
 格付処理手段227は、あるクレームについて、『全てのクレーム要素を充足する日前情報が幾つ存在するか、』『全てのクレーム要素を充足する日前情報が存在しない場合に、該非充足のクレーム要素を、他の幾つの日前情報によって充足するか、あるいは他の複数の日前情報の組み合わせによっても充足しないか、』といった判定基準に基づいて個別スコアを求めるものである。以下、新規性の観点と進歩性の観点とに分けて説明する。
<新規性の有無に係る判定処理>
 あるクレームについて、少なくとも1つの日前情報が全てのクレーム要素を充足する場合、つまり該クレームの全てのクレーム要素と該日前情報との間の総一致度が何れも総閾値以下の場合、そのクレームには、格付処理手段227によって新規性なしに対応する個別スコアが付与される。この場合の個別スコアは、例えば下記のような条件に対応づけて段階的に設定することができる。
(1)あるクレームについて、全てのクレーム要素を充足する日前情報が複数存在するという条件。
(2)あるクレームについて、全てのクレーム要素を充足する日前情報が1つだけ存在するという条件。
 図24には、条件(2)を満たす状況が例示されている。つまり、図24に例示する日前情報Dは、1つのクレームにおける全てのクレーム要素を充足している。条件(2)を満たすクレームには、新規性なしの中では相対的に上位の個別スコアが付与される。条件(1)を満たすクレームには、条件(2)を満たすクレームよりも下位の個別スコアが付与される。条件(1)を満たすクレームには、一律に同じ個別スコアが付与されるようにしてもよく、全てのクレーム要素を充足する日前情報の数が多いほど下位の個別スコアが付与されるようにしてもよい。
 格付処理手段227は、個別スコアを求める際、例えば、全てのクレーム要素を充足する日前情報に紐付く総一致度を用い、該クレームの有効性を示す個別評価値を求めてもよい。個別評価値としては、総一致度の平均又は標準偏差などが想定される。このような個別評価値には、通常、個別スコアが等しいクレーム間にも差がつく。よって、個別評価値を総合スコアの演算等に用いることにより、有効性レーティングの精度向上を図ることができる。
<進歩性の有無に係る判定処理>
 あるクレームについて、全てのクレーム要素を充足する日前情報が存在しない場合、つまり、何れの日前情報も、該クレームのうちの少なくとも1つのクレーム要素との間の総一致度が総閾値よりも大きい場合、そのクレームには、格付処理手段227によって新規性ありに対応する個別スコアが付与される。この場合の個別スコアは、例えば下記のような条件に対応づけて、段階的に設定することができる。
(クレームの有効性が相対的に低い場合:進歩性なし)
(3)あるクレームについて、クレーム要素のうちの1つが新規的であり、それを補完する日前情報が複数存在するという条件。
(4)あるクレームについて、クレーム要素のうちの1つが新規的であり、それを補完する日前情報が1つだけ存在するという条件。
(5)あるクレームについて、クレーム要素のうちの複数が新規的であり、それらを単独で補完する日前情報が複数存在するという条件。
(6)あるクレームについて、クレーム要素のうちの複数が新規的であり、それらを単独で補完する日前情報が1つだけ存在するという条件。
(7)あるクレームについて、クレーム要素のうちの複数が新規的であり、それらを複数の日前情報の組み合わせにより補完できるという条件。
(クレームの有効性が相対的に高い場合:進歩性あり)
(8)あるクレームについて、クレーム要素のうちの1つが新規的であり、それを補完する日前情報が存在しないという条件。
(9)あるクレームについて、クレーム要素のうちの複数が新規的であり、それらを複数の日前情報の組み合わせによっても補完できないという条件。
 上記の各条件については、条件に付された数字が大きくなるほど、上位の個別スコアが対応づけられるようにするとよい。ただし、条件(5)~条件(7)については、新規的なクレーム要素の数、クレーム要素を補完可能な日前情報の数、総一致度などに基づき、対応づける個別スコアの上下関係を適宜入れ替えてもよい。
 図26には、条件(3)を満たす状況を例示している。つまり、図26に例示する日前情報Dは、クレームにおける1つのクレーム要素(1e)だけを充足していないが、クレーム要素(1e)は、日前情報D又はDにより補完される。すなわち、クレーム要素(1e)と日前情報D及びDとの総一致度は0.18以下となっている。
 図27には、条件(7)を満たす状況を例示している。つまり、図27に例示する日前情報Dは、クレーム要素(1d)及び(1f)を充足していないが、クレーム要素(1d)は日前情報D又はDにより補完され、クレーム要素(1f)は日前情報Dにより補完される。上記の条件(1)~条件(9)は、あくまで例示であり、個別スコアは、新規的なクレーム要素の数、クレーム要素を補完可能な日前情報の数、総一致度などに基づき、さらに細分化することができる。
 格付処理手段227は、個別スコアを求める際、例えば、個別スコアの演算に用いた日前情報に紐付く総一致度の平均又は標準偏差などを個別評価値として求めてもよい。通常、個別評価値には、個別スコアが等しいクレーム同士であっても差がつく。したがって、個別評価値を総合スコアの演算等に用いることにより、有効性レーティングの精度を高めることができる。
 本変形例1の構築処理手段22cは、記憶部23及び収集用データベース部24に記憶されている情報をもとに、出力用データベース部25内に、複数の対象権利それぞれの個別スコア及び総合スコアを管理するデータベース5aを構築する。記憶部23内の情報には、収集処理手段22a及び評価処理手段122bが記憶させた情報も含まれる。本変形例1においても、収集処理手段122aは、世界各国の権利関連情報における差分を記憶部23等に記憶させる。権利関連情報には対象権利も含まれる。評価処理手段122bは、上記差分を用いて、追加された対象権利に関する格付けスコアなどを求めて記憶部23等に記憶させる。また、評価処理手段122bは、上記差分に基づき、クレームの訂正や権利者の変更などが行われた対象権利に関する格付けスコアなどを更新する。構築処理手段22cは、評価処理手段122bが追加し、あるいは更新した情報をもとに、出力用データベース部25のデータベースをアップデートし、該データベースをもとに、情報処理手段32aがデータベース5aをアップデートする。データ提供装置30は、格付処理手段227により求められた複数の対象権利それぞれの個別スコア及び総合スコアを管理するデータベース5aから、外部の要求に対応する格付けスコア、つまり個別スコア及び総合スコアのうちの少なくとも1つを抽出して提供する。
 分析処理部22Aは、CPU又はGPUなどの演算装置と、こうした演算装置と協働して上記及び下記の各種機能を実現させるデータ分析プログラムP10と、により構成することができる。すなわち、データ分析プログラムP10は、コンピュータとしての分析処理部22A及び記憶部23を、収集処理手段122a、評価処理手段122b、及び構築処理手段22cとして機能させるためのプログラムである。
 図28を参照して、本変形例1におけるデータ管理方法のうち、分類用データベース4aを生成する動作例について説明する。まず、収集処理手段122aは、外部から特許分類の情報を収集し、例えば図21の太枠内に示す各データを含む基礎データベースを構築する(ステップS11)。次いで、収集処理手段122aは、基礎データベース内の説明データを読み出し、読み出した説明データから自然言語処理により分類ベクトルを生成する。そして、収集処理手段122aは、生成した分類ベクトルを、該説明データに対応する分類コードに紐付けて記憶させる(ステップS12)。
 収集処理手段122aは、基礎データベース内の全ての説明データに対し、ステップS12の処理を実行する(ステップS13/No、ステップS12)。収集処理手段122aは、全ての説明データに対するステップS12の処理を実行することにより、分類用データベース4aを構築する(ステップS13/Yes)。なお、収集処理手段122aは、ステップS11の処理とステップS12及びS13の処理とを並行して行ってもよい。
 図29を参照して、本変形例1におけるデータ管理方法のうち、非特許文献の情報に分類データを付与する動作の流れについて説明する。まず、収集処理手段122aは、日前情報のうちの非特許文献の情報である未分類情報を取得する(ステップS21)。次いで、収集処理手段122aは、未分類情報から分類対象データを抽出する(ステップS22)。次に、収集処理手段122aは、分類対象データを意味ベクトルに変換することにより未知ベクトルを生成する(ステップS23)。なお、収集処理手段122aが未分類情報の全てを自然言語処理によるベクトル化の対象とする場合、ステップS22は不要となる。
 続いて、収集処理手段122aは、生成した未知ベクトルと、分類用データベース4a内の各分類ベクトルとを比較し、該未知ベクトルと各分類ベクトルとの一致度である未知一致度を求める(ステップS24)。収集処理手段122aは、未知ベクトルとの間の未知一致度が最も小さい分類ベクトルを特定する(ステップS25)。そして、収集処理手段122aは、未知ベクトルに対応する未分類情報に対し、ステップS25で特定した分類ベクトル、及び該分類ベクトルに対応する分類コードのうちの少なくとも1つである分類データを紐付けて記憶させる(ステップS26)。これにより、未分類情報についても、分類済情報と同様に取り扱うことができる。つまり、未分類情報は、分類データの紐付け処理により、主関連情報Da及び副関連情報Dbの対象とすることができる。
 次に、図30及び図31を参照して、本変形例1のデータ管理方法における、各対象権利の格付けスコアを求める動作の流れについて説明する。ここでは、日前情報における分割対象情報を一文単位でベクトル化する例を示す。
 まず、一致度処理手段226は、対象権利から請求の範囲を抽出する(ステップS31)。一致度処理手段226は、抽出した請求の範囲からクレーム1を抽出し、クレーム1に分解処理を施す。つまり、一致度処理手段226は、予め設定された分解条件により、クレーム1をクレーム要素ごとに分解する。分解条件は、クレームの上位性やクレームのカテゴリーなどに応じて、クレームごとに個別設定されてもよい(ステップS32)。
 次いで、一致度処理手段226は、1つのクレーム要素を第1ベクトルに変換する(ステップS33)。また、一致度処理手段226は、1つの日前情報を取得する(ステップS34)。そして、一致度処理手段226は、日前情報における明細書(description)などの分割対象情報を一文単位でベクトル化し、文ごとに、意味ベクトルである第2ベクトルを生成する(ステップS35)。
 続いて、一致度処理手段226は、第1ベクトルと各第2ベクトルそれぞれとの一致度である分割一致度を求め、求めた分割一致度を、各第2ベクトルに対応する文に紐付けて記憶させる(ステップS36)。次いで、一致度処理手段226は、求めた全ての分割一致度について、分割一致度が対比閾値以下であるか否かを判定する(ステップS37)。一致度処理手段226は、分割一致度が対比閾値以下であれば(ステップS37/Yes)、該分割一致度に紐付けて、クレーム要素と文との間の意味上の関連性が高いことを示す関連フラグを立てる(ステップS38)。一方、一致度処理手段226は、分割一致度が対比閾値よりも大きければ(ステップS37/No)、ステップS39の処理へ移行する。
 一致度処理手段226は、第1ベクトルと日前情報の全ての第2ベクトルとの間の分割一致度の演算、及び全ての分割一致度についての判定処理が終了すると(ステップS36~S38)、求めた全ての分割一致度に基づいて、クレーム要素と日前情報との間の総一致度を求める。例えば、一致度処理手段226は、対比閾値以下である分割一致度の平均又は標準偏差を総一致度としてもよい。一致度処理手段226は、対比閾値以下である分割一致度の中から規定数の分割一致度を抽出し、抽出した分割一致度の平均又は標準偏差を総一致度としてもよい。一致度処理手段226は、対比閾値以下である分割一致度の中で最も小さいものを総一致度としてもよい。そして、一致度処理手段226は、求めた総一致度を、クレーム要素と日前情報とに対応づけて記憶させる(ステップS39)。
 次いで、一致度処理手段226は、求めた総一致度が総閾値以下であるか否かを判定する(ステップS40)。一致度処理手段226は、総一致度が総閾値以下であれば(ステップS40/Yes)、該総一致度に紐付けて、クレーム要素と日前情報との意味上の関連性が高いことを示す一致フラグを立てる(ステップS41)。一方、一致度処理手段226は、総一致度が総閾値よりも大きければ(ステップS40/No)、ステップS42の処理へ移行する。
 一致度処理手段226は、抽出処理手段225が抽出した複数の日前情報の中に、未処理の日前情報があれば(ステップS42/Yes)、ステップS34へ移行する。すなわち、一致度処理手段226は、全ての日前情報に対し、ステップS34~ステップS41の一連の処理を実行する。
 一致度処理手段226は、全ての日前情報に対する比較判定処理が完了すると(ステップS42/No)、クレーム1に未処理のクレーム要素があるか否か、つまり、クレーム1について、未処理の第1ベクトルが存在するか否かを判定する(ステップS43)。比較判定処理とは、図30のステップS36~S41の一連の処理、あるいは該処理と同様の処理のことをいう。一致度処理手段226は、未処理の第1ベクトルが存在しなければ(ステップS43/No)、ステップS45の処理へ移行する。一方、一致度処理手段226は、未処理の第1ベクトルが存在すれば(ステップS43/Yes)、該第1ベクトルと、全ての日前情報それぞれの複数の第2ベクトルとの比較判定処理を行う。一致度処理手段226は、未処理の第1ベクトルが複数存在すれば、全ての第1ベクトルについて比較判定処理を実行する。これにより、一致度処理手段226は、クレーム1の全てのクレーム要素と全ての日前情報との組み合わせそれぞれに紐付く総一致度の導出が完了する(ステップS44)。
 次に、一致度処理手段226は、クレーム1と最も近いと推察される日前情報である主関連情報Daを特定する。主関連情報Daは、新規性又は進歩性を否定するロジックの構築の中心となる日前情報であり、日本では「主引用発明」などと称され、欧州では「Closest Prior Art」と称されるものに相当する。一致度処理手段226は、例えば、一致フラグの数が最も多い日前情報を主関連情報Daとする(ステップS45)。
 続いて、一致度処理手段226は、対象権利に未処理のクレームが存在するか否かを判定し(ステップS46)、未処理のクレームが存在しなければ(ステップS46/No)、ステップS49の処理へ移行する。一方、一致度処理手段226は、未処理のクレームが存在すれば(ステップS46/Yes)、未処理のクレームに分解処理を施し、クレーム要素を第1ベクトルに変換する(ステップS47)。そして、一致度処理手段226は、生成した全ての第1ベクトルと、主関連情報Daの各第2ベクトルとの比較判定処理を行い(ステップS48)、ステップS46の処理へ移行する。
 一致度処理手段226は、全てのクレームに対する比較判定処理が完了すると(ステップS46/No)、主関連情報Daとの間に意味上の関連性がある1又は複数の副関連情報Dbを、全ての日前情報の中から選定する。副関連情報Dbは、主関連情報Daとの組み合わせにより進歩性を否定するロジックを構築し得るものである。例えば、一致度処理手段226は、主関連情報Daに付されている分類ベクトルと、日前情報に付されている分類ベクトルとの一致度を求め、求めた一致度が副閾値以下である日前情報を副関連情報Dbとして選定する。
 一致度処理手段226は、予め設定された指定数を上限として副関連情報Dbを選定するようにしてもよい。この場合、一致度処理手段226は、進歩性を否定するという観点でより有用と推察される副関連情報Dbから順に選定するとよい。例えば、一致度処理手段226は、クレーム1の各クレーム要素につき、主関連情報Daに一致フラグが立っていないクレーム要素に対し一致フラグが立っている日前情報を、副関連情報Dbとして優先的に選定してもよい。もっとも、一致度処理手段226は、全てのクレームの各クレーム要素につき、主関連情報Daに一致フラグが立っていないクレーム要素に対し一致フラグが立っている日前情報を、副関連情報Dbとして優先的に選定してもよい(ステップS49)。
 続いて、一致度処理手段226は、下位のクレーム(クレーム2以下のクレーム)の全ての第1ベクトルと、各副関連情報Dbそれぞれの複数の第2ベクトルとの比較判定処理を行う。これにより、対象権利における各クレーム要素それぞれと、主関連情報Da及び全ての副関連情報Dbとの間の総一致度の演算が完了し、図23に例示するような一致度データベースが構築される(ステップS50)。
 格付処理手段227は、対象権利における各クレーム要素それぞれと、主関連情報Da及び全ての副関連情報Dbとの間の総一致度をもとに、クレームごとの個別スコアを求める。格付処理手段227は、上述した何れかの手法によりクレームの個別評価値を求め、求めた個別評価値の大きさから個別スコアを求めてもよい(「総一致度の平均又は標準偏差に基づく演算」「一致フラグの割合に基づく演算」参照)。この場合、例えば、個別評価値に対応する複数の数値範囲と複数の個別スコアとを関連づけたスコアテーブルを記憶部23等に格納しておいてもよい。そして、格付処理手段227は、求めた個別評価値をスコアテーブルに照らして個別スコアを求めてもよい。または、段階的に設定された複数の個別スコアと、個別スコア間の数値的境界に対応する複数の閾値とを記憶部23等に記憶させておき、格付処理手段227が、求めた個別評価値と閾値との比較処理から個別スコアを求めてもよい。格付処理手段227は、上述した「新規性と進歩性との段階的な評価による個別スコアの演算」のように、個別スコアを直接的に求めてもよい(ステップS51)。
 次いで、格付処理手段227は、暫定的な総合スコアである暫定スコアを求める。例えば、格付処理手段227は、請求の範囲にクレームが1つだけ存在する場合、個別スコアをそのまま暫定スコアとしてもよい。格付処理手段227は、請求の範囲に複数のクレームが存在する場合、最も上位の個別スコアを暫定スコアとしてもよい。また、格付処理手段227は、請求の範囲に複数のクレームが存在する場合、全ての個別スコアを数値化し、数値化した各値を用いた演算処理により暫定スコアを求めてもよい。この場合、段階的に設定される個別スコアのそれぞれに換算用の数値を割り当てておくとよい。そして、全ての個別スコアを数値化した各値から求めた演算値に対する閾値処理等により暫定スコアを求めてもい(ステップS52)。
 評価処理手段122bは、未処理の対象権利が存在する限り(ステップS53/Yes)、該対象権利に対し、ステップS31~S52の一連の処理を実行する。すなわち、一致度処理手段226は、全ての対象権利に対しステップS31~S52の一連の処理を実行し、全ての対象権利それぞれの個別スコア及び暫定スコアを求めて記憶させる。格付処理手段227は、全ての対象権利それぞれの個別スコア及び暫定スコアの導出処理が完了すると(ステップS53/No)、各対象権利それぞれの暫定スコア等を相対比較することにより、各対象権利それぞれの暫定スコアを調整し、対象権利間の相対的な有効性を示す総合スコアを求める。
 格付処理手段227は、必要に応じて暫定スコアに補正を加えるが、暫定スコアと総合スコアが一致することもある。格付処理手段227は、全ての対象権利を所定条件により分類したグループでの相対的な有効性を示す総合スコアを求めてもよい。例えば、総合スコアは、対象権利の発明又は考案が属する技術分野での相対的な有効性を示すものであってもよく、対象権利の出願日が属する任意の期間での相対的な有効性を示すものであってもよい(ステップS54)。
 以降、更新期間ごとのデータベース5aのアップデート時は、評価処理手段122bが、世界各国の権利関連情報における差分に基づき、クレームの訂正等が行われた対象権利、及び追加された対象権利についての格付けスコア等の演算を行う。その際、評価処理手段122bは、訂正等が行われたクレームの個別スコアだけを更新するといったように、変更点に基づく最小限の更新処理を実行する。そして、評価処理手段122bは、全ての対象権利間、又は所定のカテゴライズに基づく複数の対象権利間での整合をとるべく、各総合スコアの相対的な調整を実行する。次いで、構築処理手段22cは、評価処理手段122bにより追加・変更された情報をもとに、出力用データベース部25のデータベースをアップデートし、該データベースをもとに、情報処理手段32aがデータベース5aをアップデートする。
 上記の動作説明は、図30及び図31に付したステップ番号の順に説明したが、これに限定されない。例えば、クレームに対する処理(ステップS31~S33)と日前情報に対する処理(ステップS34及びS35)は、順序を入れ替えてもよく、並列的に行ってもよい。また、上記では、日前情報の分割対象情報を一文単位でベクトル化する例を示したが、これに限らず、一致度処理手段226は、二つ以上の文をまとめて1つの第2ベクトルに変換してもよい。ベクトル化する文の数は、日前情報ごとに統一する必要はなく、例えば一文の長さなどに応じて、まとめる文の数を決めてもよい。ただし、関連性の高い記載箇所を精度よく特定するには、一文単位でのベクトル化が好ましい。データ提供装置30を介して情報端末40などの外部機器へ提供するデータの中に、対象権利ごとの格付けスコアと共に、各文に対応する関連フラグの情報を含めることで、クレーム要素との関連性が相対的に高い内容の記載箇所を明示させることができるため、ユーザビリティーの向上を図ることができる。一致度処理手段226は、関連フラグ及び一致フラグのうちの何れか一方のみを立てるようにしてもよく、両者を立てる処理を行わなくてもよい。
 格付処理手段227は、暫定スコアを求めるステップS52の処理を省略してもよい。この場合、格付処理手段227は、一致度処理手段226により求められた各総一致度に基づいて、対象権利の有効性の指標となる総合評価値を求めると共に、各対象権利それぞれの総合評価値の相対比較により対象権利ごとの総合スコアを求めてもよい。格付処理手段227は、総合スコアを、個別評価値を用いた演算により求めてもよく、総一致度を用いた演算により求めてもよく、個別評価値と総一致度との双方を用いた演算により求めてもよい。請求の範囲のクレームが1つの場合は、個別評価値をそのまま総合評価値とすればよい。また、請求の範囲が複数のクレームを含んでいても、各クレームに対応する個別評価値のうちの1つを総合評価値として用いてもよい。要するに、本変形例1の分析処理部22Aは、クレームごとの個別スコアと対象権利ごとの総合スコアを求めることを目的としたものであり、その目的を達成可能な範囲において、適宜構成及び処理手順を変更してもよい。
 図32を参照して、本変形例1におけるデータ管理方法のうち、新規性及び進歩性の観点から個別スコアを導出する動作の一例について説明する。図32は、1つのクレームを分析対象として、該クレームの個別スコアを導出するまで流れを例示したフローチャートである。ここでは、個別スコアが、上位から順に「AAA」「AA」「A」「BBB」「BB」「B」「CCC」「CC」「C」「D」という10段階で設定された場合の処理例を説明する。なお、評価処理手段122bは、図31のステップS45で特定される主関連情報Da及び図31のステップS49で選定される副関連情報Dbの中から各日前情報を抽出して下記の処理を実行する。
 評価処理手段122bは、分析対象のクレームに対し無効審判が請求されているか否かを判定する。クレームに対し無効審判が請求されていることを示す情報は、予め収集処理手段122aが権利関連情報又は発明関連情報として外部から収集し、収集用データベース部24等に記憶させている(ステップS61)。評価処理手段122bは、クレームに無効審判が請求されていれば(ステップS61/Yes)、該クレームの個別スコアを「D」とする(ステップS62)。評価処理手段122bは、クレームに無効審判が請求されていなければ(ステップS61/No)、全てのクレーム要素を充足する日前情報が存在するか否か、つまり少なくとも1つの日前情報が全てのクレーム要素を充足するか否かを判定する(ステップS63)。
 評価処理手段122bは、全てのクレーム要素を充足する日前情報が存在れば(ステップS63/Yes)、全てのクレーム要素を充足する日前情報が幾つあるかに応じて個別スコアを決定する(ステップS64)。図32の例において、格付処理手段227は、全てのクレーム要素を充足する日前情報が存在する場合、該クレームに対し「CCC」以下の個別スコアを付与するようになっている。本変形例1では、新規性なしが「CCC」以下に対応づけられている。より具体的に、評価処理手段122bは、全てのクレーム要素を充足する日前情報が3つ以上存在する場合、該クレームの個別スコアを「C」とする(ステップS65)。評価処理手段122bは、全てのクレーム要素を充足する日前情報が2つ存在する場合、該クレームの個別スコアを「CC」とする(ステップS66)。評価処理手段122bは、全てのクレーム要素を充足する日前情報が1つだけ存在する場合、該クレームの個別スコアを「CCC」とする(ステップS67)。そして、評価処理手段122bは、例えば、全てのクレーム要素を充足する日前情報に紐付く総一致度と、該日前情報の数とに基づいて個別評価値を求める(ステップS68)。
 評価処理手段122bは、全てのクレーム要素を充足する日前情報が存在しない場合(ステップS63/No)、1つのクレーム要素だけを充足しない日前情報、つまり1つのクレーム要素だけを新規的とする日前情報が存在するか否かを判定する(ステップS69)。評価処理手段122bは、1つのクレーム要素だけを充足しない日前情報が存在すれば(ステップS69/Yes)、該日前情報を補完できる日前情報、つまり該日前情報で充足しないクレーム要素を充足する日前情報が存在するか否かを判定する(ステップS70)。ここで、1つのクレーム要素だけを充足しない日前情報のことを「主関連情報」とする。
 評価処理手段122bは、主関連情報で充足しないクレーム要素を充足する日前情報が存在すれば(ステップS70/Yes)、該クレームの個別スコアを「B」とする(ステップS71)。そして、評価処理手段122bは、例えば、1又は複数の主関連情報に紐付く総一致度と、主関連情報を補完できる1又は複数の日前情報に紐付く総一致度とを用いて個別評価値を求める(ステップS68)。評価処理手段122bは、主関連情報で充足しないクレーム要素を充足する日前情報が存在しなければ(ステップS70/No)、該クレームに「A」以上の個別スコアを付与する。本変形例1では、進歩性ありが「A」以上に対応づけられている。図32では、該クレームの個別スコアを「A」とする例を示している(ステップS70)。そして、評価処理手段122bは、例えば、1又は複数の主関連情報に紐付く総一致度を用いて個別評価値を求める(ステップS68)。
 評価処理手段122bは、1つのクレーム要素だけを充足しない日前情報が存在しなければ(ステップS69/No)、充足しないクレーム要素の数が最も少ない日前情報を抽出する。ここで抽出される日前情報のことを「主関連情報」とする。評価処理手段122bは、主関連情報を単独で補完できる日前情報、つまり主関連情報で充足しない複数のクレーム要素の全てを単独で充足する日前情報が存在するか否かを判定する(ステップS73)。評価処理手段122bは、主関連情報を単独で補完できる日前情報が複数存在すれば(ステップS73/Yes、ステップS74/Yes)、該クレームの個別スコアを「BB」とする(ステップS75)。評価処理手段122bは、主関連情報を単独で補完できる日前情報が1つだけ存在すれば(ステップS74/No)、該クレームの個別スコアを「BBB」とする(ステップS76)。そして、評価処理手段122bは、例えば、主関連情報及び主関連情報を単独で補完できる日前情報に紐付く総一致度を用いて個別評価値を求める(ステップS68)。
 評価処理手段122bは、主関連情報を単独で補完できる日前情報が存在しなければ(ステップS73/No)、主関連情報を複数の日前情報で補完できるか否かを判定する。ここで、主関連情報を複数の日前情報で補完できる状態とは、主関連情報で充足しない複数のクレーム要素のうちの少なくとも1つを充足する日前情報が存在し、このような日前情報を組み合わせれば主関連情報で充足しない複数のクレーム要素の全てを充足する状態のことである(ステップS77)。評価処理手段122bは、主関連情報を複数の日前情報で補完できる場合(ステップS77/Yes)、該クレームの個別スコアを「BBB」とする(ステップS78)。そして、評価処理手段122bは、例えば、主関連情報及び主関連情報を補完できる複数日前情報に紐付く総一致度を用いて個別評価値を求める(ステップS68)。
 評価処理手段122bは、主関連情報を複数の日前情報の組み合わせによっても補完できない場合(ステップS77/No)、該クレームに対し「A」以上の個別スコアを付与する。主関連情報を複数の日前情報の組み合わせによっても補完できない場合に、個別スコアを「A」「AA」「AAA」のうちの何れにするかは、例えば下記のような条件により決定される。
(a)主関連情報で非充足の複数のクレーム要素のうちの少なくとも1つは、他の日前情報によって充足されるという条件。
(b)主関連情報で非充足の複数のクレーム要素のうちの何れもが、他の日前情報によって充足されないという条件。
 条件(a)を満たす場合、該クレームには「A」又は「AA」が付与されるようにしてもよい。「A」にするか「AA」にするかは、主関連情報で非充足のクレーム要素の数、複数の日前情報の組み合わせにより補完できるクレーム要素の数などにより決定するとよい。条件(b)を満たす場合、該クレームには「AAA」が付与されるようにしてもよい。
 格付処理手段227は、あるクレームについて、主関連情報に紐付く総一致度、及び該クレームに関連づけられた日前情報の全部又は一部に紐付く総一致度を用い、個別スコアを決定してもよい。例えば、格付処理手段227は、選定条件による副関連情報Dbの絞り込みが行われている場合、クレーム要素の数と抽出処理手段225が抽出した日前情報の総数との積に対する一致フラグの数の割合を個別評価値として求めてもよい。この場合、「A」と「AA」との境界となる第1閾値と、「AA」と「AAA」との境界となる第2閾値とを、記憶部23などに記憶させておくとよい。そして、格付処理手段227は、求めた個別評価値と第1閾値及び第2閾値のうちの少なくとも1つとを比較することにより、個別スコアを決定してもよい(ステップS79)。
 評価処理手段122bは、各対象権利に含まれる1又は複数のクレームについて、上記同様、ステップS61~S79の一連の処理により個別スコアを求める。上記の動作説明は、図32に付したステップ番号の順に説明したが、各工程の順序は、クレームごとの個別スコアを求めるという目的を達成可能な範囲で変更することができる。
 以上のように、本変形例1におけるデータ分析装置20Aは、対象権利におけるクレームの1又は複数のクレーム要素を意味ベクトルである第1ベクトルに変換すると共に、複数の日前情報それぞれの一部又は全部を分割した分割データごとに意味ベクトルである第2ベクトルに変換する一致度処理手段226を有している。一致度処理手段226は、各第1ベクトルと各第2ベクトルとの相互比較により、対象権利におけるクレームのクレーム要素と各日前情報それぞれとの一致度である総一致度を求める。また、データ分析装置20Aは、一致度処理手段226により求められた各総一致度に基づいてクレームの有効性の指標となる個別スコアを求める格付処理手段227を有している。格付処理手段227は、全ての対象権利についての個別スコアを用いて、複数の対象権利間での相対的な権利の有効性を示す総合スコアを求める。ここで、意味ベクトル同士の比較に基づく総一致度には、クレーム要素と日前情報との意味上の関連性が反映されるため、総一致度をもとに個別スコア及び総合スコアを求めることで、精度のよいレーティングを実現することができる。
 格付処理手段227は、一致度処理手段226により求められた各総一致度に基づいて総合評価値を求めると共に、複数の対象権利それぞれの総合評価値の相対比較により、複数の対象権利間での相対的な権利の有効性を示す総合スコアを求めてもよい。このようにしても、精度のよいレーティングを実現することができる。かかる構成において、格付処理手段227は、一致度処理手段226により求められた各総一致度に基づいて個別スコアを求めてもよい。ここで、無効審判や異議の申立ては、クレームごとに請求することができる。つまり、権利が有効であるか無効であるかは、クレームごとに決まる。したがって、対象権利ごとの有効性だけでなく、クレームごとの有効性にも一定のニーズがある。この点、格付処理手段227は、ある対象権利のクレームごとの個別スコアを求める機能を有している。そのため、より実用的な情報提供が可能となる。
 また、一致度処理手段226は、対象権利のクレームに紐付くクレーム要素と日前情報との間の総一致度をもとに、該クレームと意味上の類似性が最も高い日前情報である主関連情報Daを特定する。そして、一致度処理手段226は、特定した主関連情報Daとの意味上の関連性が相対的に高い1又は複数の日前情報を副関連情報Dbとして選定する。すなわち、一致度処理手段226は、主関連情報Da以外の各日前情報の中から、主関連情報Daに紐付く分類ベクトルとの一致度が副閾値以下の分類ベクトルが紐付く日前情報を副関連情報Daとして選定する。格付処理手段227は、クレームと主関連情報Da及び1又は複数の前記副関連情報Dbの各々との一致度である総一致度を用いて該クレームの個別スコアを求める。すなわち、副関連情報Dbは、主関連情報Daとの組み合わせが比較的容易な日前情報であることから、総一致度に基づく個別スコア等の精度が高まるため、対象権利の有効性に関する信頼性の高い情報を提供することができる。
 データ分析装置20Aは、特許分類の情報に含まれる分類コードの説明データそれぞれを自然言語処理によりベクトル化することで、説明データそれぞれに対応する分類ベクトルを生成する収集処理手段122aを有している。収集処理手段122aは、各分類コードごとに、階層データと生成した分類ベクトルとを紐付けて分類用データベース4aを生成する。したがって、抽出処理手段225は、日前情報の絞り込みに分類用データベース4aを活用することができる。また、一致度処理手段226は、主関連情報Daの特定や副関連情報Dbの選定に、分類用データベース4aを活用することができる。
 収集処理手段122aは、日前情報のうちの未分類情報の一部又は全部を自然言語処理によりベクトル化することで、未分類情報に対応する未知ベクトルを生成してもよい。収集処理手段122aは、生成した未知ベクトルと分類用データベース4a内の各分類ベクトルとを比較し、該未知ベクトルと意味上の類似性が最も高い分類ベクトルを特定してもよい。そして、収集処理手段122aは、生成した未知ベクトルに対応する未分類情報に、特定した分類ベクトル及び該分類ベクトルに対応する分類コードのうちの少なくとも1つを紐付けて記憶させてもよい。このようにすれば、未分類情報つまり非特許文献の情報を、分類済情報と同列に扱うことができるため、抽出処理手段225による日前情報の絞り込み処理、及び一致度処理手段226による副関連情報Dbの選定処理の射程範囲を広げることができる。すなわち、クレーム要素との対比に用いる日前情報の範囲を精度よく拡張することができるため、対象権利ごとの高精度な有効性レーティングを実現することができる。例えば、一致度処理手段226は、主関連情報Daに付与されている分類コードを分類用データベース4aに照らして該分類コードに対応する分類ベクトルを求める。これにより、一致度処理手段226は、主関連情報Da以外の各日前情報の中から、主関連情報Daの分類ベクトルとの一致度が副閾値以下の分類ベクトルが紐付く日前情報を副関連情報Daとして選定することができる。
 一致度処理手段226は、Transformer系のエンコーダに基づく自然言語処理により、クレーム要素から第1ベクトルを生成すると共に、分割データから第2ベクトルを生成する。一致度処理手段226による自然言語処理としては、形態素解析を用いた手法を用いてもよいが、Transformer系のエンコーダに基づく自然言語処理を意味ベクトルへの変換に用いることで、2つのベクトル間の意味上の類似性をより精度よく求めることができる。上記同様、自然言語処理の精度の観点から、収集処理手段122aは、Transformer系のエンコーダに基づく自然言語処理により、分類ベクトル及び未知ベクトルを生成するとよい。
 本変形例1のデータ管理システム10は、一致度処理手段226及び格付処理手段227を含むデータ分析装置20Aと、格付処理手段227により求められた複数の対象権利それぞれの個別スコア及び総合スコアを管理するデータベース5aから、外部の要求に対応する個別スコア及び総合スコアのうちの少なくとも1つを抽出して提供するデータ提供装置30と、を有している。つまり、データ提供装置30は、データの要求を受けた際に、権利の有効性を評価するための処理を行う必要がないため、処理部やメモリの無駄な使用を抑制し、対象権利の有効性に関する情報を迅速に提供することができる。また、データベース5aには、格付処理手段227により求められた格付けスコアなどの情報が格納されている。そのため、ユーザは、例えば図11~図13のような画面上において、各権利に紐付けられた格付けスコアを視認することにより、自己のニーズに合致した権利を迅速かつ的確に選定することができる。
<変形例2>
 図25を参照して、本変形例2におけるデータ提供システム100の構成及び動作について説明する。本変形例2のデータ提供システム100は、前述の変形例1と同様の前提となっており、データ分析装置20Bの分析処理部22Bが、一般公開されている検索報告書に基づいて日前情報を別途抽出する機能を有する点に特徴がある。データ提供システム100の全体的な構成及び動作は、図1~図19を参照して説明した上記の例、及び変形例1と同様であるため、これらと同等の構成については同一の符号を付して説明は省略する。
 本変形例2の分析処理部22Bにおける評価処理手段222bは、変形例1の評価処理手段122bが有する各機能構成と共に、検索学習手段328と、文献推定手段329と、格付処理手段327と、を有している。検索学習手段328は、各権利関連情報それぞれに含まれる検索報告書に基づく機械学習により文献推定モデルM11を生成する。文献推定モデルM11は、対象権利の請求の範囲に基づくデータを入力とし、該対象権利との間の意味上の関連性が相対的に高い日前情報を出力するための学習済モデルである。文献推定モデルM11は、検索報告書をもとに生成されるため、文献推定モデルM11により出力される日前情報は、検索報告書に記載された特許文献や非特許文献となる。
 例えば、検索学習手段328は、複数の検索報告書における、いわゆるX文献又はY文献の識別番号(出願番号又は公開番号など)と、X文献又はY文献が対応づけられた1又は複数のクレームとを教師データとして用いることにより、文献推定モデルM11の生成・更新処理を実行する。なお、X文献は、対応づけられたクレームと特に関連のある文献であって、当該文献のみで発明の新規性又は進歩性がないと判断されたもの、とされている。Y文献は、対応づけられたクレームと特に関連のある文献であって、当該文献と他の1以上の文献との、当業者にとって自明である組合せによって進歩性がないと考えられるもの、とされている。つまり、検索学習手段328は、学習データ(訓練データ)としてのクレーム又はクレーム要素と、正解ラベルとしてのX文献又はY文献の識別番号とを用いた機械学習により文献推定モデルM11を構築する。より具体的に、検索学習手段328は、クレーム又はクレーム要素に自然言語処理を施した情報を学習データとして用いる。自然言語処理としては、意味ベクトルに変換する手法や形態素解析を用いた手法などを用いることができる。
 文献推定手段329は、対象権利における請求の範囲に基づく情報を、検索報告書に含まれる、請求の範囲の情報と、拒絶の引例とされた文献の情報とに基づいて生成された文献推定モデルM11に入力し、対象権利の拒絶の引例とされる文献を推定するものである。文献推定手段329は、予め設定された複数の対象権利について、対象権利のクレーム又はクレーム要素に自然言語処理を施して入力データを生成する。そして、文献推定手段329は、生成した入力データを文献推定モデルM11に入力することにより、1又は複数の日前情報の識別番号、もしくは該当する文献がないことを示す情報を出力する。文献推定手段329は、対象権利における全てのクレーム又は全てのクレーム要素について、文献推定モデルM11による関連文献の出力処理を行うとよい。文献推定手段329は、全ての対象権利に対し、文献推定モデルM11による関連文献の出力処理を行うようにしてもよく、予め設定された条件を満たす対象権利に対し、文献推定モデルM11による関連文献の出力処理を行うようにしてもよい。
 格付処理手段327は、文献推定手段329により推定された文献の情報を個別スコア及び総合スコアのうちの少なくとも1つに反映させるものである。格付処理手段327は、全ての対象権利の総合評価値と、文献推定手段329による出力結果とに基づいて、各対象権利それぞれの総合スコアを求めてもよい。例えば、主関連情報Da又は副関連情報Dbして抽出された日前情報の中に、文献推定手段329が求めた日前情報が存在していれば、格付処理手段327は、該日前情報の総一致度が低下するよう重み付けなどで調整した上で、改めて対象権利の総合評価値を求めるようにしてもよい。また、主関連情報Da又は副関連情報Dbして抽出された日前情報の中に、文献推定手段329が求めた日前情報が存在していなければ、格付処理手段327は、該日前情報を副関連情報Dbとして追加してもよい。この場合、格付処理手段327は、文献推定手段329が求めた日前情報に係る総一致度を用いて対象権利の新たな総合評価値を求めることになる。格付処理手段327は、各クレームの個別評価値と、文献推定手段329による出力結果とに基づいて、各クレームそれぞれの個別スコアを求めてもよい。この場合、格付処理手段327は、総合評価値と同様の手法により個別評価値を求めるとよい。
 分析処理部22Bは、CPU又はGPUなどの演算装置と、こうした演算装置と協働して上記及び下記の各種機能を実現させるデータ分析プログラムP11と、により構成することができる。すなわち、データ分析プログラムP11は、コンピュータとしての分析処理部22B及び記憶部23を、収集処理手段122a、評価処理手段222b、及び構築処理手段22cとして機能させるためのプログラムである。他の構成、代替構成、動作などは、前述の変形例1と同様である。
 以上のように、本変形例2におけるデータ分析装置20Bは、対象権利における請求の範囲に基づく入力データを、検索報告書に含まれる、請求の範囲の情報拒絶の引例とされた文献の情報とに基づいて生成された文献推定モデルM11に入力し、対象権利の拒絶の引例とされる文献を推定する文献推定手段329を有している。そして、格付処理手段327は、文献推定手段329により推定された文献の情報を個別スコア及び総合スコアのうちの少なくとも1つに反映させるよう構成されている。よって、データ分析装置20Bによれば、抽出処理手段225又は一致度処理手段226による日前情報の選別処理で漏れた、対象権利との関連性の深い日前情報を抽出し、格付けスコアに反映させることができる。もしくは、文献推定手段329により抽出された日前情報に重み付けなどを施して総一致度の調整を行い、その調整により各評価値の補正を行うことができる。したがって、格付けスコアとしての個別スコア及び総合スコアの精度を高めることができる。分析処理部22Bは、検索学習手段328を設けずに構成し、文献推定手段329は、外部で生成された文献推定モデルM11を用いるようにしてもよい。他の効果などは、前述の変形例1と同様である。
<変形例3>
 図26を参照して、本変形例3におけるデータ提供システム100の構成及び動作について説明する。本変形例3のデータ提供システム100は、上述の変形例1と同様の前提となっており、データ分析装置20Cの分析処理部22Cが、一般公開されている拒絶理由に関する書類(拒絶理由通知書・拒絶査定など)に基づいて、各対象権利が記載不備の無効理由を含む可能性を推定する機能を有している。データ提供システム100の全体的な構成及び動作は、図1~図19を参照して説明した上記の例、及び変形例1と同様であるため、これらと同等の構成については同一の符号を付して説明は省略する。
 本変形例3の分析処理部22Cにおける評価処理手段322bは、変形例1の評価処理手段122bが有する各機能構成と共に、不備学習手段428と、不備推定手段429と、格付処理手段427と、を有している。不備学習手段428は、記載不備に係る拒絶理由通知書と、該拒絶理由通知書が通知された出願に係る特許請求の範囲と、に基づく機械学習により、記載不備推定モデルM21を生成する。本変形例3において、記載不備とは、サポート要件違反、明確性要件違反、実施可能要件違反などを意味する。
 サポート要件違反を含む拒絶理由通知書には、例えば、日本であれば「第36条第6項第1号」、欧州であれば「Art.84」、米国であれば「112(a)」といった文字と数字の組み合わせが含まれる。明確性要件違反を含む拒絶理由通知書には、例えば、日本であれば「第36条第6項第2号」、欧州であれば「Art.84」、米国であれば「112(b)」といった文字と数字の組み合わせが含まれる。実施可能要件違反を含む拒絶理由通知書には、例えば、日本であれば「第36条第4項第1号」、欧州であれば「Art.83」、米国であれば「112(a)」といった文字と数字の組み合わせが含まれる。このような、記載不備に対応する条文番号を示す情報のことを「不備条文データ」という。
 不備学習手段428は、不備条文データを含む複数の拒絶理由通知書を抽出し、抽出した各拒絶理由通知書のそれぞれから出願に係る識別番号を抽出する。また、不備学習手段428は、抽出した識別番号をもとに、出願に係る請求の範囲を取得する。そして、不備学習手段428は、学習データとしてのクレーム又はクレーム要素と、正解ラベルとしての記載不備である旨の情報とを用いた機械学習により記載不備推定モデルM21の生成・更新処理を実行する。より具体的に、不備学習手段428は、クレーム又はクレーム要素に自然言語処理を施した情報を学習データとして用いる。自然言語処理としては、意味ベクトルに変換する手法や形態素解析を用いた手法などを用いることができるが、処理精度の観点からは、Transformer系のエンコーダに基づく自然言語処理が好ましい。記載不備推定モデルM21は、対象権利の請求の範囲に基づくデータを入力とし、該対象権利が記載不備に係る無効理由を有する割合である不備割合を出力するための学習済モデルである。記載不備推定モデルM21は、クレームごとの不備割合を出力する機能を有する。
 不備推定手段429は、対象権利における請求の範囲に基づく情報を、拒絶理由に関する書類に含まれる、出願の識別番号と記載不備に対応する条文番号を示す不備条文データとに基づいて生成された記載不備推定モデルM21に入力し、対象権利が記載不備に係る無効理由を有する割合である不備割合を求めるものである。不備推定手段429は、予め設定された複数の対象権利について、対象権利のクレーム又はクレーム要素に自然言語処理を施して入力データを生成する。不備推定手段429は、処理精度の観点から、Transformer系のエンコーダに基づく自然言語処理を行うようにするとよい。そして、不備推定手段429は、生成した入力データを記載不備推定モデルM21に入力することにより、該対象権利及びそのクレームの不備割合を求めて記憶させる。不備推定手段429は、対象権利における全てのクレーム又は全てのクレーム要素について、記載不備推定モデルM21による不備割合の推定処理を行うとよい。不備推定手段429は、全ての対象権利について、記載不備推定モデルM21による不備割合の推定処理を行うとよい。
 格付処理手段427は、不備推定手段429により求められた不備割合を個別スコア及び総合スコアのうちの少なくとも1つに反映させるものである。例えば、格付処理手段427は、各対象権利の総合評価値に対し、不備割合に基づく総調整値を加算するようにしてもよい。この場合、不備割合と総調整値とを関連づけた総調整テーブルを記憶部23などに格納しておくとよい。総調整テーブルは、不備割合が高くなるにつれて、総調整値が小さくなるように形成するとよい。総調整値は、正の値でも、負の値でも、これらの組み合わせでもよい。総調整テーブルの代わりに、不備割合と総調整値とを関連づけたグラフや関数を用いてもよい。かかる構成により、格付処理手段427は、不備推定手段429が求めた不備割合を総調整テーブル等に照らして総調整値を求めることができる。不備割合が予め設定された不備閾値以上の対象権利に対してのみ、総合評価値への総調整値の加算を行うようにしてもよい。
 格付処理手段327は、各クレームの個別評価値に対し、不備割合に基づく個別調整値を加算するようにしてもよい。例えば、格付処理手段427は、各クレームの個別評価値に対し、不備割合に基づく個別調整値を加算するようにしてもよい。この場合、不備割合と個別調整値とを関連づけた個別調整テーブルを記憶部23などに格納しておくとよい。個別調整テーブルは、不備割合が高くなるにつれて、個別調整値が小さくなるように形成するとよい。個別調整値は、正の値でも、負の値でも、これらの組み合わせでもよい。個別調整テーブルの代わりに、不備割合と個別調整値とを関連づけたグラフや関数を用いてもよい。かかる構成により、格付処理手段427は、不備推定手段429が求めた不備割合を個別調整テーブル等に照らして個別調整値を求めることができる。不備割合が予め設定された不備閾値以上のクレームに対してのみ、個別評価値への個別調整値の加算を行うようにしてもよい。
 分析処理部22Cは、CPU又はGPUなどの演算装置と、こうした演算装置と協働して上記及び下記の各種機能を実現させるデータ分析プログラムP21と、により構成することができる。すなわち、データ分析プログラムP21は、コンピュータとしての分析処理部22C及び記憶部23を、収集処理手段122a、評価処理手段322b、及び構築処理手段22cとして機能させるためのプログラムである。他の構成、代替構成、動作などは、前述の変形例1と同様である。
 以上のように、本変形例3におけるデータ分析装置20Cは、対象権利における請求の範囲に基づく情報を、拒絶理由に関する書類に含まれる出願の識別番号と、記載不備に対応する条文番号を示す不備条文データとに基づいて生成された記載不備推定モデルM21に入力し、対象権利に関する不備割合を求める不備推定手段429を有している。そして、格付処理手段327は、不備推定手段429により求められた不備割合を個別スコア及び総合スコアのうちの少なくとも1つに反映させるよう構成されている。よって、データ分析装置20Cによれば、新規性違反及び進歩性違反のみならず、明確性違反などの記載不備に関する無効理由を加味した対象権利の有効性レーティングを行うことができるため、格付けスコアとしての個別スコア及び総合スコアの精度及び信頼性の向上を図ることができる。
 格付処理手段327は、不備推定手段429が求めた不備割合に基づき、対象権利及びクレームのうちの少なくとも一方に対応する不備スコアを格付けスコアの1つとして求め、出力用データベース部25に記憶させてもよい。不備スコアは、記載不備の観点での有効性を示す情報として外部に提供することができるため、新規性及び進歩性と、記載不備とを切り分けて判断したいといったニーズに対応することができる。分析処理部22Cは、不備学習手段428を設けずに構成し、不備推定手段429は、外部で生成された記載不備推定モデルM21を用いるようにしてもよい。他の効果などは、前述の変形例1と同様である。
 なお、データ分析装置20Cは、変形例2の特徴的構成を含むものであってよい。つまり、評価処理手段322bは、文献推定手段329を有するように構成してもよい。この場合、文献推定モデルM11が記憶部23などに格納される。格付処理手段327は、文献推定手段329により推定された文献の情報と、不備推定手段429により求められた不備割合とを、各対象権利の格付けスコアに反映させるとよい。評価処理手段322bは、検索学習手段328を有するように構成してもよい。
<変形例4>
 図35を参照して、実施の形態1の変形例4におけるデータ提供システム100の構成及び動作について説明する。本変形例4の提供処理部32における情報処理手段32aは、権利者ごとのコストカット想定額を求める想定額演算機能を有している。コストカット想定額とは、格付けスコアに基づく算出額であり、現存する権利の一部又は全部を放棄した場合に削減できる年金コストの推定額である。
 図35は、格付けスコアと重み係数とを対応づけたコストカットテーブルの例である。コストカットテーブルは、格付けスコアが上位から下位になるにつれて、重み係数が徐々に大きくなるよう構成されている。コストカットテーブルは、記憶部33等に記憶されるテーブル情報であり、格付けスコア及び重み係数は適宜変更することができる。記憶部33には、例えば法域ごとに異なるコストカットテーブルが記憶される。図35では、格付けスコアが、上位から順に「AAA」「AA」「A」「BBB」「BB」「B」「CCC」「CC」「C」という9段階で設定された例を示している。図35の重み係数は、あくまで例示である。すなわち、重み係数は、任意に設定し、調整することができる。
 情報処理手段32aは、1つの権利の残存期間に応じた年金額の総和に、該権利に付与された格付けスコアに対応する重み係数を乗じた額を、権利者の全ての権利について合算することにより、コストカット想定額を求める。情報処理手段32aは、権利に付与された格付けスコアをコストカットテーブルに照らすことにより、該格付けスコアに対応する重み係数を求める。情報処理手段32aは、求めたコストカット想定額と共に、そのコストカット想定額を削減するための情報を、提供用データベース部35内のデータベースに格納する。コストカット想定額を削減するための情報とは、放棄すべき権利の情報などである。
 ここで、コストカット想定額と、そのコストカット想定額を削減するための情報とを合わせたものを、コストカット情報という。ユーザが情報端末40を介してある権利者のコストカット情報を要求した場合、情報処理手段32aは、提供用データベース部35内のデータベースから、要求に係るコストカット情報を読み出してユーザに提供する。もっとも、情報処理手段32aは、コストカット情報を記憶部23に記憶させてもよい。
 また、情報処理手段32aは、所定の下位の1又は複数の格付けスコアをもとにコストカット想定額を求めてもよい。すなわち、情報処理手段32aは、ある権利者の権利のうち、例えば「C」又は「CC」もしくは「C」が付与された権利の残存期間に応じた年金額の総和を権利数分合算することでコストカット想定額を求めてもよい。情報処理手段32aは、権利の出願からの経過時間の情報を用いて、コストカット想定額の演算処理を行ってもよい。すなわち、情報処理手段32aは、例えば、出願から10年以上が経過した権利など、出願から所定期間が経過した権利につき、上記の各手法によりコストカット想定額を求めてもよい。
 情報処理手段32aは、ユーザによる指示に応じて、上記の各手法によりコストカット想定額を求めるようにしてもよい。すなわち、情報処理手段32aは、ユーザが情報端末40を介して、権利者と、格付けスコアのうちの少なくとも1つとを指定した場合に、上記の各手法によりコストカット想定額を求めてもよい。また、情報処理手段32aは、ユーザが情報端末40を介して、権利者と、格付けスコアのうちの少なくとも1つと、出願からの経過時間とを指定した場合に、上記の各手法によりコストカット想定額を求めてもよい。
 以上のように、本変形例4の情報処理手段32aは、上記各手法のうちの少なくとも1つによってコストカット想定額を求め、情報端末40を介してコストカット情報をユーザに提供するようになっている。よって、ユーザは、何ら専門的な計算を行うことなく、コスト削減の方法及び削減額を迅速に知ることができるため、経済的で有用な知財管理を行うことができる。ところで、想定額演算機能は、例えば、分析処理部22の構築処理手段22cに持たせてもよい。この場合、構築処理手段22cは、求めたコストカット情報を、出力用データベース部25内のデータベースに格納するとよい。これにより、情報処理手段32aは、提供用データベース部35内のデータベースにコストカット情報を格納することができ、ユーザに対し、適宜コストカット情報を提供することができる。なお、変形例4の構成は、上述した変形例1~3の構成に適用してもよい。
 実施の形態2.
 図36~図40を参照して、本実施の形態2におけるデータ提供システム及びその周辺環境に係る構成例などにつき、特に前述した実施の形態1と異なる点について説明する。本実施の形態2のデータ提供システムは、商品の販売数に制限が設けられている点に特徴がある。前述した実施の形態1のデータ提供システムと同様の構成については同一の符号を用いて説明は省略する。
 図36に示すように、データ提供装置130は、通信部31と、提供処理部132と、記憶部33と、提供用データベース部35と、を有している。記憶部33は、データ提供プログラムP20などの提供処理部132の動作プログラムの他、有効性データなどの提供に関連する種々のデータを記憶する。なお、データ提供プログラムP20は、データ提供装置130に搭載されたコンピュータを、後述する情報処理手段132a、判定処理手段132b、及び選定処理手段132cとして機能させるためのものである。
 提供処理部132は、情報処理手段132aと、判定処理手段132bと、選定処理手段132cと、を有している。判定処理手段132bは、提供済みの有効性データに係る権利について、その提供数が予め設定された制限数未満であるか否かを判定するものである。なお、制限数は、1以上の自然数に設定され、記憶部33等に記憶されている。有効性データは売買の対象商品にもなるため、以降では、提供数のことを「販売数」ともいう。選定処理手段132cは、有効性データの転売依頼に応じて登録ユーザの中から1又は複数の転売先を選定するものである。
 情報処理手段132aは、複数の産業財産権に関連する情報をもとに構築され、複数の産業財産権それぞれの有効性に係る有効性データを含むデータベースから、外部の要求に対応する有効性データを抽出して提供するものである。情報処理手段132aは、判定処理手段132bにおいて販売数が制限数以上であると判定された場合、該判定に係る産業財産権に対応する有効性データの提供が不可である旨の提供不可情報を情報端末40へ送信するものである。情報処理手段132aは、記憶部33において販売数の増減処理を実行することにより、販売数を管理する機能を有している。
 また、情報処理手段132aは、有効性データの転売の申し込みがあった場合に、該有効性データの販売先に係る情報端末40へ転売打診情報を送信する機能を有している。さらに、情報処理手段132aは、有効性データの販売先に係る情報端末40から該有効性データの転売依頼があった場合、選定処理手段132cにおいて選定された1又は複数の転売先に対応する情報端末40へ購入を打診する旨の販促情報を送信する機能を有している。情報処理手段132aの他の構成については、前述した実施の形態1の情報処理手段32aと同様である。
 次に、図37のフローチャートを参照して、本実施の形態2のデータ提供方法のうち、ユーザが商品の購入処理を行う際の動作例について説明する。ここでは、データ提供装置30の動作を中心に説明し、ユーザが初期画面G1等を経てデータ提供装置30のシステムにログインしていることを前提とする。
 判定処理手段132bは、情報端末40から商品の購入要求を受け付けると(ステップS301)、該商品の販売数が制限数未満であるか否かを判定する(ステップS302)。提供処理部32は、販売数が制限数以上であれば(ステップS302/No)、情報端末40に購入不可通知を送信する。これにより、情報端末40は、指定した商品の購入ができない旨の情報を、端末表示部47又は報知部を介してユーザに知らせる(ステップS303)。一方、提供処理部32は、該商品の販売数が制限数未満であれば(ステップS302/Yes)、情報端末40に購入可能通知を送信する(ステップS304)。
 提供処理部32は、許容時間が経過するまでの間、情報端末40からの購入依頼を待ち(ステップS305/No、ステップS306/No)、情報端末40から購入依頼が送信されると(ステップS305/Yes)、決済サーバ600に決済依頼を送信する(ステップS307)。一方、提供処理部32は、許容時間が経過するまでの間に情報端末40から購入依頼が送信されなかった場合(ステップS305/No、ステップS306/Yes)、情報端末40にエラー信号を送信する。これにより、情報端末40は、端末表示部47又は報知部を介してユーザにタイムアウトを知らせる(ステップS308)。
 提供処理部32は、待機時間が経過するまでの間、決済サーバ600からの決済通知を待ち(ステップS309/No、ステップS310/No)、決済サーバ600から決済通知が送信されると(ステップS309/Yes)、購入に係る商品を情報端末40に提供する(ステップS311)。そして、提供処理部32は、該商品の販売数をインクリメントする(ステップS312)。
 一方、提供処理部32は、待機時間が経過するまでの間に決済サーバ600から決済通知が送信されなかった場合(ステップS309/No、ステップS310/Yes)、情報端末40にエラー信号を送信する。これにより、情報端末40は、端末表示部47又は報知部を介してユーザにタイムアウトを知らせる(ステップS313)。
 次いで、図38のシーケンスチャートを参照して、本実施の形態2のデータ提供方法のうち、ユーザが商品の転売の申し込みを行う場合の動作例について説明する。図38において、情報端末40Aは、転売対象の商品を購入したユーザの使用する情報端末40であり、情報端末40Bは、転売対象の商品を購入していないユーザの使用する情報端末40であるものとする。ここでは、各情報端末40のユーザが、初期画面G1等を経てデータ提供装置30のシステムにログインしていることを前提とする。
 情報端末40Bの端末処理部42は、ユーザによる転売の申し込みを受け付けると(ステップS401)、転売申込情報をデータ提供装置30へ送信する(ステップS402)。選定処理手段132cは、転売申込情報をもとに、1又は複数の打診先を選定する(ステップS403)。そして、選定処理手段132cは、選定した打診先である情報端末40Aへ転売打診情報を送信する(ステップS404)。
 情報端末40Aの端末処理部42は、転売打診のアラートを端末表示部47に表示させ、又は報知部に報知させる(ステップS405)。端末処理部42は、ユーザの操作に応じて、転売の打診についての詳細な情報を端末表示部47に表示させる(ステップS406)。端末処理部42は、ユーザによる転売打診を受諾する指示を受け付けると(ステップS407)、受諾情報をデータ提供装置30へ送信する(ステップS408)。
 情報処理手段132aは、受諾情報を受信すると、転売確認情報を情報端末40Bへ送信する(ステップS409)。情報端末40Bの端末処理部42は、ユーザによる購入の指示を受け付けると(ステップS410)、データ提供装置30に購入依頼を送信する(ステップS411)。情報処理手段132aは、図18のステップS119~S124と同様に決済処理を実行する(ステップS412)。そして、データ提供装置30は、ユーザの購入に係る商品を情報端末40へ提供する(ステップS413)。
 続いて、図39のシーケンスチャートを参照して、本実施の形態2のデータ提供方法のうち、ユーザが商品の転売の依頼を行う場合の動作例について説明する。図39の情報端末40A及び情報端末40Bの想定は、図38の場合と同様である。そして、各情報端末40のユーザが、初期画面G1等を経てデータ提供装置30のシステムにログインしていることを前提とする。
 情報端末40Aの端末処理部42は、ユーザによる転売依頼の指示を受け付けると(ステップS501)、データ提供装置30に転売依頼情報を送信する(ステップS502)。選定処理手段132cは、転売依頼情報に応じて、登録ユーザの中から1又は複数の転売先を選定する(ステップS503)。情報処理手段132aは、選定処理手段132cにおいて選定された1又は複数の転売先に対応する情報端末40Bへ販促情報を送信する(ステップS504)。
 情報端末40Bの端末処理部42は、販促のためのアラートを端末表示部47に表示させ、又は報知部に報知させる(ステップS505)。端末処理部42は、ユーザの操作に応じて、転売依頼についての詳細な情報を端末表示部47に表示させる(ステップS506)。端末処理部42は、ユーザによる購入の指示を受け付けると(ステップS507)、購入希望信号をデータ提供装置30へ送信し(ステップS508)、情報処理手段132aは、転売可能通知を情報端末40Aへ送信する(ステップS509)。
 情報端末40Aの端末処理部42は、ユーザによる転売の指示を受け付けると(ステップS510)、転売実施依頼をデータ提供装置30へ送信し(ステップS511)、選定処理手段132cは、転売確認情報を情報端末40Bへ送信する(ステップS512)。情報端末40Bの端末処理部42は、ユーザによる購入の指示を受け付けると(ステップS513)、データ提供装置30に購入依頼を送信する(ステップS514)。情報処理手段132aは、図18のステップS119~S124と同様に決済処理を実行する(ステップS515)。そして、データ提供装置30は、ユーザの購入に係る商品を情報端末40へ提供する(ステップS516)。他の動作については、実施の形態1の場合と同様である。
 ところで、図37では、判定処理手段132bが、情報端末40からの商品の購入要求を受け付けたときに販売数が制限数未満であるか否かを判定する例を示したが、これに限定されない。商品の販売数は、該商品が購入されたタイミングで情報処理手段132aによりインクリメントされる。その際、判定処理手段132bは、該商品の販売数が制限数未満であるか否かを判定するとよい。そして、情報処理手段132aは、判定処理手段132bにおいて販売数が制限数以上であると判定された場合、該判定に係る権利に対応する商品の提供が不可である旨の提供不可情報を情報端末40に提供するとよい。あるいは、情報処理手段132aは、商品の購入に係る画面(ユーザ画面G2、基本画面G3、詳細画面G4、一覧画面G5など)の情報に、特定の商品の販売が不可である旨の情報を含めてもよい。
 このようにすれば、情報端末40の端末処理部42は、例えば図40のように、一部の商品の提供が不可である旨の情報を端末表示部47において示すことができる。なお、図40では、商品の購入が不可である旨の情報として、棒グラフの態様を変える手法を例示したが(図40の7月~9月参照)、これに限定されず、商品の購入が不可である旨は、文字又はアイコン等によって示してもよい。そして、端末処理部42は、端末表示部47の表示画面上に、商品の購入が不可である旨の情報と共に、例えば商品の転売を申し込むためのオファーボタンWを表示させてもよい。
 以上のように、本実施の形態2のデータ提供装置130は、外部の要求に対応する有効性データを予め構築されたデータベースから抽出するようになっている。よって、データ提供装置130は、データの要求を受けた際に、権利の有効性を評価するための処理を行う必要がないため、処理部やメモリの無駄な使用を抑制し、産業財産権の有効性に関する情報を迅速に提供することができる。
 また、提供処理部132は、有効性データを提供した権利について、その提供数(販売数)が制限数未満であるか否かを判定する判定処理手段132bを有している。そして、情報処理手段132aは、判定処理手段132bにおいて提供数が制限数以上であると判定された場合に情報端末40へ提供不可情報を送信する。よって、情報端末40は、端末表示部47(図40参照)又は報知部などにより、特定の商品の購入ができないことを未然にユーザへ伝えることができる。
 判定処理手段132bは、情報端末40において権利が指定された場合、該権利に対応する有効性データの提供数が制限数未満であるか否かを判定するようにしてもよい。そして、情報処理手段132aは、判定処理手段132bにおいて提供数が制限数以上であると判定された場合、該判定に係る権利に対応する有効性データの提供が不可である旨の提供不可情報を情報端末40へ送信するとよい。このようにしても、情報端末40は、端末表示部47又は報知部などにより、指定に係る商品の購入ができないことをユーザに伝えることができる。
 ところで、有効性データなどの産業財産権に関する商品は、時間の経過に伴い、既に使用目的を果たした等の理由で、購入したユーザにとって必要性が低くなっている場合もある。この点、情報処理手段132aは、有効性データの転売の申し込みがあった場合に、該有効性データの販売先に係る情報端末40へ転売打診情報を送信する機能を有している。したがって、商品を持て余しているユーザなどに対し、転売を働きかけることにより、情報資源の有効活用を図ることができる。ここで、選定処理手段132cは、商品の販売先が複数存在する場合、全ての販売先を転売打診情報の送信先として選んでもよく、商品の所有期間や行動履歴などをもとに転売打診情報の送信先を選定してもよい。
 また、選定処理手段132cは、有効性データの転売依頼に応じて登録ユーザの中から1又は複数の転売先を選定する機能を有している。そして、情報処理手段132aは、有効性データの販売先に係る情報端末40から該有効性データの転売依頼があった場合、選定処理手段132cにおいて選定された1又は複数の転売先に対応する情報端末40へ購入を打診する旨の販促情報を送信する。よって、転売元のユーザと転売先のユーザの双方のニーズに応えることができ、情報資源の有効活用を図ることができる。本実施の形態2では、有効性データの転売処理を中心に説明したが、これに限らず、データ提供装置130は、産業財産権に関する他の商品の転売処理も、上記同様に行うとこができる。他の効果及び代替構成等については、実施の形態1と同様である。また、上述した変形例1~4の各構成は、本実施の形態2のデータ提供システム100にも適用することができる。
 上述した各実施の形態は、データ提供装置、データ管理システム、データ提供システム、データ提供プログラム、データ分析プログラム、データ提供プログラム又はデータ分析プログラムを記録したコンピュータ読み取り可能な記録媒体、データ提供方法、及びデータ管理方法における具体例であり、本発明の技術的範囲は、これらの態様に限定されるものではない。例えば、図2では、データ提供システム100が、データ分析装置20と、データ提供装置30と、1又は複数の情報端末40とにより構成された例を示したが、これに限定されない。データ提供システム100は、データ提供装置30と、1又は複数の情報端末40とにより構成し、データ分析装置20を含めなくてもよい。また、図2では、データ管理システム10が2つのサーバにより構成された例を示したが、これに限定されない。データ管理システム10は、データ分析装置20の構成及び機能とデータ提供装置30の構成及び機能とを併せ持つ1つのサーバにより構成してもよい。この場合、データ管理システム10は、出力用データベース部25及び提供用データベース部35のうちの何れかを設けずに構成してもよい。
 さらに、分析処理部22は、翻訳処理手段121を設けずに構成してもよい。ただし、翻訳処理手段121により、コアデータの言語の統一を図った上で、学習フェーズ及び推定フェーズを実行した方が、高精度で多様性のあるデータ管理システム10を構築するすることができる。また、分析処理部22は、前処理手段122を設けずに構成してもよい。ただし、前処理手段122を設けた方が、機械学習の精度を高めることができ、信頼性の高い商品を提供することができる。上記各実施の形態では、格付けスコアが7段階又は9段階に設定された例を示したが、これに限らず、格付けスコアは、任意の数の段階設定を採ることができる。
 上記では、端末表示部47の表示画面につき、図4~図17、図40を例示して説明したが、各表示画面の態様は、上記各図の態様に限定されず、表示画面の各パーツは適宜取捨選択することができる。加えて、各表示画面は、手入力する入力欄の代わりに、ドロップダウン式のUIを採用してもよく、ドロップダウン式のUIの代わりに、ドラムロール式のUI等を採用してもよい。また、データ提供システム100は、課金したユーザと課金していないユーザとの間に、提供する情報量の差を設けるように構成してもよい。なお、何れの情報を課金対象とするかは、任意に設定し、変更することができる。
 変形例1では、分析処理部22Aが32次元の意味ベクトルを生成する例を示したが、意味ベクトルの次元はこれに限定されない。変形例1では、1からコサイン類似度を減算することにより一致度を求める手法を説明したが、これに限らず、一致度としてコサイン類似度を直接的に用いてもよい。ただし、演算精度の観点からは、1からコサイン類似度を減算した一致度を用いる方が好ましい。
 4a 分類用データベース、5a データベース、10 データ管理システム、20、20A~20C データ分析装置、21 通信部、22、22A~22C 分析処理部、22a、122a 収集処理手段、22b、122b、222b、322b 評価処理手段、22c 構築処理手段、23 記憶部、24 収集用データベース部、25 出力用データベース部、30、130 データ提供装置、31 通信部、32、132 提供処理部、32a、132a 情報処理手段、33 記憶部、35 提供用データベース部、40、40A、40B 情報端末、41 端末通信部、42 端末処理部、43 端末記憶部、46 端末入力部、47 端末表示部、47a 検索部、100 データ提供システム、121、221 翻訳処理手段、122 前処理手段、123 学習処理手段、124 推定処理手段、132b 判定処理手段、132c 選定処理手段、225 抽出処理手段、226 一致度処理手段、227、327、427 格付処理手段、328 検索学習手段、329 文献推定手段、428 不備学習手段、429 不備推定手段、500 情報提供サーバ群、600 決済サーバ、A 検索部、A1 入力欄、A2 検索ボタン、B ランキング指示部、B1 格付けボタン、B2 ESGボタン、C ダッシュボード部、D1 第1格付け部、D2 第2格付け部、E1 指定ボタン、E2 確認ボタン、E3 購入ボタン、G1 初期画面、G2 ユーザ画面、G3 基本画面、G4 詳細画面、G5 一覧画面、G6 権利者画面、G7 権利画面、G8 ESG全般画面、G9 ESG個別画面、G10 発明者画面、Gx 購入画面、H 決済方法部、J1 お知らせ欄、J2 固有情報部、K1 第1データ、K2 第2データ、K3 一覧表示部、K4 期間指定欄、L ログインボタン、L1 個別評価部、L2 ソート指示部、L3 公報ボタン、L4 一覧部、L5 資料部、L6 経過情報部、L7 発明者情報部、La 格付け優先キー、Lb ESG優先キー、Lc 年金優先キー、Lo 総合評価部、M1 推定モデル、M11 文献推定モデル、M21 記載不備推定モデル、N ネットワーク、P 内容欄、P1、P11、P21 データ分析プログラム、P2、P20 データ提供プログラム、Q 金額欄、Q1 公報部、Q2 詳細一覧部、Q3 選択部、Qa、Za、Zd、Zk 表示欄、Qb、Zb、Ze、Zm 展開ボタン、Qc、Zc、Zf、Zn リスト部、Qx スコア部、Qy 文献リスト部、Qz 関連度表示部、R1 比較データ、R2 ランキング部、R3 詳細分析欄、S1 選択ボックス、S2 権利番号欄、S3 備考欄、T 期間表示部、U ユーザ名表示部、V1 一覧表示部、V2 評価部、W オファーボタン、X 登録ボタン、Y ログアウトボタン、Z1 呼出部、Z2 スコア指定部、Z3 順序指定部、Zo 件数部。

 

Claims (39)

  1.  複数の産業財産権に関連する情報をもとに構築され、複数の産業財産権それぞれの有効性に係る有効性データを管理するデータベースから、外部の要求に対応する前記有効性データを抽出して提供する提供処理部を備え、
     前記有効性データは、複数の産業財産権の間での相対的な有効性を示す格付けスコアを含む、データ提供装置。
  2.  前記格付けスコアは、産業財産権のうちの特許権の有効性の指標となるものであり、
     前記有効性データは、
     特許権の有効性に関連する技術情報を含む、請求項1に記載のデータ提供装置。
  3.  前記提供処理部は、
     複数の前記技術情報を含む前記有効性データについて、該有効性データに係る特許権との関連度合いが高い順に前記データベース内の各技術情報を並べ替えるものである、請求項2に記載のデータ提供装置。
  4.  前記有効性データは、
     特許権をESGの観点から評価した指標値であるESGスコアを含む、請求項2又は3に記載のデータ提供装置。
  5.  前記提供処理部は、
     ネットワークを介して通信可能な情報端末において発明者が指定された場合、該発明者の評価指数の情報を提供するものである、請求項2~4の何れか一項に記載のデータ提供装置。
  6.  前記提供処理部は、
     ネットワークを介して通信可能な情報端末において1又は複数の産業財産権が指定された場合、該産業財産権に対応する前記有効性データを提供するものである、請求項1~5の何れか一項に記載のデータ提供装置。
  7.  前記提供処理部は、
     ネットワークを介して通信可能な情報端末において、複数の産業財産権と共に前記格付けスコアに基づく並べ方が指定された場合、各産業財産権それぞれに対応する前記有効性データを前記並べ方により整理して提供するものである、請求項1~6の何れか一項に記載のデータ提供装置。
  8.  前記提供処理部は、
     ネットワークを介して通信可能な情報端末において権利者及び期間が指定された場合、該権利者の該期間内の産業財産権に対応する前記有効性データを提供するものである、請求項1~7の何れか一項に記載のデータ提供装置。
  9.  前記提供処理部は、
     ネットワークを介して通信可能な情報端末において、権利者及び期間と共に前記格付けスコアに基づく並べ方が指定され、かつ該期間内に複数の産業財産権が含まれる場合、該権利者の該期間内の各産業財産権それぞれに対応する前記有効性データを前記並べ方により整理して提供するものである、請求項1~8の何れか一項に記載のデータ提供装置。
  10.  前記提供処理部は、
     ネットワークを介して通信可能な情報端末において、権利者及び期間と共に前記格付けスコアのうちの少なくとも1つが選定された場合、該権利者の該期間内の、選定された前記格付けスコアが付与された産業財産権に対応する前記有効性データを提供するものである、請求項1~9の何れか一項に記載のデータ提供装置。
  11.  前記提供処理部は、
     ネットワークを介して通信可能な情報端末において権利者が指定された場合、該権利者の第1期間における産業財産権を前記第1期間よりも短い第2期間ごとに整理した第1元データを提供し、
     前記情報端末において前記第2期間が指定された場合、該権利者の前記第2期間における産業財産権を前記第2期間よりも短い第3期間ごとに整理した第2元データを提供し、
     前記情報端末において前記第3期間が指定された場合、前記第3期間における産業財産権に対応する前記有効性データを提供するものである、請求項1~10の何れか一項に記載のデータ提供装置。
  12.  前記有効性データは、
     権利維持に対するコストパフォーマンスの高さを示す年金コスト情報を含む、請求項1~11の何れか一項に記載のデータ提供装置。
  13.  前記提供処理部は、
     前記有効性データを提供した産業財産権について、その提供数が予め設定された制限数未満であるか否かを判定する判定処理手段と、
     前記判定処理手段において前記提供数が前記制限数以上であると判定された場合、該判定に係る産業財産権に対応する前記有効性データの提供が不可である旨の情報を送信する情報処理手段と、を有する、請求項1~12の何れか一項に記載のデータ提供装置。
  14.  前記提供処理部は、
     ネットワークを介して通信可能な情報端末において産業財産権が指定された場合、該産業財産権に対応する前記有効性データの提供数が予め設定された制限数未満であるか否かを判定する判定処理手段と、
     前記判定処理手段において前記提供数が前記制限数以上であると判定された場合、該判定に係る産業財産権に対応する前記有効性データの提供が不可である旨の情報を前記情報端末へ送信する情報処理手段と、を有する、請求項1~12の何れか一項に記載のデータ提供装置。
  15.  前記情報処理手段は、
     前記有効性データの転売の申し込みがあった場合に、該有効性データの販売先に係る情報端末へ転売打診情報を送信する機能を有する、請求項13又は14に記載のデータ提供装置。
  16.  前記提供処理部は、
     前記有効性データの転売依頼に応じて登録ユーザの中から1又は複数の転売先を選定する選定処理手段を有し、
     前記情報処理手段は、
     前記有効性データの販売先に係る情報端末から該有効性データの転売依頼があった場合、前記選定処理手段において選定された1又は複数の転売先に対応する情報端末へ購入を打診する旨の販促情報を送信する機能を有する、請求項13~15の何れか一項に記載のデータ提供装置。
  17.  分析対象とされている特許又は実用新案に係る対象権利におけるクレームの1又は複数のクレーム要素を意味ベクトルである第1ベクトルに変換すると共に、発明又は考案に関連する情報であって前記対象権利の出願日よりも前に公開された複数の日前情報それぞれの一部又は全部を分割した分割データごとに意味ベクトルである第2ベクトルに変換し、各第1ベクトルと各第2ベクトルとの相互比較により、前記対象権利におけるクレームのクレーム要素と各日前情報それぞれとの一致度である総一致度を求める一致度処理手段と、
     前記一致度処理手段により求められた各総一致度に基づいてクレームの有効性の指標となる個別スコアを求める格付処理手段と、を有し、
     前記格付処理手段は、
     全ての前記対象権利についての前記個別スコアを用いて、複数の対象権利間での相対的な権利の有効性を示す総合スコアを求めるものである、データ分析装置。
  18.  分析対象とされている特許又は実用新案に係る対象権利におけるクレームの1又は複数のクレーム要素を意味ベクトルである第1ベクトルに変換すると共に、発明又は考案に関連する情報であって前記対象権利の出願日よりも前に公開された複数の日前情報それぞれの一部又は全部を分割した分割データごとに意味ベクトルである第2ベクトルに変換し、各第1ベクトルと各第2ベクトルとの相互比較により、クレーム要素と前記日前情報との一致度である総一致度を求める一致度処理手段と、
     前記一致度処理手段により求められた各総一致度に基づいて、前記対象権利の有効性の指標となる総合評価値を求めると共に、複数の前記対象権利それぞれの前記総合評価値の相対比較により、複数の前記対象権利間での相対的な権利の有効性を示す総合スコアを求める格付処理手段と、を有する、データ分析装置。
  19.  前記格付処理手段は、
     前記一致度処理手段により求められた各総一致度に基づいてクレームの有効性の指標となる個別スコアを求めるものである、請求項18に記載のデータ分析装置。
  20.  特許分類の情報に含まれる分類コードの説明文の情報である説明データそれぞれを自然言語処理によりベクトル化することで、前記説明データそれぞれに対応する意味ベクトルである分類ベクトルを生成し、各分類コードごとに、分類コードの階層の情報である階層データと生成した分類ベクトルとを紐付けて分類用データベースを生成する収集処理手段を有する、請求項17又は19に記載のデータ分析装置。
  21.  前記収集処理手段は、
     前記日前情報のうちの非特許文献の情報の一部又は全部を自然言語処理によりベクトル化することで、前記非特許文献の情報に対応する意味ベクトルである未知ベクトルを生成し、生成した未知ベクトルと前記分類用データベース内の各分類ベクトルとを比較し、該未知ベクトルと意味上の類似性が最も高い分類ベクトルを特定し、生成した未知ベクトルに対応する前記非特許文献の情報に、特定した分類ベクトル及び該分類ベクトルに対応する分類コードのうちの少なくとも1つを紐付けて記憶させるものである、請求項20に記載のデータ分析装置。
  22.  前記一致度処理手段は、
     前記対象権利のクレームに紐付くクレーム要素と前記日前情報との間の前記総一致度をもとに、該クレームと意味上の類似性が最も高い前記日前情報である主関連情報を特定すると共に、前記主関連情報以外の各日前情報の中から、前記主関連情報に紐付く分類ベクトルとの一致度が副閾値以下の分類ベクトルが紐付く前記日前情報を副関連情報として選定するものであり、
     前記格付処理手段は、
     クレームと前記主関連情報及び1又は複数の前記副関連情報の各々との一致度である前記総一致度を用いて該クレームの前記個別スコアを求めるものである、請求項20又は21に記載のデータ分析装置。
  23.  前記格付処理手段は、
     前記一致度処理手段により求められた各総一致度に基づいてクレームの有効性の指標となる個別評価値を求め、各クレームそれぞれの前記個別評価値の相対比較によりクレームごとの前記個別スコアを求めるものである、請求項17、19~22の何れか一項に記載のデータ分析装置。
  24.  前記格付処理手段は、
     あるクレームについて、
     全てのクレーム要素を充足する日前情報が幾つ存在するか、
     全てのクレーム要素を充足する日前情報が存在しない場合に、該非充足のクレーム要素を、他の幾つの日前情報によって充足するか、あるいは他の複数の日前情報の組み合わせによっても充足しないか、
     といった判定基準に基づいて、前記個別スコアを求めるものである、請求項22に記載のデータ分析装置。
  25.  前記対象権利における請求の範囲に基づく情報を、検索報告書に含まれる、請求の範囲の情報と拒絶の引例とされた文献の情報とに基づいて生成された文献推定モデルに入力し、前記対象権利の拒絶の引例とされる文献を推定する文献推定手段を有し、
     前記格付処理手段は、
     前記文献推定手段により推定された文献の情報を前記個別スコア及び前記総合スコアのうちの少なくとも1つに反映させるものである、請求項17、19~24の何れか一項に記載のデータ分析装置。
  26.  前記対象権利における請求の範囲に基づく情報を、拒絶理由に関する書類に含まれる、出願の識別番号と記載不備に対応する条文番号を示す不備条文データとに基づいて生成された記載不備推定モデルに入力し、前記対象権利が記載不備に係る無効理由を有する割合である不備割合を求める不備推定手段を有し、
     前記格付処理手段は、
     前記不備推定手段により求められた前記不備割合を前記個別スコア及び前記総合スコアのうちの少なくとも1つに反映させるものである、請求項17、19~25の何れか一項に記載のデータ分析装置。
  27.  前記一致度処理手段は、
     Transformer系のエンコーダに基づく自然言語処理により、クレーム要素から前記第1ベクトルを生成すると共に、前記分割データから前記第2ベクトルを生成するものである、請求項17~26の何れか一項に記載のデータ分析装置。
  28.  請求項17、19~26の何れか一項に記載のデータ分析装置と、
     前記格付処理手段により求められた複数の前記対象権利それぞれの前記個別スコア及び前記総合スコアを管理するデータベースから、外部の要求に対応する前記個別スコア及び前記総合スコアのうちの少なくとも1つを抽出して提供するデータ提供装置と、を有するデータ管理システム。
  29.  複数の産業財産権に関連する情報を用いて複数の産業財産権それぞれの有効性を推定するデータ分析装置と、
     請求項1~16の何れか一項に記載のデータ提供装置と、を有し、
     前記データ分析装置は、
     外部から収集した複数の産業財産権に関連する情報のそれぞれに含まれるコアデータに対し、共通言語に統一化する翻訳処理を施して翻訳データを生成する翻訳処理手段と、
     前記翻訳データに基づく学習用データを用いた機械学習により、前記有効性データを求めるための推定モデルを生成する学習処理手段と、を有する、データ管理システム。
  30.  前記データ分析装置は、
     前記翻訳データに解析処理を施して前記学習用データを生成する前処理手段を有する、請求項29に記載のデータ管理システム。
  31.  前記前処理手段は、
     前記翻訳データに解析処理を施して分析用データを生成する機能を有し、
     前記データ分析装置は、
     前記前処理手段において生成された前記分析用データを前記推定モデルの入力として前記有効性データを求める推定処理手段を有する、請求項30に記載のデータ管理システム。
  32.  請求項1~16の何れか一項に記載のデータ提供装置と、
     前記データ提供装置と通信可能な情報端末と、を有し、
     前記提供処理部は、
     前記有効性データを含む画面の情報を前記情報端末に提供するものであり、
     前記情報端末は、
     前記データ提供装置から提供された前記画面の情報を表示する表示部を有する、データ提供システム。
  33.  請求項29~31の何れか一項に記載のデータ管理システムと、
     前記データ提供装置と通信可能な情報端末と、を有し、
     前記提供処理部は、
     前記有効性データを含む画面の情報を前記情報端末に提供するものであり、
     前記情報端末は、
     前記データ提供装置から提供された前記画面の情報を表示する表示部を有する、データ提供システム。
  34.  データ提供装置に搭載されたコンピュータを、
     複数の産業財産権に関連する情報をもとに構築され、複数の産業財産権それぞれについての各産業財産権の間での相対的な有効性を示す格付けスコアを含む有効性データを管理するデータベースから、外部の要求に対応する前記有効性データを抽出して提供する情報処理手段、として機能させるためのデータ提供プログラム。
  35.   請求項34に記載のデータ提供プログラムを記録したコンピュータ読み取り可能な記録媒体。
  36.  データ分析装置に搭載されたコンピュータを、
     外部から収集した複数の産業財産権に関連する情報のそれぞれに含まれるコアデータに対し、共通言語に統一化する翻訳処理を施して翻訳データを生成する翻訳処理手段、
     及び、前記翻訳データに基づく学習用データを用いた機械学習により、複数の産業財産権それぞれについての各産業財産権の間での相対的な有効性を示す格付けスコアを含む有効性データを求めるための推定モデルを生成する学習処理手段、として機能させるためのデータ分析プログラムを記録したコンピュータ読み取り可能な記録媒体。。
  37.  データ分析装置に搭載されたコンピュータを、
     特許分類の情報に含まれる分類コードの説明文の情報である説明データそれぞれを自然言語処理によりベクトル化することで、説明データそれぞれに対応する意味ベクトルである分類ベクトルを生成し、
     前記日前情報のうちの非特許文献の情報の一部又は全部を自然言語処理によりベクトル化することで、前記非特許文献の情報に対応する意味ベクトルである未知ベクトルを生成し、
     生成した未知ベクトルと各分類ベクトルとを比較し、該未知ベクトルと意味上の類似性が最も高い分類ベクトルを特定し、
     生成した未知ベクトルに対応する前記非特許文献の情報に、特定した分類ベクトル及び該分類ベクトルに対応する前記分類コードのうちの少なくとも1つを紐付けて記憶させる収集処理手段、として機能させるためのデータ分析プログラムを記録したコンピュータ読み取り可能な記録媒体。
  38.  ネットワークを介して情報端末から1又は複数の産業財産権の指定を受け付け、
     複数の産業財産権に関連する情報をもとに構築されたデータベースであって、複数の産業財産権それぞれについての各産業財産権の間での相対的な有効性を示す格付けスコアを含む有効性データを管理するデータベースから、指定に係る産業財産権に対応する前記有効性データを抽出し、
     抽出した前記有効性データを前記情報端末に提供する、データ提供方法。
  39.  外部から収集した複数の産業財産権に関連する情報のそれぞれに含まれるコアデータに対し、共通言語に統一化する翻訳処理を施して翻訳データを生成し、
     生成した前記翻訳データに基づく学習用データを用いての機械学習により、複数の産業財産権それぞれについての各産業財産権の間での相対的な有効性を示す格付けスコアを含む有効性データを求めるための推定モデルを生成する、データ管理方法。

     
PCT/JP2021/035544 2021-01-15 2021-09-28 データ提供装置、システム、プログラム、方法、データ分析装置、データ管理システム、方法、及び記録媒体 WO2022153613A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP21919504.7A EP4280151A1 (en) 2021-01-15 2021-09-28 Data provision device, system, program, method, data analysis device, data management system, method, and recording medium
US17/791,178 US20240177255A1 (en) 2021-01-15 2021-09-28 A data providing device, a data providing system, a data providing program, a data providing method, a data analysis device, a data management system, a data management method, and a data recording medium
CN202180084854.0A CN116615723A (zh) 2021-01-15 2021-09-28 数据提供装置、数据提供***、数据提供程序、数据提供方法、数据分析设备、数据管理***、数据管理方法和数据记录介质

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021004599A JP2024065118A (ja) 2021-01-15 2021-01-15 データ提供装置、データ管理システム、データ提供システム、データ提供プログラム、データ分析プログラム、記録媒体、データ提供方法、及びデータ管理方法
JP2021-004599 2021-01-15

Publications (1)

Publication Number Publication Date
WO2022153613A1 true WO2022153613A1 (ja) 2022-07-21

Family

ID=82448126

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/035544 WO2022153613A1 (ja) 2021-01-15 2021-09-28 データ提供装置、システム、プログラム、方法、データ分析装置、データ管理システム、方法、及び記録媒体

Country Status (5)

Country Link
US (1) US20240177255A1 (ja)
EP (1) EP4280151A1 (ja)
JP (1) JP2024065118A (ja)
CN (1) CN116615723A (ja)
WO (1) WO2022153613A1 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005332330A (ja) 2004-05-21 2005-12-02 Shigematsu:Kk 特許有効性評価装置および特許有効性評価方法
WO2014118861A1 (ja) * 2013-01-31 2014-08-07 アスタミューゼ株式会社 情報提示装置及び情報提示システム
JP2018067274A (ja) * 2016-10-21 2018-04-26 株式会社Ipam Japan 特許価値評価装置及び特許価値評価方法
JP2018169854A (ja) * 2017-03-30 2018-11-01 和之 白井 特許要件適否予測装置および特許要件適否予測プログラム
JP2019101944A (ja) * 2017-12-06 2019-06-24 株式会社AI Samurai 知的財産システム、知的財産支援方法および知的財産支援プログラム
JP2020149658A (ja) * 2019-03-07 2020-09-17 株式会社鈴康 情報処理方法、プログラム及び情報処理装置
JP2020154571A (ja) * 2019-03-19 2020-09-24 ジャングルX株式会社 ゲームサービス提供装置、ゲームサービス提供方法及びゲームサービス提供プログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005332330A (ja) 2004-05-21 2005-12-02 Shigematsu:Kk 特許有効性評価装置および特許有効性評価方法
WO2014118861A1 (ja) * 2013-01-31 2014-08-07 アスタミューゼ株式会社 情報提示装置及び情報提示システム
JP2018067274A (ja) * 2016-10-21 2018-04-26 株式会社Ipam Japan 特許価値評価装置及び特許価値評価方法
JP2018169854A (ja) * 2017-03-30 2018-11-01 和之 白井 特許要件適否予測装置および特許要件適否予測プログラム
JP2019101944A (ja) * 2017-12-06 2019-06-24 株式会社AI Samurai 知的財産システム、知的財産支援方法および知的財産支援プログラム
JP2020149658A (ja) * 2019-03-07 2020-09-17 株式会社鈴康 情報処理方法、プログラム及び情報処理装置
JP2020154571A (ja) * 2019-03-19 2020-09-24 ジャングルX株式会社 ゲームサービス提供装置、ゲームサービス提供方法及びゲームサービス提供プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MORI, HISAO: "Proposal on Valuation Methods for Patents Acquired by Universities", PATENT : THE PATENT MAGAZINE, JAPAN PATENT ATTORNEYS ASSOCIATION, vol. 72, no. 2, 31 January 2019 (2019-01-31), JP, pages 56 - 64, XP009538358, ISSN: 0287-4954 *
SUZUKI, KATSUNORI: "Improvement and Optimization of Automatic Research Paper Classification into an International Patent Classification System", TRANSACTIONS OF INFORMATION PROCESSING SOCIETY OF JAPAN, vol. 54, no. 1, 31 December 2012 (2012-12-31), JP , pages 414 - 422, XP009538204, ISSN: 1882-7799 *

Also Published As

Publication number Publication date
EP4280151A1 (en) 2023-11-22
CN116615723A (zh) 2023-08-18
US20240177255A1 (en) 2024-05-30
JP2024065118A (ja) 2024-05-15

Similar Documents

Publication Publication Date Title
Sun et al. A novel stock recommendation system using Guba sentiment analysis
US20170235820A1 (en) System and engine for seeded clustering of news events
Gangwar et al. Probabilistic and intuitionistic fuzzy sets–based method for fuzzy time series forecasting
Barnett et al. A multi-level network analysis of web-citations among the world’s universities
Christin What data can do: A typology of mechanisms
KR101531970B1 (ko) 소셜 미디어 데이터 및 증시 관련 웹데이터 분석을 통한 주가 예측 방법 및 이를 적용한 주가 예측 시스템
Garcia-Lopez et al. Analysis of relationships between tweets and stock market trends
Li et al. Stock prediction via sentimental transfer learning
Chen et al. The integration of artificial neural networks and text mining to forecast gold futures prices
KR101544450B1 (ko) 소셜 데이터의 분석을 통한 감성 영향 인덱스의 생성 방법 및 그 시스템
CA2956627A1 (en) System and engine for seeded clustering of news events
Petropoulos et al. Employing *** trends and deep learning in forecasting financial market turbulence
Smailović Sentiment analysis in streams of microblogging posts
EP3994646A1 (en) Analysis of intellectual-property data in relation to products and services
Darena et al. Machine learning-based analysis of the association between online texts and stock price movements
Sachini et al. Identifying the intellectual capital of Greek defence firms. Science outputs and industrial considerations
JP2015194955A (ja) 入札情報検索システム
WO2022153613A1 (ja) データ提供装置、システム、プログラム、方法、データ分析装置、データ管理システム、方法、及び記録媒体
Kim et al. Opinion Mining‐Based Term Extraction Sentiment Classification Modeling
JP6941802B1 (ja) 検索システム、検索方法及び検索プログラム
CN112989054B (zh) 一种文本处理方法和装置
CN113254571A (zh) 知识点存储方法、装置、服务器及介质
Hou et al. Heuristic and integrated approach for technical document authority and authentication sequence determination
Duan et al. Mining opinion and sentiment for stock return prediction based on web-forum messages
Thotawaththa et al. Automated categorization of privacy policies based on user perspective

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 17791178

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21919504

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 202180084854.0

Country of ref document: CN

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2021919504

Country of ref document: EP

Effective date: 20230816

NENP Non-entry into the national phase

Ref country code: JP