JP2022176388A

JP2022176388A - 企業評価装置及び企業評価方法

Info

Publication number: JP2022176388A
Application number: JP2021082843A
Authority: JP
Inventors: 光弘岡本; Mitsuhiro Okamoto
Original assignee: Ipdefine; Ipdefine Ltd
Current assignee: Ipdefine; Ipdefine Ltd
Priority date: 2021-05-15
Filing date: 2021-05-15
Publication date: 2022-11-28
Also published as: EP4339874A1; WO2022244892A1; US20240220905A1

Abstract

【課題】経営指標の観点から客観的に企業を評価し、信頼性の高い評価結果を導出する企業評価装置、企業評価プログラム、記録媒体、及び企業評価方法を提供すること。【解決手段】企業評価装置は、企業に紐付けられた１又は複数の産業財産権に関する情報の、企業の経営方針に組み込まれる経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて企業の評価結果を求める評価処理手段を有している。企業評価プログラムは、コンピュータを評価処理手段として機能させるためのものである。【選択図】図２

Description

本発明は、企業の客観的な評価を行う企業評価装置及び企業評価方法に関する。

近年、ＥＳＧ又はＳＤＧｓのような企業の経営方針に組み込まれる指標（以下、経営指標ともいう。）が、主として機関投資家の間で重要視されている。ここで、ＥＳＧとは、環境（Ｅｎｖｉｒｏｎｍｅｎｔ）、社会（Ｓｏｃｉａｌ）、ガバナンス（Ｇｏｖｅｒｎａｎｃｅ）の頭文字をとったものであり、ＳＤＧｓとは、ＳｕｓｔａｉｎａｂｌｅＤｅｖｅｌｏｐｍｅｎｔＧｏａｌｓ（持続可能な開発目標）の略である。

ただし、どの企業がどのような取り組みを行っているかを投資家等が個別に調査を行うのは困難である。そのため、多様な企業を格付けする格付機関が、経営指標の観点から企業を評価し、その結果を投資家等に提供している。例えば、特許文献１の企業評価遂行装置は、インターネット上で収集したニュース記事をもとに、ＥＳＧの観点から企業を評価するようになっている。

特表２０２１－５０４７８９号公報

しかしながら、複数存在する格付機関には、経営指標の観点から企業を評価するための共通の基準がなく、各格付機関が独自の手法で企業の格付を行っているのが実情である。よって、企業の評価結果には、格付機関ごとの主観や価値観が入るおそれがあり、公平感を得られにくいという課題がある。そのため、経営指標の観点から企業を評価する際の客観性及び信頼性を高める手法が望まれている。

本発明は、上述のような課題を解決するためになされたものであり、経営指標の観点から客観的に企業を評価し、信頼性の高い評価結果を導出する企業評価装置及び企業評価方法を提供することを目的とする。

本発明の一態様に係る企業評価装置は、企業に紐付けられた１又は複数の産業財産権に関する情報の、企業の経営方針に組み込まれる経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて、経営指標の観点での企業の評価結果を求める評価処理手段を有するものである。

本発明の一態様に係る企業評価方法は、企業に紐付けられた１又は複数の産業財産権に関する情報の、企業の経営方針に組み込まれる経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて、経営指標の観点での企業の評価結果を求める、という手法を採っている。

本発明は、企業に紐付けられた１又は複数の産業財産権に関する情報の、企業の経営方針に組み込まれる経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて企業の評価結果を求める。そのため、経営指標の観点での企業の評価に産業財産権の観点を採り入れることができる。ここで、産業財産権は、各国の特許庁において審査等が行われているため、登録された権利には客観的な有用性が認められる。また、産業財産権の取得に際し、出願人は通常、審査が行われることを前提に、客観的な有用性を確保すべく出願書類を作成する。よって、産業財産権に関する情報に基づく評価結果は、自ずと客観性の高い情報となる。したがって、本発明によれば、経営指標の観点から客観的に企業を評価し、信頼性の高い評価結果を導出することができる。

本発明の実施の形態に係る企業評価装置及びその周辺構成を例示したブロック図である。図１の企業評価装置の機能的な構成を例示したブロック図である。図２の名寄せ処理手段が作成する対象リストの一例を概略的に示す説明図である。図２の記憶部に記憶される重み情報の、産業財産権に関する情報との関係性を例示した説明図である。図２の公報処理手段が求める公報係数の概要を例示した説明図である。図２の分類処理手段が抽出し収集する分類情報の概要を例示した説明図である。図２の記憶部に格納される階層テーブルを概略的に例示した説明図である。図２の記憶部に格納されるワードテーブルを概略的に例示した説明図である。図２の記憶部に格納される抽出数テーブルを概略的に例示した説明図である。図２の分類処理手段が求める分類スコアに関する説明図である。本実施の形態における企業評価方法の全体的な処理の流れを例示したフローチャートである。本実施の形態の企業評価方法のうち、ワード処理工程での関連スコアの導出に係る動作例を示すフローチャートである。本実施の形態の企業評価方法のうち、公報処理工程での公報係数の導出に係る動作例を示すフローチャートである。本実施の形態の企業評価方法のうち、分類処理工程における動作例を示すフローチャートである。本実施の形態の変形例に係る分類テーブルを例示した説明図である。本実施の形態の変形例に係る分類テーブルの作成方法の動作例を示すフローチャートである。本実施の形態の変形例に係る企業評価方法のうち、分類処理工程における動作例を示すフローチャートである。

実施の形態．
図１を参照して、本実施の形態における企業評価装置１０及びその周辺環境に係る構成例について説明する。企業評価装置１０は、評価対象の企業に紐付けられた１又は複数の産業財産権に関する情報の、企業の経営方針に組み込まれる経営指標に対する関連性の度合いを解析するアルゴリズムを用いて、企業を経営指標の観点から評価するものである。企業評価装置１０は、機械学習を用いた手法により、企業を経営指標の観点から評価する機能を有している。経営指標は、環境面や社会的側面にも配慮した指標であり、特に中長期的な企業の経営方針に組み込まれるものである。

企業評価装置１０は、インターネットなどのネットワークＮを介して、管理端末５０、１又は複数の情報端末８０、格付サーバ群１００、及び情報提供サーバ群３００などの外部機器との間で通信可能に接続される。企業評価装置１０は、オンプレミス型の物理サーバ、もしくはクラウドコンピューティングに基づくクラウドサーバ、又はこれらを組み合わせたシステムなどにより構成される。

ここで、産業財産権とは、知的財産権のうちの、特許権、実用新案権、意匠権、及び商標権のことであるが、本実施の形態では、特に特許権及び実用新案権のことを指す。すなわち、産業財産権に関する情報には、公報（特許公報、特許公開公報、実用新案に関する公報など）、出願人、権利者、発明者又は考案者などの情報の他、出願経過に関する情報や、審査等に関する情報などが含まれる。審査等に関する情報は、産業財産権に係る公報が拒絶理由通知等で引用された数（被引用数）を示す被引用情報を含んでいてもよい。審査等に関する情報は、サーチ会社の検索報告書、及び審査官等による検索処理や審査内容等の情報を含んでいてもよい。

産業財産権に関する情報は、原則として１つの出願に対応し、権利化された出願（存続期間満了等により消滅したものも含む）に関する情報だけでなく、権利化されなかった出願に関する情報や、権利化前の審査中もしくは審査待ちの出願に関する情報も含む。権利化されなかった出願には、所定期間内に審査請求がされなかった出願、及び拒絶査定等が確定した出願などが含まれる。以降では、産業財産権に関する情報のことを「権利関連情報」ともいう。権利関連情報には、少なくとも出願番号の情報が含まれる。

格付サーバ１１０は、企業の経営方針に組み込まれる指標である経営指標の観点から企業の格付処理を行うものである。すなわち、格付サーバ１１０は、ＭＳＣＩ（Morgan Stanley Capital International）、ＦＴＳＥ、又はＳｕｓｔａｉｎａｌｙｔｉｃｓなどの格付機関が使用し管理するサーバ等である。格付サーバ群１００は、１又は複数の格付サーバ１１０を想定したものである。格付サーバ１１０は、クラウドコンピューティングに基づくクラウドサーバ、もしくはオンプレミス型の物理サーバ、又はこれらを組み合わせたシステムなどにより構成される。

企業評価装置１０は、格付サーバ１１０と連携して企業評価システム２００を構築することができる。すなわち、企業評価装置１０は、評価対象とされている企業の権利関連情報に基づいて、該企業を経営指標の観点から評価し、評価の結果を１又は複数の格付サーバ１１０へ提供するようにしてもよい。これにより、格付サーバ１１０は、企業の格付処理に産業財産権の観点と組み入れることができるため、顧客に提供する情報の客観性を高めることができる。

管理端末５０は、企業評価装置１０内の情報を管理するためのものである。管理端末５０は、例えば企業評価装置１０内のソフトウェア及びデータなどを管理する企業が使用するＰＣ（Personal Computer）である。ＰＣには、タブレットＰＣ、ノートＰＣ、デスクトップ型ＰＣなどが含まれる。管理者は、管理端末５０を介して、企業評価装置１０内のデータベースの情報、プログラム、及び各種パラメータの調整・変更などを行うことができる。

情報提供サーバ群３００は、例えばＡＰＩ（Application Programming Interface）を通じて権利関連情報を提供する世界各国のサーバ等を想定したものである。情報提供サーバ群３００を構成する各サーバ等では、１つのデータセットである権利関連情報が、出願人もしくは権利者たる企業等に紐付けられている。情報提供サーバ群３００を構成する各サーバ等は、クラウドコンピューティングに基づくクラウドサーバ、もしくはオンプレミス型の物理サーバ、又はこれらを組み合わせたシステムなどにより構成される。

情報提供サーバ群３００は、１の発明又は考案に係る出願人又は権利者を示す１又は複数の名称データに１つのファミリーＩＤが紐づけられたデータベース（以下、知財データベースという。）を格納するサーバ装置を含んでいる。昨今は、多くの企業が同じ発明等を複数の国へ特許出願しており、このような特許出願のまとまりのことをパテントファミリーという。ファミリーＩＤは、パテントファミリー間に共通に付与される識別情報であり、企業名の表記がどんなにかけ離れていても、同一の企業には同一のファミリーＩＤが付与される。

情報端末８０は、ユーザの操作に応じて企業評価装置１０又は格付サーバ１１０が提供するデータベースにアクセスし、該データベース内の種々の情報を取得して表示する。すなわち、情報端末８０は、企業の客観的な評価の結果である格付スコア等を企業評価装置１０から取得し、取得した格付スコア等の情報をユーザに提供する。情報端末８０は、産業財産権に基づく客観性が反映された客観格付スコア等を格付サーバ１１０から取得し、取得した客観格付スコア等の情報をユーザに提供する。

図２に示すように、企業評価装置１０は、通信部１１と、記憶部１２と、制御部１３と、評価データベース部１２０と、を有している。通信部１１は、制御部１３が管理端末５０、情報端末８０、格付サーバ群１００、及び情報提供サーバ群３００などの外部機器との間で有線又は無線による通信を行うためのインタフェースである。

記憶部１２は、企業評価プログラムＰ１のような制御部１３の動作プログラムの他、企業の評価に要する種々のデータ等を記憶する。記憶部１２には、企業に紐付けられた１又は複数の権利関連情報の経営指標に対する関連性の度合い（関連度合い）を企業評価に反映させる重み情報が記憶される。

重み情報には、所在係数、関連係数ｄ、検索数、関連スコアＵ、公報係数ｅ、被引用係数ｆ、分類スコアＨ、ワード係数Ｄのうちの少なくとも１つが含まれる。重み情報は、階層係数ｈ１及び説明係数ｈ２のうちの少なくとも１つを含んでもよい。重み情報は、抽出数及び抽出係数Ｋを含んでもよい。重み情報は、分類係数ｇを含んでもよい。重み情報は、対象情報に係る出願日や権利化された日付などに基づく経過係数を含んでもよい。重み情報は、検索数の想定外の増加が企業の評価結果に及ぼす影響を緩和するための緩和係数を含んでもよい。

記憶部１２は、例えば、関連データ１２ａ、対象リスト１２ｂ、緩和テーブル、関連テーブル１２ｃ、公報係数テーブル１２ｄ、階層テーブル１２ｅ、ワードテーブル１２ｆ、抽出数テーブル１２ｇ、及び分類テーブル１２ｈなどのテーブル情報を記憶する。記憶部１２には、権利関連情報に係る公報の内容の有効性を推定するための推定モデルＭ１が格納されてもよい。記憶部１２は、ＲＡＭ（Random Access Memory）及びＲＯＭ（Read Only Memory）、フラッシュメモリ等のＰＲＯＭ（Programmable ＲＯＭ）、ＳＳＤ（Solid State Drive）、又はＨＤＤ（Hard Disk Drive）等により構成することができる。

制御部１３は、収集処理手段１３ａと、名寄せ処理手段１３ｂと、評価処理手段１３ｃと、を有している。収集処理手段１３ａは、ＡＰＩ等を通じて権利関連情報を定期的に収集する。例えば、収集処理手段１３ａは、世界中の特許公報、特許公開公報、実用新案に関する公報などの情報を権利関連情報として収集する。収集処理手段１３ａは、収集した権利関連情報に対し、情報の区切りの整理やファイル形式の整備などを施して正規化する機能を有している。収集処理手段１３ａは、世界中の非特許文献、各種の技術論文・技報、技術標準、企業・研究機関・大学等のＷｅｂサイト、Ｗｅｂ上の記事・カタログ、ブログ、ＳＮＳ（social networking service）等のデータを収集し、こうしたデータを公報係数ｅの導出に用いてもよい。

収集処理手段１３ａは、格付機関において経営指標との間に関連性があるとされている複数のキーワードを、格付サーバ群１００に設けられているデータベースから収集し、これらをまとめて関連データ１２ａとして記憶部１２に記憶させる。以降では、関連データ１２ａでリスト化されている各キーワードのことを関連ワードＷと称する。収集処理手段１３ａが格付サーバ群１００から収集する関連ワードＷは、経営指標と権利関連情報との関連性の度合いを評価する際に使用することができる。

収集処理手段１３ａは、類義語やサジェストキーワード等の周辺語の検索が可能な外部サーバにアクセスし、格付サーバ群１００から収集した関連ワードＷの周辺語を抽出する機能を有している。収集処理手段１３ａは、抽出した周辺語についても、関連ワードＷとして記憶部１２に記憶させてもよい。すなわち、収集処理手段１３ａは、格付サーバ群１００から収集した関連ワードＷを類義語等にまで拡張する機能を有している。もっとも、周辺語の検索が可能な類義語辞典等のソフトウェアを記憶部１２等に格納しておき、収集処理手段１３ａが、該ソフトウェアを利用して関連ワードＷを拡張するようにしてもよい。

ところで、格付サーバ群１００から収集した関連ワードＷの周辺語を収集処理手段１３ａが収集する際、経営指標との関連性が低く、企業の評価に用いるには不適切な周辺語が抽出されることも想定される。そのため、収集処理手段１３ａは、格付サーバ群１００から収集した関連ワードＷに紐付く周辺語に対し、経営指標との関連性に基づく取捨選択を行う機能を有している。周辺語の取捨選択機能には、自然言語処理や機械学習を採り入れるとよい。例えば、収集処理手段１３ａは、Ｗｏｒｄ２Ｖｅｃ（単語をベクトル化する自然言語処理技術）等により、格付サーバ群１００から収集した関連ワードＷを分散表現に変換すると共に、抽出した周辺語を分散表現に変換し、これらベクトルの一致度合いに基づいて周辺語の取捨選択を行うとよい。

名寄せ処理手段１３ｂは、情報提供サーバ群３００の知財データベースにアクセスし、リスト化の対象とされている複数の権利関連情報を抽出して整理するものである。例えば、１０年間や２０年間といった指定期間の権利関連情報、国単位あるいは地域単位などによる指定エリアの権利関連情報、又は指定エリアにおける指定期間の権利関連情報などがリスト化の対象とされる。リスト化の対象は、管理端末５０などから設定することができ、適宜変更することも可能である。

名寄せ処理手段１３ｂは、ある指定期間の権利関連情報がリスト化の対象とされている場合、該指定期間内の権利関連情報に紐付く各情報を抽出する。名寄せ処理手段１３ｂは、例えば日本、米国、中国、及び欧州といった指定エリアの権利関連情報がリスト化の対象とされている場合、該各国の権利関連情報に紐付く各情報を抽出する。名寄せ処理手段１３ｂは、ある指定エリアにおける指定期間の権利関連情報がリスト化の対象とされている場合、該指定エリアにおける該指定期間内の権利関連情報に紐付く各情報を抽出する。もっとも、リスト化の対象は任意に設定することができ、名寄せ処理手段１３ｂは、知財データベース内の全ての権利関連情報をリスト化の対象とすることもできる。

以降では、リスト化の対象とされている権利関連情報のことを「対象情報」ともいう。すなわち、名寄せ処理手段１３ｂは、知財データベースにアクセスし、複数の対象情報それぞれに含まれる出願番号と、該各出願番号のそれぞれに紐付く名称データ及びファミリーＩＤを抽出する。そして、名寄せ処理手段１３ｂは、ファミリーＩＤに基づいて出願番号及び名称データを整理して対象リスト１２ｂを作成する。

名寄せ処理手段１３ｂは、１つの企業等が１つの出願だけを行っている場合、同一のファミリーＩＤに紐付く複数の名称データに、共通の名称及び共通の識別情報のうちの少なくとも一方である共通データを対応づけて、対象リスト１２ｂを作成する。共通データは、ファミリーＩＤをもとに名称データを名寄せしたものである。

図３の対象リスト１２ｂは、各対象情報について、共通データと出願番号と名称データとファミリーＩＤとが関連付けられたテーブル情報の例である。図３では、ファミリーＩＤをＦ_１～Ｆ_Ｎ（Ｎは任意の自然数）と略記しており、このＮは対象情報の数（対象情報１～Ｎ）に相当する。なお、図３では、ファミリーＩＤ「Ｆ_１」に紐付く情報を太線で囲い、それ以下の情報についてもファミリーＩＤごとにソートされていることを示している。対象リスト１２ｂは、登録番号などを含めて構成してもよい。

名寄せ処理手段１３ｂは、ファミリーＩＤが共通する複数の名称データのうちの１つを共通データとしてもよく、これらに共通する文字等を共通データとしてもよい。名寄せ処理手段１３ｂは、共通データを別途生成してもよい。なお、図３では、ファミリーＩＤとの対応関係を明確にするため、便宜上、共通データに１～Ｎを対応づけて用いている。名寄せ処理手段１３ｂは、一企業に対応する複数の名称データに統一感がなくても、ファミリーＩＤを用いた画一的な処理により、精度のよい名寄せ処理を行うことができる。

ところで、１つの企業等が複数の出願を行っている場合は、１つの企業等に複数のファミリーＩＤが付与されることになる。また、共同出願の場合は、２以上の企業等に１つのファミリーＩＤが付与されることになる。そのため、名寄せ処理手段１３ｂは、１つのファミリーＩＤとこれに紐付く１又は複数の名称データとにより構成される複数の名称データ群を企業ごとにグループ化し、各グループに固有の共通データを付与する機能を有している。すなわち、名寄せ処理手段１３ｂは、複数の名称データ群の各々を構成する名称データの共通性及び類似性などにより、名称データ群（ファミリーＩＤ）を企業ごとにグループ化し、図３の例と同様、グループ内の各名称データに固有の共通データを付与して対象リスト１２ｂを作成する。これにより、同一企業等の出願番号及び名称データには同一の共通データが対応づけられるため、企業ごとの評価を精度よく行うことができる。

評価処理手段１３ｃは、企業に紐付けられた１又は複数の権利関連情報の、経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて、経営指標の観点での企業の評価結果を求めるものである。評価処理手段１３ｃは、企業に紐付けられた１又は複数の権利関連情報から、経営指標に関連する複数の関連ワードＷを検索し、検索された関連ワードＷに紐付く重み情報を用いて企業の評価結果を求める機能を有している。関連ワードＷに紐付く重み情報には、複数の関連ワードＷのうちの少なくとも１つに設定される関連係数ｄと、関連ワードＷの検索数と、関連ワードＷの所在に応じて設定される所在係数と、が含まれる。本実施の形態において、評価処理手段１３ｃは、企業の評価結果として、評価スコアＴｓ及び格付スコアを求めるようになっている。

評価処理手段１３ｃは、関連ワードＷと完全に一致する単語を検索してもよいが、検索精度を確保する観点からは、Ｗｏｒｄ２Ｖｅｃ又はＤｏｃ２Ｖｅｃといった自然言語処理により、関連ワードＷとの意味上の一致度合いに基づく単語検索を行うとよい。例えば、評価処理手段１３ｃは、権利関連情報の少なくとも一部に形態素解析を施して品詞情報付きの形態素に分解した後、各形態素を分散表現にする（ここで分散表現にされた形態素を要素ベクトルとする。）。そして、評価処理手段１３ｃは、関連ワードＷを分散表現にしたベクトルと各要素ベクトルとを比較して、一定以上の一致度合いの要素ベクトルを検索するとよい。つまり、評価処理手段１３ｃは、関連ワードＷの類似検索を行うように構成するとよい。

ここで、図４を参照して、重み情報に含まれる種々の重み係数等について説明する。図４では、１つの対象情報について例示しているが、重み情報は全ての対象情報に対し設定される。

図４では、ｎ個の関連ワードＷ１～Ｗｎ（ｎは任意の自然数）が設定された前提となっており、関連係数ｄとしては、関連ワードＷごとに個別設定された関連係数ｄ_１～ｄ_ｎを例示している。関連係数ｄ_１～ｄ_ｎは、全てが異なる値である必要はなく、幾つかの重複があってもよい。もっとも、図４では、複数の関連ワードＷの全てに関連係数ｄが設定された例を示しているが、これに限らず、複数の関連ワードＷのうちの一部だけに関連係数ｄが設定されてもよい。つまり、関連係数ｄは、複数の関連ワードＷのうちの少なくとも１つに設定されるものであってよい。

ここで、所在とは、関連ワードＷが権利関連情報のどの箇所に存在しているかを示す情報である。本実施の形態では、所在係数として、関連ワードＷが明細書に存在している場合の重み係数である明細係数ａと、関連ワードＷが要約書に存在している場合の重み係数である要約係数ｂと、関連ワードＷが請求の範囲に存在している場合の重み係数である請求係数ｃと、を採用している。

すなわち、所在係数は、明細書に対応する明細係数ａと、要約書に対応する要約係数ｂと、請求の範囲に対応する請求係数ｃと、を含む。要約係数ｂは、明細係数ａよりも大きく設定するとよく、請求係数ｃは、要約係数ｂよりも大きく設定するとよい。つまり、明細係数ａ、要約係数ｂ、及び請求係数ｃは、明細係数ａが１、要約係数ｂが３、請求係数ｃが５といったように、「ａ＜ｂ＜ｃ」の関係が成立するようにするとよい。これは、発明の技術的範囲が請求の範囲に基づいて定められる一方で、明細書には権利範囲との関連性が薄い内容も記載されることから、請求の範囲に関連ワードＷが存在すれば、経営指標との関連性が相対的に高いと考えられるためである。明細書は、請求の範囲及び要約書に比べて記載量が多く、同じ用語が何度も繰り返して記載され得ることも要因の１つである。なお、要約書には、請求の範囲の要約あるいは抜粋が記載されることも多いため、関連ワードＷが要約書に記載されている方が、明細書に記載されているよりも、経営指標との関連性が高いと推察される。もっとも、明細係数ａ、要約係数ｂ、及び請求係数ｃは、「ａ≦ｂ≦ｃ」の関係が成立するように設定してもよい。

公報係数ｅは、公報の内容の有効性の程度に応じて設定され、産業財産権が特許権又は実用新案権であることを前提とする重み係数である。公報係数ｅは、予め設定された条件により段階的に設定してもよく、対象情報に含まれる用語等に基づく分析処理により、対象情報ごとに個別に求めてもよい。被引用係数ｆは、公報の引用回数に応じて設定される重み係数である。分類係数ｇは、関連スコアＵと分類スコアＨとの間のバランスを調整するための重み係数であり、関連スコアＵ及び分類スコアＨの演算自体で該バランスを調整すれば、分類係数ｇは不要となる。

分類スコアＨは、産業財産権が特許権又は実用新案権であることを前提として、特許分類における分類コードごとに設定される。特許分類とは、ＣＰＣ又はＩＰＣなどのことである。こうした特許分類は、複数の分類コードが階層構造により整理されており、各分類コードには説明文が紐付けられている。すなわち、分類コードには、該分類コードの階層の情報である階層データと、該分類コードの説明文の情報である説明データとが紐付けられている。以降では、分類コードとこれに紐付く階層データ及び説明データを合わせた情報を分類情報という。分類スコアＨは、階層データに対応づけられた階層係数ｈ１と、説明データに対応づけられる説明係数ｈ２と、を用いた演算により求めることができる。

図２に示すように、評価処理手段１３ｃは、ワード処理手段１３１と、公報処理手段１３２と、分類処理手段１３３と、格付処理手段１３４と、を有している。ワード処理手段１３１は、各対象処理手段それぞれについて、下記式（１）のような演算により、対象情報ごとの関連スコアＵを求める。

すなわち、ワード処理手段１３１は、対象情報から各関連ワードＷを検索し、関連ワードＷの所在と共に、その検索数を求める。本実施の形態において、ワード処理手段１３１は、自然言語処理に基づく関連ワードＷの類似検索を行う機能を有している。そして、ワード処理手段１３１は、全ての関連ワードＷについて、所在係数（ａ～ｃ）と関連係数ｄ_ｋと検索数（Ｘ_ｋ～Ｚ_ｋ）とを求めると共に、これらの積を合算して関連スコアＵを求める。ワード処理手段１３１は、求めた関連スコアＵを対象情報に対応づけて記憶部１２に記憶させる。例えば、ワード処理手段１３１は、対象情報と関連スコアＵとを対応づけた関連テーブル１２ｃを作成する。

ところで、発明の名称や構成部材の名称など、明細書等の中で多用され得るものに関連ワードＷ（類似も含む）が含まれる場合は、検索数が想定以上に多くなり、関連スコアＵの信頼性が低下するおそれがある。そのため、例えば検索数の上限値を設定しておき、ワード処理手段１３１は、検索数が上限値を超えた場合、関連スコアＵの演算に用いる検索数を上限値に置き換えるようにしてもよい。

また、検索数の想定外の過多に伴う関連スコアＵの信頼性低下を抑制するため、検索数の増加が関連スコアＵに及ぼす影響を緩和する緩和係数を予め設定し、記憶部１２に記憶させてもよい。例えば、検索数と緩和係数とを関連付けた緩和テーブルを記憶部１２に格納しておき、ワード処理手段１３１は、求めた検索数を緩和テーブルに照らして緩和係数を求めるとよい。この場合、ワード処理手段１３１は、例えば、検索数に緩和係数を乗じた値を該検索数の代わりに用いて関連スコアＵの演算を行うとよい。さらに、ワード処理手段１３１は、検索数の上限値を用いる手法と、緩和係数を用いる手法とを併用するように構成してもよい。もっとも、関連スコアＵの演算には、関連ワードＷが検索されたか否かだけを反映させるようにしてもよい。すなわち、ワード処理手段１３１は、関連スコアＵの演算において、検索数が１の場合と検索数が複数の場合とを同列に扱うようにしてもよい。

公報処理手段１３２は、対象情報ごとの公報係数ｅを求めるものである。図５は、公報係数ｅの概要を例示した説明図である。図５に示すように、公報係数ｅは、公報係数ｅ_１と公報係数ｅ_２と公報係数ｅ_３と公報係数ｅ_４とを含むように構成することができる。公報係数ｅ_１は、特許公報に対応する。公報係数ｅ_２は、特許公開公報のうちで有効性が相対的に高いとされるものに対応する。公報係数ｅ_３は、特許公開公報のうちで有効性が相対的に低いとされるもの又は実用新案に関する公報のうち有効性が相対的に低いとされるものに対応する。公報係数ｅ_４は、特許公開公報のうちで有効性が極めて低いとされるもの又は実用新案に関する公報のうちで有効性が相対的に低いとされるものに対応する。公報係数ｅ_２は、公報係数ｅ_１よりも小さく設定し、公報係数ｅ_３は、公報係数ｅ_２よりも小さく設定し、公報係数ｅ_４は、公報係数ｅ_３よりも小さく設定するとよい。

ところで、公報係数ｅ_１と公報係数ｅ_２～ｅ_４との判別処理は、公報種別、すなわち各公報に付されているコード等により画一的に行うことができる。一方、公報係数ｅ_２と公報係数ｅ_３と公報係数ｅ_４との判別は、公報種別だけを用いて行うよりも、機械学習等に基づく分析処理を採り入れた方が判別精度が向上する。そのため、公報処理手段１３２は、対象情報ごとに所定の分析処理を行って公報係数ｅを求める機能を有している。公報処理手段１３２は、対象情報と公報係数ｅとを対応づけた公報係数テーブル１２ｄを作成するとよい。

本実施の形態において、公報処理手段１３２は、記憶部１２又は外部の記憶装置に格納された推定モデルＭ１を用いて公報係数ｅを求めるようになっている。推定モデルＭ１は、公報の内容の有効性を示す公報係数ｅを出力する学習済モデルである。公報の内容には、請求の範囲及び明細書のうちの少なくとも一方が含まれ、要約書や図面が含まれてもよい。公報の内容の有効性は、新規性及び進歩性等の観点、すなわち無効可能性などの観点から分析され、審査等に関する情報も分析対象とされる。推定モデルＭ１は、公報係数ｅと共に、公報係数ｅの導出の根拠となった情報を出力するように構成してもよい。図２では、推定モデルＭ１が記憶部１２に格納されている例を示している。

対象情報は、推定モデルＭ１の入力とする推定用データの元となるコアデータと、補助的あるいは付随的なデータである補助データと、を含んでいる。対象情報が特許又は実用新案に関するものであれば、コアデータには、請求項の情報、拒絶理由通知書、サーチ会社の検索報告書などが含まれる。すなわち、公報処理手段１３２は、対象情報ごとに生成した推定用データを推定モデルＭ１の入力とし、推定モデルＭ１から出力される公報係数ｅを対象情報に対応づけて公報係数テーブル１２ｄを作成する。

より具体的に、公報処理手段１３２は、対象情報のコアデータに解析処理を施すことにより推定用データを生成する前処理機能を有している。推定用データは、公報の内容の有効性を推定するために推定モデルＭ１の入力とするデータである。公報処理手段１３２は、コアデータに対し、形態素解析などの自然言語処理を施す機能を有している。形態素解析とは、自然言語で書かれたコアデータを、言語上の最小単位である形態素に分割し（分かち書きし）、各形態素のそれぞれの品詞や変化などを判別することである。

公報処理手段１３２は、コアデータから分割した各形態素のそれぞれに、動詞、名詞、形容詞などの品詞の情報を付して分散表現に変換することにより推定用データを生成する。公報処理手段１３２は、推定用データの生成に際して、助詞や助動詞などを削除する機能を有している。公報処理手段１３２は、各形態素のそれぞれに変換処理を施す際、機械学習の鍵となるキー情報を抽出するようにしてもよく、さらに、抽出したキー情報に対して重み付けなどの処理を行ってもよい。もっとも、公報処理手段１３２は、前処理機能により、コアデータの中から不要データを削除するような比較的簡易な解析処理を行うことで推定用データを生成してもよい。不要データとは、例えば数値、改行、又は記号などの、推定モデルＭ１の訓練及び該モデルを用いた演算にとって重要度の低い文字などのことである。

公報処理手段１３２は、コアデータに基づく機械学習により推定モデルＭ１を生成する学習処理機能を有していてもよい。公報処理手段１３２は、学習処理機能により、１日などの任意の期間ごとに推定モデルＭ１の更新処理を行うようにしてもよい。公報処理手段１３２は、例えばＤＮＮ（Deep Neural Network）を用いた教師あり学習により推定モデルＭ１を生成するとよい。公報処理手段１３２は、教師なし学習又は半教師あり学習により推定モデルＭ１を生成してもよい。公報処理手段１３２は、ＧＢＤＴ (Gradient Boosting Decision Tree)を用いた機械学習により推定モデルＭ１を生成してもよい。公報処理手段１３２は、線形回帰、ロジスティック回帰、又は決定木などの回帰の手法により推定モデルＭ１を生成するものであってよい。公報処理手段１３２は、ランダムフォレスト又はサポートベクターマシンなどの分類の手法により推定モデルＭ１を生成するものであってよい。公報処理手段１３２は、上述した複数の機械学習を組み合わせた手法により推定モデルＭ１を生成してもよい。

公報処理手段１３２は、コアデータを予め設定された共通言語に統一化する翻訳処理機能を有していてもよい。この場合、公報処理手段１３２は、対象情報ごとにコアデータを抽出し、抽出したコアデータが共通言語以外の言語で構成されていれば、該コアデータを共通言語に翻訳して翻訳データを生成する。公報処理手段１３２は、コアデータが共通言語を含んでいても、コアデータの一部に共通言語以外の言語が含まれていれば、そのコアデータに対し、部分的に翻訳処理を施して翻訳データを生成する。

公報処理手段１３２は、翻訳処理機能を有する場合、前処理機能により翻訳データに解析処理を施して推定モデルＭ１の入力とする推定用データを生成する。公報処理手段１３２は、翻訳処理機能及び学習処理機能を有する場合、翻訳データに基づく機械学習により推定モデルＭ１を生成する。公報処理手段１３２は、対象情報ごとに生成した推定用データを推定モデルＭ１の入力とし、推定モデルＭ１から出力される公報係数ｅを対象情報に関連付けて公報係数テーブル１２ｄを作成する。

分類処理手段１３３は、各対象情報及び情報提供サーバ群３００等から、図６に例示するような構成の分類情報を抽出する。図６では、対象情報１～Ｎに対応づけて、便宜上、分類コードをＰ_１～Ｐ_Ｎと記載して区別しているが、重複する分類コードが存在する場合もある。図６における階層データの表記は、あくまで例示である。

図７は、階層データと階層係数ｈ１とが関連付けられた階層テーブル１２ｅを概略的に例示した表である。分類処理手段１３３は、各対象情報につき、抽出した階層データを階層テーブル１２ｅに照らして階層係数ｈ１を求める。図７では便宜上、全ての階層係数ｈ１を「△△」としているが、階層テーブル１２ｅでは、階層データごとに異なる階層係数ｈ１が設定される。もっとも、階層テーブル１２ｅは、幾つかの異なる階層データに対し、同一の階層係数ｈ１が設定されてもよい。階層係数ｈ１は、上位層の階層データよりも、下位層の階層データの方が大きくなるよう、段階的に設定するとよい。

図８は、関連ワードＷ１～Ｗｎとワード係数Ｄとが関連付けられたワードテーブル１２ｆを概略的に例示した表である。図８では便宜上、全てのワード係数Ｄを「◆◆」としているが、ワードテーブル１２ｆでは、幾つかの異なる関連ワードＷごとに異なるワード係数Ｄが設定される。もっとも、ワードテーブル１２ｆは、幾つかの異なる関連ワードＷに対し、同一のワード係数Ｄが設定されてもよい。ワード係数Ｄは、関連係数ｄと同じ値に設定されてもよく、異なる値に設定されてもよく、一部が関連係数ｄと同じ値に設定されてもよい。

図９は、抽出数と抽出係数Ｋとが関連付けられた抽出数テーブル１２ｇを概略的に例示した表である。抽出数とは、説明データから抽出される各関連ワードＷの数（説明データに含まれる各関連ワードＷの数）のことである。抽出係数Ｋは、抽出数の想定外の増加が分類スコアＨに与える影響を吸収するためのものである。図９では便宜上、全ての抽出係数Ｋを「▼▼」としているが、抽出数テーブル１２ｇでは、幾つかの異なる抽出数ごとに異なる抽出係数Ｋが設定される。もっとも、抽出数テーブル１２ｇは、幾つかの異なる抽出数に対し、同一の抽出係数Ｋが設定されてもよい。

分類処理手段１３３は、各対象情報について、抽出した説明データと関連データ１２ａの各関連ワードＷとを照合し、照合の結果を用いて説明係数ｈ２を求め、求めた説明係数ｈ２を記憶部１２に記憶させる。より具体的に、分類処理手段１３３は、まず、説明データから関連ワードＷを抽出し、抽出した関連ワードＷの種類及び抽出数に基づいて説明係数ｈ２を求める。

分類処理手段１３３は、ワード処理手段１３１と同様、Ｗｏｒｄ２Ｖｅｃ又はＤｏｃ２Ｖｅｃといった自然言語処理により、関連ワードＷとの意味上の一致度合いに基づいて単語の抽出を行ってもよい。例えば、分類処理手段１３３は、説明データに形態素解析を施して品詞情報付きの形態素に分解した後、各形態素を分散表現にし、これらと関連ワードＷを分散表現にしたベクトルとを比較して、一定以上の一致度合いのものを抽出するとよい。

〔１ワード抽出処理〕
分類処理手段１３３は、説明データから１つだけ抽出された関連ワードＷについては、該関連ワードＷをワードテーブル１２ｆに照らしてワード係数Ｄを抽出し、これを説明係数ｈ２として記憶部１２に記憶させる。

〔複数ワード抽出処理〕
分類処理手段１３３は、説明データから複数の同じ関連ワードＷが抽出された場合、該関連ワードＷをワードテーブル１２ｆに照らしてワード係数Ｄを求めると共に、該関連ワードＷが抽出された数である抽出数を抽出数テーブル１２ｇに照らして抽出係数Ｋを求める。そして、分類処理手段１３３は、求めたワード係数Ｄ及び抽出係数Ｋを用いて説明係数ｈ２を求める。分類処理手段１３３は、例えば、ワード係数Ｄと抽出係数Ｋとの積を説明係数ｈ２とする。

分類処理手段１３３は、説明データから異なる複数の関連ワードＷが検索された場合、各関連ワードＷについて、抽出数が１であれば、上述の１ワード抽出処理で説明係数ｈ２を求めた演算により説明要素係数を導出し、抽出数が複数であれば、上述の複数ワード抽出処理で説明係数ｈ２を求めた演算により説明要素係数を導出する。そして、分類処理手段１３３は、各関連ワードＷそれぞれの説明要素係数を用いて説明係数ｈ２を求める。

分類処理手段１３３は、関連ワードＷが１つも抽出されなかった説明データを有する対象情報について、分類スコアＨの演算対象から除外する機能を有している。分類処理手段１３３は、経営指標との関連性が相対的に低い関連ワードＷだけが抽出された説明データを有する対象情報を、分類スコアＨの演算対象から除外するようにしてもよい。すなわち、対象情報の中には、分類スコアＨが生成されないものも存在する。もっとも、関連ワードＷとは別に、説明文の抽出処理用の抽出ワードを設けてもよい。この場合、抽出ワードと関連ワードＷとの間に重複が生じてもよい。

図１０は、分類コードＱ_１～Ｑ_Ｍと、階層係数ｈ１、説明係数ｈ２、及び分類スコアＨとを例示した説明図である。図１０において、分類コードＱ_１～Ｑ_Ｍは、分類コードＰ_１～Ｐ_Ｎの一部を除外したもの、あるいは分類コードＰ_１～Ｐ_Ｎそのものである。つまり、Ｍは「Ｍ≦Ｎ」の関係を満たす任意の自然数である。分類コードＱ_１～Ｑ_Ｍには、分類コードＰ_１～Ｐ_Ｎと同様、重複するものが存在する場合がある。

分類処理手段１３３は、分類コードＱ_１～Ｑ_Ｍのそれぞれにつき、階層係数ｈ１と説明係数ｈ２とを用いて分類スコアＨを求め、求めた分類スコアＨを対象情報に紐付けて記憶部１２に記憶させる。分類処理手段１３３は、例えば階層係数ｈ１と説明係数ｈ２との積を分類スコアＨとする。対象情報に分類コードが複数付与されている場合、代表的な１つの分類コードについての分類スコアＨを求めてもよく、複数の分類コードそれぞれの分類スコアを上記同様に求め、これらを用いて分類スコアＨを求めてもよい。本実施の形態において、分類処理手段１３３は、複数の分類コードと分類スコアＨとを対応づけた分類テーブル１２ｈを記憶部１２に格納するようになっている。分類スコアＨは、格付処理手段１３４が対象スコアＴを求める際に用いられる。

格付処理手段１３４は、例えば下記式（２）のような演算により、対象情報ごとの対象スコアＴを求めるものである。すなわち、格付処理手段１３４は、関連スコアＵと、分類スコアＨと、分類係数ｇと、公報係数ｅと、被引用係数ｆとを用いて、対象情報ごとの対象スコアＴを求めるように構成することができる。格付処理手段１３４は、分類スコアＨが生成されなかった対象情報については、例えば、下記式（２）のＨを０として対象スコアＴを求める。

関連スコアＵは、ワード処理手段１３１により求められ、ワードテーブル１２ｆに格納されている。分類スコアＨは、分類処理手段１３３により求められ、分類テーブル１２ｈに格納されている。公報係数ｅは、公報処理手段１３２により求められ、公報係数テーブル１２ｄに格納されている。被引用係数ｆは、例えば、被引用数と被引用係数ｆとを対応づけた被引用テーブル（図示せず）のような形式で、予め記憶部１２に記憶されている。この場合、格付処理手段１３４は、収集処理手段１３ａによって収集された被引用情報を被引用テーブルに照らして被引用係数ｆを求める。

そして、格付処理手段１３４は、例えば下記の式（３）のように、対象情報ごとの対象スコアＴの平均をとることにより、企業ごとの評価スコアＴｓを求める。式（３）における「ｍ」は、１つの企業に対応する対象情報の数であり、１又は２の場合もある。

格付処理手段１３４は、企業ごとの評価スコアＴｓを、レーティング用に設定された複数の閾値と比較する等により、評価スコアＴｓを段階的な表現に変換した格付スコアを求める。格付スコアは、例えば「ＡＡＡ」「ＡＡ」「Ａ」「ＢＢＢ」「ＢＢ」「Ｂ」「ＣＣＣ」「ＣＣ」「Ｃ」「Ｄ」のような符号等を用いて表される。

そして、格付処理手段１３４は、評価データベース部１２０に、対象情報に係る企業の情報と、評価スコアＴｓ及び格付スコアとを関連付けて整理した評価データベース１２０ａを構築する。評価データベース部１２０は、評価データベース１２０ａを格納する記憶装置である。格付処理手段１３４は、評価データベース１２０ａに、対象情報ごとに対象スコアＴを対応づけたテーブル情報を格納してもよい。評価データベース部１２０は、評価データベース１２０ａ内の情報を情報端末８０又は格付サーバ１１０などの外部機器へ提供するものである。評価データベース部１２０は、ＲＡＭ及びＲＯＭ、フラッシュメモリ等のＰＲＯＭ、ＳＳＤ、又はＨＤＤ等により構成される。もっとも、評価データベース部１２０は、企業評価装置１０の外部に設けてもよい。

制御部１３は、ＣＰＵ（Central Processing Unit）又はＧＰＵ（Graphics Processing Unit）などの演算装置と、こうした演算装置と協働して上記の各種機能を実現させる企業評価プログラムＰ１とにより構成することができる。すなわち、企業評価プログラムＰ１は、コンピュータとしての制御部１３及び記憶部１２を、収集処理手段１３ａ、名寄せ処理手段１３ｂ、評価処理手段１３ｃとして機能させるためのプログラムである。記憶部１２は、企業評価プログラムを記録したコンピュータ読み取り可能な記録媒体に相当する。もっとも、上記の各種機能のうちの一部は、ハードウェアにより実現してもよい。

続いて、図１１を参照して、本実施の形態における企業評価方法の全体的な処理の流れの一例を説明する。なお、ステップＳ１０３の処理は図１２のフローチャートに対応し、ステップＳ１０４の処理は図１３の処理に対応し、ステップＳ１０５の処理は図１４のフローチャートに対応する。

〔名寄せ処理工程〕
まず、名寄せ処理手段１３ｂは、複数の対象情報のそれぞれに含まれる出願番号と、該各出願番号のそれぞれに紐付く名称データ及びファミリーＩＤを抽出する（ステップＳ１０１）。名寄せ処理手段１３ｂは、抽出したファミリーＩＤに基づいて出願番号及び名称データをリスト化すると共に、同一の企業等に対応する１又は複数の名称データに固有の共通データを対応づけて対象リスト１２ｂを作成する（ステップＳ１０２）。

〔評価処理工程〕
（ワード処理工程）
ワード処理手段１３１は、各対象情報から複数の関連ワードＷを検索し、対象情報ごとに、関連ワードＷに紐付く重み情報を求める。そして、ワード処理手段１３１は、各関連ワードＷの検索数及び重み情報に基づいて、対象情報ごとの関連スコアＵを求める。また、ワード処理手段１３１は、対象情報と関連スコアＵとを対応づけた関連テーブル１２ｃを作成する（ステップＳ１０３）。

（公報処理工程）
公報処理手段１３２は、各対象情報に含まれるコアデータから、対象情報ごとに推定用データを生成する。また、公報処理手段１３２は、生成した推定用データを推定モデルＭ１の入力として、各対象情報それぞれの公報係数ｅを求める。そして、公報処理手段１３２は、対象情報と公報係数ｅとを対応づけた公報係数テーブル１２ｄを作成する（ステップＳ１０４）。

（分類処理工程）
分類処理手段１３３は、各対象情報及び情報提供サーバ群３００等から分類情報を抽出し、分類情報に基づいて、対象情報ごとの分類スコアＨを求める。そして、分類処理手段１３３は、対象情報と分類スコアＨとを対応づけた分類テーブル１２ｈを作成する（ステップＳ１０５）。

（格付処理工程）
次いで、格付処理手段１３４は、各対象情報について、関連テーブル１２ｃから関連スコアＵを読み出し、公報係数テーブル１２ｄから公報係数ｅを読み出し、分類テーブル１２ｈから分類スコアＨを読み出すと共に、記憶部１２から分類係数ｇ及び被引用係数ｆを読み出す。そして、格付処理手段１３４は、読み出した各情報を用いて、例えば式（２）のような演算により、対象スコアＴを求める（ステップＳ１０６）。

格付処理手段１３４は、ファミリーＩＤに基づいて各企業が整理された対象リスト１２ｂを参照し、対象スコアＴを企業ごとに整理する。そして、格付処理手段１３４は、例えば式（３）のような演算により、企業ごとの評価スコアＴｓを求める（ステップＳ１０７）。格付処理手段１３４は、評価スコアＴｓを段階的に判別し、企業ごとの格付スコアを求める（ステップＳ１０８）。そして、格付処理手段１３４は、対象情報に係る企業の情報と、評価スコアＴｓ及び格付スコアとを関連付けて整理した評価データベース１２０ａを構築する（ステップＳ１０９）。

ステップＳ１０３～Ｓ１０５の各処理は、ステップ番号の順に行う必要はない。すなわち、ステップＳ１０３～Ｓ１０５の各処理の順序は適宜変更してもよく、並行処理により実行してもよい。

次に、図１２を参照して、本実施の形態の企業評価方法のうちの、ワード処理工程における動作例を具体的に説明する。ここでは、１つの対象情報についての関連スコアＵを求める動作を説明する。

ワード処理手段１３１は、対象情報から１つの関連ワードＷを検索する（ステップＳ２０１）。ワード処理手段１３１は、該関連ワードＷが検索されなければ（ステップＳ２０２／Ｎｏ）、未検索の他の関連ワードＷの検索処理を開始する（ステップＳ２０１）。

ワード処理手段１３１は、該関連ワードＷが検索されると（ステップＳ２０２／Ｙｅｓ）、検索数が複数であれば（ステップＳ２０３／Ｎｏ）、検索数を緩和テーブルに照らして緩和係数を求める（ステップＳ２０４）。そして、ワード処理手段１３１は、例えば、所在係数と、関連係数ｄと、検索数と緩和係数との積と、を乗じた値を単語スコアとして求める（ステップＳ２０５）。一方、ワード処理手段１３１は、検索数が１であれば（ステップＳ２０３／Ｙｅｓ）、所在係数と関連係数ｄとを乗じた値を単語スコアとして求める（ステップＳ２０５）。

ワード処理手段１３１は、未検索の関連ワードＷがあれば（ステップＳ２０６／Ｙｅｓ）、ステップＳ２０１～Ｓ２０６の一連の処理を繰り返し実行する。ワード処理手段１３１は、全ての関連ワードＷの検索処理が終わると（ステップＳ２０６／Ｎｏ）、求めた全ての単語スコアを積算することにより関連スコアＵを求める（ステップＳ２０７）。ワード処理手段１３１は、全ての対象情報に対し、上記ステップＳ２０１～Ｓ２０７の一連の処理を実行する。

次に、図１３を参照して、本実施の形態の企業評価方法のうちの、公報処理工程での公報係数ｅの導出に係る動作例を具体的に説明する。ここでは、１つの対象情報についての公報係数ｅを求める動作を説明する。

公報処理手段１３２は、対象情報からコアデータを抽出する（ステップＳ３０１）。公報処理手段１３２は、コアデータを共通言語に翻訳して翻訳データを生成する（ステップＳ３０２）。公報処理手段１３２は、翻訳データに自然言語処理などの解析処理を施して推定用データを生成する（ステップＳ３０３）。そして、公報処理手段１３２は、推定用データを推定モデルＭ１の入力とすることにより、推定モデルＭ１の出力値である公報係数ｅを求める（ステップＳ３０４）。

次に、図１４を参照して、本実施の形態の企業評価方法のうちの、分類処理工程における動作例を具体的に説明する。ここでは、１つの対象情報についての分類スコアＨを求める動作を説明する。

分類処理手段１３３は、対象情報から分類情報を抽出すると共に、抽出した分類情報に紐付く階層データ及び説明データを情報提供サーバ群３００等から取得する。階層データは、分類情報の構成から導出してもよい（ステップＳ４０１）。分類処理手段１３３は、取得した説明データに対し、複数の関連ワードＷについての抽出処理を行う（ステップＳ４０２）。分類処理手段１３３は、全ての関連ワードＷが説明データ中に存在しなければ（ステップＳ４０３／Ｎｏ）、分類スコアＨを求めずに該対象情報についての処理を終了する。

分類処理手段１３３は、説明データ中に少なくとも１つの関連ワードＷが存在すれば（ステップＳ４０３／Ｙｅｓ）、関連ワードＷの種類及び抽出数に基づいて説明係数ｈ２を求める。すなわち、分類処理手段１３３は、説明データ中に１つだけ存在する関連ワードＷについては、抽出された関連ワードＷをワードテーブル１２ｆに照らしてワード係数Ｄを抽出し、これを説明係数ｈ２として記憶部１２に記憶させる。分類処理手段１３３は、説明データ中に複数存在する関連ワードＷについては、該関連ワードＷをワードテーブル１２ｆに照らしてワード係数Ｄを求めると共に、該関連ワードＷの抽出数を抽出数テーブル１２ｇに照らして抽出係数Ｋを求める。そして、分類処理手段１３３は、ワード係数Ｄと抽出係数Ｋとを乗ずる等により説明係数ｈ２を求める（ステップＳ４０４）。

分類処理手段１３３は、取得した階層データを階層テーブル１２ｅに照らして階層係数ｈ１を求める（ステップＳ４０５）。分類処理手段１３３は、一種類の関連ワードＷだけが抽出された場合、該関連ワードＷの階層係数ｈ１及び説明係数ｈ２を用いて分類スコアＨを求める。分類処理手段１３３は、複数種類の関連ワードＷが抽出された場合、各関連ワードＷそれぞれの階層係数ｈ１及び説明係数ｈ２を求め、これらを用いて分類スコアＨを求める（ステップＳ４０６）。

以上のように、本実施の形態における企業評価装置１０は、企業に紐付けられた１又は複数の権利関連情報の、経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて企業の評価結果を求める。そのため、企業の評価に産業財産権の観点を採り入れることができる。ここで、産業財産権は、各国の特許庁において審査等が行われているため、登録された権利には客観的な有用性が認められる。また、権利取得のための出願段階であったとしても、出願人は通常、審査が行われることを前提に、客観的な視点から、有用性の確保を意識して出願書類を作成する。よって、産業財産権に関する情報に基づく評価結果は、自ずと客観性の高い情報となる。したがって、企業評価装置１０によれば、経営指標の観点から客観的に企業を評価し、信頼性の高い評価結果を導出することができる。

そして、企業評価装置１０は、企業の評価結果を格付機関に提供することができる。企業の評価結果は、格付サーバ１１０にダウンロードさせるようにしてもよく、紙媒体にプリントアウトして提供してもよい。企業評価装置１０は、企業の評価結果を、例えば、ＭＩＣＲＯＳＯＦＴＥＸＣＥＬ（登録商標）のＸＬＳファイル、ＣＳＶ（Comma-Separated Values）ファイル、テキストファイルなどのデータファイルで提供してもよい。格付機関は、企業評価装置１０による企業の評価結果を、独自の分析結果に組み入れることにより、企業評価に対する客観性及び信頼性を高めることができる。

ところで、ＥＳＧ等の経営指標に関する企業評価には、法整備の不十分さ、創造的側面の評価の困難性、粉飾の可能性、及び全産業共通の評価指標設定の困難性などの課題があるとされている。この点、企業評価装置１０による評価結果には、各国の特許庁等の法的機関が介在する産業財産権に関する情報の内容が反映されており、産業財産権の権利化には創造性も要求される。そして、各国の特許庁における審査等には透明性が確保されており、粉飾の余地はない。すなわち、企業評価装置１０による評価結果は、産業財産権に係る出願書類等及びその審査機関の信頼性を背景とする情報であるため、上記のような従来の課題を解決することができる。

評価処理手段１３ｃは、企業に紐付けられた１又は複数の権利関連情報から、経営指標に関連する複数の関連ワードＷを検索し、検索された関連ワードＷに紐付く重み情報を用いて企業の評価結果を求めることができる。評価処理手段１３ｃは、関連ワードＷに紐付く重み情報として、複数の関連ワードＷのうちの少なくとも１つに設定される関連係数ｄを用いてもよい。これにより、関連ワードＷごとの経営指標との関連性の違いが、企業の評価結果に反映されるため、評価結果の精度を高めることができる。もっとも、関連係数ｄは、全ての関連ワードＷに対し個別に設定されてもよい。

評価処理手段１３ｃは、関連ワードＷに紐付く重み情報として、関連ワードＷの検索数を用いてもよい。評価処理手段１３ｃは、検索数をそのまま用いて対象スコアＴの演算等を行ってもよいが、上限値の設定、緩和係数の設定、又はこれらの組み合わせにより、検索数に変換処理を施した値を用いて対象スコアＴの演算等を行うようにするとよい。これにより、検索数の想定外の増加に伴う評価結果の信頼性低下を防ぐことができる。

評価処理手段１３ｃは、関連ワードＷに紐付く重み情報として、関連ワードＷの所在に応じて設定される所在係数を用いてもよい。所在係数は、明細書に対応する明細係数ａと、要約書に対応し、明細係数ａよりも大きく設定される要約係数ｂと、請求の範囲に対応し、要約係数ｂよりも大きく設定される請求係数ｃと、を含むよう構成することができる。このようにすれば、特許出願等に係る提出書類ごとの重要性の違いなどを、企業の評価結果に反映させることができるため、信頼性の向上を図ることができる。

評価処理手段１３ｃは、公報の内容の有効性の程度に応じて設定される公報係数ｅを用いて企業の評価結果を求めてもよい。このようにすれば、対象情報に係る公報の内容の客観的な有効性を評価結果に反映することができるため、評価結果の客観性をさらに高めることができる。評価処理手段１３ｃは、分類コードごとに設定された分類スコアＨを用いて企業の評価結果を求めてもよい。このようにすれば、分類コードに潜在している経営指標との関連度を、企業の評価結果に落とし込むことができるため、経営指標の観点での企業評価をさらに高精度に行うことができる。

分類スコアＨは、分類コードの階層ごとに、上位層よりも下位層の方が大きくなるよう段階的に設定された階層係数ｈ１を要素としてもよい。このようにすれば、出願書類のより本質的な内容に紐づく下位層の重みが相対的に強化されるため、評価結果の信頼性を高めることができる。分類スコアＨは、分類コードの説明文の内容に基づく説明係数ｈ２を要素としてもよい。このようにすれば、経営指標に関連する用語の説明文中の有無などを、企業の評価結果に加味することができるため、評価精度の向上を図ることができる。評価処理手段１３ｃは、公報係数ｅを求める手法と同様、解析処理を用いた機械学習により説明係数ｈ２を求めてもよい。

また、企業評価装置１０は、知財データベースにアクセスし、リスト化の対象とされている複数の権利関連情報それぞれに含まれる出願番号と、該各出願番号のそれぞれに紐付く名称データ及びファミリーＩＤを抽出する名寄せ処理手段１３ｂを有している。名寄せ処理手段１３ｂは、抽出したファミリーＩＤに基づいて出願番号及び名称データを整理して対象リスト１２ｂを作成するようになっている。より具体的に、名寄せ処理手段１３ｂは、複数の名称データ群の各々を構成する名称データの共通性及び類似性などにより、名称データ群を企業ごとにグループ化し、グループ内の各名称データに対し固有の共通データを付与して対象リスト１２ｂを作成する。ここで、ファミリーＩＤは、パテントファミリー間に共通に付与される識別情報であり、企業名の表記がどんなにかけ離れていても、同一の企業には同一のファミリーＩＤが付与される。したがって、企業評価装置１０によれば、企業名間の類似性の程度にかかわらず、高精度な名寄せ処理を実現することができるため、企業ごとのカテゴライズを精度よく行うことができる。

＜変形例＞
上記においては、分類処理手段１３３が、対象スコアＴを求める際に分類スコアＨを都度求める例を説明したが、これに限定されない。例えば、記憶部１２には、説明文に関連ワードＷもしくは抽出ワードが含まれる分類コードと、分類スコアＨとを対応づけた分類テーブル１２ｈを予め格納しておいてもよい。

図１５は、説明文に関連ワードＷもしくは抽出ワードが含まれる分類コードＲ_１～Ｒ_Ｓ（Ｓは任意の自然数）と、上記同様に分類処理手段１３３によって求められた分類スコアＨとを対応づけた分類テーブル１２ｈを例示したものである。他の構成については、上記の説明と同様であるため省略する。

図１６を参照して、本変形例における分類テーブル１２ｈの作成方法の動作例を説明する。上述した図１４と同等の各工程については同一のステップ番号を付して説明は省略する。ここでは、関連ワードＷを用いる例について説明する。

分類処理手段１３３は、情報提供サーバ群３００等から複数の分類情報を取得する（ステップＳ５０１）。次いで、分類処理手段１３３は、任意の分類情報に含まれる説明データに対し、複数の関連ワードＷについての抽出処理を行う（ステップＳ４０２）。分類処理手段１３３は、説明データ中に少なくとも１つの関連ワードＷが存在すれば（ステップＳ４０３／Ｙｅｓ）、関連ワードＷの種類及び抽出数に基づいて説明係数ｈ２を求める（ステップＳ４０４）。

次いで、分類処理手段１３３は、取得した階層データを階層テーブル１２ｅに照らして階層係数ｈ１を求める（ステップＳ４０５）。そして、分類処理手段１３３は、抽出された関連ワードＷの階層係数ｈ１及び説明係数ｈ２を用いて分類スコアＨを求め、求めた分類スコアＨを分類コードに紐付けて記憶部１２に記憶させる（ステップＳ４０６）。分類処理手段１３３は、抽出処理を行っていない分類情報があるか否かを判定する（ステップＳ５０２）。

分類処理手段１３３は、抽出処理用の全ての関連ワードＷが説明データ中に存在しなければ（ステップＳ４０３／Ｎｏ）、その説明データに紐付く分類情報については、分類スコアＨを求めずに、抽出処理を行っていない分類情報があるか否かを判定する（ステップＳ５０２）。分類処理手段１３３は、抽出処理を行っていない分類情報が存在する限り（ステップＳ５０２／Ｙｅｓ）、ステップＳ４０２～Ｓ４０６の一連の処理を実行し、分類テーブル１２ｈに係るデータベースを構築し、これを更新する。分類処理手段１３３は、全ての分類情報の抽出処理が終了すると（ステップＳ５０２／Ｎｏ）、分類テーブル１２ｈの作成処理を終了する。

次に、図１７を参照して、本変形例の企業評価方法のうち、分類処理工程における動作例について説明する。ここでは、１つの対象情報についての分類スコアＨを求める動作を説明する。

分類処理手段１３３は、対象情報から分類コードを抽出する（ステップＳ６０１）。分類処理手段１３３は、抽出した分類コードを分類テーブル１２ｈに照らして分類スコアＨを求める。分類処理手段１３３は、ステップＳ６０１において、複数の分類コードを抽出した場合、予め設定された優先度の高い１つの分類コードを分類テーブル１２ｈに照らして分類スコアＨを求めてもよい。同場合において、分類処理手段１３３は、予め設定された優先度の高い複数の分類コードを分類テーブル１２ｈに照らし、それぞれの分類スコアＨを求め、これらを用いた所定の演算により該対象情報における分類スコアＨを求めてもよい。もっとも、同場合において、分類処理手段１３３は、抽出した全ての分類コードを分類テーブル１２ｈに照らし、それぞれの分類スコアＨを求め、これらを用いた所定の演算により該対象情報における分類スコアＨを求めてもよい。

以上のように、本変形例における企業評価装置１０は、分類コードと分類スコアＨとを対応づけた分類テーブル１２ｈが予め記憶部１２に格納されている。そのため、分類処理手段１３３は、分類コードを分類テーブル１２ｈに照らすことにより、分類スコアＨの有無を迅速に判定し、格納されている分類スコアＨを抽出することができる。そのため、企業の評価結果に係る演算処理の迅速化を図ることができる。分類テーブル１２ｈは、ネットワークＮを介してＰＣやサーバ等に提供してもよい。この場合、分類テーブル１２ｈは、ＭＩＣＲＯＳＯＦＴＥＸＣＥＬ（登録商標）のＸＬＳファイル、ＣＳＶ（Comma-Separated Values）ファイル、テキストファイルなどのデータファイルで提供してもよい。もっとも、分類テーブル１２ｈは、紙媒体にプリントアウトして提供してもよい。

上述した実施の形態は、企業評価装置、企業評価プログラム、記録媒体、及び企業評価方法における具体例であり、本発明の技術的範囲は、これらの態様に限定されるものではない。例えば、上記の式（１）は、関連スコアＵを求める演算式の一例を示したに過ぎず、種々の変形が可能であり、これに応じて企業評価プログラムの構成も変更される。ワード処理手段１３１は、関連スコアＵの演算に、所在係数、関連係数ｄ_ｋ、及び検索数のうちの何れか１つ又は２つを用いるようにしてもよい。つまり、重み情報は、所在係数、関連係数ｄ_ｋ、及び検索数のうちの少なくとも１つを含む構成としてもよい。

分類処理手段１３３は、抽出係数Ｋを用いずに分類スコアＨを求めてもよい。つまり、重み情報は、抽出係数Ｋを含めずに構成してもよい。上記の説明では、分類スコアＨが階層係数ｈ１と説明係数ｈ２との双方を要素とする例を示したが、これに限定されない。分類処理手段１３３は、階層係数ｈ１をそのまま分類スコアＨとしてもよく、説明係数ｈ２をそのまま分類スコアＨとしてもよい。つまり、重み情報は、階層係数ｈ１及び説明係数ｈ２のうちの少なくとも１つを含むよう構成してもよい。なお、分類処理手段１３３は、階層係数ｈ１を用いない場合に階層データの取得が不要となり、説明係数ｈ２を用いない場合に説明データの取得が不要となる。

上記の式（２）では、対象スコアＴの演算に分類係数ｇが用いられる例を示したが、格付処理手段１３４は、分類係数ｇを用いずに対象スコアＴを求めてもよい。つまり、重み情報は、分類係数ｇを含めずに構成してもよい。格付処理手段１３４は、被引用係数ｆを用いずに対象スコアＴを求めてもよい。つまり、重み情報は、被引用係数ｆを含めずに構成してもよい。格付処理手段１３４は、公報係数ｅを用いずに対象スコアＴを求めてもよい。つまり、重み情報は、公報係数ｅを含めずに構成してもよく、この場合、公報処理手段１３２は不要となる。格付処理手段１３４は、分類スコアＨを用いずに対象スコアＴを求めてもよい。つまり、重み情報は、分類スコアＨを含めずに構成してもよく、この場合、分類処理手段１３３は不要となる。格付処理手段１３４は、関連スコアＵを用いずに対象スコアＴを求めてもよい。つまり、重み情報は、関連スコアＵを含めずに構成してもよく、この場合、ワード処理手段１３１は不要となる。

１０企業評価装置、１１通信部、１２記憶部、１２ａ関連データ、１２ｂ対象リスト、１２ｃ関連テーブル、１２ｄ公報係数テーブル、１２ｅ階層テーブル、１２ｆワードテーブル、１２ｇ抽出数テーブル、１２ｈ分類テーブル、１３制御部、１３ａ収集処理手段、１３ｂ処理手段、１３ｃ評価処理手段、４０情報端末、５０管理端末、８０情報端末、１００格付サーバ群、１１０格付サーバ、１２０評価データベース部、１２０ａ評価データベース、１３１ワード処理手段、１３２公報処理手段、１３３分類処理手段、１３４格付処理手段、２００企業評価システム、３００情報提供サーバ群、Ｄワード係数、Ｈ分類スコア、Ｋ抽出係数、Ｍ１推定モデル、Ｎネットワーク、Ｐ１企業評価プログラム、Ｔ対象スコア、Ｔｓ評価スコア、Ｕ関連スコア、Ｗ関連ワード、ａ明細係数、ｂ要約係数、ｃ請求係数、ｄ関連係数、ｅ公報係数、ｆ被引用係数、ｇ分類係数、ｈ１階層係数、ｈ２説明係数。

Claims

企業に紐付けられた１又は複数の産業財産権に関する情報の、企業の経営方針に組み込まれる経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて、前記経営指標の観点での企業の評価結果を求める評価処理手段を有する、企業評価装置。
前記評価処理手段は、
企業に紐付けられた１又は複数の前記産業財産権に関する情報から、前記経営指標に関連する複数の関連ワードを検索し、検索された前記関連ワードに紐付く前記重み情報を用いて前記評価結果を求めるものである、請求項１に記載の企業評価装置。
前記評価処理手段は、
前記関連ワードに紐付く前記重み情報として、
複数の前記関連ワードのうちの少なくとも１つに設定される関連係数を用いるものである、請求項２に記載の企業評価装置。
前記評価処理手段は、
前記関連ワードに紐付く前記重み情報として、
前記関連ワードの検索数を用いるものである、請求項２又は３に記載の企業評価装置。
前記評価処理手段は、
前記関連ワードに紐付く前記重み情報として、
前記関連ワードの所在に応じて設定される所在係数を用いるものである、請求項２～４の何れか一項に記載の企業評価装置。
前記産業財産権は、特許権又は実用新案権であり、
前記所在係数は、
明細書に対応する明細係数と、
要約書に対応し、前記明細係数よりも大きく設定される要約係数と、
請求の範囲に対応し、前記要約係数よりも大きく設定される請求係数と、を含む、請求項５に記載の企業評価装置。
前記産業財産権は、特許権又は実用新案権であり、
前記評価処理手段は、
公報の内容の有効性の程度に応じて設定される公報係数を用いて前記評価結果を求めるものである、請求項１～６の何れか一項に記載の企業評価装置。
前記産業財産権は、特許権又は実用新案権であり、
前記評価処理手段は、
前記重み情報として、複数の分類コードが階層構造により整理された特許分類における、前記分類コードごとに設定された分類スコアを用いて前記評価結果を求めるものである、請求項１～７の何れか一項に記載の企業評価装置。
前記分類スコアは、
前記分類コードの階層ごとに、上位層よりも下位層の方が大きくなるよう段階的に設定された階層係数を要素とするものである、請求項８に記載の企業評価装置。
前記分類コードには説明文が紐付けられており、
前記分類スコアは、
前記説明文の内容に基づく説明係数を要素とするものである、請求項８又は９に記載の企業評価装置。
企業に紐付けられた１又は複数の産業財産権に関する情報の、企業の経営方針に組み込まれる経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて、前記経営指標の観点での企業の評価結果を求める、企業評価方法。