JP2022176388A - 企業評価装置及び企業評価方法 - Google Patents

企業評価装置及び企業評価方法 Download PDF

Info

Publication number
JP2022176388A
JP2022176388A JP2021082843A JP2021082843A JP2022176388A JP 2022176388 A JP2022176388 A JP 2022176388A JP 2021082843 A JP2021082843 A JP 2021082843A JP 2021082843 A JP2021082843 A JP 2021082843A JP 2022176388 A JP2022176388 A JP 2022176388A
Authority
JP
Japan
Prior art keywords
company
coefficient
evaluation
processing means
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021082843A
Other languages
English (en)
Inventor
光弘 岡本
Mitsuhiro Okamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ipdefine
Ipdefine Ltd
Original Assignee
Ipdefine
Ipdefine Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ipdefine, Ipdefine Ltd filed Critical Ipdefine
Priority to JP2021082843A priority Critical patent/JP2022176388A/ja
Priority to PCT/JP2022/022254 priority patent/WO2022244892A1/ja
Priority to EP22804799.9A priority patent/EP4339874A1/en
Priority to US18/558,350 priority patent/US20240220905A1/en
Publication of JP2022176388A publication Critical patent/JP2022176388A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Technology Law (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】経営指標の観点から客観的に企業を評価し、信頼性の高い評価結果を導出する企業評価装置、企業評価プログラム、記録媒体、及び企業評価方法を提供すること。【解決手段】企業評価装置は、企業に紐付けられた1又は複数の産業財産権に関する情報の、企業の経営方針に組み込まれる経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて企業の評価結果を求める評価処理手段を有している。企業評価プログラムは、コンピュータを評価処理手段として機能させるためのものである。【選択図】図2

Description

本発明は、企業の客観的な評価を行う企業評価装置及び企業評価方法に関する。
近年、ESG又はSDGsのような企業の経営方針に組み込まれる指標(以下、経営指標ともいう。)が、主として機関投資家の間で重要視されている。ここで、ESGとは、環境(Environment)、社会(Social)、ガバナンス(Governance)の頭文字をとったものであり、SDGsとは、Sustainable Development Goals(持続可能な開発目標)の略である。
ただし、どの企業がどのような取り組みを行っているかを投資家等が個別に調査を行うのは困難である。そのため、多様な企業を格付けする格付機関が、経営指標の観点から企業を評価し、その結果を投資家等に提供している。例えば、特許文献1の企業評価遂行装置は、インターネット上で収集したニュース記事をもとに、ESGの観点から企業を評価するようになっている。
特表2021-504789号公報
しかしながら、複数存在する格付機関には、経営指標の観点から企業を評価するための共通の基準がなく、各格付機関が独自の手法で企業の格付を行っているのが実情である。よって、企業の評価結果には、格付機関ごとの主観や価値観が入るおそれがあり、公平感を得られにくいという課題がある。そのため、経営指標の観点から企業を評価する際の客観性及び信頼性を高める手法が望まれている。
本発明は、上述のような課題を解決するためになされたものであり、経営指標の観点から客観的に企業を評価し、信頼性の高い評価結果を導出する企業評価装置及び企業評価方法を提供することを目的とする。
本発明の一態様に係る企業評価装置は、企業に紐付けられた1又は複数の産業財産権に関する情報の、企業の経営方針に組み込まれる経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて、経営指標の観点での企業の評価結果を求める評価処理手段を有するものである。
本発明の一態様に係る企業評価方法は、企業に紐付けられた1又は複数の産業財産権に関する情報の、企業の経営方針に組み込まれる経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて、経営指標の観点での企業の評価結果を求める、という手法を採っている。
本発明は、企業に紐付けられた1又は複数の産業財産権に関する情報の、企業の経営方針に組み込まれる経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて企業の評価結果を求める。そのため、経営指標の観点での企業の評価に産業財産権の観点を採り入れることができる。ここで、産業財産権は、各国の特許庁において審査等が行われているため、登録された権利には客観的な有用性が認められる。また、産業財産権の取得に際し、出願人は通常、審査が行われることを前提に、客観的な有用性を確保すべく出願書類を作成する。よって、産業財産権に関する情報に基づく評価結果は、自ずと客観性の高い情報となる。したがって、本発明によれば、経営指標の観点から客観的に企業を評価し、信頼性の高い評価結果を導出することができる。
本発明の実施の形態に係る企業評価装置及びその周辺構成を例示したブロック図である。 図1の企業評価装置の機能的な構成を例示したブロック図である。 図2の名寄せ処理手段が作成する対象リストの一例を概略的に示す説明図である。 図2の記憶部に記憶される重み情報の、産業財産権に関する情報との関係性を例示した説明図である。 図2の公報処理手段が求める公報係数の概要を例示した説明図である。 図2の分類処理手段が抽出し収集する分類情報の概要を例示した説明図である。 図2の記憶部に格納される階層テーブルを概略的に例示した説明図である。 図2の記憶部に格納されるワードテーブルを概略的に例示した説明図である。 図2の記憶部に格納される抽出数テーブルを概略的に例示した説明図である。 図2の分類処理手段が求める分類スコアに関する説明図である。 本実施の形態における企業評価方法の全体的な処理の流れを例示したフローチャートである。 本実施の形態の企業評価方法のうち、ワード処理工程での関連スコアの導出に係る動作例を示すフローチャートである。 本実施の形態の企業評価方法のうち、公報処理工程での公報係数の導出に係る動作例を示すフローチャートである。 本実施の形態の企業評価方法のうち、分類処理工程における動作例を示すフローチャートである。 本実施の形態の変形例に係る分類テーブルを例示した説明図である。 本実施の形態の変形例に係る分類テーブルの作成方法の動作例を示すフローチャートである。 本実施の形態の変形例に係る企業評価方法のうち、分類処理工程における動作例を示すフローチャートである。
実施の形態.
図1を参照して、本実施の形態における企業評価装置10及びその周辺環境に係る構成例について説明する。企業評価装置10は、評価対象の企業に紐付けられた1又は複数の産業財産権に関する情報の、企業の経営方針に組み込まれる経営指標に対する関連性の度合いを解析するアルゴリズムを用いて、企業を経営指標の観点から評価するものである。企業評価装置10は、機械学習を用いた手法により、企業を経営指標の観点から評価する機能を有している。経営指標は、環境面や社会的側面にも配慮した指標であり、特に中長期的な企業の経営方針に組み込まれるものである。
企業評価装置10は、インターネットなどのネットワークNを介して、管理端末50、1又は複数の情報端末80、格付サーバ群100、及び情報提供サーバ群300などの外部機器との間で通信可能に接続される。企業評価装置10は、オンプレミス型の物理サーバ、もしくはクラウドコンピューティングに基づくクラウドサーバ、又はこれらを組み合わせたシステムなどにより構成される。
ここで、産業財産権とは、知的財産権のうちの、特許権、実用新案権、意匠権、及び商標権のことであるが、本実施の形態では、特に特許権及び実用新案権のことを指す。すなわち、産業財産権に関する情報には、公報(特許公報、特許公開公報、実用新案に関する公報など)、出願人、権利者、発明者又は考案者などの情報の他、出願経過に関する情報や、審査等に関する情報などが含まれる。審査等に関する情報は、産業財産権に係る公報が拒絶理由通知等で引用された数(被引用数)を示す被引用情報を含んでいてもよい。審査等に関する情報は、サーチ会社の検索報告書、及び審査官等による検索処理や審査内容等の情報を含んでいてもよい。
産業財産権に関する情報は、原則として1つの出願に対応し、権利化された出願(存続期間満了等により消滅したものも含む)に関する情報だけでなく、権利化されなかった出願に関する情報や、権利化前の審査中もしくは審査待ちの出願に関する情報も含む。権利化されなかった出願には、所定期間内に審査請求がされなかった出願、及び拒絶査定等が確定した出願などが含まれる。以降では、産業財産権に関する情報のことを「権利関連情報」ともいう。権利関連情報には、少なくとも出願番号の情報が含まれる。
格付サーバ110は、企業の経営方針に組み込まれる指標である経営指標の観点から企業の格付処理を行うものである。すなわち、格付サーバ110は、MSCI(Morgan Stanley Capital International)、FTSE、又はSustainalyticsなどの格付機関が使用し管理するサーバ等である。格付サーバ群100は、1又は複数の格付サーバ110を想定したものである。格付サーバ110は、クラウドコンピューティングに基づくクラウドサーバ、もしくはオンプレミス型の物理サーバ、又はこれらを組み合わせたシステムなどにより構成される。
企業評価装置10は、格付サーバ110と連携して企業評価システム200を構築することができる。すなわち、企業評価装置10は、評価対象とされている企業の権利関連情報に基づいて、該企業を経営指標の観点から評価し、評価の結果を1又は複数の格付サーバ110へ提供するようにしてもよい。これにより、格付サーバ110は、企業の格付処理に産業財産権の観点と組み入れることができるため、顧客に提供する情報の客観性を高めることができる。
管理端末50は、企業評価装置10内の情報を管理するためのものである。管理端末50は、例えば企業評価装置10内のソフトウェア及びデータなどを管理する企業が使用するPC(Personal Computer)である。PCには、タブレットPC、ノートPC、デスクトップ型PCなどが含まれる。管理者は、管理端末50を介して、企業評価装置10内のデータベースの情報、プログラム、及び各種パラメータの調整・変更などを行うことができる。
情報提供サーバ群300は、例えばAPI(Application Programming Interface)を通じて権利関連情報を提供する世界各国のサーバ等を想定したものである。情報提供サーバ群300を構成する各サーバ等では、1つのデータセットである権利関連情報が、出願人もしくは権利者たる企業等に紐付けられている。情報提供サーバ群300を構成する各サーバ等は、クラウドコンピューティングに基づくクラウドサーバ、もしくはオンプレミス型の物理サーバ、又はこれらを組み合わせたシステムなどにより構成される。
情報提供サーバ群300は、1の発明又は考案に係る出願人又は権利者を示す1又は複数の名称データに1つのファミリーIDが紐づけられたデータベース(以下、知財データベースという。)を格納するサーバ装置を含んでいる。昨今は、多くの企業が同じ発明等を複数の国へ特許出願しており、このような特許出願のまとまりのことをパテントファミリーという。ファミリーIDは、パテントファミリー間に共通に付与される識別情報であり、企業名の表記がどんなにかけ離れていても、同一の企業には同一のファミリーIDが付与される。
情報端末80は、ユーザの操作に応じて企業評価装置10又は格付サーバ110が提供するデータベースにアクセスし、該データベース内の種々の情報を取得して表示する。すなわち、情報端末80は、企業の客観的な評価の結果である格付スコア等を企業評価装置10から取得し、取得した格付スコア等の情報をユーザに提供する。情報端末80は、産業財産権に基づく客観性が反映された客観格付スコア等を格付サーバ110から取得し、取得した客観格付スコア等の情報をユーザに提供する。
図2に示すように、企業評価装置10は、通信部11と、記憶部12と、制御部13と、評価データベース部120と、を有している。通信部11は、制御部13が管理端末50、情報端末80、格付サーバ群100、及び情報提供サーバ群300などの外部機器との間で有線又は無線による通信を行うためのインタフェースである。
記憶部12は、企業評価プログラムP1のような制御部13の動作プログラムの他、企業の評価に要する種々のデータ等を記憶する。記憶部12には、企業に紐付けられた1又は複数の権利関連情報の経営指標に対する関連性の度合い(関連度合い)を企業評価に反映させる重み情報が記憶される。
重み情報には、所在係数、関連係数d、検索数、関連スコアU、公報係数e、被引用係数f、分類スコアH、ワード係数Dのうちの少なくとも1つが含まれる。重み情報は、階層係数h1及び説明係数h2のうちの少なくとも1つを含んでもよい。重み情報は、抽出数及び抽出係数Kを含んでもよい。重み情報は、分類係数gを含んでもよい。重み情報は、対象情報に係る出願日や権利化された日付などに基づく経過係数を含んでもよい。重み情報は、検索数の想定外の増加が企業の評価結果に及ぼす影響を緩和するための緩和係数を含んでもよい。
記憶部12は、例えば、関連データ12a、対象リスト12b、緩和テーブル、関連テーブル12c、公報係数テーブル12d、階層テーブル12e、ワードテーブル12f、抽出数テーブル12g、及び分類テーブル12hなどのテーブル情報を記憶する。記憶部12には、権利関連情報に係る公報の内容の有効性を推定するための推定モデルM1が格納されてもよい。記憶部12は、RAM(Random Access Memory)及びROM(Read Only Memory)、フラッシュメモリ等のPROM(Programmable ROM)、SSD(Solid State Drive)、又はHDD(Hard Disk Drive)等により構成することができる。
制御部13は、収集処理手段13aと、名寄せ処理手段13bと、評価処理手段13cと、を有している。収集処理手段13aは、API等を通じて権利関連情報を定期的に収集する。例えば、収集処理手段13aは、世界中の特許公報、特許公開公報、実用新案に関する公報などの情報を権利関連情報として収集する。収集処理手段13aは、収集した権利関連情報に対し、情報の区切りの整理やファイル形式の整備などを施して正規化する機能を有している。収集処理手段13aは、世界中の非特許文献、各種の技術論文・技報、技術標準、企業・研究機関・大学等のWebサイト、Web上の記事・カタログ、ブログ、SNS(social networking service)等のデータを収集し、こうしたデータを公報係数eの導出に用いてもよい。
収集処理手段13aは、格付機関において経営指標との間に関連性があるとされている複数のキーワードを、格付サーバ群100に設けられているデータベースから収集し、これらをまとめて関連データ12aとして記憶部12に記憶させる。以降では、関連データ12aでリスト化されている各キーワードのことを関連ワードWと称する。収集処理手段13aが格付サーバ群100から収集する関連ワードWは、経営指標と権利関連情報との関連性の度合いを評価する際に使用することができる。
収集処理手段13aは、類義語やサジェストキーワード等の周辺語の検索が可能な外部サーバにアクセスし、格付サーバ群100から収集した関連ワードWの周辺語を抽出する機能を有している。収集処理手段13aは、抽出した周辺語についても、関連ワードWとして記憶部12に記憶させてもよい。すなわち、収集処理手段13aは、格付サーバ群100から収集した関連ワードWを類義語等にまで拡張する機能を有している。もっとも、周辺語の検索が可能な類義語辞典等のソフトウェアを記憶部12等に格納しておき、収集処理手段13aが、該ソフトウェアを利用して関連ワードWを拡張するようにしてもよい。
ところで、格付サーバ群100から収集した関連ワードWの周辺語を収集処理手段13aが収集する際、経営指標との関連性が低く、企業の評価に用いるには不適切な周辺語が抽出されることも想定される。そのため、収集処理手段13aは、格付サーバ群100から収集した関連ワードWに紐付く周辺語に対し、経営指標との関連性に基づく取捨選択を行う機能を有している。周辺語の取捨選択機能には、自然言語処理や機械学習を採り入れるとよい。例えば、収集処理手段13aは、Word2Vec(単語をベクトル化する自然言語処理技術)等により、格付サーバ群100から収集した関連ワードWを分散表現に変換すると共に、抽出した周辺語を分散表現に変換し、これらベクトルの一致度合いに基づいて周辺語の取捨選択を行うとよい。
名寄せ処理手段13bは、情報提供サーバ群300の知財データベースにアクセスし、リスト化の対象とされている複数の権利関連情報を抽出して整理するものである。例えば、10年間や20年間といった指定期間の権利関連情報、国単位あるいは地域単位などによる指定エリアの権利関連情報、又は指定エリアにおける指定期間の権利関連情報などがリスト化の対象とされる。リスト化の対象は、管理端末50などから設定することができ、適宜変更することも可能である。
名寄せ処理手段13bは、ある指定期間の権利関連情報がリスト化の対象とされている場合、該指定期間内の権利関連情報に紐付く各情報を抽出する。名寄せ処理手段13bは、例えば日本、米国、中国、及び欧州といった指定エリアの権利関連情報がリスト化の対象とされている場合、該各国の権利関連情報に紐付く各情報を抽出する。名寄せ処理手段13bは、ある指定エリアにおける指定期間の権利関連情報がリスト化の対象とされている場合、該指定エリアにおける該指定期間内の権利関連情報に紐付く各情報を抽出する。もっとも、リスト化の対象は任意に設定することができ、名寄せ処理手段13bは、知財データベース内の全ての権利関連情報をリスト化の対象とすることもできる。
以降では、リスト化の対象とされている権利関連情報のことを「対象情報」ともいう。すなわち、名寄せ処理手段13bは、知財データベースにアクセスし、複数の対象情報それぞれに含まれる出願番号と、該各出願番号のそれぞれに紐付く名称データ及びファミリーIDを抽出する。そして、名寄せ処理手段13bは、ファミリーIDに基づいて出願番号及び名称データを整理して対象リスト12bを作成する。
名寄せ処理手段13bは、1つの企業等が1つの出願だけを行っている場合、同一のファミリーIDに紐付く複数の名称データに、共通の名称及び共通の識別情報のうちの少なくとも一方である共通データを対応づけて、対象リスト12bを作成する。共通データは、ファミリーIDをもとに名称データを名寄せしたものである。
図3の対象リスト12bは、各対象情報について、共通データと出願番号と名称データとファミリーIDとが関連付けられたテーブル情報の例である。図3では、ファミリーIDをF~F(Nは任意の自然数)と略記しており、このNは対象情報の数(対象情報1~N)に相当する。なお、図3では、ファミリーID「F」に紐付く情報を太線で囲い、それ以下の情報についてもファミリーIDごとにソートされていることを示している。対象リスト12bは、登録番号などを含めて構成してもよい。
名寄せ処理手段13bは、ファミリーIDが共通する複数の名称データのうちの1つを共通データとしてもよく、これらに共通する文字等を共通データとしてもよい。名寄せ処理手段13bは、共通データを別途生成してもよい。なお、図3では、ファミリーIDとの対応関係を明確にするため、便宜上、共通データに1~Nを対応づけて用いている。名寄せ処理手段13bは、一企業に対応する複数の名称データに統一感がなくても、ファミリーIDを用いた画一的な処理により、精度のよい名寄せ処理を行うことができる。
ところで、1つの企業等が複数の出願を行っている場合は、1つの企業等に複数のファミリーIDが付与されることになる。また、共同出願の場合は、2以上の企業等に1つのファミリーIDが付与されることになる。そのため、名寄せ処理手段13bは、1つのファミリーIDとこれに紐付く1又は複数の名称データとにより構成される複数の名称データ群を企業ごとにグループ化し、各グループに固有の共通データを付与する機能を有している。すなわち、名寄せ処理手段13bは、複数の名称データ群の各々を構成する名称データの共通性及び類似性などにより、名称データ群(ファミリーID)を企業ごとにグループ化し、図3の例と同様、グループ内の各名称データに固有の共通データを付与して対象リスト12bを作成する。これにより、同一企業等の出願番号及び名称データには同一の共通データが対応づけられるため、企業ごとの評価を精度よく行うことができる。
評価処理手段13cは、企業に紐付けられた1又は複数の権利関連情報の、経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて、経営指標の観点での企業の評価結果を求めるものである。評価処理手段13cは、企業に紐付けられた1又は複数の権利関連情報から、経営指標に関連する複数の関連ワードWを検索し、検索された関連ワードWに紐付く重み情報を用いて企業の評価結果を求める機能を有している。関連ワードWに紐付く重み情報には、複数の関連ワードWのうちの少なくとも1つに設定される関連係数dと、関連ワードWの検索数と、関連ワードWの所在に応じて設定される所在係数と、が含まれる。本実施の形態において、評価処理手段13cは、企業の評価結果として、評価スコアTs及び格付スコアを求めるようになっている。
評価処理手段13cは、関連ワードWと完全に一致する単語を検索してもよいが、検索精度を確保する観点からは、Word2Vec又はDoc2Vecといった自然言語処理により、関連ワードWとの意味上の一致度合いに基づく単語検索を行うとよい。例えば、評価処理手段13cは、権利関連情報の少なくとも一部に形態素解析を施して品詞情報付きの形態素に分解した後、各形態素を分散表現にする(ここで分散表現にされた形態素を要素ベクトルとする。)。そして、評価処理手段13cは、関連ワードWを分散表現にしたベクトルと各要素ベクトルとを比較して、一定以上の一致度合いの要素ベクトルを検索するとよい。つまり、評価処理手段13cは、関連ワードWの類似検索を行うように構成するとよい。
ここで、図4を参照して、重み情報に含まれる種々の重み係数等について説明する。図4では、1つの対象情報について例示しているが、重み情報は全ての対象情報に対し設定される。
図4では、n個の関連ワードW1~Wn(nは任意の自然数)が設定された前提となっており、関連係数dとしては、関連ワードWごとに個別設定された関連係数d~dを例示している。関連係数d~dは、全てが異なる値である必要はなく、幾つかの重複があってもよい。もっとも、図4では、複数の関連ワードWの全てに関連係数dが設定された例を示しているが、これに限らず、複数の関連ワードWのうちの一部だけに関連係数dが設定されてもよい。つまり、関連係数dは、複数の関連ワードWのうちの少なくとも1つに設定されるものであってよい。
ここで、所在とは、関連ワードWが権利関連情報のどの箇所に存在しているかを示す情報である。本実施の形態では、所在係数として、関連ワードWが明細書に存在している場合の重み係数である明細係数aと、関連ワードWが要約書に存在している場合の重み係数である要約係数bと、関連ワードWが請求の範囲に存在している場合の重み係数である請求係数cと、を採用している。
すなわち、所在係数は、明細書に対応する明細係数aと、要約書に対応する要約係数bと、請求の範囲に対応する請求係数cと、を含む。要約係数bは、明細係数aよりも大きく設定するとよく、請求係数cは、要約係数bよりも大きく設定するとよい。つまり、明細係数a、要約係数b、及び請求係数cは、明細係数aが1、要約係数bが3、請求係数cが5といったように、「a<b<c」の関係が成立するようにするとよい。これは、発明の技術的範囲が請求の範囲に基づいて定められる一方で、明細書には権利範囲との関連性が薄い内容も記載されることから、請求の範囲に関連ワードWが存在すれば、経営指標との関連性が相対的に高いと考えられるためである。明細書は、請求の範囲及び要約書に比べて記載量が多く、同じ用語が何度も繰り返して記載され得ることも要因の1つである。なお、要約書には、請求の範囲の要約あるいは抜粋が記載されることも多いため、関連ワードWが要約書に記載されている方が、明細書に記載されているよりも、経営指標との関連性が高いと推察される。もっとも、明細係数a、要約係数b、及び請求係数cは、「a≦b≦c」の関係が成立するように設定してもよい。
公報係数eは、公報の内容の有効性の程度に応じて設定され、産業財産権が特許権又は実用新案権であることを前提とする重み係数である。公報係数eは、予め設定された条件により段階的に設定してもよく、対象情報に含まれる用語等に基づく分析処理により、対象情報ごとに個別に求めてもよい。被引用係数fは、公報の引用回数に応じて設定される重み係数である。分類係数gは、関連スコアUと分類スコアHとの間のバランスを調整するための重み係数であり、関連スコアU及び分類スコアHの演算自体で該バランスを調整すれば、分類係数gは不要となる。
分類スコアHは、産業財産権が特許権又は実用新案権であることを前提として、特許分類における分類コードごとに設定される。特許分類とは、CPC又はIPCなどのことである。こうした特許分類は、複数の分類コードが階層構造により整理されており、各分類コードには説明文が紐付けられている。すなわち、分類コードには、該分類コードの階層の情報である階層データと、該分類コードの説明文の情報である説明データとが紐付けられている。以降では、分類コードとこれに紐付く階層データ及び説明データを合わせた情報を分類情報という。分類スコアHは、階層データに対応づけられた階層係数h1と、説明データに対応づけられる説明係数h2と、を用いた演算により求めることができる。
図2に示すように、評価処理手段13cは、ワード処理手段131と、公報処理手段132と、分類処理手段133と、格付処理手段134と、を有している。ワード処理手段131は、各対象処理手段それぞれについて、下記式(1)のような演算により、対象情報ごとの関連スコアUを求める。
Figure 2022176388000002
すなわち、ワード処理手段131は、対象情報から各関連ワードWを検索し、関連ワードWの所在と共に、その検索数を求める。本実施の形態において、ワード処理手段131は、自然言語処理に基づく関連ワードWの類似検索を行う機能を有している。そして、ワード処理手段131は、全ての関連ワードWについて、所在係数(a~c)と関連係数dと検索数(X~Z)とを求めると共に、これらの積を合算して関連スコアUを求める。ワード処理手段131は、求めた関連スコアUを対象情報に対応づけて記憶部12に記憶させる。例えば、ワード処理手段131は、対象情報と関連スコアUとを対応づけた関連テーブル12cを作成する。
ところで、発明の名称や構成部材の名称など、明細書等の中で多用され得るものに関連ワードW(類似も含む)が含まれる場合は、検索数が想定以上に多くなり、関連スコアUの信頼性が低下するおそれがある。そのため、例えば検索数の上限値を設定しておき、ワード処理手段131は、検索数が上限値を超えた場合、関連スコアUの演算に用いる検索数を上限値に置き換えるようにしてもよい。
また、検索数の想定外の過多に伴う関連スコアUの信頼性低下を抑制するため、検索数の増加が関連スコアUに及ぼす影響を緩和する緩和係数を予め設定し、記憶部12に記憶させてもよい。例えば、検索数と緩和係数とを関連付けた緩和テーブルを記憶部12に格納しておき、ワード処理手段131は、求めた検索数を緩和テーブルに照らして緩和係数を求めるとよい。この場合、ワード処理手段131は、例えば、検索数に緩和係数を乗じた値を該検索数の代わりに用いて関連スコアUの演算を行うとよい。さらに、ワード処理手段131は、検索数の上限値を用いる手法と、緩和係数を用いる手法とを併用するように構成してもよい。もっとも、関連スコアUの演算には、関連ワードWが検索されたか否かだけを反映させるようにしてもよい。すなわち、ワード処理手段131は、関連スコアUの演算において、検索数が1の場合と検索数が複数の場合とを同列に扱うようにしてもよい。
公報処理手段132は、対象情報ごとの公報係数eを求めるものである。図5は、公報係数eの概要を例示した説明図である。図5に示すように、公報係数eは、公報係数eと公報係数eと公報係数eと公報係数eとを含むように構成することができる。公報係数eは、特許公報に対応する。公報係数eは、特許公開公報のうちで有効性が相対的に高いとされるものに対応する。公報係数eは、特許公開公報のうちで有効性が相対的に低いとされるもの又は実用新案に関する公報のうち有効性が相対的に低いとされるものに対応する。公報係数eは、特許公開公報のうちで有効性が極めて低いとされるもの又は実用新案に関する公報のうちで有効性が相対的に低いとされるものに対応する。公報係数eは、公報係数eよりも小さく設定し、公報係数eは、公報係数eよりも小さく設定し、公報係数eは、公報係数eよりも小さく設定するとよい。
ところで、公報係数eと公報係数e~eとの判別処理は、公報種別、すなわち各公報に付されているコード等により画一的に行うことができる。一方、公報係数eと公報係数eと公報係数eとの判別は、公報種別だけを用いて行うよりも、機械学習等に基づく分析処理を採り入れた方が判別精度が向上する。そのため、公報処理手段132は、対象情報ごとに所定の分析処理を行って公報係数eを求める機能を有している。公報処理手段132は、対象情報と公報係数eとを対応づけた公報係数テーブル12dを作成するとよい。
本実施の形態において、公報処理手段132は、記憶部12又は外部の記憶装置に格納された推定モデルM1を用いて公報係数eを求めるようになっている。推定モデルM1は、公報の内容の有効性を示す公報係数eを出力する学習済モデルである。公報の内容には、請求の範囲及び明細書のうちの少なくとも一方が含まれ、要約書や図面が含まれてもよい。公報の内容の有効性は、新規性及び進歩性等の観点、すなわち無効可能性などの観点から分析され、審査等に関する情報も分析対象とされる。推定モデルM1は、公報係数eと共に、公報係数eの導出の根拠となった情報を出力するように構成してもよい。図2では、推定モデルM1が記憶部12に格納されている例を示している。
対象情報は、推定モデルM1の入力とする推定用データの元となるコアデータと、補助的あるいは付随的なデータである補助データと、を含んでいる。対象情報が特許又は実用新案に関するものであれば、コアデータには、請求項の情報、拒絶理由通知書、サーチ会社の検索報告書などが含まれる。すなわち、公報処理手段132は、対象情報ごとに生成した推定用データを推定モデルM1の入力とし、推定モデルM1から出力される公報係数eを対象情報に対応づけて公報係数テーブル12dを作成する。
より具体的に、公報処理手段132は、対象情報のコアデータに解析処理を施すことにより推定用データを生成する前処理機能を有している。推定用データは、公報の内容の有効性を推定するために推定モデルM1の入力とするデータである。公報処理手段132は、コアデータに対し、形態素解析などの自然言語処理を施す機能を有している。形態素解析とは、自然言語で書かれたコアデータを、言語上の最小単位である形態素に分割し(分かち書きし)、各形態素のそれぞれの品詞や変化などを判別することである。
公報処理手段132は、コアデータから分割した各形態素のそれぞれに、動詞、名詞、形容詞などの品詞の情報を付して分散表現に変換することにより推定用データを生成する。公報処理手段132は、推定用データの生成に際して、助詞や助動詞などを削除する機能を有している。公報処理手段132は、各形態素のそれぞれに変換処理を施す際、機械学習の鍵となるキー情報を抽出するようにしてもよく、さらに、抽出したキー情報に対して重み付けなどの処理を行ってもよい。もっとも、公報処理手段132は、前処理機能により、コアデータの中から不要データを削除するような比較的簡易な解析処理を行うことで推定用データを生成してもよい。不要データとは、例えば数値、改行、又は記号などの、推定モデルM1の訓練及び該モデルを用いた演算にとって重要度の低い文字などのことである。
公報処理手段132は、コアデータに基づく機械学習により推定モデルM1を生成する学習処理機能を有していてもよい。公報処理手段132は、学習処理機能により、1日などの任意の期間ごとに推定モデルM1の更新処理を行うようにしてもよい。公報処理手段132は、例えばDNN(Deep Neural Network)を用いた教師あり学習により推定モデルM1を生成するとよい。公報処理手段132は、教師なし学習又は半教師あり学習により推定モデルM1を生成してもよい。公報処理手段132は、GBDT (Gradient Boosting Decision Tree)を用いた機械学習により推定モデルM1を生成してもよい。公報処理手段132は、線形回帰、ロジスティック回帰、又は決定木などの回帰の手法により推定モデルM1を生成するものであってよい。公報処理手段132は、ランダムフォレスト又はサポートベクターマシンなどの分類の手法により推定モデルM1を生成するものであってよい。公報処理手段132は、上述した複数の機械学習を組み合わせた手法により推定モデルM1を生成してもよい。
公報処理手段132は、コアデータを予め設定された共通言語に統一化する翻訳処理機能を有していてもよい。この場合、公報処理手段132は、対象情報ごとにコアデータを抽出し、抽出したコアデータが共通言語以外の言語で構成されていれば、該コアデータを共通言語に翻訳して翻訳データを生成する。公報処理手段132は、コアデータが共通言語を含んでいても、コアデータの一部に共通言語以外の言語が含まれていれば、そのコアデータに対し、部分的に翻訳処理を施して翻訳データを生成する。
公報処理手段132は、翻訳処理機能を有する場合、前処理機能により翻訳データに解析処理を施して推定モデルM1の入力とする推定用データを生成する。公報処理手段132は、翻訳処理機能及び学習処理機能を有する場合、翻訳データに基づく機械学習により推定モデルM1を生成する。公報処理手段132は、対象情報ごとに生成した推定用データを推定モデルM1の入力とし、推定モデルM1から出力される公報係数eを対象情報に関連付けて公報係数テーブル12dを作成する。
分類処理手段133は、各対象情報及び情報提供サーバ群300等から、図6に例示するような構成の分類情報を抽出する。図6では、対象情報1~Nに対応づけて、便宜上、分類コードをP~Pと記載して区別しているが、重複する分類コードが存在する場合もある。図6における階層データの表記は、あくまで例示である。
図7は、階層データと階層係数h1とが関連付けられた階層テーブル12eを概略的に例示した表である。分類処理手段133は、各対象情報につき、抽出した階層データを階層テーブル12eに照らして階層係数h1を求める。図7では便宜上、全ての階層係数h1を「△△」としているが、階層テーブル12eでは、階層データごとに異なる階層係数h1が設定される。もっとも、階層テーブル12eは、幾つかの異なる階層データに対し、同一の階層係数h1が設定されてもよい。階層係数h1は、上位層の階層データよりも、下位層の階層データの方が大きくなるよう、段階的に設定するとよい。
図8は、関連ワードW1~Wnとワード係数Dとが関連付けられたワードテーブル12fを概略的に例示した表である。図8では便宜上、全てのワード係数Dを「◆◆」としているが、ワードテーブル12fでは、幾つかの異なる関連ワードWごとに異なるワード係数Dが設定される。もっとも、ワードテーブル12fは、幾つかの異なる関連ワードWに対し、同一のワード係数Dが設定されてもよい。ワード係数Dは、関連係数dと同じ値に設定されてもよく、異なる値に設定されてもよく、一部が関連係数dと同じ値に設定されてもよい。
図9は、抽出数と抽出係数Kとが関連付けられた抽出数テーブル12gを概略的に例示した表である。抽出数とは、説明データから抽出される各関連ワードWの数(説明データに含まれる各関連ワードWの数)のことである。抽出係数Kは、抽出数の想定外の増加が分類スコアHに与える影響を吸収するためのものである。図9では便宜上、全ての抽出係数Kを「▼▼」としているが、抽出数テーブル12gでは、幾つかの異なる抽出数ごとに異なる抽出係数Kが設定される。もっとも、抽出数テーブル12gは、幾つかの異なる抽出数に対し、同一の抽出係数Kが設定されてもよい。
分類処理手段133は、各対象情報について、抽出した説明データと関連データ12aの各関連ワードWとを照合し、照合の結果を用いて説明係数h2を求め、求めた説明係数h2を記憶部12に記憶させる。より具体的に、分類処理手段133は、まず、説明データから関連ワードWを抽出し、抽出した関連ワードWの種類及び抽出数に基づいて説明係数h2を求める。
分類処理手段133は、ワード処理手段131と同様、Word2Vec又はDoc2Vecといった自然言語処理により、関連ワードWとの意味上の一致度合いに基づいて単語の抽出を行ってもよい。例えば、分類処理手段133は、説明データに形態素解析を施して品詞情報付きの形態素に分解した後、各形態素を分散表現にし、これらと関連ワードWを分散表現にしたベクトルとを比較して、一定以上の一致度合いのものを抽出するとよい。
〔1ワード抽出処理〕
分類処理手段133は、説明データから1つだけ抽出された関連ワードWについては、該関連ワードWをワードテーブル12fに照らしてワード係数Dを抽出し、これを説明係数h2として記憶部12に記憶させる。
〔複数ワード抽出処理〕
分類処理手段133は、説明データから複数の同じ関連ワードWが抽出された場合、該関連ワードWをワードテーブル12fに照らしてワード係数Dを求めると共に、該関連ワードWが抽出された数である抽出数を抽出数テーブル12gに照らして抽出係数Kを求める。そして、分類処理手段133は、求めたワード係数D及び抽出係数Kを用いて説明係数h2を求める。分類処理手段133は、例えば、ワード係数Dと抽出係数Kとの積を説明係数h2とする。
分類処理手段133は、説明データから異なる複数の関連ワードWが検索された場合、各関連ワードWについて、抽出数が1であれば、上述の1ワード抽出処理で説明係数h2を求めた演算により説明要素係数を導出し、抽出数が複数であれば、上述の複数ワード抽出処理で説明係数h2を求めた演算により説明要素係数を導出する。そして、分類処理手段133は、各関連ワードWそれぞれの説明要素係数を用いて説明係数h2を求める。
分類処理手段133は、関連ワードWが1つも抽出されなかった説明データを有する対象情報について、分類スコアHの演算対象から除外する機能を有している。分類処理手段133は、経営指標との関連性が相対的に低い関連ワードWだけが抽出された説明データを有する対象情報を、分類スコアHの演算対象から除外するようにしてもよい。すなわち、対象情報の中には、分類スコアHが生成されないものも存在する。もっとも、関連ワードWとは別に、説明文の抽出処理用の抽出ワードを設けてもよい。この場合、抽出ワードと関連ワードWとの間に重複が生じてもよい。
図10は、分類コードQ~Qと、階層係数h1、説明係数h2、及び分類スコアHとを例示した説明図である。図10において、分類コードQ~Qは、分類コードP~Pの一部を除外したもの、あるいは分類コードP~Pそのものである。つまり、Mは「M≦N」の関係を満たす任意の自然数である。分類コードQ~Qには、分類コードP~Pと同様、重複するものが存在する場合がある。
分類処理手段133は、分類コードQ~Qのそれぞれにつき、階層係数h1と説明係数h2とを用いて分類スコアHを求め、求めた分類スコアHを対象情報に紐付けて記憶部12に記憶させる。分類処理手段133は、例えば階層係数h1と説明係数h2との積を分類スコアHとする。対象情報に分類コードが複数付与されている場合、代表的な1つの分類コードについての分類スコアHを求めてもよく、複数の分類コードそれぞれの分類スコアを上記同様に求め、これらを用いて分類スコアHを求めてもよい。本実施の形態において、分類処理手段133は、複数の分類コードと分類スコアHとを対応づけた分類テーブル12hを記憶部12に格納するようになっている。分類スコアHは、格付処理手段134が対象スコアTを求める際に用いられる。
格付処理手段134は、例えば下記式(2)のような演算により、対象情報ごとの対象スコアTを求めるものである。すなわち、格付処理手段134は、関連スコアUと、分類スコアHと、分類係数gと、公報係数eと、被引用係数fとを用いて、対象情報ごとの対象スコアTを求めるように構成することができる。格付処理手段134は、分類スコアHが生成されなかった対象情報については、例えば、下記式(2)のHを0として対象スコアTを求める。
Figure 2022176388000003
関連スコアUは、ワード処理手段131により求められ、ワードテーブル12fに格納されている。分類スコアHは、分類処理手段133により求められ、分類テーブル12hに格納されている。公報係数eは、公報処理手段132により求められ、公報係数テーブル12dに格納されている。被引用係数fは、例えば、被引用数と被引用係数fとを対応づけた被引用テーブル(図示せず)のような形式で、予め記憶部12に記憶されている。この場合、格付処理手段134は、収集処理手段13aによって収集された被引用情報を被引用テーブルに照らして被引用係数fを求める。
そして、格付処理手段134は、例えば下記の式(3)のように、対象情報ごとの対象スコアTの平均をとることにより、企業ごとの評価スコアTsを求める。式(3)における「m」は、1つの企業に対応する対象情報の数であり、1又は2の場合もある。
Figure 2022176388000004
格付処理手段134は、企業ごとの評価スコアTsを、レーティング用に設定された複数の閾値と比較する等により、評価スコアTsを段階的な表現に変換した格付スコアを求める。格付スコアは、例えば「AAA」「AA」「A」「BBB」「BB」「B」「CCC」「CC」「C」「D」のような符号等を用いて表される。
そして、格付処理手段134は、評価データベース部120に、対象情報に係る企業の情報と、評価スコアTs及び格付スコアとを関連付けて整理した評価データベース120aを構築する。評価データベース部120は、評価データベース120aを格納する記憶装置である。格付処理手段134は、評価データベース120aに、対象情報ごとに対象スコアTを対応づけたテーブル情報を格納してもよい。評価データベース部120は、評価データベース120a内の情報を情報端末80又は格付サーバ110などの外部機器へ提供するものである。評価データベース部120は、RAM及びROM、フラッシュメモリ等のPROM、SSD、又はHDD等により構成される。もっとも、評価データベース部120は、企業評価装置10の外部に設けてもよい。
制御部13は、CPU(Central Processing Unit)又はGPU(Graphics Processing Unit)などの演算装置と、こうした演算装置と協働して上記の各種機能を実現させる企業評価プログラムP1とにより構成することができる。すなわち、企業評価プログラムP1は、コンピュータとしての制御部13及び記憶部12を、収集処理手段13a、名寄せ処理手段13b、評価処理手段13cとして機能させるためのプログラムである。記憶部12は、企業評価プログラムを記録したコンピュータ読み取り可能な記録媒体に相当する。もっとも、上記の各種機能のうちの一部は、ハードウェアにより実現してもよい。
続いて、図11を参照して、本実施の形態における企業評価方法の全体的な処理の流れの一例を説明する。なお、ステップS103の処理は図12のフローチャートに対応し、ステップS104の処理は図13の処理に対応し、ステップS105の処理は図14のフローチャートに対応する。
〔名寄せ処理工程〕
まず、名寄せ処理手段13bは、複数の対象情報のそれぞれに含まれる出願番号と、該各出願番号のそれぞれに紐付く名称データ及びファミリーIDを抽出する(ステップS101)。名寄せ処理手段13bは、抽出したファミリーIDに基づいて出願番号及び名称データをリスト化すると共に、同一の企業等に対応する1又は複数の名称データに固有の共通データを対応づけて対象リスト12bを作成する(ステップS102)。
〔評価処理工程〕
(ワード処理工程)
ワード処理手段131は、各対象情報から複数の関連ワードWを検索し、対象情報ごとに、関連ワードWに紐付く重み情報を求める。そして、ワード処理手段131は、各関連ワードWの検索数及び重み情報に基づいて、対象情報ごとの関連スコアUを求める。また、ワード処理手段131は、対象情報と関連スコアUとを対応づけた関連テーブル12cを作成する(ステップS103)。
(公報処理工程)
公報処理手段132は、各対象情報に含まれるコアデータから、対象情報ごとに推定用データを生成する。また、公報処理手段132は、生成した推定用データを推定モデルM1の入力として、各対象情報それぞれの公報係数eを求める。そして、公報処理手段132は、対象情報と公報係数eとを対応づけた公報係数テーブル12dを作成する(ステップS104)。
(分類処理工程)
分類処理手段133は、各対象情報及び情報提供サーバ群300等から分類情報を抽出し、分類情報に基づいて、対象情報ごとの分類スコアHを求める。そして、分類処理手段133は、対象情報と分類スコアHとを対応づけた分類テーブル12hを作成する(ステップS105)。
(格付処理工程)
次いで、格付処理手段134は、各対象情報について、関連テーブル12cから関連スコアUを読み出し、公報係数テーブル12dから公報係数eを読み出し、分類テーブル12hから分類スコアHを読み出すと共に、記憶部12から分類係数g及び被引用係数fを読み出す。そして、格付処理手段134は、読み出した各情報を用いて、例えば式(2)のような演算により、対象スコアTを求める(ステップS106)。
格付処理手段134は、ファミリーIDに基づいて各企業が整理された対象リスト12bを参照し、対象スコアTを企業ごとに整理する。そして、格付処理手段134は、例えば式(3)のような演算により、企業ごとの評価スコアTsを求める(ステップS107)。格付処理手段134は、評価スコアTsを段階的に判別し、企業ごとの格付スコアを求める(ステップS108)。そして、格付処理手段134は、対象情報に係る企業の情報と、評価スコアTs及び格付スコアとを関連付けて整理した評価データベース120aを構築する(ステップS109)。
ステップS103~S105の各処理は、ステップ番号の順に行う必要はない。すなわち、ステップS103~S105の各処理の順序は適宜変更してもよく、並行処理により実行してもよい。
次に、図12を参照して、本実施の形態の企業評価方法のうちの、ワード処理工程における動作例を具体的に説明する。ここでは、1つの対象情報についての関連スコアUを求める動作を説明する。
ワード処理手段131は、対象情報から1つの関連ワードWを検索する(ステップS201)。ワード処理手段131は、該関連ワードWが検索されなければ(ステップS202/No)、未検索の他の関連ワードWの検索処理を開始する(ステップS201)。
ワード処理手段131は、該関連ワードWが検索されると(ステップS202/Yes)、検索数が複数であれば(ステップS203/No)、検索数を緩和テーブルに照らして緩和係数を求める(ステップS204)。そして、ワード処理手段131は、例えば、所在係数と、関連係数dと、検索数と緩和係数との積と、を乗じた値を単語スコアとして求める(ステップS205)。一方、ワード処理手段131は、検索数が1であれば(ステップS203/Yes)、所在係数と関連係数dとを乗じた値を単語スコアとして求める(ステップS205)。
ワード処理手段131は、未検索の関連ワードWがあれば(ステップS206/Yes)、ステップS201~S206の一連の処理を繰り返し実行する。ワード処理手段131は、全ての関連ワードWの検索処理が終わると(ステップS206/No)、求めた全ての単語スコアを積算することにより関連スコアUを求める(ステップS207)。ワード処理手段131は、全ての対象情報に対し、上記ステップS201~S207の一連の処理を実行する。
次に、図13を参照して、本実施の形態の企業評価方法のうちの、公報処理工程での公報係数eの導出に係る動作例を具体的に説明する。ここでは、1つの対象情報についての公報係数eを求める動作を説明する。
公報処理手段132は、対象情報からコアデータを抽出する(ステップS301)。公報処理手段132は、コアデータを共通言語に翻訳して翻訳データを生成する(ステップS302)。公報処理手段132は、翻訳データに自然言語処理などの解析処理を施して推定用データを生成する(ステップS303)。そして、公報処理手段132は、推定用データを推定モデルM1の入力とすることにより、推定モデルM1の出力値である公報係数eを求める(ステップS304)。
次に、図14を参照して、本実施の形態の企業評価方法のうちの、分類処理工程における動作例を具体的に説明する。ここでは、1つの対象情報についての分類スコアHを求める動作を説明する。
分類処理手段133は、対象情報から分類情報を抽出すると共に、抽出した分類情報に紐付く階層データ及び説明データを情報提供サーバ群300等から取得する。階層データは、分類情報の構成から導出してもよい(ステップS401)。分類処理手段133は、取得した説明データに対し、複数の関連ワードWについての抽出処理を行う(ステップS402)。分類処理手段133は、全ての関連ワードWが説明データ中に存在しなければ(ステップS403/No)、分類スコアHを求めずに該対象情報についての処理を終了する。
分類処理手段133は、説明データ中に少なくとも1つの関連ワードWが存在すれば(ステップS403/Yes)、関連ワードWの種類及び抽出数に基づいて説明係数h2を求める。すなわち、分類処理手段133は、説明データ中に1つだけ存在する関連ワードWについては、抽出された関連ワードWをワードテーブル12fに照らしてワード係数Dを抽出し、これを説明係数h2として記憶部12に記憶させる。分類処理手段133は、説明データ中に複数存在する関連ワードWについては、該関連ワードWをワードテーブル12fに照らしてワード係数Dを求めると共に、該関連ワードWの抽出数を抽出数テーブル12gに照らして抽出係数Kを求める。そして、分類処理手段133は、ワード係数Dと抽出係数Kとを乗ずる等により説明係数h2を求める(ステップS404)。
分類処理手段133は、取得した階層データを階層テーブル12eに照らして階層係数h1を求める(ステップS405)。分類処理手段133は、一種類の関連ワードWだけが抽出された場合、該関連ワードWの階層係数h1及び説明係数h2を用いて分類スコアHを求める。分類処理手段133は、複数種類の関連ワードWが抽出された場合、各関連ワードWそれぞれの階層係数h1及び説明係数h2を求め、これらを用いて分類スコアHを求める(ステップS406)。
以上のように、本実施の形態における企業評価装置10は、企業に紐付けられた1又は複数の権利関連情報の、経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて企業の評価結果を求める。そのため、企業の評価に産業財産権の観点を採り入れることができる。ここで、産業財産権は、各国の特許庁において審査等が行われているため、登録された権利には客観的な有用性が認められる。また、権利取得のための出願段階であったとしても、出願人は通常、審査が行われることを前提に、客観的な視点から、有用性の確保を意識して出願書類を作成する。よって、産業財産権に関する情報に基づく評価結果は、自ずと客観性の高い情報となる。したがって、企業評価装置10によれば、経営指標の観点から客観的に企業を評価し、信頼性の高い評価結果を導出することができる。
そして、企業評価装置10は、企業の評価結果を格付機関に提供することができる。企業の評価結果は、格付サーバ110にダウンロードさせるようにしてもよく、紙媒体にプリントアウトして提供してもよい。企業評価装置10は、企業の評価結果を、例えば、MICROSOFT EXCEL(登録商標)のXLSファイル、CSV(Comma-Separated Values)ファイル、テキストファイルなどのデータファイルで提供してもよい。格付機関は、企業評価装置10による企業の評価結果を、独自の分析結果に組み入れることにより、企業評価に対する客観性及び信頼性を高めることができる。
ところで、ESG等の経営指標に関する企業評価には、法整備の不十分さ、創造的側面の評価の困難性、粉飾の可能性、及び全産業共通の評価指標設定の困難性などの課題があるとされている。この点、企業評価装置10による評価結果には、各国の特許庁等の法的機関が介在する産業財産権に関する情報の内容が反映されており、産業財産権の権利化には創造性も要求される。そして、各国の特許庁における審査等には透明性が確保されており、粉飾の余地はない。すなわち、企業評価装置10による評価結果は、産業財産権に係る出願書類等及びその審査機関の信頼性を背景とする情報であるため、上記のような従来の課題を解決することができる。
評価処理手段13cは、企業に紐付けられた1又は複数の権利関連情報から、経営指標に関連する複数の関連ワードWを検索し、検索された関連ワードWに紐付く重み情報を用いて企業の評価結果を求めることができる。評価処理手段13cは、関連ワードWに紐付く重み情報として、複数の関連ワードWのうちの少なくとも1つに設定される関連係数dを用いてもよい。これにより、関連ワードWごとの経営指標との関連性の違いが、企業の評価結果に反映されるため、評価結果の精度を高めることができる。もっとも、関連係数dは、全ての関連ワードWに対し個別に設定されてもよい。
評価処理手段13cは、関連ワードWに紐付く重み情報として、関連ワードWの検索数を用いてもよい。評価処理手段13cは、検索数をそのまま用いて対象スコアTの演算等を行ってもよいが、上限値の設定、緩和係数の設定、又はこれらの組み合わせにより、検索数に変換処理を施した値を用いて対象スコアTの演算等を行うようにするとよい。これにより、検索数の想定外の増加に伴う評価結果の信頼性低下を防ぐことができる。
評価処理手段13cは、関連ワードWに紐付く重み情報として、関連ワードWの所在に応じて設定される所在係数を用いてもよい。所在係数は、明細書に対応する明細係数aと、要約書に対応し、明細係数aよりも大きく設定される要約係数bと、請求の範囲に対応し、要約係数bよりも大きく設定される請求係数cと、を含むよう構成することができる。このようにすれば、特許出願等に係る提出書類ごとの重要性の違いなどを、企業の評価結果に反映させることができるため、信頼性の向上を図ることができる。
評価処理手段13cは、公報の内容の有効性の程度に応じて設定される公報係数eを用いて企業の評価結果を求めてもよい。このようにすれば、対象情報に係る公報の内容の客観的な有効性を評価結果に反映することができるため、評価結果の客観性をさらに高めることができる。評価処理手段13cは、分類コードごとに設定された分類スコアHを用いて企業の評価結果を求めてもよい。このようにすれば、分類コードに潜在している経営指標との関連度を、企業の評価結果に落とし込むことができるため、経営指標の観点での企業評価をさらに高精度に行うことができる。
分類スコアHは、分類コードの階層ごとに、上位層よりも下位層の方が大きくなるよう段階的に設定された階層係数h1を要素としてもよい。このようにすれば、出願書類のより本質的な内容に紐づく下位層の重みが相対的に強化されるため、評価結果の信頼性を高めることができる。分類スコアHは、分類コードの説明文の内容に基づく説明係数h2を要素としてもよい。このようにすれば、経営指標に関連する用語の説明文中の有無などを、企業の評価結果に加味することができるため、評価精度の向上を図ることができる。評価処理手段13cは、公報係数eを求める手法と同様、解析処理を用いた機械学習により説明係数h2を求めてもよい。
また、企業評価装置10は、知財データベースにアクセスし、リスト化の対象とされている複数の権利関連情報それぞれに含まれる出願番号と、該各出願番号のそれぞれに紐付く名称データ及びファミリーIDを抽出する名寄せ処理手段13bを有している。名寄せ処理手段13bは、抽出したファミリーIDに基づいて出願番号及び名称データを整理して対象リスト12bを作成するようになっている。より具体的に、名寄せ処理手段13bは、複数の名称データ群の各々を構成する名称データの共通性及び類似性などにより、名称データ群を企業ごとにグループ化し、グループ内の各名称データに対し固有の共通データを付与して対象リスト12bを作成する。ここで、ファミリーIDは、パテントファミリー間に共通に付与される識別情報であり、企業名の表記がどんなにかけ離れていても、同一の企業には同一のファミリーIDが付与される。したがって、企業評価装置10によれば、企業名間の類似性の程度にかかわらず、高精度な名寄せ処理を実現することができるため、企業ごとのカテゴライズを精度よく行うことができる。
<変形例>
上記においては、分類処理手段133が、対象スコアTを求める際に分類スコアHを都度求める例を説明したが、これに限定されない。例えば、記憶部12には、説明文に関連ワードWもしくは抽出ワードが含まれる分類コードと、分類スコアHとを対応づけた分類テーブル12hを予め格納しておいてもよい。
図15は、説明文に関連ワードWもしくは抽出ワードが含まれる分類コードR~R(Sは任意の自然数)と、上記同様に分類処理手段133によって求められた分類スコアHとを対応づけた分類テーブル12hを例示したものである。他の構成については、上記の説明と同様であるため省略する。
図16を参照して、本変形例における分類テーブル12hの作成方法の動作例を説明する。上述した図14と同等の各工程については同一のステップ番号を付して説明は省略する。ここでは、関連ワードWを用いる例について説明する。
分類処理手段133は、情報提供サーバ群300等から複数の分類情報を取得する(ステップS501)。次いで、分類処理手段133は、任意の分類情報に含まれる説明データに対し、複数の関連ワードWについての抽出処理を行う(ステップS402)。分類処理手段133は、説明データ中に少なくとも1つの関連ワードWが存在すれば(ステップS403/Yes)、関連ワードWの種類及び抽出数に基づいて説明係数h2を求める(ステップS404)。
次いで、分類処理手段133は、取得した階層データを階層テーブル12eに照らして階層係数h1を求める(ステップS405)。そして、分類処理手段133は、抽出された関連ワードWの階層係数h1及び説明係数h2を用いて分類スコアHを求め、求めた分類スコアHを分類コードに紐付けて記憶部12に記憶させる(ステップS406)。分類処理手段133は、抽出処理を行っていない分類情報があるか否かを判定する(ステップS502)。
分類処理手段133は、抽出処理用の全ての関連ワードWが説明データ中に存在しなければ(ステップS403/No)、その説明データに紐付く分類情報については、分類スコアHを求めずに、抽出処理を行っていない分類情報があるか否かを判定する(ステップS502)。分類処理手段133は、抽出処理を行っていない分類情報が存在する限り(ステップS502/Yes)、ステップS402~S406の一連の処理を実行し、分類テーブル12hに係るデータベースを構築し、これを更新する。分類処理手段133は、全ての分類情報の抽出処理が終了すると(ステップS502/No)、分類テーブル12hの作成処理を終了する。
次に、図17を参照して、本変形例の企業評価方法のうち、分類処理工程における動作例について説明する。ここでは、1つの対象情報についての分類スコアHを求める動作を説明する。
分類処理手段133は、対象情報から分類コードを抽出する(ステップS601)。分類処理手段133は、抽出した分類コードを分類テーブル12hに照らして分類スコアHを求める。分類処理手段133は、ステップS601において、複数の分類コードを抽出した場合、予め設定された優先度の高い1つの分類コードを分類テーブル12hに照らして分類スコアHを求めてもよい。同場合において、分類処理手段133は、予め設定された優先度の高い複数の分類コードを分類テーブル12hに照らし、それぞれの分類スコアHを求め、これらを用いた所定の演算により該対象情報における分類スコアHを求めてもよい。もっとも、同場合において、分類処理手段133は、抽出した全ての分類コードを分類テーブル12hに照らし、それぞれの分類スコアHを求め、これらを用いた所定の演算により該対象情報における分類スコアHを求めてもよい。
以上のように、本変形例における企業評価装置10は、分類コードと分類スコアHとを対応づけた分類テーブル12hが予め記憶部12に格納されている。そのため、分類処理手段133は、分類コードを分類テーブル12hに照らすことにより、分類スコアHの有無を迅速に判定し、格納されている分類スコアHを抽出することができる。そのため、企業の評価結果に係る演算処理の迅速化を図ることができる。分類テーブル12hは、ネットワークNを介してPCやサーバ等に提供してもよい。この場合、分類テーブル12hは、MICROSOFT EXCEL(登録商標)のXLSファイル、CSV(Comma-Separated Values)ファイル、テキストファイルなどのデータファイルで提供してもよい。もっとも、分類テーブル12hは、紙媒体にプリントアウトして提供してもよい。
上述した実施の形態は、企業評価装置、企業評価プログラム、記録媒体、及び企業評価方法における具体例であり、本発明の技術的範囲は、これらの態様に限定されるものではない。例えば、上記の式(1)は、関連スコアUを求める演算式の一例を示したに過ぎず、種々の変形が可能であり、これに応じて企業評価プログラムの構成も変更される。ワード処理手段131は、関連スコアUの演算に、所在係数、関連係数d、及び検索数のうちの何れか1つ又は2つを用いるようにしてもよい。つまり、重み情報は、所在係数、関連係数d、及び検索数のうちの少なくとも1つを含む構成としてもよい。
分類処理手段133は、抽出係数Kを用いずに分類スコアHを求めてもよい。つまり、重み情報は、抽出係数Kを含めずに構成してもよい。上記の説明では、分類スコアHが階層係数h1と説明係数h2との双方を要素とする例を示したが、これに限定されない。分類処理手段133は、階層係数h1をそのまま分類スコアHとしてもよく、説明係数h2をそのまま分類スコアHとしてもよい。つまり、重み情報は、階層係数h1及び説明係数h2のうちの少なくとも1つを含むよう構成してもよい。なお、分類処理手段133は、階層係数h1を用いない場合に階層データの取得が不要となり、説明係数h2を用いない場合に説明データの取得が不要となる。
上記の式(2)では、対象スコアTの演算に分類係数gが用いられる例を示したが、格付処理手段134は、分類係数gを用いずに対象スコアTを求めてもよい。つまり、重み情報は、分類係数gを含めずに構成してもよい。格付処理手段134は、被引用係数fを用いずに対象スコアTを求めてもよい。つまり、重み情報は、被引用係数fを含めずに構成してもよい。格付処理手段134は、公報係数eを用いずに対象スコアTを求めてもよい。つまり、重み情報は、公報係数eを含めずに構成してもよく、この場合、公報処理手段132は不要となる。格付処理手段134は、分類スコアHを用いずに対象スコアTを求めてもよい。つまり、重み情報は、分類スコアHを含めずに構成してもよく、この場合、分類処理手段133は不要となる。格付処理手段134は、関連スコアUを用いずに対象スコアTを求めてもよい。つまり、重み情報は、関連スコアUを含めずに構成してもよく、この場合、ワード処理手段131は不要となる。
10 企業評価装置、11 通信部、12 記憶部、12a 関連データ、12b 対象リスト、12c 関連テーブル、12d 公報係数テーブル、12e 階層テーブル、12f ワードテーブル、12g 抽出数テーブル、12h 分類テーブル、13 制御部、13a 収集処理手段、13b 処理手段、13c 評価処理手段、40 情報端末、50 管理端末、80 情報端末、100 格付サーバ群、110 格付サーバ、120 評価データベース部、120a 評価データベース、131 ワード処理手段、132 公報処理手段、133 分類処理手段、134 格付処理手段、200 企業評価システム、300 情報提供サーバ群、D ワード係数、H 分類スコア、K 抽出係数、M1 推定モデル、N ネットワーク、P1 企業評価プログラム、T 対象スコア、Ts 評価スコア、U 関連スコア、W 関連ワード、a 明細係数、b 要約係数、c 請求係数、d 関連係数、e 公報係数、f 被引用係数、g 分類係数、h1 階層係数、h2 説明係数。

Claims (11)

  1. 企業に紐付けられた1又は複数の産業財産権に関する情報の、企業の経営方針に組み込まれる経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて、前記経営指標の観点での企業の評価結果を求める評価処理手段を有する、企業評価装置。
  2. 前記評価処理手段は、
    企業に紐付けられた1又は複数の前記産業財産権に関する情報から、前記経営指標に関連する複数の関連ワードを検索し、検索された前記関連ワードに紐付く前記重み情報を用いて前記評価結果を求めるものである、請求項1に記載の企業評価装置。
  3. 前記評価処理手段は、
    前記関連ワードに紐付く前記重み情報として、
    複数の前記関連ワードのうちの少なくとも1つに設定される関連係数を用いるものである、請求項2に記載の企業評価装置。
  4. 前記評価処理手段は、
    前記関連ワードに紐付く前記重み情報として、
    前記関連ワードの検索数を用いるものである、請求項2又は3に記載の企業評価装置。
  5. 前記評価処理手段は、
    前記関連ワードに紐付く前記重み情報として、
    前記関連ワードの所在に応じて設定される所在係数を用いるものである、請求項2~4の何れか一項に記載の企業評価装置。
  6. 前記産業財産権は、特許権又は実用新案権であり、
    前記所在係数は、
    明細書に対応する明細係数と、
    要約書に対応し、前記明細係数よりも大きく設定される要約係数と、
    請求の範囲に対応し、前記要約係数よりも大きく設定される請求係数と、を含む、請求項5に記載の企業評価装置。
  7. 前記産業財産権は、特許権又は実用新案権であり、
    前記評価処理手段は、
    公報の内容の有効性の程度に応じて設定される公報係数を用いて前記評価結果を求めるものである、請求項1~6の何れか一項に記載の企業評価装置。
  8. 前記産業財産権は、特許権又は実用新案権であり、
    前記評価処理手段は、
    前記重み情報として、複数の分類コードが階層構造により整理された特許分類における、前記分類コードごとに設定された分類スコアを用いて前記評価結果を求めるものである、請求項1~7の何れか一項に記載の企業評価装置。
  9. 前記分類スコアは、
    前記分類コードの階層ごとに、上位層よりも下位層の方が大きくなるよう段階的に設定された階層係数を要素とするものである、請求項8に記載の企業評価装置。
  10. 前記分類コードには説明文が紐付けられており、
    前記分類スコアは、
    前記説明文の内容に基づく説明係数を要素とするものである、請求項8又は9に記載の企業評価装置。
  11. 企業に紐付けられた1又は複数の産業財産権に関する情報の、企業の経営方針に組み込まれる経営指標に対する関連性の度合いを企業評価に反映させる重み情報を用いて、前記経営指標の観点での企業の評価結果を求める、企業評価方法。
JP2021082843A 2021-05-15 2021-05-15 企業評価装置及び企業評価方法 Pending JP2022176388A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2021082843A JP2022176388A (ja) 2021-05-15 2021-05-15 企業評価装置及び企業評価方法
PCT/JP2022/022254 WO2022244892A1 (ja) 2021-05-15 2022-06-01 企業評価装置及び企業評価方法
EP22804799.9A EP4339874A1 (en) 2021-05-15 2022-06-01 Company evaluation device and company evaluation method
US18/558,350 US20240220905A1 (en) 2021-05-15 2022-06-01 Company evaluation device and company evaluation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021082843A JP2022176388A (ja) 2021-05-15 2021-05-15 企業評価装置及び企業評価方法

Publications (1)

Publication Number Publication Date
JP2022176388A true JP2022176388A (ja) 2022-11-28

Family

ID=84141756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021082843A Pending JP2022176388A (ja) 2021-05-15 2021-05-15 企業評価装置及び企業評価方法

Country Status (4)

Country Link
US (1) US20240220905A1 (ja)
EP (1) EP4339874A1 (ja)
JP (1) JP2022176388A (ja)
WO (1) WO2022244892A1 (ja)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005326897A (ja) * 2003-10-21 2005-11-24 Ipb:Kk 技術・知財評価装置及び技術・知財評価方法
CA2543616A1 (en) * 2003-10-23 2005-05-06 Intellectual Property Bank Corp. System for evaluating enterprise and program for evaluating enterprise
EP1783624A4 (en) * 2004-07-05 2009-04-29 Intellectual Property Bank COMPANY EVALUATION DEVICE, COMPANY EVALUATION PROGRAM AND COMPANY EVALUATION PROCEDURES
KR101118057B1 (ko) * 2009-12-15 2012-02-24 한국발명진흥회 특허 자동 평가 시스템 및 상기 시스템에서의 평가 요소 정보 처리 방법
US11449673B2 (en) 2017-11-23 2022-09-20 Isd Inc. ESG-based company evaluation device and an operation method thereof
CN109447699A (zh) * 2018-10-23 2019-03-08 国网江苏省电力有限公司 一种专利价值评估***
JP7341786B2 (ja) * 2019-08-15 2023-09-11 株式会社カネカ 指標算出装置および指標算出プログラム

Also Published As

Publication number Publication date
EP4339874A1 (en) 2024-03-20
WO2022244892A1 (ja) 2022-11-24
US20240220905A1 (en) 2024-07-04

Similar Documents

Publication Publication Date Title
Jonnalagadda et al. A new iterative method to reduce workload in systematic review process
JP5817531B2 (ja) 文書クラスタリングシステム、文書クラスタリング方法およびプログラム
US20130013612A1 (en) Techniques for comparing and clustering documents
Stokes et al. Exploring criteria for successful query expansion in the genomic domain
Gkotsis et al. It's all in the content: state of the art best answer prediction based on discretisation of shallow linguistic features
Shah et al. Sentimental Analysis Using Supervised Learning Algorithms
Bhat et al. Sumitup: A hybrid single-document text summarizer
US20160364428A1 (en) Database update and analytics system
Khan et al. Multi-objective model selection (MOMS)-based semi-supervised framework for sentiment analysis
Meetei et al. Low resource language specific pre-processing and features for sentiment analysis task
JP7409484B2 (ja) リスク評価装置、リスク評価方法およびプログラム
JP5836893B2 (ja) ファイル管理装置、ファイル管理方法、及びプログラム
Hussain et al. A technique for perceiving abusive bangla comments
Balaguer et al. CatSent: a Catalan sentiment analysis website
Lee et al. Knowledge structure of Korean medical informatics: A social network analysis of articles in journal and proceedings
WO2022244892A1 (ja) 企業評価装置及び企業評価方法
Kim et al. Opinion Mining‐Based Term Extraction Sentiment Classification Modeling
Chakraborti et al. Product news summarization for competitor intelligence using topic identification and artificial bee colony optimization
Herng Leong et al. Classification of healthcare service reviews with sentiment analysis to refine user satisfaction
Rybiński et al. DomESA: a novel approach for extending domain-oriented lexical relatedness calculations with domain-specific semantics
Gözükara et al. Türkçe ve ingilizce yorumların duygu analizinde doküman vektörü hesaplama yöntemleri için bir deneysel inceleme
Raghavan et al. Information retrieval as a domain: visualizations based on two data sets
Lin et al. Realtime event summarization from tweets with inconsistency detection
Dhea Noranita et al. Classification of MTI Student Thesis Documents at Bina Darma University Palembang Using Naïve Bayes
US20180349358A1 (en) Non-transitory computer-readable storage medium, information processing device, and information generation method