JP6308706B1

JP6308706B1 - 特許要件適否予測装置および特許要件適否予測プログラム

Info

Publication number: JP6308706B1
Application number: JP2017067305A
Authority: JP
Inventors: 和之白井
Original assignee: 和之白井
Priority date: 2017-03-30
Filing date: 2017-03-30
Publication date: 2018-04-11
Anticipated expiration: 2037-03-30
Also published as: JP2018169854A

Abstract

【課題】特許要件の適否に関する予測が審査実務に適合した内容で行われ、出願書類の準備負担を有効に軽減する。【解決手段】特許要件適否予測サーバは、予測対象発明が１または２以上の請求項に記載され、かつ予測対象発明が記載されている詳細な説明を含む案文書を構成する案文書データから抽出されたデータであって、予測対象発明の要旨を特定し得る用語を示す要旨データを記憶する要旨データ記憶手段と、指定先行技術データを記憶する指定先行技術データ記憶手段と、指定先行技術発明との関係による予測対象発明の進歩性の要件適否に関する発明指定進歩性予測データを生成する進歩性予測処理部と、発明指定進歩性予測データを用いて予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有する。【選択図】図４

Description

本発明は、出願書類の案文書に記載されている発明について、新規性、進歩性といった特許要件に適合しているか否かの適否を予測する特許要件適否予測装置および特許要件適否予測プログラムに関する。

従来、電力需要や株価の予測、商品の購買予測、不動産の将来価格の予測といった様々な場面で予測が行われ、そのための装置や方法も数多く提案されている。発明を特許出願して権利化する権利化業務に関しても、出願された発明に関する特許可能性（特許性、パテンタビリティともいう）を予測する技術が提案されている（例えば、特許文献１参照）。特許文献１には、次のような特許性予測装置が記載されている。この装置は、審査結果通知済の特許出願（既通知出願）を特許データベースから取得して、既通知出願の請求項についての情報量と、類似する先行出願の数を検出し、既通知出願を対象とする回帰分析を実行して、これらから算出した登録予見式にしたがい、審査結果未通知出願の特許性の予測値を算出する。

また、従来、特許可能性の予測のほか、発明の特許性や発明の質、特許出願や特許権の価値を評価する装置や方法も提案されている（例えば、特許文献２，３，４，５，６参照）。

特開２００９−２３８０７４号公報特開２０１５−２０７１９４号公報特開２０００−１８１９６６号公報特開２０００−１３２６０６号公報特開２０１５−１８７８８３号公報特開２００７−１０８８０３号公報

上記のとおり、従来技術によれば特許出願について特許可能性を予測することや特許権を評価することが可能である。

しかし、前述の従来技術、例えば、特許文献１記載の特許性予測装置では、特許性の予測が、既通知出願の請求項についての情報量や、類似する先行出願数といった情報に基づき算出された登録予見式にしたがって行われる。この予測は、請求項の広狭、技術分野の疎密および特許性との間の統計的な相関関係に基づいて行われ、特許法や特許・実用新案審査基準に基づくものではなかった。そのため、特許文献１記載の特許性予測装置では、特許実務に沿った予測結果が得られないおそれが高いという課題があった。

ところで、特許出願をしようとするときは、出願しようとする発明について先行技術調査を行い、その結果見つかった文献に記載されている先行技術との対比を行い、特許要件を具備するように、出願しようとする発明と先行技術との相違点を明確にして出願書類を準備することが望ましい。

しかし、特許要件の審査は、特許庁審査官が特許法や特許・実用新案審査基準に沿って行うものであるから（特許法47条）、特許要件を具備するように出願書類を準備するには、特許法や特許・実用新案審査基準の理解が不可欠であり、特に、特許法第２９条第２項の要件（進歩性）を具備するように出願書類を準備するには、特許法や特許・実用新案審査基準の十分な理解と、より熟練した経験やスキルが求められる。そのため、特許要件を具備するように出願書類を準備することは、とても手間や時間のかかることである。

この点、特許文献１記載の従来技術によって、発明の特許可能性が予測されるから、これを活用することによって、出願書類の準備に要する負担を軽減できるのではないかとも考えられる。

しかし、特許文献１記載の従来技術では、予測結果が審査実務に適合していないおそれがあるから、そのような予測結果を活用しても、出願書類の準備負担の軽減が有効にならないおそれがある。

したがって、特許要件を具備するような出願書類を準備するための負担軽減が有効になるよう、出願しようとする発明に関し、特許要件の適否の予測が審査実務に適合した内容で行われることが望まれていた。

本発明は、上記課題を解決するためになされたもので、特許要件の適否に関する予測が審査実務に適合した内容で行われ、出願書類の準備負担を有効に軽減し得る特許要件適否予測装置および特許要件適否予測プログラムを提供することを目的とする。

上記課題を解決するため、本発明は、特許要件適否の予測対象となる予測対象発明が１または２以上の請求項に記載され、かつその予測対象発明が記載されている詳細な説明を含む案文書を構成する案文書データから抽出されたデータであって、その予測対象発明の要旨を特定し得る用語を示す用語データであり、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび詳細な説明に含まれる課題の部分から抽出された課題データを含むデータを要旨データとして記憶する要旨データ記憶手段と、指定先行技術発明が記載されている指定先行技術文献を構成する指定先行技術データを記憶する指定先行技術データ記憶手段と、指定先行技術発明との関係による予測対象発明の進歩性の要件適否に関する発明指定進歩性予測データを生成する進歩性予測処理部と、その発明指定進歩性予測データを用いて予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有し、進歩性予測処理部は、文書ベクトルの分類を行う文書分類部を有し、その文書分類部は、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される要旨移動ベクトルを進歩性の要件に適合するか否かのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、その要旨移動ベクトルは、各請求項に応じた予測対象発明の要旨ベクトルと、指定先行技術データに応じた引用候補ベクトルとの差分に応じたベクトルである特許要件適否予測装置を特徴とする。

また、本発明は、特許要件適否の予測対象となる予測対象発明が１または２以上の請求項に記載され、かつその予測対象発明が記載されている詳細な説明を含む案文書を構成する案文書データから抽出されたデータであって、その予測対象発明の要旨を特定し得る用語を示す用語データであり、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび詳細な説明に含まれる課題の部分から抽出された課題データを含むデータを要旨データとして記憶する要旨データ記憶手段と、指定先行技術発明が記載されている指定先行技術文献を構成する指定先行技術データを記憶する指定先行技術データ記憶手段と、要旨データ記憶手段に記憶されている要旨データを用いて、公開公報の電子データである公開公報データを検索し、その検索結果に応じて、予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、その新規性予測データおよび進歩性予測データを用いて予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有し、進歩性予測処理部は、公開公報データによって特定される先行技術発明のうち、予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、主引用発明検索部は、要旨データ記憶手段に記憶されている要旨データのうちの各請求項の特徴部分データおよび課題データを主検索文書データとして公開公報データを対象とする概念検索を行い、その概念検索の結果、類似度の降順にその類似度が最も高い最類似文献を含む複数の文献を類似文献として抽出し、かつ各その類似文献を主引用発明が開示されている主引用文献とし、文書分類部は、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される要旨移動ベクトルを進歩性の要件に適合しない可能性が極めて高いクラス、高いクラス、その進歩性の要件に適合するクラスのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、その要旨移動ベクトルは、各請求項に応じた予測対象発明の要旨ベクトルと、各類似文献に応じた引用候補ベクトルそれぞれとの差分に応じた複数のベクトルであり、特許要件適否予測処理手段は、文書分類部から出力される複数の要件適否文書ベクトルに応じて、予測対象発明について、進歩性の要件に適合しない可能性を示す非適合率を算出する非適合率算出部と、指定先行技術データ記憶手段に指定先行技術データが記憶されているときに、進歩性予測処理部が、進歩性予測データの代わりに指定先行技術発明との関係による予測対象発明の進歩性の要件適否に関する発明指定進歩性予測データを生成するように制御する予測処理制御部とを更に有する特許要件適否予測装置を提供する。

上記特許要件適否予測装置の場合、文書分類部は、訓練データとして、学習文書ベクトルが第１の学習文書ベクトルで教師ベクトルが新規性および進歩性の拒絶理由有りを示すベクトルとの組み合わせと、学習文書ベクトルが第２の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由有りで新規性の拒絶理由無しを示すベクトルとの組み合わせと、学習文書ベクトルが第３の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由無しを示すベクトルとの組み合わせが用いられ、第１の学習文書ベクトルは、すでに公開されている公開済出願の中で拒絶理由通知が発行された出願であって、その拒絶理由通知で同じ文献を引用して新規性および進歩性無しの拒絶理由が指摘されていた新規性・進歩性拒絶出願のその拒絶理由が指摘されていた請求項に応じた文書ベクトルと、その拒絶理由で引用されていた文献である第１の主引用刊行物に応じた第１の引用文書ベクトルとの差分に応じた第１の移動文書ベクトルであり、第２の学習文書ベクトルは、公開済出願の中で拒絶理由通知が発行された出願であって、その拒絶理由通知で新規性の拒絶理由は指摘されていないが進歩性の拒絶理由が指摘されていた進歩性拒絶出願の該拒絶理由が指摘されていた請求項に応じた文書ベクトルと、その拒絶理由で主たる刊行物として引用されていた第２の主引用刊行物に応じた第２の引用文書ベクトルとの差分に応じた第２の移動文書ベクトルであり、第３の学習文書ベクトルは、公開済出願の中で拒絶理由通知が発行されずに特許査定が発行された拒絶無し出願または拒絶理由通知が発行された出願であって、その拒絶理由通知で進歩性の拒絶理由が指摘されていなかった進歩性拒絶無し出願の請求項１に応じた文書ベクトルと、拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる学習用最類似文献に応じた非引用文書ベクトルとの差分から求めた第３の移動文書ベクトルである特許要件適否予測装置とすることができる。

さらに、本発明は、特許要件適否の予測対象となる予測対象発明が１または２以上の請求項に記載され、かつその予測対象発明が記載されている詳細な説明を含む案文書を構成する案文書データから抽出されたデータであって、その予測対象発明の要旨を特定し得る用語を示す用語データであり、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび詳細な説明に含まれる課題の部分から抽出された課題データを含むデータを要旨データとして記憶する要旨データ記憶手段と、要旨データ記憶手段に記憶されている要旨データを用いて、公開公報の電子データである公開公報データを検索し、その検索結果に応じて、予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、その新規性予測データおよび進歩性予測データを用いて予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段と、その予測結果ファイル生成部によって生成された予測結果ファイルを記憶する予測結果記憶手段とを有し、進歩性予測処理部は、公開公報データによって特定される先行技術発明のうち、予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、主引用発明検索部は、要旨データ記憶手段に記憶されている要旨データのうちの各請求項の特徴部分データおよび課題データを主検索文書データとして公開公報データを対象とする概念検索を行い、その概念検索の結果、類似度の降順にその類似度が最も高い最類似文献を含む複数の文献を類似文献として抽出し、かつ各その類似文献を主引用発明が開示されている主引用文献とし、文書分類部は、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される要旨移動ベクトルを進歩性の要件に適合しない可能性が極めて高いクラス、高いクラス、その進歩性の要件に適合するクラスのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、その要旨移動ベクトルは、各請求項に応じた予測対象発明の要旨ベクトルと、各類似文献に応じた引用候補ベクトルそれぞれとの差分に応じた複数のベクトルである特許要件適否予測装置を提供する。

さらにまた、本発明は、コンピュータを特許要件適否予測装置として機能させるための特許要件適否予測プログラムであって、そのコンピュータを特許要件適否の予測対象となる予測対象発明が１または２以上の請求項に記載され、かつその予測対象発明が記載されている詳細な説明を含む案文書を構成する案文書データから抽出されたデータであって、その予測対象発明の要旨を特定し得る用語を示す用語データであり、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび詳細な説明に含まれる課題の部分から抽出された課題データを含むデータを要旨データとして記憶させる要旨データ記憶制御手段と、指定先行技術発明が記載されている指定先行技術文献を構成する指定先行技術データを記憶させる指定先行技術データ記憶制御手段と、指定先行技術発明との関係による予測対象発明の進歩性の要件適否に関する発明指定進歩性予測データを生成する進歩性予測処理部と、その発明指定進歩性予測データを用いて予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段として機能させ、進歩性予測処理部が文書ベクトルの分類を行う文書分類部を有し、その文書分類部が、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される要旨移動ベクトルを進歩性の要件に適合するか否かのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、その要旨移動ベクトルは、各請求項に応じた予測対象発明の要旨ベクトルと、指定先行技術データに応じた引用候補ベクトルとの差分に応じたベクトルである特許要件適否予測プログラムを提供する。

以上詳述したように、本発明によれば、特許要件の適否に関する予測が審査実務に適合した内容で行われ、出願書類の準備負担を有効に軽減し得る特許要件適否予測装置および特許要件適否予測プログラムが得られる。

本発明の第１の実施の形態に係る特許要件適否予測サーバを含む特許要件適否予測システムのシステム構成図である。特許要件適否予測サーバの内部の構成を中心に示すブロック図である。ユーザ端末装置の内部の構成を中心に示すブロック図である。本発明の第１の実施の形態に係る特許要件適否予測サーバの主要な構成を示す機能ブロック図である。要旨データ抽出部の主要な構成を示す機能ブロック図である。本発明の第１の実施の形態に係る特許要件適否予測処理部の主要な構成を示す機能ブロック図である。入力ベクトル生成部の主要な構成を示す機能ブロック図である。要旨データ記憶部のレコードレイアウトの一例を示す図である。ＣＴデータ記憶部のレコードレイアウトの一例を示す図である。予測結果記憶部のレコードレイアウトの一例を示す図である。機械学習部のネットワーク構造の一例を示す図である。特許要件適否予測処理の動作手順の一例を示すフローチャートである。特許要件適否予測ルーチンの動作手順の一例を示すフローチャートである。新規性・拡大先願予測ルーチンの動作手順の一例を示すフローチャートである。拡大先願予測ルーチンの動作手順の一例を示すフローチャートである。進歩性予測ルーチンの動作手順の一例を示すフローチャートである。単一独立項ルーチンの一例を示すフローチャートである。複数独立項ルーチンの動作手順の一例を示すフローチャートである。独立項検索処理の一例を示すフローチャートである。主引用発明検索処理の一例を示すフローチャートである。副引用発明検索処理の一例を示すフローチャートである。従属項検索処理の一例を示すフローチャートである。審査対象となる特許出願と、複数の特許公開公報との関係を模式的に示した図である。独立項テーブルのレコードレイアウトの一例を示す図である。特許要件適否予測リストの一例を示す図である。本発明の第２の実施の形態に係る特許要件適否予測サーバの主要な構成を示す機能ブロック図である。本発明の第２の実施の形態に係る特許要件適否予測処理部の主要な構成を示す機能ブロック図である。同じく入力ベクトル生成部の主要な構成を示す機能ブロック図である。同じく予測結果記憶部のレコードレイアウトの一例を示す図である。同じく特許要件適否予測リストの一例を示す図である。変形例に係る特許要件適否予測処理部の主要な構成を示す機能ブロック図である。サーチ無し特許要件適否予測ルーチンの動作手順の一例を示すフローチャートである。サーチ無し進歩性予測ルーチンの動作手順の一例を示すフローチャートである。サーチ無し単一独立項ルーチンの一例を示すフローチャートである。サーチ無し複数独立項ルーチンの動作手順の一例を示すフローチャートである。

以下、本発明の実施の形態について図面を参照しつつ説明する。なお、同一要素には同一符号を用い、重複する説明は省略する。

第１の実施の形態
(特許要件適否予測システムの全体構成）
まず、本発明の第１の実施の形態に係る特許要件適否予測サーバ１０を含む特許要件適否予測システム１の構成について説明する。

図１は特許要件適否予測システム１のシステム構成図である。図１に示すように、特許要件適否予測システム１は、特許要件適否予測サーバ１０と、ユーザが操作する複数のユーザ端末装置３０（図１では、固定端末装置３０Ａ、３０Ｂ、３０Ｃ）とを有し、これらがインターネットＮ１を介して互いに接続される構成を有している。

特許要件適否予測サーバ１０は、特許要件適否予測プログラムにしたがったデータ処理を行う。特許要件適否予測サーバ１０は、ユーザが出願しようとする発明について、特許要件（本実施形態では、新規性（特許法第２９条第１項３号）、拡大先願（特許法第２９条の２）および進歩性（特許法第２９条第２項））に適合しているか否かを予測する。ユーザ端末装置３０は、特許要件適否予測サーバ１０との間でデータの受信または送信を行う。

特許要件適否予測システム１では、ユーザが出願しようとする発明が、特許要件に適合しているか否か（特許要件適否）の予測対象となるので、本実施の形態に係る予測対象発明に相当する。そして、特許要件適否予測サーバ１０が、その予測対象発明について、２種類の予測モード（後述するサーチ有りモードまたはサーチ無しモードのいずれかのモード）で特許要件の適否を予測する。いずれのモードにおいても、進歩性違反の拒絶理由が見つかる可能性が高いか低いかを審査実績に基づく複数の訓練データで機械学習を行った人工知能プログラムで予測して、特許要件の適否が予測される。特許要件適否予測サーバ１０によって、特許要件の適否の予測が審査実務に適合した内容で行われるため、出願書類の準備負担を有効に軽減することができる。

ここで、サーチ有りモードとは、予測対象発明に関して、公開公報（主として公開特許公報）の電子データである公開公報データの検索（後述する主引用発明検索および副引用発明検索）を行い、その検索結果に応じて特許要件の適否予測を行うモードである。サーチ無しモードとは、予測対象発明に関して、公開公報データの検索を行うことなく、後述する指定先行技術発明との関係による特許要件の適否予測を行うモードである。

（特許要件適否予測サーバ１０の構成）
次に、図２を参照して特許要件適否予測サーバ１０の構成について説明する。図２は、特許要件適否予測サーバ１０の内部の構成を中心に示すブロック図である。特許要件適否予測サーバ１０は、予測対象発明の特許要件適否の予測に関するサービスを提供する専門事業者が運用するサーバである。

特許要件適否予測サーバ１０は、ＣＰＵ（Central Processing Unit）１１と、ＲＯＭ(Read Only Memory)１２と、ＲＡＭ（Random Access Memory）１３とを有している。ＣＰＵ１１は、ＲＯＭ１２に記憶されているプログラムにしたがい作動して、ＫＢＣ（Key board controller）１７を介してキーボード１９やマウス２０の操作入力で得られる入力データをメインバス１９Ａを介して入力する一方、他の構成要素との信号の入出力を行い、特許要件適否予測サーバ１０全体の動作制御を行う。ＣＰＵ１１は、後述する特許要件適否予測プログラムにしたがい、後述する案文データ生成部１０１、要旨データ抽出部１０２、特許要件適否予測処理部１０３、対象公報抽出部１０４、予測結果編集処理部１０５、指定先行技術データ生成部１０６としての動作を行う。ＲＯＭ１２には、特許要件適否予測プログラム等のＣＰＵ１１が実行する制御プログラムと、恒久的なデータが記憶されている。ＲＡＭ１３にはＣＰＵ１１が作動する際に用いるデータやプログラムが記憶されている。

そのほか特許要件適否予測サーバ１０は、ハードディスク装置（Hard disk drive,ＨＤＤ）１４と、通信制御部１５と、通信処理部１６と、ビデオコントローラ１８とを有している。

ハードディスク装置１４には、特許要件適否予測プログラムの実行に必要な図４に示す各種記憶部またはＤＢ（database）と、その他の記憶部またはＤＢが形成されている。ハードディスク装置１４には、指定先行技術データ記憶部１５１と、予測対象トランザクション記憶部（予測対象ＴＲ記憶部）１５２と、要旨データ記憶部１５３と、クレームツリーデータ記憶部１５４と、対象公報記憶部１５５と、予測結果ファイル記憶部１５６とが形成されている。各記憶部またはＤＢについては後述する。

通信制御部１５は、ＣＰＵ１１の指示にしたがい作動して、ユーザ端末装置３０や、図示しない特許庁サーバとの通信を行うための回線の接続および切断を制御する。通信処理部１６は、通信制御部１５の指示にしたがい作動して、インターネットＮ１を介して行われるデータの送受信を実行する。

ビデオコントローラ１８は、図示しないディスプレイ装置における画像表示を制御して、各種の設定に用いられる画面等を表示させる。

そして、ハードディスク装置１４の各種記憶部またはＤＢについて説明すると次のとおりである。指定先行技術データ記憶部１５１には、ユーザ端末装置３０から送信されるユーザ特定に必要なデータ（例えば、会員ＩＤ）と、そのユーザが指定した指定先行技術発明が記載された指定先行技術文献を構成する指定先行技術データとが記憶されている。指定先行技術発明は、特許要件適否予測サーバ１０による特許要件適否の予測にあたり、ユーザが指定した先行技術発明であり、例えば、ユーザが自らの調査によって見つけた公開特許公報に記載されている先行技術発明に相当する。

指定先行技術データが指定先行技術データ記憶部１５１に記憶されているときは、ユーザが先行技術発明を指定した場合に相当する。この場合、サーチ無しモードにおいて、その指定先行技術発明との関係において、予測対象発明の進歩性の適否が予測される（指定先行技術発明からみて進歩性があるのかどうかが予測される）。

予測対象ＴＲ記憶部１５２には、案文データ生成部１０１が生成した案文書データ（後述する案文書を構成する電子データ）が記憶されている。公開公報ＤＢ１５０は、公開特許公報の電子データが公開公報データとして格納されている。公開公報ＤＢ１５０として、図４では、工業所有権情報・研修館により運営されている特許情報プラットフォーム（Ｊ−ＰｌａｔＰａｔ）のデータベースまたはそこからダウンロードした電子データを記憶しているデータベースを想定している。後者のデータベースは、図示しないサーバに格納することができるし、ＨＤＤ１４に格納してもよい。

案文書とは、予測対象発明が記載されている文献であって、その予測対象発明が１または２以上の請求項（本実施の形態では独立形式で記載されている場合を想定しているが、従属形式でもよい）に記載されている部分（願書に添付される特許請求の範囲に相当する文書）と、その予測対象発明が詳細に記載されている部分（本実施の形態において、「詳細な説明」といい、願書に添付される明細書の「発明の詳細な説明」に相当する文書）とを含んでいる。その「詳細な説明」には、少なくとも、予測対象発明の名称が記載されている部分（「発明の名称」に相当する部分）と、課題の部分（予測対象発明の解決しようとする課題が記載されている部分で、「発明が解決しようとする課題」に相当する部分）とを含み、本実施の形態では、「発明を実施するための形態」に相当する部分と、技術分野に相当する部分が含まれている。そして、案文書データは、暗号化通信（例えば、SSLを利用した暗号化通信）によって、ユーザ端末装置３０から特許要件適否予測サーバ１０に送信される。

要旨データ記憶部１５３には、要旨データ抽出部１０２が抽出・生成した要旨データが記憶されている。要旨データは、予測対象発明の要旨を特定し得る用語を示す用語データであって、少なくとも後述する特徴部分データと課題データとが含まれている。

要旨データ記憶部１５３には、例えば図８に示すように、データ種別エリア１５３ａ、項番エリア１５３ｂ、用語記憶部１５３ｃを有するレコードが記憶されている。データ種別エリア１５３ａは、各レコードに記憶されているデータが案文書のどの部分のデータであるのかを示すデータ（「データ種別」という）が記憶されている。本実施の形態では、データ種別として、"Ｃ"、"Ｐ"、"Ｔ"、"Ｄ"の４種類が設定されている。"Ｃ"は請求の範囲のデータ、"Ｐ"は課題の部分のデータ、"Ｔ"は技術分野の部分のデータ、"Ｄ"は発明の実施の形態の部分のデータをそれぞれ示している。項番エリア１５３ｂには、請求項の番号が記憶されている。用語記憶部１５３ｃは、用語エリア１５３ｃ１、展開度エリア１５３ｃ２および必須フラグエリア１５３ｃ３を有している。図８では、これらの組み合わせが１５通り用意されているが、この組み合わせは１５通りより多くてもよいし、少なくてもよい。そして、用語エリア１５３ｃ１，展開度エリア１５３ｃ２，必須フラグエリア１５３ｃ３には、それぞれ要旨の特定に用いられる用語、後述する展開度（Ｅｄ）、必須フラグ（Ｅｆ）が記憶されている。

図８では、一例として、特開２００８−６２２８２号公報に記載されている発明が予測対象発明であった場合の要旨データ（上半分のデータ）と、特開２０１１−１８６７３５号公報に記載されている発明が予測対象発明であった場合の要旨データ（下半分のデータ）とが記載されている。前者は、独立形式で記載されている請求項（独立項）が１つの場合、後者は独立項が複数の場合の例示である。

クレームツリーデータ記憶部（ＣＴデータ記憶部）１５４には、後述するクレームツリーデータ（claim tree データ、ＣＴデータともいう）が記憶されている。ＣＴデータ記憶部１５４には、例えば図９（Ａ）に示すように、独立区分エリア１５４ａと、ナンバエリア１５４ｂと、ＭＡＸ区分エリア１５４ｃと、従属項エリア１５４ｄと、サーチフラグエリア１５４ｅを含むレコードが記憶されている。

独立区分エリア１５４ａには、案文書に記載されている各請求項が独立形式で記載されている請求項（独立項）か、従属形式で記載されている請求項（従属項）のいずれであるかを示す独立区分（独立項がスペース、従属項が"Ｄ"）が記憶されている。ナンバエリア１５４ｂには各請求項の番号（請求項ナンバ）が記憶されている。ＭＡＸ区分エリア１５４ｃには、ＭＡＸ区分が記憶されている。ＭＡＸ区分には、同じ独立項を引用する従属項が複数あった場合の最も番号の大きい請求項（最大従属項）に"Ｍ"、それ以外にスペースがセットされている。

図９（Ａ）は、特開２００８−６２２８２号公報に記載されている発明が予測対象発明であった場合のＣＴデータを示しているが、該公報では、従属項の中で請求項９が最大従属項なので、請求項ナンバが"９"のレコードのＭＡＸ区分に"Ｍ"、それ以外の請求項ナンバのＭＡＸ区分にスペースがセットされている。また、図９（Ｂ）は、特開２０１１−１８６７３５号公報に記載されている発明が予測対象発明であった場合のＣＴデータを示しているが、該公報では、請求項１、請求項６が独立項であり、請求項５、請求項７が最大従属項なので、請求項ナンバが"５"のレコードと、"７"のレコードのＭＡＸ区分に"Ｍ"、これら以外のＭＡＸ区分にスペースがセットされている。

従属項エリア１５４ｄには、従属項が引用している請求項の番号が記憶されている。サーチフラグエリア１５４ｅには、サーチフラグ、すなわち、後述する主引用発明検索が実行済である否かの区分が記憶されている。スペースは主引用発明検索の実行前、"９"は実行済を示している。

対象公報記憶部１５５には、主引用発明検索および副引用発明検索の対象とされる公開公報データ（検索対象公報データ）が記憶されている。予測結果記憶部１５６には、図１０に示すような後述する予測結果ファイルが記憶されている。

続いて、要旨データ抽出部１０２、特許要件適否予測処理部１０３について説明する。要旨データ抽出部１０２は、図５に示すように、候補抽出部１１１、要部データ抽出部１１２、ＣＴデータ生成部１１３、テキスト分析・用語抽出部１１４、展開度・必須要件分析部１１５、係り受け解析部１１６、パターンデータ抽出部１１７およびファイル生成部１１８を有している。なお、図示の都合上、図５では、詳細な説明データ記憶部（詳細な説明ＴＲ）１６０、請求の範囲データ記憶部（請求の範囲ＴＲ）１６１、要部データ記憶部（要部データＴＲ）１６２が要旨データ抽出部１０２に含まれているが、これらはデータ記憶手段であるＨＤＤ１４に設けられている。

候補抽出部１１１は、予測対象ＴＲ記憶部１５２に記憶されている案文書データを読み込み、そこから不要なデータをスキップ（読み飛ばし）して要旨データ作成に必要なデータを抽出し、抽出後のデータを詳細な説明データ（明細書データ）と、請求の範囲データとに分けて、それぞれ詳細な説明ＴＲ１６０、請求の範囲ＴＲ１６１に記憶させる。ここでは、「前記」、「該」、「当該」と、段落番号がスキップされる。

要部データ抽出部１１２は、予測対象ＴＲ記憶部１５２に記憶されている案文書データを読み込み、そこから案文書の要部に相当する部分のデータ（要部データ）を抽出し、抽出した要部データを要部データ記憶部１６２に記憶させる。ここでは、要部データとして、予測対象発明の名称が記載されている部分のデータ（発明の名称）および技術分野に相当する部分のデータと、課題の部分の「本発明」または「この発明」の文字列を含む一文のデータとを抽出する。

ＣＴデータ生成部１１３は、予測対象ＴＲ記憶部１５２に記憶されている案文書データを読み込み、そのうちの請求の範囲の部分に記載されているデータを読み込んで前述したクレームツリーデータ（ＣＴデータ）を生成し、それＣＴデータ記憶部１５４に記憶させる。

テキスト分析・用語抽出部１１４は、詳細な説明ＴＲ１６０、請求の範囲ＴＲ１６１からそれぞれテキストデータを入力し、そのそれぞれについて、特徴語を抽出して（特許請求の範囲は請求項ごと）、各特徴語を重要とされる順序で出力する。この場合、例えば、形態素解析またはＮ−Ｇｒａｍなどの索引文字列抽出処理を実行して、各単語の出現頻度、各単語の共起頻度を調べ、その結果に応じて各特徴語を出力する。

展開度・必須要件分析部１１５は、請求の範囲ＴＲ１６１から請求の範囲データを読み込んで，テキスト分析・用語抽出部１１４で抽出された各特徴語について、展開度と、必須要件に該当するか否かとを調べ、その結果を出力する。ここで、展開度（Ｅｄ）とは、各特徴語がいくつの請求項に展開されているのか（用いられているのか）、展開されている請求項の個数を示すデータである。一般に、特許出願の出願書類では、できるだけ広い範囲の発明思想がカバーされるように、より重要な事項が請求項１（または他の独立項）に広い範囲で記載され、そこから下位の請求項に段階的に範囲を縮小（具体化）されながら記載されることが多い。そのため、展開度（Ｅｄ）が大きいほど、重要度がより高いと考えられるので、展開度は発明の要旨を把握するのに有益な情報と考えられる。例えば、図８に示すデータ種別"Ｃ"、項番"１"の用語エリア１５３ｃ１が"用語１"のエリアに「パンチ」という用語がセットされているが、この「パンチ」という用語は、特開２００８−６２２８２号公報の特許請求の範囲において、請求項１、２、３、４、５に記載されているので、展開度エリア１５３ｃ２に"５"がセットされている。

必須要件に該当するか否かは、各請求項の特徴部分に記載されているか否かであって、必須フラグ（Ｅｆ）によって示されている。本件出願に係る発明の実施の形態では、各請求項における最終段落、または「ことを特徴とする」の文字列を含む一文を各請求項の特徴部分としていて、そのデータが特徴部分データであり、ここに含まれている用語が必須要件を満たすものとしている。特徴部分から抽出された用語には、必須要件を満たすことを示す"Ｘ"が必須フラグ（Ｅｆ）にセットされる。

係受け解析部１１６は、要部データ記憶部１６２に記憶されている要部データについて係受け解析を行い、その結果をパターンデータ抽出部１１７に出力する。

パターンデータ抽出部１１７は、係受け解析部１１６の解析結果を入力して、ひらがなの「を」の直前の名詞と、それに対応した動詞の組み合わせとなる文字列と、発明の名称のうち、先頭に記載されているもの（筆頭名称）を出力する。例えば、特開２００８−６２２８２号公報の「発明が解決しようとする課題」の欄の「本発明」の文字列を含む一文の中に、ひらがなの「を」の直前の名詞と、それに対応した動詞の組み合わせとして、「調整」および「行わず」と、「同心性」および「得る」と、「精密打ち抜き型」および「提供」がある。これらがパターンデータ抽出部１１７から出力される。本実施の形態において、パターンデータ抽出部１１７から出力されるデータのうち、課題の部分から抽出されたデータが課題データに相当していて、例えば図８のデータ種別"Ｐ"のレコードのようなデータとすることができる。

ファイル生成部１１８はテキスト分析・用語抽出部１１４、展開度・必須要件分析部１１５およびパターンデータ抽出部１１７から出力されるデータを用いて要旨データを生成し、要旨データ記憶部１５３に記憶させる。この場合、テキスト分析・用語抽出部１１４および展開度・必須要件分析部１１５の出力データを用いて、データ種別"Ｃ"、"Ｄ"のデータが生成され、パターンデータ抽出部１１７の出力データを用いて、データ種別"Ｐ"、"Ｔ"のデータが生成される。

特許要件適否予測処理部１０３は、図６に示すように、新規性・拡大先願予測処理部１２５と、進歩性予測処理部１２６とを有している。新規性・拡大先願予測処理部１２５は、要旨データ記憶部１５３に記憶されている要旨データを検索タームに用いて対象公報記憶部１５５の検索対象公報データの全文検索を行い、その結果にしたがい、新規性・拡大先願予測データＮｄを予測結果ファイル生成部１２７に出力する。新規性・拡大先願予測処理部１２５の機能、動作手順については、後に詳しく説明する。

進歩性予測処理部１２６は、引用発明検索部１３１と、入力ベクトル生成部１３２と、機械学習部１３３と、指定予測データ生成部１３４とを有している。引用発明検索部１３１は、後述する主引用発明検索を行う主引用発明検索部および副引用発明検索を行う副引用発明検索部を有している。また、引用発明検索部１３１は、主引用発明検索および副引用発明検索の結果にしたがい、進歩性予測データＶｄ１を予測結果ファイル生成部１２７に出力し、検索の対象となった請求項に応じた請求項要旨データｉｅｄと概念検索データＶｄ２を入力ベクトル生成部１３２に出力する。概念検索データＶｄ２には、概念検索の結果、最も類似度が高いとされた文献（最類似文献）の公開公報データが含まれている。引用発明検索部１３１の機能、動作手順については、後に詳しく説明する。

入力ベクトル生成部１３２は、図７に示すように、要旨ベクトル生成部１３２ａと、引用候補ベクトル生成部１３２ｂと、移動ベクトル生成部１３２cとを有している。

要旨ベクトル生成部１３２ａは、請求項要旨データｉｅｄを入力してその特徴語を抽出し、各語に応じた重み付けを行って、各請求項の記載に応じた要旨ベクトルＥＶを生成する。引用候補ベクトル生成部１３２ｂは、後述するサーチ有りモードにおいて、概念検索データＶｄ２に含まれる最類似文献の公開公報データを入力してその特徴語を抽出し、各語に応じた重み付けを行って最類似文献に応じた文書ベクトル（引用候補ベクトル）ＲｆＶを生成する。また、サーチ無しモードにおいて、指定先行技術データＶｓ２を入力してその特徴語を抽出し、各語に応じた重み付けを行って指定先行技術データに応じた文書ベクトル（引用候補ベクトル）ＲｆＶを生成する。移動ベクトル生成部１３２ｃは、要旨ベクトルＥＶと、引用候補ベクトルＲｆＶとの差分を計算して、双方の文書ベクトルの差分に応じた要旨移動ベクトルＶ３を生成する。

最類似文献は、主引用発明検索部による概念検索の結果、最も類似度が高いとされた文献であるため、予測対象発明の進歩性の審査で主引用発明の開示文献として引用される確率が最も高いと推測される。そのため、最類似文献を引用候補として引用候補ベクトルＲｆＶを求め、これと要旨ベクトルＥＶとの差分を計算して要旨移動ベクトルＶ３を求めれば、予測対象発明と、最類似文献に開示されている発明との相違に応じた文書ベクトル（要旨移動ベクトルＶ３に相当する）が生成される。

機械学習部１３３は、本発明の実施の形態にかかる文書分類部であって、次のような訓練データ（学習パターンともいう）を用いた機械学習（教師付き学習）によって、後述する要旨移動ベクトルＶ３を進歩性の要件に適合するクラスと適合しないクラス（拒絶理由が無いクラスと有るクラス）に分類し、その分類結果に応じた出力信号（要件適否文書ベクトル）Ｖ４を出力するように構築されている。本発明の実施の形態の場合、学習パターンは次に述べるＨＬパターンとすることができる。

ＨＬパターンは、学習文書ベクトルが第１の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由有りを示すベクトル（例えば、正解のクラスに対応した次元だけが"１"で、他が"０"のベクトル）との組み合わせと、学習文書ベクトルが第２の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由無しを示すベクトル（例えば、上記とは別の次元だけが"１"で、他が"０"のベクトル）との組み合わせのパターンである。

第１の学習文書ベクトルは、公開済出願の中で特許庁の審査の結果、初めての拒絶理由通知（１ｓｔアクション）が発行された出願であって、その１ｓｔアクションで進歩性違反の拒絶理由（特許法第２９条第２項の要件を満たしていないとする拒絶理由）が指摘されていた出願（進歩性拒絶出願）の該拒絶理由が指摘されていた（拒絶理由通知発行時点の）請求項に応じた文書ベクトルと、そのときの引用文献１（主たる刊行物として引用されていた主引用文献）に応じた文書ベクトル（引用文書ベクトル）との差分に応じた第１の移動文書ベクトルである。

第２の学習文書ベクトルは、公開済出願の中で審査の結果、１ｓｔアクションが発行されずに特許査定が発行された出願（拒絶無し出願）または１ｓｔアクションは発行されたがその拒絶理由に進歩性違反の拒絶理由が指摘されていなかった出願（進歩性拒絶無し出願）の（拒絶理由通知が発行された時点の）請求項１に応じた文書ベクトルと、それら拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる文献（学習用最類似文献）に応じた文書ベクトル（非引用文書ベクトル）との差分に応じた第２の移動文書ベクトルである。

機械学習部１３３は、上記のようなＨＬパターンの学習パターンで学習を繰り返し行うことにより、要旨移動ベクトルＶ３を進歩性の拒絶理由有りまたは無しのいずれかのクラスに分類し、その分類したクラスに応じた要件適否文書ベクトルＶ４を出力する。前者は、予測対象発明が出願された場合について、進歩性違反の拒絶理由が発行される可能性が高い場合、後者は低い場合に相当する。

機械学習部１３３は、入力される要旨移動ベクトルＶ３を進歩性の拒絶理由が有るクラスと無いクラスに分類して、その分類結果に応じた要件適否文書ベクトルＶ４を出力すればよいので、機械学習部１３３にサポートベクターマシーン（ＳＶＭ）と呼ばれる学習アルゴリズムを適用することができる。サポートベクターマシーン（ＳＶＭ）によれば、決定境界との距離（マージン）が最大になるように、決定境界を得ることができる。

また、機械学習部１３３の情報処理に脳神経回路網をモデルにしたニューラルネットワークを適用することができる。ニューラルネットワークには、階層型ニューラルネットワークと、相互結合型ニューラルネットワークがある。たとえば、機械学習部１３３の学習アルゴリズムとして、階層型ニューラルネットワークのパーセプトロンを適用することができる。

パーセプトロンはＳ層、Ａ層、Ｒ層と呼ばれる３層からなる階層型ネットワークで構成され（図示せず）、Ｓ層からＡ層、Ａ層からＲ層という片方向の結合だけが存在している。前述のＨＬパターンの学習パターンが与えられると、第１の学習文書ベクトルまたは第２の学習文書ベクトルが入力されたときの出力ベクトルがそれぞれの教師ベクトルと異なっていたときに、その誤差に応じて結合の重みが修正され、出力ベクトルと教師ベクトルとの誤差が一定値以下になったときに学習が終了する。

しかしながら、パーセプトロンでは、学習パターンが線形分離不可能な場合にアルゴリズムが停止しないおそれがある。そのため、機械学習部１３３が学習によって非線形な決定境界を獲得できるようにするため、階層型ニューラルネットワークの中で応用例が多く、誤識別の少ない非線形識別面が学習できるＢＰ（バックプロパゲーション）ネットワークを適用することが好ましい。

ＢＰネットワークは、図１１に示すように、入力層および出力層と、その間の中間層とを有し、誤差逆伝播アルゴリズムと呼ばれる学習アルゴリズムによって、ユニット間のすべての結合の重みが学習可能になっている。誤差逆伝播アルゴリズムでは、入力信号が入力層、中間層、出力層と伝わり、その一方、誤差信号が逆に伝わることによって、重み調整が行われる。

そして、図１１に示すＢＰネットワークに、学習パターンｘ_ｐ（ｘ_０、ｘ_１・・・ｘ_ｎ）が入力されたとき、ある階層のｊ（０≦ｊ≦ｎ）番目のユニットには、そのユニットｊとの結合を有する１階層前のユニットから重み付きの信号が入力される。そこで、１階層前のｉ（０≦ｉ≦ｎ）番目のユニットからの信号をｔ_ｉｐ，重みをｗ_ｉｊとすると、ユニットｊへの入力は、式１のようになり、ユニットｊの出力は、閾値関数をｆとして、式２のようになる。

式１

式２

学習パターンｘ_ｐに対する誤差Ｄ_ｐは、出力層のユニットｋの出力と、教師信号ｂ_ｋｐの差の２乗和で定義されるから、以下の式３のようになる。この誤差Ｄ_ｐをすべての学習パターンに対して足しあげて式４のＤを求め、そのＤが最小になるように、ユニット間の結合重みが調整されて機械学習部１３３における学習が行われる。この場合、個々の学習パターンが入力されるごとに、式５によって重みが調整される。ｗ_ｉｊは更新前の重み、ｗ'_ijは更新後の重み、ρは学習係数である。これは確率的最急降下法と呼ばれる。なお、ユニットの入出力関数は式６に示すシグモイド関数が用いられる。

式３

式４

式５

式６

指定予測データ生成部１３４は、サーチ無しモードにおいて、要旨データ記憶部１５３に記憶されている要旨データと、指定先行技術データ記憶部１５１に記憶されている指定先行技術データとを入力して、各請求項に応じた予測対象発明の請求項要旨データｉｅｄと、指定先行技術データＶｓ２とを入力ベクトル生成部１３２に出力し、進歩性予測データＶｓ１を予測結果ファイル生成部１２７に出力する。進歩性予測データＶｓ１には、指定先行技術データＶｓ２とともに主引用発明が見つかったことを示す検索フラグ"ＶＹ"が請求項ごとに含まれていて、これと、後述する要件適否文書ベクトルＶ４とが本実施に形態にかかる発明指定進歩性予測データに相当する。

（ユーザ端末装置３０の構成）
ユーザ端末装置３０は、図１に示すように、インターネットＮ１への接続環境を備え、特許要件適否予測サーバ１０と通信を行うことができる。なお、ユーザ端末装置３０は、据え置き型（または持ち運び可能なノート型）のパーソナルコンピュータを想定しているが、タブレット型の端末装置でもよい。

ユーザ端末装置３０は、図３に示すように、ＣＰＵ３１、ＲＯＭ３２、ＲＡＭ３３、データ記憶部３４、液晶表示部３５を有している。また、ユーザ端末装置３０は、音声変換処理部３６、通信制御部３７、通信処理部３８ａ、無線通信部３８ｂ、スピーカ３９およびマイク４０を有している。

ＣＰＵ３１は、ＲＯＭ３２に記憶されているプログラムにしたがい作動してユーザ端末装置３０全体の動作制御を司る。ＲＯＭ３２はＣＰＵ３１が実行するプログラム、例えば、データ通信を行うための通信制御プログラムが記憶されている。ＲＡＭ３３には、ＣＰＵ３１によるプログラムの実行に必要なデータ等が記憶される。

データ記憶部３４には種々のデータが記憶されている。液晶表示部３５は、ＬＣＤ（Liquid Crystal Display）とその駆動部を有し、文字、図形、記号などの画像表示を行う画像表示手段である。音声変換処理部３６は、音声データを伸張してスピーカ３９に出力する一方、マイク４０から入力するアナログ音声信号をデジタルの音声データに変換および圧縮して、通信処理部３８ａに入力する。通信制御部３７はＣＰＵ３１の指示を受けて作動し、データ通信を行うための回線の接続および切断を制御する。通信処理部３８ａは、通信制御部３７の指示にしたがい作動して、インターネットＮ１を介して行われるデータの送受信を実行する。無線通信部３８ｂは通信制御部３７の制御にしたがい、無線によるデータの送受信を実行する無線通信手段である。スピーカ３９は、音声を出力する音声出力手段であり、マイク４０はユーザの会話内容等の音声を入力し、電気信号に変換する。

(特許要件適否予測システムの動作内容）
次に、図４とともに図１２から図２２までと、図３２から図３５までとを参照して、特許要件適否予測サーバ１０による特許要件適否予測処理の動作内容について説明する。

ここで、図４は、特許要件適否予測処理を実現する特許要件適否予測サーバ１０の主要な構成を示す機能ブロック図である。特許要件適否予測サーバ１０では、ＣＰＵ１１が特許要件適否予測プログラムにしたがい、公開公報ＤＢ１５０、指定先行技術データ記憶部１５１、要旨データ記憶部１５３等に記憶されている各種ファイルやＤＢにアクセスしながら、案文データ生成部１０１、要旨データ抽出部１０２、特許要件適否予測処理部１０３、予測結果編集処理部１０５、指定先行技術データ生成部１０６としての動作を行う。これにより、特許要件適否予測処理が実行される。なお、特許要件適否予測プログラムは、特許要件適否予測サーバ１０を案文データ生成部１０１、要旨データ抽出部１０２、特許要件適否予測処理部１０３、予測結果編集処理部１０５、指定先行技術データ生成部１０６等として機能させるためのプログラムである。

そして、特許要件適否予測サーバ１０が特許要件適否予測処理を行うときは、ＣＰＵ１１が特許要件適否予測プログラムにしたがい図１２に示すフローチャートに沿った動作を行う。図１２は、特許要件適否予測プログラムにしたがったＣＰＵ１１の特許要件適否予測処理の動作手順の一例を示すフローチャートである。なお、図１２、図１３等において"Ｓ"とはステップを略記したものである。

ＣＰＵ１１は、特許要件適否予測プログラムにしたがい動作を開始すると、ステップ１に進み、ユーザ認証処理を行う。ここでは、ユーザがユーザ端末装置３０を用いて入力したユーザＩＤおよびパスワードを確認する等してユーザ認証処理を行う。次に、ＣＰＵ１１は、ステップ２に進み、ポイント残高確認処理を行う。ポイント残高確認処理では、ユーザのポイント残高が一定値以上あるかどうかをＣＰＵ１１が確認し、ポイント残高不足であれば、特許要件適否予測処理を終了するか、ポイント残高不足を知らせるメッセージの送信などを行う。

ＣＰＵ１１は、処理をステップ３に進めると、発明データ受信・復号化が実行される。このステップ３では、ＣＰＵ１１が通信処理部１６を作動させるなどして、ユーザ端末装置３０から暗号化通信（例えばＳＳＬを利用した暗号化通信）による発明データ受信を実行するとともに、案文データ生成部１０１としての動作を行い、発明データ受信で受信した案文書データの復号化を行い、さらにマシン日付を出願日にセットしたうえで、予測対象ＴＲ記憶部１５２に記憶させる。また、ＣＰＵ１１は、発明データ受信の受信データに指定先行技術データが含まれているときは、その指定先行技術データの復号化を行い、さらに、指定先行技術データ記憶制御手段としての動作を行い指定先行技術データ生成部１０６を作動させて、復号化した指定先行技術データを指定先行技術データ記憶部１５１に記憶させる。続いてステップ４に処理が進むと、案文カウンタＭＡＸに受信した案文書データの件数がセットされ、案文カウンタに"０"がセットされる。

次に、ＣＰＵ１１は、処理をステップ５に進めて、指定先行技術データ記憶部１５１に指定先行技術データが記憶されているかどうかによって、予測モードがサーチ有りモードかサーチ無しモードなのかを判定する。そして、指定先行技術データ記憶部１５１に指定先行技術データが記憶されているときは、ＣＰＵ１１が予測処理制御部としての動作を行い、サーチ無しモードによる要件適否の予測を行うためステップ６Ａに処理を進め、一方、指定先行技術データ記憶部１５１に指定先行技術データが記憶されていなければ、サーチ有りモードによる要件適否の予測を行うため、ＣＰＵ１１はステップ６に処理を進める。

そして、ＣＰＵ１１は、処理をステップ６に進めると予測終了条件が成立しているか否かを判定する。ここで、ＣＰＵ１１は予測終了条件が成立しているときはステップ８に進むが、そうでないときはステップ７に進む。ＣＰＵ１１はステップ７に進むと、後述する特許要件適否予測ルーチンを実行するが、ステップ８に進むと、終了処理を実行し、そのユーザに対する特許要件適否予測処理を終了する。このようにすることで、サーチ有りモードでは、予測終了条件が成立するまでの間、特許要件適否予測処理が自動的かつ継続的に実行される。

また、ステップ６Ａに進んだ場合も、ステップ６と同様、予測終了条件の成否が判定され、予測終了条件が成立すればステップ８に進むが、そうでないときはステップ９に進み、ＣＰＵ１１が後述するサーチ無し特許要件適否予測ルーチンを実行して、その後、ステップ６Ａにもどる。このようにすることで、サーチ無しモードでは、予測終了条件が成立するまでの間、サーチ無し特許要件適否予測処理が自動的かつ継続的に実行される。

そして、ＣＰＵ１１はステップ７に進むときは、図１３に示すフローチャートに沿って特許要件適否予測ルーチンを実行する。

（特許要件適否予測ルーチン）
ＣＰＵ１１は特許要件適否予測ルーチンを開始すると、ステップ１１に進み、案文カウンタに"１"を加算する。続くステップ１２では、案文カウンタが案文カウンタＭＡＸよりも大きいか否かを判定し、大きくなければ処理をステップ１３に進めるが、そうでなければ（案文カウンタが案文カウンタＭＡＸより大きいとき）はステップ１６に処理を進める。

ＣＰＵ１１は、ステップ１３に処理を進めると、対象公報抽出部１０４としての動作を行って案文書データの出願日（ステップ３でマシン日付がセットされている）を基準にして公開公報データの抽出を行い、抽出したデータを検索対象公報データとして対象公報記憶部１５５に記憶させる。また、ＣＰＵ１１は、要旨データ抽出部１０２としての動作を行って前述した要旨データおよびＣＴデータを生成し、それぞれ要旨データ記憶部１５３、ＣＴデータ記憶部１５４に記憶させる。対象公報抽出部１０４は、出願日が案文書データの出願日よりも前の公開公報データを抽出する。

続いてＣＰＵ１１は、ステップ１４に処理を進めて後述する新規性・拡大先願予測ルーチンを実行してからステップ１５に進み、進歩性予測ルーチンを実行する。その後、ＣＰＵ１１は、ステップ１１に戻って上記同様の処理を繰り返す。ステップ１６では、ＣＰＵ１１が予測結果編集処理部１０５としての動作を行い、後述する予測結果リストＬ１を編集出力する。その後、ステップ１７のポイント消費処理を実行して、特許要件適否予測を行った案文書データの件数に応じて、ポイント残高を減らす。その後、特許要件適否予測ルーチンが終了する。

（サーチ無し特許要件適否予測ルーチン）
一方、ＣＰＵ１１は、図３２に示すように、サーチ無し特許要件適否予測ルーチンを開始すると、ステップ１１、ステップ１２を特許要件適否予測ルーチンと同様に実行した後、ステップ１３Ａを実行する。ステップ１３Ａでは、ＣＰＵ１１が要旨データ抽出部１０２としての動作を行って前述した要旨データおよびＣＴデータを生成し、それぞれ要旨データ記憶部１５３、ＣＴデータ記憶部１５４に記憶させる。また、続いてＣＰＵ１１はステップ１２５に処理を進めて後述するサーチ無し進歩性予測ルーチンを実行し、その後、ステップ１１に戻る。処理がステップ１２から、ステップ１６，１７に進む場合も、それらステップ１６，１７を特許要件適否予測ルーチンと同様に実行する。

（新規性・拡大先願予測ルーチン）
そして、図１３に戻り、ＣＰＵ１１は、ステップ１４に処理を進めると、前述した新規性・拡大先願予測処理部１２５としての動作を行い、図１４、図１５に示すフローチャートに沿って、新規性・拡大先願予測ルーチンを実行する。

この場合、ＣＰＵ１１は、新規性・拡大先願予測ルーチンをスタートするとステップ２１に処理を進め、文献カウンタ（文献ｃｔ）および文献ＭＡＸに"０"をセットし、項番カウンタ（項番ｃｔ）に"１"をセットする。続いてステップ２２に処理が進み、要旨データ記憶部１５３に記憶されている要旨データの項番ｃｔに応じたデータを検索タームに用いて、対象公報記憶部１５５の検索対象公報データについて全文検索が行われ、ヒットした文献の件数が文献ＭＡＸにセットされる。この場合、ステップ２１で項番カウンタに"１"がセットされているので、項番エリア１５３ｂが"１"のデータ、すなわち請求項１の要旨データを用いて検索タームが設定される。

続いて処理がステップ２３に進み、ステップ２２でヒットした文献があったか否か（文献ＭＡＸが１以上か否か）が判定され、ヒットした文献があればステップ２４に処理が進み、そうでなければ新規性・拡大先願予測ルーチンが終了する。

ステップ２４では、文献カウンタに"１"が加算され、続くステップ２５では、文献カウンタが文献ＭＡＸ以下であるか否かが判定され、これが成立しているときはステップ２６に処理が進み、そうでなければステップ２９に処理が進む。ステップ２６では、ヒットした文献の出願公開日（ヒット文献公開日）が案文書データの出願日（対象出願日）よりも小さいか否か（ヒット文献公開日＜対象出願日が成立するか否か）が判定され、これが成立しているときはステップ２７に処理が進み、そうでなければステップ２８に処理が進む。ステップ２７では、新規性無しを示す新規性フラグ"Ｎ１"を含むように新規性・拡大先願予測データＮｄが生成される。その後、ステップ２４に戻り、上記同様の処理が繰り返えされる。

そして、ステップ２８では、後述する拡大先願予測ルーチンが実行される。ステップ２９では、ＣＴデータ記憶部１５４を参照して、他の独立項が有るか否かが判定され、他の独立項があるときはステップ３０に処理が進み、そうでなければステップ３１で新規性・拡大先願予測データＮｄが出力された後、新規性・拡大先願予測ルーチンが終了する。ステップ３０では、ＣＰＵ１１が文献カウンタおよび文献ＭＡＸに"０"をセットし、項番カウンタに"１"よりも大きい請求項ナンバがセットされる。その後、処理がステップ２２に戻り、上記同様の処理が繰り返される。

一方、ＣＰＵ１１は、図１５に示すフローチャートに沿って拡大先願予測ルーチンを実行する。拡大先願予測ルーチンがスタートすると、ステップ４１に処理が進み、ヒットした文献の出願日（文献出願日）が対象出願日よりも前であるか否か（文献出願日＜対象出願日が成立するか否か）が判定され、これが成立しているときはステップ４２に処理が進むが、そうでなければ拡大先願予測ルーチンを終了する。ステップ４２では、予測対象発明とヒットした文献とで発明者が同一であるか否かが判定され、これが成立していないときはステップ４３に処理が進むが、成立していれば拡大先願予測ルーチンを終了する。ステップ４３では、予測対象発明とヒットした文献とで出願人が同一であるか否かが判定され、これが成立していないときはステップ４４に処理が進むが、成立していれば拡大先願予測ルーチンを終了する。そして、ＣＰＵ１１は、ステップ４４に処理を進めると、拡大先願の要件（特許法第２９条の２に規定される要件）を満たしていないことを示す拡大先願フラグ"Ｆ１"を含むように新規性・拡大先願予測データＮｄを生成する。その後、拡大先願予測ルーチンが終了する。

以上で新規性・拡大先願予測ルーチンが終了すると、図１３において処理がステップ１４からステップ１５に進み、ＣＰＵ１１が進歩性予測処理部１２６としての動作を行い、進歩性予測ルーチンを実行する。ＣＰＵ１１は、図１６〜図２２に示すフローチャートに沿って進歩性予測ルーチンを実行する。

（進歩性予測ルーチン）
ＣＰＵ１１は、進歩性予測ルーチンをスタートするとステップ５１に処理を進め、ＣＴデータ記憶部１５４から、独立区分エリア１５４ａの独立区分がスペースのレコードにつき、そのナンバエリア１５４ｂの請求項ナンバを取得して、後述する独立項テーブル１６５のナンバエリア（Ｎｏエリア）１６５ｂにセットする。続くステップ５２では、ＣＴデータ記憶部１５４から、サーチフラグエリア１５４ｅのサーチフラグがスペースで、ＭＡＸ区分エリア１５４ｃのＭＡＸ区分が"Ｍ"のレコードからそのナンバエリア１５４ｂの請求項ナンバを取得したうえで、取得した請求項ナンバの最小値（ＭＩＮ）を求め、それをＭＡＸカウンタにセットする。図９（Ｂ）のように、ＭＡＸ区分が"Ｍ"のレコードが複数あるときはそのうちの最も小さい請求項ナンバがＭＡＸカウンタにセットされる。

そして、ＣＰＵ１１は、ステップ５３に処理を進めて独立項テーブル１６５のＮｏエリア１６５ｂをサーチし、続くステップ５４で、"１"よりも大きい請求項ナンバがあるか否かを判定し、"１"よりも大きい請求項ナンバがあるか否かで処理が分岐する。この場合、"１"よりも大きい請求項ナンバがなければ処理がステップ５５に進み、あれば処理がステップ５６に進む。ステップ５５は予測対象発明の案文書に含まれる請求項の中で独立項が１つだけの場合の処理（単一独立項ルーチン）、ステップ５６は独立項が複数の場合の処理（複数独立項ルーチン）に相当している。前者は例えば予測対象発明が特開２００８−６２２８２号公報に開示されている発明の場合、後者は例えば予測対象発明が特開２０１１−１８６７３５号公報に開示されている発明の場合に相当している。

独立項テーブル１６５は、図２４に示すように、カウンタエリア１６５ａ，Ｎｏエリア１６５ｂおよびサーチフラグエリア１６５ｃを有している。カウンタエリア１６５ａには、記憶されるデータの件数に応じた数値が記憶されている。Ｎｏエリア１６５ｂには、独立項の番号が記憶される。サーチフラグエリア１６５ｃにはサーチフラグが記憶されている。図２４には、一例として、予測対象発明が特開２０１１−１８６７３５号公報に開示されている発明の場合が示されている。

そして、ＣＰＵ１１は、ステップ５５に処理を進めると、図１７に示すフローチャートに沿って単一独立項ルーチンを実行する。ＣＰＵ１１は、単一独立項ルーチンを開始すると、ステップ６１に処理を進め、ＣＴデータ記憶部１５４から、サーチフラグエリア１５４ｅのサーチフラグがスペースのレコードについて、そのナンバエリア１５４ｂから請求項ナンバを取得して、そのうちの最小値（ＭＩＮ）を項番カウンタにセットする。続くステップ６２では、後述する独立項検索処理が行われる。続くステップ６３で検索フラグ（検索ｆｌａｇ）が"ＶＸ"または"ＶＹ"であるか否かが判定され、検索フラグが"ＶＸ"または"ＶＹ"であれば処理がステップ６４に進み、そうでなければ単一独立項ルーチンを終了する。

ＣＰＵ１１は、ステップ６４に処理を進めると項番カウンタに"１"を加算する。続くステップ６５では、項番カウンタが、ステップ５２でセットしたＭＡＸカウンタ以下であるか否かが判定され、項番カウンタがＭＡＸカウンタ以下ならステップ６６に処理を進めて後述する従属項検索処理が実行されるが、そうでなければ独立項検索処理が終了する。

そして、ＣＰＵ１１は図１８に示すフローチャートに沿って、複数独立項ルーチンを実行する。ＣＰＵ１１は処理をスタートすると、ステップ５２に処理を進め、前述同様の処理を実行し、その後、ステップ５５に進んで、上記同様にして単一独立項ルーチンを実行する。その後、ＣＰＵ１１は処理をステップ６７に進め、ＣＴデータ記憶部１５４に、サーチフラグエリア１５４ｅのサーチフラグがスペースのレコードがあるか否か（すなわち、検索処理が行われていないレコードがあるか否か）が判定され、あればステップ５２に戻って上記同様の処理が実行されるが、そうでなければ複数独立項ルーチンが終了する。

また、ＣＰＵ１１は図１９に示すフローチャートに沿って、独立項検索処理を実行する。独立項検索処理では、ＣＰＵ１１が引用発明検索部１３１としての動作を行い、独立項について主引用発明検索および副引用発明検索を行う。

ＣＰＵ１１は、独立項検索処理を開始すると、ステップ７１に処理を進めて後述する主引用発明検索処理を実行する。続くステップ７２では、主引用発明検索処理で主引用発明があったか否か（後述する主引用文献がセットされているか否か）が判定され、主引用発明があればステップ７３に処理が進むが、主引用発明がなければステップ７６に処理が進む。続くステップ７３では、後述する副用発明検索処理が実行され、そのあとのステップ７４で、副引用発明検索処理で副引用発明があったか否か（後述する副引用文献がセットされているか否か）が判定される。副引用発明があればステップ７５に処理が進み、副引用発明がなければステップ７７に処理が進む。

ＣＰＵ１１はステップ７５に処理を進めると、該当する請求項ナンバの検索フラグ（検索ｆｌａｇ）に"ＶＸ"をセットし、ステップ７７では、検索フラグ（検索ｆｌａｇ）に"ＶＹ"をセットする。また、ＣＰＵ１１はステップ７６に処理を進めると、ＣＴデータ記憶部１５４に記憶されているレコードのうち、ナンバエリア１５４ｂの請求項ナンバが項番カウンタに一致しているレコードについて、サーチフラグエリア１５４ｅのサーチフラグＥｆにサーチ済み（検索済み）を示す"９"をセットする。また、ＣＰＵ１１はセットされた検索フラグを含むように進歩性予測データＶｄ１を生成して、それを予測結果ファイル生成部１２７に出力する。また、ＣＰＵ１１は検索結果に応じた請求項要旨データｉｅｄと概念検索データＶｄ２を入力ベクトル生成部１３２に出力する。この場合、請求項要旨データｉｅｄは、検索の対象となった請求項の要旨データとすることができるが、予測対象ＴＲ記憶部１５２に記憶されている予測対象発明の検索の対象となった請求項のデータでもよい。検索フラグは、主引用発明が見つかった場合に"ＶＸ"または"ＶＹ"がセットされるが、主引用発明が見つかると、それによって、進歩性の要件を満たさないと判断される可能性が高いため、進歩性違反の拒絶理由が見つかるか否かは主引用発明が見つかるか否かに大きく左右される。進歩性予測データＶｄ１は、このような検索フラグを含むことによって、進歩性の要件適否を示すものとなる。

そして、ＣＰＵ１１は図２０に示すフローチャートに沿って、主引用発明検索処理を実行する。主引用発明検索処理は、予測対象発明に最も近い主引用発明を検索する処理である。

ＣＰＵ１１は、主引用発明検索処理を開始すると、ステップ８１に処理を進めて、展開度カウンタｔｃに"０"をセットする。続いてＣＰＵ１１は、ステップ８２に処理を進め、要旨データ記憶部１５３から、次のデータを読みだして主検索文書データ（主引用発明を概念検索で検索するときの文書データ）を設定する。１つは、データ種別が"Ｃ"で、項番エリア１５３ｂの番号が項番カウンタに相当するレコード（項番カウンタには、ステップ６１で独立項の最小値がセットされている）から必須フラグＥｆが"Ｘ"で、展開度Ｅｄが展開度の最大値（展開度ＭＡＸ）−展開度カウンタｔｃの用語（例えば、展開度ＭＡＸが"５"なら、展開度Ｅｄが"５"−ｔｃの用語）であり、もう１つは、課題データ、すなわち、データ種別が"Ｐ"のレコードのデータである。

続くステップ８３では、ＣＰＵ１１が主引用発明の検索処理、すなわち、主検索文書データを入力文書に用いて、対象公報記憶部１５５に記憶されている検索対象公報データについて概念検索を行う。この概念検索では、主検索文書データと、検索される文書それぞれを特徴語の抽出、重み付けを行う等してそれぞれの文書に応じたベクトル（文書ベクトル）が生成され、各ベクトルの内積が求められて類似度が算出される。次にステップ８４では、ステップ８３の概念検索の結果から、最も大きい類似度が一定値以上になっているか否かが判定され、一定値以上の場合はステップ８５に処理が進むが、そうでなければステップ８７に処理が進む。ステップ８５では、類似度が一定値以上の文献が複数あったか否かが判定され、なければステップ８６に処理が進み、あれば処理がステップ８９に進む。主引用発明検索処理では、類似度が一定値以上の文献があったときだけ主引用文献がセットされる。

ステップ８６では、ヒットした文献が主引用文献（主引用発明が開示されている先行技術文献）にセットされて主引用発明検索処理が終了する。ステップ８７では、展開度カウンタｔｃに"１"が加算され、その後のステップ８８では、展開度ＭＡＸ−展開度カウンタｔｃが"０"以下であるか否かが判定され、"０"以下なら主引用発明検索処理を終了するが、そうでなければステップ８２に戻って上記の処理を繰り返す。

こうすることで、はじめに展開度Ｅｄが展開度ＭＡＸのより重要な用語で概念検索が行される。概念検索では、文献の類似度に応じて、複数の文献が抽出され得るが、最も高い類似度が一定値に達していないときは、その文献が主引用文献に該当しないおそれが高い。そのため、類似度が一定値以上の文献が見つからなかった場合に展開度Ｅｄが展開度ＭＡＸよりも小さい用語を含めて再び概念検索が実行される。

ステップ８９では、類似度の最も大きい文献（最類似文献ともいう）を主引用文献にセットし、その後、主引用発明検索処理が終了する。

そして、ＣＰＵ１１は図２１に示すフローチャートに沿って、副引用発明検索処理を実行する。副引用発明検索処理は、予測対象発明と主引用発明との相違点を含む副引用発明を検索する処理であり、主引用発明検索処理で主引用発明が見つかったときだけ実行される。

ＣＰＵ１１は、副引用発明検索処理を開始すると、ステップ９１に処理を進めて、要旨データ記憶部１５３から、データ種別が"Ｃ"で、項番エリア１５３ｂの番号が項番カウンタに相当するレコードの主検索文書データに含まれていない用語（検索未使用データ）と、データ種別が"Ｐ"のレコードのデータとを読み出し、それらを副検索ターム（副引用発明を全文検索で検索するときのキーワード）に設定する。

続くステップ９２では、ＣＰＵ１１が副引用発明の検索処理、すなわち、副検索タームを検索キーワードに用いて、対象公報記憶部１５５に記憶されている検索対象公報データについて全文検索を行う。続くステップ９３では、ステップ９２でヒットした文献があったか否かが判定され、ヒットした文献があればステップ９４に処理が進み、そうでなければ処理がステップ９６に進む。ステップ９４では、ヒットした文献が複数あったか否かが判定され、ヒットした文献が複数なければステップ９５に処理が進み、ヒットした文献が複数あれば処理がステップ９８に進む。

ステップ９５では、ヒットした文献が副引用文献（副引用発明が開示されている先行技術文献）にセットされて副引用発明検索処理が終了する。ステップ９６では、副検索タームが変更されて再び全文検索が行われる。ここでは、副検索タームが、データ種別が"Ｃ"で、項番エリア１５３ｂの番号が項番カウンタに相当するレコードの主検索文書データに含まれていない検索未使用データと、データ種別が"Ｔ"のレコードのデータに変更される。次のステップ９７でヒットした文献があったか否かが判定され、ヒットした文献があればステップ９４に処理が進み、なければ副引用発明検索処理が終了する。さらに、ステップ９８では、ヒットした文献のそれぞれについて、データ種別が"Ｃ"で、項番エリア１５３ｂの番号が項番カウンタに相当するレコードの必須フラグＥｆが"Ｘ"の用語との一致数がカウントされ、その一致数が副引用ファイルにセットされる。次のステップ９９で副引用ファイルが一致数の降順にソートされ、続くステップ１００で副引用ファイルの先頭から３件が副引用文献にセットされ、その後、副引用発明検索処理が終了する。副引用発明検索で複数の文献がヒットしたときは、そのそれぞれについて、予測対象発明の特徴部分がどの程度開示されているのかが、必須フラグＥｆが"Ｘ"の用語との一致数で調べられ、その一致数の多い文献が副引用文献にセットされる。

そして、ＣＰＵ１１は図２２に示すフローチャートに沿って、従属項検索処理を実行する。従属項検索処理は、検索フラグ（検索ｆｌａｇ）が"ＶＸ"または"ＶＹ"であったとき（主引用発明がみつかったとき）だけ実行される。ＣＰＵ１１が従属項検索処理を開始すると、ステップ１１１に処理が進み、要旨データ記憶部１５３から、データ種別が"Ｃ"で、項番エリア１５３ｂの番号が項番カウンタに相当するレコード（項番カウンタには、ステップ６４で独立項の最小値に順次"１"が加算される）から必須フラグＥｆが"Ｘ"の用語が読み出され、それが従属検索ターム（従属項に記載されている発明を全文検索で検索するときのキーワード）に設定される。次のステップ１１２でＣＰＵ１１が従属検索タームを検索キーワードに用いて、主引用文献について全文検索を行い、従属項に記載されている発明が主引用文献に開示されているか否かを調べる。

次のステップ１１３で、ヒットした文献があったか否かが判定され、ヒットした文献があればステップ１１４に処理が進み、そうでなければ処理がステップ１１６に処理が進む。ステップ１１４では、該当する請求項ナンバの検索フラグ（検索ｆｌａｇ）に"ＶＸ"がセットされ、ヒットした文献が該当する請求項ナンバの主引用文献にセットされる。その後、処理がステップ１１５に進み、ＣＴデータ記憶部１５４に記憶されているレコードのうち、ナンバエリア１５４ｂの請求項ナンバが項番カウンタに一致するレコードについて、サーチフラグエリア１５４ｅのサーチフラグＥｆに"９"がセットされ、その後、従属項検索処理が終了する。また、ステップ１１６では、従属検索タームで副引用文献について全文検索が行われ、次のステップ１１７で、ヒットした文献があったか否かが判定される。ヒットした文献があればステップ１１８を実行したあとステップ１１５に進み、なければ従属項検索処理が終了する。ステップ１１８では、該当する請求項ナンバの検索フラグ（検索ｆｌａｇ）に"ＶＹ"がセットされ、ヒットした文献が該当する請求項ナンバの副引用文献にセットされる。

以上のようにして、新規性・拡大先願予測ルーチンと、進歩性予測ルーチンとが実行されると、それぞれの結果に応じて、新規性・拡大先願予測データＮｄと、進歩性予測データＶｄ１とが予測結果ファイル生成部１２７に出力される。また、機械学習部１３３から要件適否文書ベクトルＶ４が出力されるので、これらを用いて予測結果ファイル生成部１２７が図１０に示した予測結果ファイルを生成し、予測結果記憶部１５６に記憶させる。

予測結果ファイルは、図１０に示すように、案文書番号、請求項、主検索文書データ、副検索ターム、検索フラグ、ヒット文献、マシン予測の各項目のデータが予測対象発明ごとに記憶されている。マシン予測とは、機械学習記憶部１３３からの要件適否文書ベクトルＶ４に応じたデータであって、進歩性予測ルーチンで見つかった主引用文献および副引用文献を引用した進歩性違反の拒絶理由が見つかる可能性が高いか低いか（高い場合は"Ｈ"、低い場合は"Ｌ"）を示している。

また、予測結果編集部１０５が予測結果ファイルを読み込み、図２５に示すような特許要件適否予測リストＬ１を編集および出力して、ユーザ端末装置３０に送信する。特許要件適否予測リストＬ１には、予測対象発明の案文書番号、請求項の番号とともに、新規性（拡大先願）、進歩性の要件適否がその根拠となる文献（主引用文献、副引用文献）とともに示されている。新規性（拡大先願）、進歩性の要件に適合しない（満たさない）と予測される場合は、"Ｘ"、適合する（満たす）と予測される場合は"Ａ"が記載される。これらは、予測結果ファイルの検索フラグで判断される。

進歩性の要件に適合しないと予測される場合の"Ｘ"（主引用文献、副引用文献有り）、"Ｙ"（主引用文献のみ有り）、には、"Ｈ"、"Ｌ"が併記される（図２５では、"Ｈ"が併記されるばあいのみ例示）これは、機械学習部１３３の要件適否文書ベクトルＶ４にしたがったもので、"Ｈ"は主引用文献で進歩性違反の拒絶理由が発行される可能性が高い場合、"Ｌ"は低い場合を示している。

（サーチ無し進歩性予測ルーチン）
ＣＰＵ１１は、サーチ無し進歩性予測ルーチンをスタートすると、図３３に示すように、進歩性予測ルーチンと同様にして、ステップ５１、５２，５３、５４を実行する。ステップ５４で、"１"よりも大きい請求項ナンバがあるか否かで処理が分岐する。この場合、"１"よりも大きい請求項ナンバがなければ処理がステップ１２６に進み、あれば処理がステップ１２７に進む。ステップ１２６はサーチ無し単一独立項ルーチン、ステップ１２７はサーチ無し複数独立項ルーチンである。前者は図３４に沿って実行されるが、後者は図３５に沿って実行される。

（サーチ無し単一独立項ルーチン）
ＣＰＵ１１は、サーチ無し単一独立項ルーチンをスタートすると、図３４に示すように、図１７と同様にステップ６１を実行したあと、指定予測データ生成部１３４としての動作を行い、ステップ１３０，１３１を実行する。ＣＰＵ１１は、ステップ１３０に処理を進めると、要旨データ記憶部１５３から項番１５３ｂが最小値ＭＩＮに応じたレコードと、データ種別が"Ｐ"のレコードを読み出して請求項要旨データｉｅｄを生成する。ＣＰＵ１１は、続くステップ１３１では、指定先行技術データ記憶部１５１に記憶されている指定先行技術データを読み出して、進歩性予測データＶｓ１と指定先行技術データＶｓ２ｓを生成し、それぞれ予測結果ファイル生成部１２７、入力ベクトル生成部１３２に出力する。続くステップ１３２で、サーチフラグエリア１５４ｅのサーチフラグＥｆに"９"をセットすると、サーチ無し単一独立項ルーチンが終了する。

（サーチ無し複数独立項ルーチン）
ＣＰＵ１１は、サーチ無し複数独立項ルーチンをスタートすると、図３５に示すように、ステップ１２６に進んで上記同様にしてサーチ無し単一独立項ルーチンを実行する。その後、図１８と同様のステップ６７に処理が進み、ＣＴデータ記憶部１５４に、サーチフラグエリア１５４ｅのサーチフラグがスペースのレコードがあるか否かが判定され、レコードがあればステップ１２６に戻ってサーチ無し単一独立項ルーチンが上記同様に実行されるが、無ければサーチ無し複数独立項ルーチンが終了する。

以上のように、本発明の実施の形態にかかる特許要件適否予測サーバ１０では、サーチ有りモードの場合は、予測対象発明が記載されている案文書の案文書データから要旨データを生成し、これを用いて主引用発明検索、副引用発明検索を行っている。主引用発明検索は、予測対象発明とその骨格において共通する、すなわち、先行技術発明のうち、予測対象発明に最も近い主引用発明を要旨データで探し出す処理であり、特許法や特許・実用新案審査基準に沿って行われる。副引用発明検索は、主引用発明検索で主引用発明が見つかった場合に、発明が解決しようとする課題や、技術分野を特定する用語を用いた全文検索で行われており、これも特許法や特許・実用新案審査基準に沿って行われる。したがって、本発明の実施の形態にかかる特許要件適否予測サーバ１０では、特許要件の適否に関する予測が審査実務に適合した内容で行われるので、特許出願の出願書類の準備負担を有効に軽減することができる。

一方、前述したように、特許要件適否予測処理部１０３が機械学習部１３３を有しているが、その機械学習部１３３は過去の審査実績に基づく学習データで訓練された人工知能プログラムで構築されている。

ところで、平成２６年の実績ベースで年間３２万数千件程度の特許出願が出されており、その一部またはそれ以前の多数の特許出願について１ｓｔアクションがすでに発行されている。その中には、拒絶理由通知で進歩性違反の拒絶理由が指摘されている出願（進歩性拒絶出願）が多数存在している。

進歩性拒絶出願では、審査結果が、審査時点の請求項に記載された発明と主引用発明とに相違点があったものの、その相違点だけでは、進歩性があるとは審査官によって判断されなかったということを意味している。これに対し、特許出願の中には、１ｓｔアクションが発行されることなく特許査定が発行された出願や、拒絶理由通知が発行されたものの、その理由に進歩性違反の拒絶理由が指摘されていなかった出願（進歩性拒絶無し出願）も存在している。

そして、例えば図２３に示すように、審査対象となる特許出願Ｐｄがあり、その出願日がｔ_０であったとすると、特許出願Ｐｄに対する主引用発明または副引用発明となりえるのは、公知、公用、文献公知およびインターネット公知の発明であり、主に出願日ｔ_０より前にすでに公開されている出願の特許公開公報（図２３では、ｒｆ１〜ｒｆ６）に開示されている発明である。

ここで、仮に、審査の結果、公報ｒｆ６に開示されている発明が主引用発明に該当すると判断されたとする。すると、その場合、特許出願Ｐｄに係る発明と、その公報ｒｆ６に開示されている発明とに相違点があったものの、その相違点に応じた距離ｄｐが、特許出願Ｐｄに係る発明の進歩性を肯定するに足りる大きさではなかったと考えられる。逆に、公報ｒｆ６に開示されている発明が主引用発明には該当しないと判断されていたとすれば、距離ｄｐが、出願Ｐｄに係る発明の進歩性を肯定するに足りる大きさであったと考えられる。

もし、発明の進歩性が肯定されるときの相違がどの程度で、否定されるときの相違がどの程度なのかが割り出せれば、それが特許要件適否の客観的な判断材料になると考えられるが、以上を考慮すると、そのためには、２つの発明の相違に応じた距離ｄｐがどの程度なのかを割り出すのが有効であると考えられる。これを過去の審査実績に基づく訓練データの学習によって割り出し、進歩性が否定されるおそれが高いのか、それとも低いのかの目安を付けるのが機械学習部１３３である。

機械学習部１３３の学習において、本件出願にかかる発明（本願発明）では、距離ｄｐを２つの文書ベクトルの差分と捉え、進歩性の拒絶理由有りの場合、無しの場合それぞれの距離ｄｐを学習するため、前述のＨＬパターンによる訓練データで学習が行われている。

そして、特許要件の適否を予測する場合は、予測対象発明について、その要旨データを求め、それを用いて概念検索で最類似文献を探し出す。最類似文献は、予測対象発明の文書ベクトル（正確には、独立項の記載事項などから求めた文書ベクトル）に最も類似度が高い文書ベクトルを有しているので、公開済出願の中で主引用文献になる可能性が最も高いと認められる。

その最類似文献から求めた引用候補ベクトルＲｆＶと、予測対象発明の要旨データから求めた要旨ベクトルＥＶとの差分を求めて要旨移動ベクトルＶ３を生成し、これを機械学習部１３３に入力して、主引用発明検索で見つかった主引用文献を引用する進歩性違反の拒絶理由が有るのか、無いのかが出力されるようにしている。これにより、進歩性違反の拒絶理由が見つかる可能性が高いのか、低いのかの目安を付けることが可能になる。

以上のように、特許要件適否予測サーバ１０では、機械学習部１３３を備えていることによって、特許庁の審査実績を反映させる形で特許要件適否の予測が行われることになる。従前のような審査官や弁理士などの専門家の経験や勘だけに頼らざるを得ない判断結果に人工知能の判断結果を生かせるようになるため、予測結果に客観性を持たせることが可能になり、出願書類の準備負担の軽減を通じて権利化業務の効率向上が期待できる。

特にサーチ無しモードの場合は、指定先行技術発明との関係による特許要件の適否予測が行われるため、ユーザが自ら指定した先行技術発明からみて、予測対象発明が進歩性の要件を具備しているのかどうかが予測される。出願書類が準備される際には、先行技術調査で見つかった文献に記載されている先行技術と出願しようとする発明との相違が明確になるようにするものであるが、その相違で、果たしてその発明が進歩性を具備するのか、確信が持てない場合が多々ある。また、進歩性を具備するように出願書類を準備したものの、進歩性違反の拒絶理由が指摘されることもある。この点、特許要件適否予測サーバ１０では、機械学習部１３３によって、進歩性適否の目安を付けることができるので、それを出願書類の準備の段階で生かすことで、出願書類の準備負担の軽減に加え、出願書類の品質向上が期待できる。

また、進歩性予測処理部１２６が主引用発明検索では概念検索を行い、副引用発明検索で全文検索を行っている。進歩性違反の拒絶理由が有るのかどうかは主引用発明が見つかるか否かが大きく左右するが、その主引用発明を探す主引用発明検索で全文検索を行うと、複数の文献がヒットする可能性があり、主引用発明（主引用文献）を特定できない場合がある。この点、概念検索では、文書ベクトルの内積から求めた類似度にしたがい類似している文献が順番付けされるので、最も類似度の高い文献を選ぶことで主引用文献を特定できる。こうして見つけた主引用文献に機械学習部１３３による予測を併用することで、その主引用文献を引用した進歩性違反の拒絶理由が出るおそれが高いのか、低いのかを予測することができる。また、副引用発明検索で全文検索を行うことで、副引用文献があるのかどうかを明確にすることができる。

以上の説明では、より好ましい実施の形態として、進歩性予測処理部１２６の引用発明検索部１３１が主引用発明検索部および副引用発明検索部を有している場合を示している。前述したように、主引用発明検索によって主引用発明が見つかると、進歩性無しの拒絶理由が見つかる可能性が高いから、主引用発明が見つかったら、その後は副引用発明検索を行うことなく入力ベクトル生成部１３２と、機械学習部１３３を作動させて要件適否文書ベクトルＶ４を出力するようにしてもよい。この場合でも、前述のステップ８９でセットされる主引用文献に関する進歩性予測データＶｄ１と、機械学習部１３３により生成される要件適否文書ベクトルＶ４とを併用することで、審査実務に適合した内容の予測が行えるのであって、しかもその予測は人工知能の判断結果を生かしたものとなるから、予測結果に客観性を持たせることができる。したがって、進歩性予測処理部１２６が主引用発明検索部を有していればよく、副引用発明検索部を有していなくてもよいが、上記のように、副引用発明検索部を有する進歩性予測処理部１２６の方がより好ましい。

第２の実施の形態
続いて、第２の実施の形態に係る特許要件適否予測サーバ２００について、図２６〜図３０を参照して説明する。特許要件適否予測サーバ２００は、図２６に示すように、前述した特許要件適否予測サーバ１０と比較して、特許要件適否予測処理部１０３、予測結果編集処理部１０５、予測結果記憶部１５６の代わりに特許要件適否予測処理部２０３、予測結果編集処理部２０５、予測結果記憶部２５６を有する点と、予測結果リストＬ１の代わりに予測結果リストＬ２を出力する点とで相違している。

特許要件適否予測処理部２０３は、図２７に示すように、特許要件適否予測処理部１０３と比較して、進歩性予測処理部１２６と予測結果ファイル生成部１２７の代わりに進歩性予測処理部２２６と予測結果ファイル生成部２２７を有する点で相違している。

そして、進歩性予測処理部２２６は、進歩性予測処理部１２６と比較して、引用発明検索部１３１と機械学習部１３３の代わりに引用発明検索部２３１と機械学習部２３３を有する点と、入力ベクトル生成部１３２の動作が異なる点とで相違している。

前述した第１の実施の形態に係る進歩性予測処理部１２６では、主引用発明検索を行うことによって、最類似文献だけを主引用文献にセットしているが（ステップ８９）、第２の実施の形態に係る進歩性予測処理部２２６では、類似度の降順に最類似文献を含むｎ件の文献（ｎは２以上の整数）を類似文献として抽出し、それら各類似文献を主引用文献にセットしている。また、機械学習部２３３が、ｎ件の要旨移動ベクトルＶ３_１〜Ｖ３_ｎをそれぞれ後述するＳクラス、Ｈクラス、Ｌクラスの３つのクラスに分類する。

引用発明検索部２３１は、引用発明検索部１３１と同様に主引用発明検索部および副引用発明検索部を有しているが、引用発明検索部１３１と比較して、主引用発明検索部の動作が異なり、出力されるデータも異なる。引用発明検索部１３１では、主引用発明検索部が主引用発明検索を行うことによって、最類似文献を主引用文献にセットしているが（前述した主引用発明検索処理のステップ８９）、引用発明検索部２３１の主引用発明検索部は、ステップ８９において、類似度の降順に最類似文献を含むｎ件の文献を類似文献として抽出し、それらを主引用文献（ｄｏｃ_１〜ｄｏｃ_ｎ）にセットする。また、主引用発明検索部の動作が異なることに伴い、前述した独立項検索処理におけるステップ７６でＣＰＵ１１が各類似文献に応じたｎ件の進歩性予測データＶｄ１_１〜Ｖｄ１_ｎを生成して、それらを予測結果ファイル生成部２２７に出力する。また、独立項検索処理において、ＣＰＵ１１は請求項要旨データｉｅｄを入力ベクトル生成部１３２に出力するが、各類似文献に応じたｎ件の概念検索データＶｄ２_１〜Ｖｄ２_ｎを入力ベクトル生成部１３２に出力する。

機械学習部２３３は、機械学習部１３３と比較して、次に述べるＳＨＬパターンを学習パターンに用いた機械学習（教師付き学習）によって、各類似文献に応じたｎ件の要旨移動ベクトルＶ３_１〜Ｖ３_ｎをそれぞれＳクラス、Ｈクラス、Ｌクラスのいずれかに分類し、その分類結果に応じたｎ件の出力信号（要件適否文書ベクトルＶ４_１〜Ｖ４_ｎ）を出力するように構築されている。Ｓクラス、Ｈクラス、Ｌクラスは、それぞれ、進歩性の要件に適合しない可能性が極めて高いクラス、適合しない可能性が高いクラス、適合するクラス（予測対象発明について、進歩性違反の拒絶理由が見つかる可能性が極めて高いクラス、高いクラス、無いクラス）に相当している。

また、ＳＨＬパターンは、次のパターンＳ、Ｈ、Ｌの３つのパターンの組み合わせである。
パターンＳ：学習文書ベクトルが第１の学習文書ベクトルで教師ベクトルが新規性および進歩性の拒絶理由有りを示すベクトル（例えば、正解のクラスに対応した次元だけが"１"で、他が"０"のベクトル）との組み合わせ
パターンＨ：学習文書ベクトルが第２の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由有りで新規性の拒絶理由無しを示すベクトル（例えば、正解のクラスに対応した上記とは別の次元だけが"１"で、他が"０"のベクトル）との組み合わせ
パターンＬ：学習文書ベクトルが第３の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由無しを示すベクトル（例えば、上記２つとは別の次元だけが"１"で、他が"０"のベクトル）との組み合わせのパターンである。

第１の学習文書ベクトルは、公開済出願の中で特許庁の審査の結果、初めての拒絶理由通知（１ｓｔアクション）が発行された出願であって、その１ｓｔアクションで、同じ文献を引用して新規性および進歩性違反の拒絶理由（特許法第２９条第１項第３号および同条第２項の要件を満たしていないとする拒絶理由）が指摘されていた出願（新規性・進歩性拒絶出願）の該拒絶理由が指摘されていた（拒絶理由通知発行時点の）請求項に応じた文書ベクトルと、そのときの引用文献１（主たる刊行物として引用されていた第１の主引用刊行物）に応じた文書ベクトル（第１の引用文書ベクトル）との差分に応じた第１の移動文書ベクトルである。

第２の学習文書ベクトルは、公開済出願の中で特許庁の審査の結果、初めての拒絶理由通知（１ｓｔアクション）が発行された出願であって、その１ｓｔアクションで、新規性の拒絶理由（特許法第２９条第１項第３号の要件を満たしていないとする拒絶理由）は指摘されていないが、進歩性違反の拒絶理由（同条第２項の要件を満たしていないとする拒絶理由）が指摘されていた出願（進歩性拒絶出願）の該拒絶理由が指摘されていた（拒絶理由通知発行時点の）請求項に応じた文書ベクトルと、そのときの引用文献１（主たる刊行物として引用されていた第２の主引用刊行物）に応じた文書ベクトル（第２の引用文書ベクトル）との差分に応じた第２の移動文書ベクトルである。

第３の学習文書ベクトルは、公開済出願の中で審査の結果、１ｓｔアクションが発行されずに特許査定が発行された出願（拒絶無し出願）または１ｓｔアクションは発行されたがその拒絶理由に進歩性違反の拒絶理由が指摘されていなかった出願（進歩性拒絶無し出願）の（拒絶理由通知が発行された時点の）請求項１に応じた文書ベクトルと、それら拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる文献（学習用最類似文献）に応じた文書ベクトル（非引用文書ベクトル）との差分に応じた第３の移動文書ベクトルである。

機械学習部２３３は、機械学習部１３３と同様、情報処理に脳神経回路網をモデルにしたニューラルネットワークを適用することができるが、そのうちのＢＰ（バックプロパゲーション）ネットワークを適用することが好ましい。

そして、進歩性予測処理部１２６の入力ベクトル生成部１３２は図２８に示すように、要旨ベクトル生成部１３２ａと、引用候補ベクトル生成部１３２ｂと、移動ベクトル生成部１３２cとを有しているが、そのうちの引用候補ベクトル生成部１３２ｂと、移動ベクトル生成部１３２cの動作が異なっている。すなわち、引用候補ベクトル生成部１３２ｂは、引用発明検索部２３１からｎ件の概念検索データＶｄ２_１〜Ｖｄ２_ｎが入力されるので、そのそれぞれに含まれる各類似文献の公開公報データを入力してその特徴語を抽出し、各語に応じた重み付けを行って各類似文献に応じたｎ件の文書ベクトル（引用候補ベクトル）ＲｆＶ_１〜ＲｆＶ_ｎを生成する。移動ベクトル生成部１３２ｃは、要旨ベクトルＥＶと、各引用候補ベクトルＲｆＶ_１〜ＲｆＶ_ｎとの差分を計算して、双方の文書ベクトルの差分に応じたｎ件の要旨移動ベクトルＶ３_１〜Ｖ３_ｎを生成する。

前述したように、各類似文献は、主引用発明検索部による概念検索によって、最も高い類似度からその降順に抽出した文献であるため、そのいずれも予測対象発明の審査で、主引用発明の開示文献として引用される確率が高いと推測される。そのため、各類似文献を引用候補として引用候補ベクトルＲｆＶ_１〜ＲｆＶ_ｎを求め、これらと要旨ベクトルＥＶとの差分を計算して要旨移動ベクトルＶ３_１〜Ｖ３_ｎを求めれば、予測対象発明と、各類似文献に開示されている発明との相違に応じた要旨移動ベクトルＶ３_１〜Ｖ３_ｎが生成される。

予測結果ファイル生成部２２７は、予測結果ファイル生成部１２７と比較して、図２９に示したレイアウトを有する予測結果ファイルを生成してそれを予測結果記憶部２５６に記憶させる点と、本発明の実施の形態にかかる非適合率算出部としての動作を行い、予測対象発明に関する非適合率Ｖｒを算出する点とで相違している。

非適合率Ｖｒは、予測対象発明についての進歩性の要件に適合しない可能性であって、予測対象発明について、進歩性違反の拒絶理由が見つかる可能性を示している。機械学習部２３３から出力される要件適否文書ベクトルＶ４_１〜Ｖ４_ｎは、進歩性の要件に適合しない可能性が極めて高い、高い、無いといった内容で生成されるので、予測対象発明について、各類似文献との関係でみた進歩性違反の拒絶理由が見つかる可能性を示している。そのため、これらを用いて予測結果ファイル生成部２２７が予測対象発明に関する非適合率Ｖｒを算出する。この場合、予測結果ファイル生成部２２７は、その非適合率Ｖｒを非適合率算出規則にしたがい算出する。非適合率算出規則とは、予測結果ファイル生成部２２７が非適合率Ｖｒを算出する規則であって、本実施の形態では、要件適否文書ベクトルＶ４_１〜Ｖ４_ｎの中に含まれるＳクラス、Ｈクラス、Ｍクラスそれぞれの件数に応じて、非適合率Ｖｒの数値が決定されるように、図示しない算出規則テーブルに設定されている。非適合率算出規則は例えば次のようにすることができる。

Ｓクラスが２件以上：Ｖｒ≧８５％
Ｓクラスが１件で、Ｈクラスの件数が５０％以上：Ｖｒ≧７５％
Ｓクラスが１件で、Ｈクラスの件数が５０％未満：Ｖｒ≧６５％
Ｓクラスが０件で、Ｈクラスの件数が５０％以上：Ｖｒ≧５０％
Ｓクラスが０件で、Ｈクラスの件数が５０％未満：Ｖｒ≧４０％
Ｓクラス、Ｈクラスがともに０件：Ｖｒ≧１５％

上記非適合率算出規則によれば、例えば、類似文献が５件（前述の整数ｎが"５"）の場合、Ｓクラスが２件あればＶｒ≧８５％である。また、Ｓクラスが１件で、Ｈクラスが３件ならＶｒ≧７５％になるが、Ｈクラスが２件だとＶｒ≧６５％、Ｓクラス、Ｈクラスがともに０件（全件がＬクラス）だとＶｒ≧１５％になる。

そして、図２９に示すように、予測結果ファイル生成部２２７が生成する予測結果ファイルは、予測結果ファイル生成部１２７が生成する予測結果ファイルと比較して、非適合率Ｖｒが含まれている点で相違している。

また、予測結果編集処理部２０５は、予測結果編集処理部１０５と比較して、予測結果ファイルを読み込み、図３０に示すような特許要件適否予測リストＬ２を編集および出力する点で相違している。特許要件適否予測リストＬ２は、特許要件適否予測リストＬ１と比較して、ＯＡ率が追加されている点で相違している。ＯＡ率とは、予測対象発明について、審査過程で特許要件（新規性または進歩性）に違反する拒絶理由が見つかり、それを示す拒絶理由通知書が発行される可能性を示していて、前述した非適合率Ｖｒに相当する数値が示されている。

以上のように、第２の実施の形態に係る特許要件適否予測サーバ２００では、特許要件適否予測処理部２０３の進歩性予測処理部２２６において、引用発明検索部２３１が最類似文献を含むｎ件の類似文献を主引用文献にセットしている。また、機械学習部２３３が各類似文献に応じた要旨移動ベクトルＶ３_１〜Ｖ３_ｎをＳクラス、Ｈクラス、Ｌクラスの３つに分類し、その分類結果に応じた要件適否文書ベクトルＶ４_１〜Ｖ４_ｎを出力する。

第１の実施の形態に係る特許要件適否予測サーバ１０では、特許要件適否に関する予測が審査実務に適合した内容で、しかも特許庁の審査実績を反映させる形で行われる。この点は、特許要件適否予測サーバ２００も同様である。

しかし、特許要件適否予測サーバ１０では、主引用発明検索で、主引用文献として、最類似文献だけが抽出されるに過ぎなかった。最類似文献は、概念検索の結果、予測対象発明との類似度が最も高いとされた文献であるため、実際の審査の結果、主引用文献として引用される可能性が最も高いと考えられる。とはいえ、最類似文献が実際の審査で引用されるとは限らないし、最類似文献と、その次の類似度の文献（次類似文献）とで類似度の相違がごくわずかでしかなく、その次類似文献の方が最類似文献よりも主引用文献として適切な場合も十分に考えられる。そのため、主引用発明検索で最類似文献を含む複数の文献を抽出し、これらを対象として機械学習部２３３による文書ベクトルの分類を行えば、次類似文献をも考慮に入れた形で特許要件適否に関する予測が行われる。そのため、特許要件適否予測サーバ１０の予測の精度よりも、特許要件適否予測サーバ２００の予測の精度が向上する。

また、実際の審査実務では、ある特許出願について、進歩性違反の拒絶理由が見つかるとき、進歩性違反の拒絶理由と新規性違反の拒絶理由とが同じ文献（この場合に引用される文献を新規性・進歩性拒絶引用文献ともいう）を引用して指摘される場合がある。このような場合、その特許出願にかかる請求項にかかる発明と、新規性・進歩性拒絶引用文献に開示されている発明とに相違がないと審査官によって判断されているから、要旨移動ベクトルＶ３_１〜Ｖ３_ｎの中にＳクラスへ分類される文書ベクトルが含まれているときは、進歩性違反の拒絶理由が見つかる可能性がそうでない場合に比べてより高くなっていると考えられる。したがって、新規性・進歩性拒絶出願からみた距離ｄｐと、進歩性拒絶出願からみた距離ｄｐとが区別できるように、ＳＨＬパターンによる機械学習を行って機械学習部２３３を構築しておくことで、進歩性違反の拒絶理由が見つかる可能性が極めて高い場合とそうでない場合とを区別した予測が可能になる。こうすることで、特許要件適否予測サーバ２００による予測精度の向上と、業務効率のより一層の改善が期待できる。

（変形例１）
上記の進歩性予測処理部２２６では、一つの機械学習部２３３がｎ件の要旨移動ベクトルＶ３_１〜Ｖ３_ｎの分類を行っていたが、図３１に示した特許要件適否予測処理部２１３における進歩性予測処理部２２７のように、要旨移動ベクトルＶ３_１〜Ｖ３_ｎに応じた複数の機械学習部２３３_１〜２３３_ｎを有し、そのそれぞれが要旨移動ベクトルＶ３_１〜Ｖ３_ｎを分類するようにしてもよい。また、図示はしないが、入力ベクトル生成部１３２も、概念検索データＶｄ２_１〜Ｖｄ２_ｎの件数に応じて複数設けてもよい。これらのようにすると、各機械学習部２３３_１〜２３３_ｎまたは各入力ベクトル生成部１３２が並行に処理を実行するので、処理時間を短縮することができる。なお、図示はしないが、指定先行技術データ記憶部１５１に複数の指定先行技術データが記憶されているとき（複数の指定先行技術データを受信して）に、指定予測データ生成部１３４がそれらに応じて複数の進歩性予測データＶｓ１、指定先行技術データＶｓ２を生成してもよい。

（変形例２）
以上述べた各実施の形態では、特許要件適否予測サーバ１０，２００に特許要件適否予測プログラムがインストールされることによって、特許要件適否予測サーバ１０，２００が特許要件適否予測装置として機能する場合を例にとって説明している。その他、本発明は、ユーザ端末装置３０が特許要件適否予測装置として機能する場合についても適用がある。この場合、前述した特許要件適否予測プログラムについて少なくとも以下の変更点１）、２）にしたがった変更を行い、その変更後の特許要件適否予測プログラムを特許要件適否予測サーバ１０，２００からユーザ端末装置３０にダウンロードし、ユーザ端末装置３０にインストールすればよい。

変更点１）指定ナンバなどの入力操作を行うための画像データを特許要件適否予測サーバ１０，２００からユーザ端末装置３０に送信することなくユーザ端末装置３０に表示させる。
変更点２）特許要件適否予測リストをユーザ端末装置３０が出力する。

以上の説明は、本発明の実施の形態についての説明であって、この発明の装置及び方法を限定するものではなく、様々な変形例を容易に実施することができる。また、各実施形態における構成要素、機能、特徴あるいは方法ステップを適宜組合わせて構成される装置又は方法も本発明に含まれるものである。

例えば、ユーザ端末装置は高機能携帯電話機や、タブレット型の端末装置ではなく、ノートパソコンや、ＰＤＡでもよい。なお、ＣＰＵ１１が実行する特許要件適否予測プログラムは、磁気記録媒体、ＣＤ−ＲＯＭ，ＤＶＤ等の各種記録媒体に記録することができるし、ネットワークを介して図示しないサーバからダウンロードすることもできる。

また、上記の実施形態では、ユーザ端末装置３０が案文書データを特許要件適否予測サーバ１０に送信している。案文書データによって特定される予測対象発明は、未だ出願されていないため、公知にならないようにする必要がある。そのためには、案文書データから要旨データを抽出する要旨データ抽出手段（要旨データ抽出部１０２に相当）をユーザ端末装置３０に設けて、ユーザ端末装置３０が要旨データを生成し、ユーザ端末装置３０から要旨データを暗号化通信によって特許要件適否予測サーバ１０に送信することが好ましい。この場合、特許要件適否予測サーバ１０は、受信した要旨データを記憶する要旨データ記憶部１５３を有していればよく、要旨データ抽出部１０２を有していなくてもよい。

本発明を適用することにより、特許要件の適否に関する予測が審査実務に適合した内容で行われ、出願書類の準備負担を有効に軽減することができる。本発明は、特許要件適否予測装置および特許要件適否予測プログラムの分野で利用することができる。

１…特許要件適否予測システム、１０，２００…特許要件適否予測サーバ、１１，３１…ＣＰＵ、３０…ユーザ端末装置、１０１…案文データ生成部、１０２…要旨データ抽出部、１０３，２０３，２１３…特許要件適否予測処理部、１０５…予測結果編集処理部、１０６…指定先行技術データ生成部、１２５…新規性・拡大先願予測処理部、１２６，２２６，２２７…進歩性予測処理部、１３２…入力ベクトル生成部、１３２ａ…要旨ベクトル生成部、１３２ｂ…引用候補ベクトル生成部、１３２ｃ…移動ベクトル生成部、１３３，２３３…機械学習部、１３４…指定予測データ生成部、１５１…指定先行技術データ記憶部、１５３…要旨データ記憶部、１５４…ＣＴデータ記憶部、１５６，２５６…予測結果記憶部、Ｌ１、Ｌ２…予測結果リスト。

Claims

特許要件適否の予測対象となる予測対象発明が１または２以上の請求項に記載され、かつ該予測対象発明が記載されている詳細な説明を含む案文書を構成する案文書データから抽出されたデータであって、該予測対象発明の要旨を特定し得る用語を示す用語データであり、少なくとも各前記請求項の特徴部分から抽出された特徴部分データおよび前記詳細な説明に含まれる課題の部分から抽出された課題データを含むデータを要旨データとして記憶する要旨データ記憶手段と、
指定先行技術発明が記載されている指定先行技術文献を構成する指定先行技術データを記憶する指定先行技術データ記憶手段と、
前記指定先行技術発明との関係による前記予測対象発明の進歩性の要件適否に関する発明指定進歩性予測データを生成する進歩性予測処理部と、該発明指定進歩性予測データを用いて前記予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有し、
前記進歩性予測処理部は、文書ベクトルの分類を行う文書分類部を有し、
該文書分類部は、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される要旨移動ベクトルを進歩性の要件に適合するか否かのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、該要旨移動ベクトルは、各前記請求項に応じた前記予測対象発明の要旨ベクトルと、前記指定先行技術データに応じた引用候補ベクトルとの差分に応じたベクトルである特許要件適否予測装置。
特許要件適否の予測対象となる予測対象発明が１または２以上の請求項に記載され、かつ該予測対象発明が記載されている詳細な説明を含む案文書を構成する案文書データから抽出されたデータであって、該予測対象発明の要旨を特定し得る用語を示す用語データであり、少なくとも各前記請求項の特徴部分から抽出された特徴部分データおよび前記詳細な説明に含まれる課題の部分から抽出された課題データを含むデータを要旨データとして記憶する要旨データ記憶手段と、
指定先行技術発明が記載されている指定先行技術文献を構成する指定先行技術データを記憶する指定先行技術データ記憶手段と、
前記要旨データ記憶手段に記憶されている前記要旨データを用いて、公開公報の電子データである公開公報データを検索し、該検索結果に応じて、前記予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、前記予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、該新規性予測データおよび進歩性予測データを用いて前記予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有し、
前記進歩性予測処理部は、前記公開公報データによって特定される先行技術発明のうち、前記予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、
前記主引用発明検索部は、前記要旨データ記憶手段に記憶されている前記要旨データのうちの各前記請求項の前記特徴部分データおよび前記課題データを主検索文書データとして前記公開公報データを対象とする概念検索を行い、該概念検索の結果、類似度の降順に該類似度が最も高い最類似文献を含む複数の文献を類似文献として抽出し、かつ各該類似文献を前記主引用発明が開示されている主引用文献とし、
前記文書分類部は、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される要旨移動ベクトルを進歩性の要件に適合しない可能性が極めて高いクラス、高いクラス、該進歩性の要件に適合するクラスのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、該要旨移動ベクトルは、各前記請求項に応じた前記予測対象発明の要旨ベクトルと、各前記類似文献に応じた引用候補ベクトルそれぞれとの差分に応じた複数のベクトルであり、
前記特許要件適否予測処理手段は、
前記文書分類部から出力される複数の前記要件適否文書ベクトルに応じて、前記予測対象発明について、前記進歩性の要件に適合しない可能性を示す非適合率を算出する非適合率算出部と、
前記指定先行技術データ記憶手段に前記指定先行技術データが記憶されているときに、前記進歩性予測処理部が、前記進歩性予測データの代わりに前記指定先行技術発明との関係による前記予測対象発明の進歩性の要件適否に関する発明指定進歩性予測データを生成するように制御する予測処理制御部とを更に有する特許要件適否予測装置。
特許要件適否の予測対象となる予測対象発明が１または２以上の請求項に記載され、かつ該予測対象発明が記載されている詳細な説明を含む案文書を構成する案文書データから抽出されたデータであって、該予測対象発明の要旨を特定し得る用語を示す用語データであり、少なくとも各前記請求項の特徴部分から抽出された特徴部分データおよび前記詳細な説明に含まれる課題の部分から抽出された課題データを含むデータを要旨データとして記憶する要旨データ記憶手段と、
前記要旨データ記憶手段に記憶されている前記要旨データを用いて、公開公報の電子データである公開公報データを検索し、該検索結果に応じて、前記予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、前記予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、該新規性予測データおよび進歩性予測データを用いて前記予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段と、
該予測結果ファイル生成部によって生成された前記予測結果ファイルを記憶する予測結果記憶手段とを有し、
前記進歩性予測処理部は、前記公開公報データによって特定される先行技術発明のうち、前記予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、
前記主引用発明検索部は、前記要旨データ記憶手段に記憶されている前記要旨データのうちの各前記請求項の前記特徴部分データおよび前記課題データを主検索文書データとして前記公開公報データを対象とする概念検索を行い、該概念検索の結果、類似度の降順に該類似度が最も高い最類似文献を含む複数の文献を類似文献として抽出し、かつ各該類似文献を前記主引用発明が開示されている主引用文献とし、
前記文書分類部は、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される要旨移動ベクトルを進歩性の要件に適合しない可能性が極めて高いクラス、高いクラス、該進歩性の要件に適合するクラスのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、該要旨移動ベクトルは、各前記請求項に応じた前記予測対象発明の要旨ベクトルと、各前記類似文献に応じた引用候補ベクトルそれぞれとの差分に応じた複数のベクトルである特許要件適否予測装置。
コンピュータを特許要件適否予測装置として機能させるための特許要件適否予測プログラムであって、該コンピュータを
特許要件適否の予測対象となる予測対象発明が１または２以上の請求項に記載され、かつ該予測対象発明が記載されている詳細な説明を含む案文書を構成する案文書データから抽出されたデータであって、該予測対象発明の要旨を特定し得る用語を示す用語データであり、少なくとも各前記請求項の特徴部分から抽出された特徴部分データおよび前記詳細な説明に含まれる課題の部分から抽出された課題データを含むデータを要旨データとして記憶させる要旨データ記憶制御手段と、
指定先行技術発明が記載されている指定先行技術文献を構成する指定先行技術データを記憶させる指定先行技術データ記憶制御手段と、
前記指定先行技術発明との関係による前記予測対象発明の進歩性の要件適否に関する発明指定進歩性予測データを生成する進歩性予測処理部と、該発明指定進歩性予測データを用いて前記予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段として機能させ、
前記進歩性予測処理部が文書ベクトルの分類を行う文書分類部を有し、
該文書分類部が、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される要旨移動ベクトルを進歩性の要件に適合するか否かのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、該要旨移動ベクトルは、各前記請求項に応じた前記予測対象発明の要旨ベクトルと、前記指定先行技術データに応じた引用候補ベクトルとの差分に応じたベクトルである特許要件適否予測プログラム。