以下、本発明の実施の形態について図面を参照しつつ説明する。なお、同一要素には同一符号を用い、重複する説明は省略する。
第1の実施の形態
(特許要件適否予測システムの全体構成)
まず、本発明の第1の実施の形態に係る特許要件適否予測サーバ10を含む特許要件適否予測システム1の構成について説明する。
図1は特許要件適否予測システム1のシステム構成図である。図1に示すように、特許要件適否予測システム1は、特許要件適否予測サーバ10と、ユーザが操作する複数のユーザ端末装置30(図1では、固定端末装置30A、30B、30C)とを有し、これらがインターネットN1を介して互いに接続される構成を有している。
特許要件適否予測サーバ10は、特許要件適否予測プログラムにしたがったデータ処理を行う。特許要件適否予測サーバ10は、ユーザが出願しようとする発明について、特許要件(本実施形態では、新規性(特許法第29条第1項3号)、拡大先願(特許法第29条の2)および進歩性(特許法第29条第2項))に適合しているか否かを予測する。ユーザ端末装置30は、特許要件適否予測サーバ10との間でデータの受信または送信を行う。
特許要件適否予測システム1では、ユーザが出願しようとする発明が、特許要件に適合しているか否か(特許要件適否)の予測対象となるので、本実施の形態に係る予測対象発明に相当する。そして、特許要件適否予測サーバ10が、その予測対象発明について、2種類の予測モード(後述するサーチ有りモードまたはサーチ無しモードのいずれかのモード)で特許要件の適否を予測する。いずれのモードにおいても、進歩性違反の拒絶理由が見つかる可能性が高いか低いかを審査実績に基づく複数の訓練データで機械学習を行った人工知能プログラムで予測して、特許要件の適否が予測される。特許要件適否予測サーバ10によって、特許要件の適否の予測が審査実務に適合した内容で行われるため、出願書類の準備負担を有効に軽減することができる。
ここで、サーチ有りモードとは、予測対象発明に関して、公開公報(主として公開特許公報)の電子データである公開公報データの検索(後述する主引用発明検索および副引用発明検索)を行い、その検索結果に応じて特許要件の適否予測を行うモードである。サーチ無しモードとは、予測対象発明に関して、公開公報データの検索を行うことなく、後述する指定先行技術発明との関係による特許要件の適否予測を行うモードである。
(特許要件適否予測サーバ10の構成)
次に、図2を参照して特許要件適否予測サーバ10の構成について説明する。図2は、特許要件適否予測サーバ10の内部の構成を中心に示すブロック図である。特許要件適否予測サーバ10は、予測対象発明の特許要件適否の予測に関するサービスを提供する専門事業者が運用するサーバである。
特許要件適否予測サーバ10は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13とを有している。CPU11は、ROM12に記憶されているプログラムにしたがい作動して、KBC(Key board controller)17を介してキーボード19やマウス20の操作入力で得られる入力データをメインバス19Aを介して入力する一方、他の構成要素との信号の入出力を行い、特許要件適否予測サーバ10全体の動作制御を行う。CPU11は、後述する特許要件適否予測プログラムにしたがい、後述する案文データ生成部101、要旨データ抽出部102、特許要件適否予測処理部103、対象公報抽出部104、予測結果編集処理部105、指定先行技術データ生成部106としての動作を行う。ROM12には、特許要件適否予測プログラム等のCPU11が実行する制御プログラムと、恒久的なデータが記憶されている。RAM13にはCPU11が作動する際に用いるデータやプログラムが記憶されている。
そのほか特許要件適否予測サーバ10は、ハードディスク装置(Hard disk drive,HDD)14と、通信制御部15と、通信処理部16と、ビデオコントローラ18とを有している。
ハードディスク装置14には、特許要件適否予測プログラムの実行に必要な図4に示す各種記憶部またはDB(database)と、その他の記憶部またはDBが形成されている。ハードディスク装置14には、指定先行技術データ記憶部151と、予測対象トランザクション記憶部(予測対象TR記憶部)152と、要旨データ記憶部153と、クレームツリーデータ記憶部154と、対象公報記憶部155と、予測結果ファイル記憶部156とが形成されている。各記憶部またはDBについては後述する。
通信制御部15は、CPU11の指示にしたがい作動して、ユーザ端末装置30や、図示しない特許庁サーバとの通信を行うための回線の接続および切断を制御する。通信処理部16は、通信制御部15の指示にしたがい作動して、インターネットN1を介して行われるデータの送受信を実行する。
ビデオコントローラ18は、図示しないディスプレイ装置における画像表示を制御して、各種の設定に用いられる画面等を表示させる。
そして、ハードディスク装置14の各種記憶部またはDBについて説明すると次のとおりである。指定先行技術データ記憶部151には、ユーザ端末装置30から送信されるユーザ特定に必要なデータ(例えば、会員ID)と、そのユーザが指定した指定先行技術発明が記載された指定先行技術文献を構成する指定先行技術データとが記憶されている。指定先行技術発明は、特許要件適否予測サーバ10による特許要件適否の予測にあたり、ユーザが指定した先行技術発明であり、例えば、ユーザが自らの調査によって見つけた公開特許公報に記載されている先行技術発明に相当する。
指定先行技術データが指定先行技術データ記憶部151に記憶されているときは、ユーザが先行技術発明を指定した場合に相当する。この場合、サーチ無しモードにおいて、その指定先行技術発明との関係において、予測対象発明の進歩性の適否が予測される(指定先行技術発明からみて進歩性があるのかどうかが予測される)。
予測対象TR記憶部152には、案文データ生成部101が生成した案文書データ(後述する案文書を構成する電子データ)が記憶されている。公開公報DB150は、公開特許公報の電子データが公開公報データとして格納されている。公開公報DB150として、図4では、工業所有権情報・研修館により運営されている特許情報プラットフォーム(J−PlatPat)のデータベースまたはそこからダウンロードした電子データを記憶しているデータベースを想定している。後者のデータベースは、図示しないサーバに格納することができるし、HDD14に格納してもよい。
案文書とは、予測対象発明が記載されている文献であって、その予測対象発明が1または2以上の請求項(本実施の形態では独立形式で記載されている場合を想定しているが、従属形式でもよい)に記載されている部分(願書に添付される特許請求の範囲に相当する文書)と、その予測対象発明が詳細に記載されている部分(本実施の形態において、「詳細な説明」といい、願書に添付される明細書の「発明の詳細な説明」に相当する文書)とを含んでいる。その「詳細な説明」には、少なくとも、予測対象発明の名称が記載されている部分(「発明の名称」に相当する部分)と、課題の部分(予測対象発明の解決しようとする課題が記載されている部分で、「発明が解決しようとする課題」に相当する部分)とを含み、本実施の形態では、「発明を実施するための形態」に相当する部分と、技術分野に相当する部分が含まれている。そして、案文書データは、暗号化通信(例えば、SSLを利用した暗号化通信)によって、ユーザ端末装置30から特許要件適否予測サーバ10に送信される。
要旨データ記憶部153には、要旨データ抽出部102が抽出・生成した要旨データが記憶されている。要旨データは、予測対象発明の要旨を特定し得る用語を示す用語データであって、少なくとも後述する特徴部分データと課題データとが含まれている。
要旨データ記憶部153には、例えば図8に示すように、データ種別エリア153a、項番エリア153b、用語記憶部153cを有するレコードが記憶されている。データ種別エリア153aは、各レコードに記憶されているデータが案文書のどの部分のデータであるのかを示すデータ(「データ種別」という)が記憶されている。本実施の形態では、データ種別として、"C"、"P"、"T"、"D"の4種類が設定されている。"C"は請求の範囲のデータ、"P"は課題の部分のデータ、"T"は技術分野の部分のデータ、"D"は発明の実施の形態の部分のデータをそれぞれ示している。項番エリア153bには、請求項の番号が記憶されている。用語記憶部153cは、用語エリア153c1、展開度エリア153c2および必須フラグエリア153c3を有している。図8では、これらの組み合わせが15通り用意されているが、この組み合わせは15通りより多くてもよいし、少なくてもよい。そして、用語エリア153c1,展開度エリア153c2,必須フラグエリア153c3には、それぞれ要旨の特定に用いられる用語、後述する展開度(Ed)、必須フラグ(Ef)が記憶されている。
図8では、一例として、特開2008−62282号公報に記載されている発明が予測対象発明であった場合の要旨データ(上半分のデータ)と、特開2011−186735号公報に記載されている発明が予測対象発明であった場合の要旨データ(下半分のデータ)とが記載されている。前者は、独立形式で記載されている請求項(独立項)が1つの場合、後者は独立項が複数の場合の例示である。
クレームツリーデータ記憶部(CTデータ記憶部)154には、後述するクレームツリーデータ(claim tree データ、CTデータともいう)が記憶されている。CTデータ記憶部154には、例えば図9(A)に示すように、独立区分エリア154aと、ナンバエリア154bと、MAX区分エリア154cと、従属項エリア154dと、サーチフラグエリア154eを含むレコードが記憶されている。
独立区分エリア154aには、案文書に記載されている各請求項が独立形式で記載されている請求項(独立項)か、従属形式で記載されている請求項(従属項)のいずれであるかを示す独立区分(独立項がスペース、従属項が"D")が記憶されている。ナンバエリア154bには各請求項の番号(請求項ナンバ)が記憶されている。MAX区分エリア154cには、MAX区分が記憶されている。MAX区分には、同じ独立項を引用する従属項が複数あった場合の最も番号の大きい請求項(最大従属項)に"M"、それ以外にスペースがセットされている。
図9(A)は、特開2008−62282号公報に記載されている発明が予測対象発明であった場合のCTデータを示しているが、該公報では、従属項の中で請求項9が最大従属項なので、請求項ナンバが"9"のレコードのMAX区分に"M"、それ以外の請求項ナンバのMAX区分にスペースがセットされている。また、図9(B)は、特開2011−186735号公報に記載されている発明が予測対象発明であった場合のCTデータを示しているが、該公報では、請求項1、請求項6が独立項であり、請求項5、請求項7が最大従属項なので、請求項ナンバが"5"のレコードと、"7"のレコードのMAX区分に"M"、これら以外のMAX区分にスペースがセットされている。
従属項エリア154dには、従属項が引用している請求項の番号が記憶されている。サーチフラグエリア154eには、サーチフラグ、すなわち、後述する主引用発明検索が実行済である否かの区分が記憶されている。スペースは主引用発明検索の実行前、"9"は実行済を示している。
対象公報記憶部155には、主引用発明検索および副引用発明検索の対象とされる公開公報データ(検索対象公報データ)が記憶されている。予測結果記憶部156には、図10に示すような後述する予測結果ファイルが記憶されている。
続いて、要旨データ抽出部102、特許要件適否予測処理部103について説明する。要旨データ抽出部102は、図5に示すように、候補抽出部111、要部データ抽出部112、CTデータ生成部113、テキスト分析・用語抽出部114、展開度・必須要件分析部115、係り受け解析部116、パターンデータ抽出部117およびファイル生成部118を有している。なお、図示の都合上、図5では、詳細な説明データ記憶部(詳細な説明TR)160、請求の範囲データ記憶部(請求の範囲TR)161、要部データ記憶部(要部データTR)162が要旨データ抽出部102に含まれているが、これらはデータ記憶手段であるHDD14に設けられている。
候補抽出部111は、予測対象TR記憶部152に記憶されている案文書データを読み込み、そこから不要なデータをスキップ(読み飛ばし)して要旨データ作成に必要なデータを抽出し、抽出後のデータを詳細な説明データ(明細書データ)と、請求の範囲データとに分けて、それぞれ詳細な説明TR160、請求の範囲TR161に記憶させる。ここでは、「前記」、「該」、「当該」と、段落番号がスキップされる。
要部データ抽出部112は、予測対象TR記憶部152に記憶されている案文書データを読み込み、そこから案文書の要部に相当する部分のデータ(要部データ)を抽出し、抽出した要部データを要部データ記憶部162に記憶させる。ここでは、要部データとして、予測対象発明の名称が記載されている部分のデータ(発明の名称)および技術分野に相当する部分のデータと、課題の部分の「本発明」または「この発明」の文字列を含む一文のデータとを抽出する。
CTデータ生成部113は、予測対象TR記憶部152に記憶されている案文書データを読み込み、そのうちの請求の範囲の部分に記載されているデータを読み込んで前述したクレームツリーデータ(CTデータ)を生成し、それCTデータ記憶部154に記憶させる。
テキスト分析・用語抽出部114は、詳細な説明TR160、請求の範囲TR161からそれぞれテキストデータを入力し、そのそれぞれについて、特徴語を抽出して(特許請求の範囲は請求項ごと)、各特徴語を重要とされる順序で出力する。この場合、例えば、形態素解析またはN−Gramなどの索引文字列抽出処理を実行して、各単語の出現頻度、各単語の共起頻度を調べ、その結果に応じて各特徴語を出力する。
展開度・必須要件分析部115は、請求の範囲TR161から請求の範囲データを読み込んで,テキスト分析・用語抽出部114で抽出された各特徴語について、展開度と、必須要件に該当するか否かとを調べ、その結果を出力する。ここで、展開度(Ed)とは、各特徴語がいくつの請求項に展開されているのか(用いられているのか)、展開されている請求項の個数を示すデータである。一般に、特許出願の出願書類では、できるだけ広い範囲の発明思想がカバーされるように、より重要な事項が請求項1(または他の独立項)に広い範囲で記載され、そこから下位の請求項に段階的に範囲を縮小(具体化)されながら記載されることが多い。そのため、展開度(Ed)が大きいほど、重要度がより高いと考えられるので、展開度は発明の要旨を把握するのに有益な情報と考えられる。例えば、図8に示すデータ種別"C"、項番"1"の用語エリア153c1が"用語1"のエリアに「パンチ」という用語がセットされているが、この「パンチ」という用語は、特開2008−62282号公報の特許請求の範囲において、請求項1、2、3、4、5に記載されているので、展開度エリア153c2に"5"がセットされている。
必須要件に該当するか否かは、各請求項の特徴部分に記載されているか否かであって、必須フラグ(Ef)によって示されている。本件出願に係る発明の実施の形態では、各請求項における最終段落、または「ことを特徴とする」の文字列を含む一文を各請求項の特徴部分としていて、そのデータが特徴部分データであり、ここに含まれている用語が必須要件を満たすものとしている。特徴部分から抽出された用語には、必須要件を満たすことを示す"X"が必須フラグ(Ef)にセットされる。
係受け解析部116は、要部データ記憶部162に記憶されている要部データについて係受け解析を行い、その結果をパターンデータ抽出部117に出力する。
パターンデータ抽出部117は、係受け解析部116の解析結果を入力して、ひらがなの「を」の直前の名詞と、それに対応した動詞の組み合わせとなる文字列と、発明の名称のうち、先頭に記載されているもの(筆頭名称)を出力する。例えば、特開2008−62282号公報の「発明が解決しようとする課題」の欄の「本発明」の文字列を含む一文の中に、ひらがなの「を」の直前の名詞と、それに対応した動詞の組み合わせとして、「調整」および「行わず」と、「同心性」および「得る」と、「精密打ち抜き型」および「提供」がある。これらがパターンデータ抽出部117から出力される。本実施の形態において、パターンデータ抽出部117から出力されるデータのうち、課題の部分から抽出されたデータが課題データに相当していて、例えば図8のデータ種別"P"のレコードのようなデータとすることができる。
ファイル生成部118はテキスト分析・用語抽出部114、展開度・必須要件分析部115およびパターンデータ抽出部117から出力されるデータを用いて要旨データを生成し、要旨データ記憶部153に記憶させる。この場合、テキスト分析・用語抽出部114および展開度・必須要件分析部115の出力データを用いて、データ種別"C"、"D"のデータが生成され、パターンデータ抽出部117の出力データを用いて、データ種別"P"、"T"のデータが生成される。
特許要件適否予測処理部103は、図6に示すように、新規性・拡大先願予測処理部125と、進歩性予測処理部126とを有している。新規性・拡大先願予測処理部125は、要旨データ記憶部153に記憶されている要旨データを検索タームに用いて対象公報記憶部155の検索対象公報データの全文検索を行い、その結果にしたがい、新規性・拡大先願予測データNdを予測結果ファイル生成部127に出力する。新規性・拡大先願予測処理部125の機能、動作手順については、後に詳しく説明する。
進歩性予測処理部126は、引用発明検索部131と、入力ベクトル生成部132と、機械学習部133と、指定予測データ生成部134とを有している。引用発明検索部131は、後述する主引用発明検索を行う主引用発明検索部および副引用発明検索を行う副引用発明検索部を有している。また、引用発明検索部131は、主引用発明検索および副引用発明検索の結果にしたがい、進歩性予測データVd1を予測結果ファイル生成部127に出力し、検索の対象となった請求項に応じた請求項要旨データiedと概念検索データVd2を入力ベクトル生成部132に出力する。概念検索データVd2には、概念検索の結果、最も類似度が高いとされた文献(最類似文献)の公開公報データが含まれている。引用発明検索部131の機能、動作手順については、後に詳しく説明する。
入力ベクトル生成部132は、図7に示すように、要旨ベクトル生成部132aと、引用候補ベクトル生成部132bと、移動ベクトル生成部132cとを有している。
要旨ベクトル生成部132aは、請求項要旨データiedを入力してその特徴語を抽出し、各語に応じた重み付けを行って、各請求項の記載に応じた要旨ベクトルEVを生成する。引用候補ベクトル生成部132bは、後述するサーチ有りモードにおいて、概念検索データVd2に含まれる最類似文献の公開公報データを入力してその特徴語を抽出し、各語に応じた重み付けを行って最類似文献に応じた文書ベクトル(引用候補ベクトル)RfVを生成する。また、サーチ無しモードにおいて、指定先行技術データVs2を入力してその特徴語を抽出し、各語に応じた重み付けを行って指定先行技術データに応じた文書ベクトル(引用候補ベクトル)RfVを生成する。移動ベクトル生成部132cは、要旨ベクトルEVと、引用候補ベクトルRfVとの差分を計算して、双方の文書ベクトルの差分に応じた要旨移動ベクトルV3を生成する。
最類似文献は、主引用発明検索部による概念検索の結果、最も類似度が高いとされた文献であるため、予測対象発明の進歩性の審査で主引用発明の開示文献として引用される確率が最も高いと推測される。そのため、最類似文献を引用候補として引用候補ベクトルRfVを求め、これと要旨ベクトルEVとの差分を計算して要旨移動ベクトルV3を求めれば、予測対象発明と、最類似文献に開示されている発明との相違に応じた文書ベクトル(要旨移動ベクトルV3に相当する)が生成される。
機械学習部133は、本発明の実施の形態にかかる文書分類部であって、次のような訓練データ(学習パターンともいう)を用いた機械学習(教師付き学習)によって、後述する要旨移動ベクトルV3を進歩性の要件に適合するクラスと適合しないクラス(拒絶理由が無いクラスと有るクラス)に分類し、その分類結果に応じた出力信号(要件適否文書ベクトル)V4を出力するように構築されている。本発明の実施の形態の場合、学習パターンは次に述べるHLパターンとすることができる。
HLパターンは、学習文書ベクトルが第1の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由有りを示すベクトル(例えば、正解のクラスに対応した次元だけが"1"で、他が"0"のベクトル)との組み合わせと、学習文書ベクトルが第2の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由無しを示すベクトル(例えば、上記とは別の次元だけが"1"で、他が"0"のベクトル)との組み合わせのパターンである。
第1の学習文書ベクトルは、公開済出願の中で特許庁の審査の結果、初めての拒絶理由通知(1stアクション)が発行された出願であって、その1stアクションで進歩性違反の拒絶理由(特許法第29条第2項の要件を満たしていないとする拒絶理由)が指摘されていた出願(進歩性拒絶出願)の該拒絶理由が指摘されていた(拒絶理由通知発行時点の)請求項に応じた文書ベクトルと、そのときの引用文献1(主たる刊行物として引用されていた主引用文献)に応じた文書ベクトル(引用文書ベクトル)との差分に応じた第1の移動文書ベクトルである。
第2の学習文書ベクトルは、公開済出願の中で審査の結果、1stアクションが発行されずに特許査定が発行された出願(拒絶無し出願)または1stアクションは発行されたがその拒絶理由に進歩性違反の拒絶理由が指摘されていなかった出願(進歩性拒絶無し出願)の(拒絶理由通知が発行された時点の)請求項1に応じた文書ベクトルと、それら拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる文献(学習用最類似文献)に応じた文書ベクトル(非引用文書ベクトル)との差分に応じた第2の移動文書ベクトルである。
機械学習部133は、上記のようなHLパターンの学習パターンで学習を繰り返し行うことにより、要旨移動ベクトルV3を進歩性の拒絶理由有りまたは無しのいずれかのクラスに分類し、その分類したクラスに応じた要件適否文書ベクトルV4を出力する。前者は、予測対象発明が出願された場合について、進歩性違反の拒絶理由が発行される可能性が高い場合、後者は低い場合に相当する。
機械学習部133は、入力される要旨移動ベクトルV3を進歩性の拒絶理由が有るクラスと無いクラスに分類して、その分類結果に応じた要件適否文書ベクトルV4を出力すればよいので、機械学習部133にサポートベクターマシーン(SVM)と呼ばれる学習アルゴリズムを適用することができる。サポートベクターマシーン(SVM)によれば、決定境界との距離(マージン)が最大になるように、決定境界を得ることができる。
また、機械学習部133の情報処理に脳神経回路網をモデルにしたニューラルネットワークを適用することができる。ニューラルネットワークには、階層型ニューラルネットワークと、相互結合型ニューラルネットワークがある。たとえば、機械学習部133の学習アルゴリズムとして、階層型ニューラルネットワークのパーセプトロンを適用することができる。
パーセプトロンはS層、A層、R層と呼ばれる3層からなる階層型ネットワークで構成され(図示せず)、S層からA層、A層からR層という片方向の結合だけが存在している。前述のHLパターンの学習パターンが与えられると、第1の学習文書ベクトルまたは第2の学習文書ベクトルが入力されたときの出力ベクトルがそれぞれの教師ベクトルと異なっていたときに、その誤差に応じて結合の重みが修正され、出力ベクトルと教師ベクトルとの誤差が一定値以下になったときに学習が終了する。
しかしながら、パーセプトロンでは、学習パターンが線形分離不可能な場合にアルゴリズムが停止しないおそれがある。そのため、機械学習部133が学習によって非線形な決定境界を獲得できるようにするため、階層型ニューラルネットワークの中で応用例が多く、誤識別の少ない非線形識別面が学習できるBP(バックプロパゲーション)ネットワークを適用することが好ましい。
BPネットワークは、図11に示すように、入力層および出力層と、その間の中間層とを有し、誤差逆伝播アルゴリズムと呼ばれる学習アルゴリズムによって、ユニット間のすべての結合の重みが学習可能になっている。誤差逆伝播アルゴリズムでは、入力信号が入力層、中間層、出力層と伝わり、その一方、誤差信号が逆に伝わることによって、重み調整が行われる。
そして、図11に示すBPネットワークに、学習パターンxp(x0、x1・・・xn)が入力されたとき、ある階層のj(0≦j≦n)番目のユニットには、そのユニットjとの結合を有する1階層前のユニットから重み付きの信号が入力される。そこで、1階層前のi(0≦i≦n)番目のユニットからの信号をtip,重みをwijとすると、ユニットjへの入力は、式1のようになり、ユニットjの出力は、閾値関数をfとして、式2のようになる。
学習パターンxpに対する誤差Dpは、出力層のユニットkの出力と、教師信号bkpの差の2乗和で定義されるから、以下の式3のようになる。この誤差Dpをすべての学習パターンに対して足しあげて式4のDを求め、そのDが最小になるように、ユニット間の結合重みが調整されて機械学習部133における学習が行われる。この場合、個々の学習パターンが入力されるごとに、式5によって重みが調整される。wijは更新前の重み、w'ijは更新後の重み、ρは学習係数である。これは確率的最急降下法と呼ばれる。なお、ユニットの入出力関数は式6に示すシグモイド関数が用いられる。
指定予測データ生成部134は、サーチ無しモードにおいて、要旨データ記憶部153に記憶されている要旨データと、指定先行技術データ記憶部151に記憶されている指定先行技術データとを入力して、各請求項に応じた予測対象発明の請求項要旨データiedと、指定先行技術データVs2とを入力ベクトル生成部132に出力し、進歩性予測データVs1を予測結果ファイル生成部127に出力する。進歩性予測データVs1には、指定先行技術データVs2とともに主引用発明が見つかったことを示す検索フラグ"VY"が請求項ごとに含まれていて、これと、後述する要件適否文書ベクトルV4とが本実施に形態にかかる発明指定進歩性予測データに相当する。
(ユーザ端末装置30の構成)
ユーザ端末装置30は、図1に示すように、インターネットN1への接続環境を備え、特許要件適否予測サーバ10と通信を行うことができる。なお、ユーザ端末装置30は、据え置き型(または持ち運び可能なノート型)のパーソナルコンピュータを想定しているが、タブレット型の端末装置でもよい。
ユーザ端末装置30は、図3に示すように、CPU31、ROM32、RAM33、データ記憶部34、液晶表示部35を有している。また、ユーザ端末装置30は、音声変換処理部36、通信制御部37、通信処理部38a、無線通信部38b、スピーカ39およびマイク40を有している。
CPU31は、ROM32に記憶されているプログラムにしたがい作動してユーザ端末装置30全体の動作制御を司る。ROM32はCPU31が実行するプログラム、例えば、データ通信を行うための通信制御プログラムが記憶されている。RAM33には、CPU31によるプログラムの実行に必要なデータ等が記憶される。
データ記憶部34には種々のデータが記憶されている。液晶表示部35は、LCD(Liquid Crystal Display)とその駆動部を有し、文字、図形、記号などの画像表示を行う画像表示手段である。音声変換処理部36は、音声データを伸張してスピーカ39に出力する一方、マイク40から入力するアナログ音声信号をデジタルの音声データに変換および圧縮して、通信処理部38aに入力する。通信制御部37はCPU31の指示を受けて作動し、データ通信を行うための回線の接続および切断を制御する。通信処理部38aは、通信制御部37の指示にしたがい作動して、インターネットN1を介して行われるデータの送受信を実行する。無線通信部38bは通信制御部37の制御にしたがい、無線によるデータの送受信を実行する無線通信手段である。スピーカ39は、音声を出力する音声出力手段であり、マイク40はユーザの会話内容等の音声を入力し、電気信号に変換する。
(特許要件適否予測システムの動作内容)
次に、図4とともに図12から図22までと、図32から図35までとを参照して、特許要件適否予測サーバ10による特許要件適否予測処理の動作内容について説明する。
ここで、図4は、特許要件適否予測処理を実現する特許要件適否予測サーバ10の主要な構成を示す機能ブロック図である。特許要件適否予測サーバ10では、CPU11が特許要件適否予測プログラムにしたがい、公開公報DB150、指定先行技術データ記憶部151、要旨データ記憶部153等に記憶されている各種ファイルやDBにアクセスしながら、案文データ生成部101、要旨データ抽出部102、特許要件適否予測処理部103、予測結果編集処理部105、指定先行技術データ生成部106としての動作を行う。これにより、特許要件適否予測処理が実行される。なお、特許要件適否予測プログラムは、特許要件適否予測サーバ10を案文データ生成部101、要旨データ抽出部102、特許要件適否予測処理部103、予測結果編集処理部105、指定先行技術データ生成部106等として機能させるためのプログラムである。
そして、特許要件適否予測サーバ10が特許要件適否予測処理を行うときは、CPU11が特許要件適否予測プログラムにしたがい図12に示すフローチャートに沿った動作を行う。図12は、特許要件適否予測プログラムにしたがったCPU11の特許要件適否予測処理の動作手順の一例を示すフローチャートである。なお、図12、図13等において"S"とはステップを略記したものである。
CPU11は、特許要件適否予測プログラムにしたがい動作を開始すると、ステップ1に進み、ユーザ認証処理を行う。ここでは、ユーザがユーザ端末装置30を用いて入力したユーザIDおよびパスワードを確認する等してユーザ認証処理を行う。次に、CPU11は、ステップ2に進み、ポイント残高確認処理を行う。ポイント残高確認処理では、ユーザのポイント残高が一定値以上あるかどうかをCPU11が確認し、ポイント残高不足であれば、特許要件適否予測処理を終了するか、ポイント残高不足を知らせるメッセージの送信などを行う。
CPU11は、処理をステップ3に進めると、発明データ受信・復号化が実行される。このステップ3では、CPU11が通信処理部16を作動させるなどして、ユーザ端末装置30から暗号化通信(例えばSSLを利用した暗号化通信)による発明データ受信を実行するとともに、案文データ生成部101としての動作を行い、発明データ受信で受信した案文書データの復号化を行い、さらにマシン日付を出願日にセットしたうえで、予測対象TR記憶部152に記憶させる。また、CPU11は、発明データ受信の受信データに指定先行技術データが含まれているときは、その指定先行技術データの復号化を行い、さらに、指定先行技術データ記憶制御手段としての動作を行い指定先行技術データ生成部106を作動させて、復号化した指定先行技術データを指定先行技術データ記憶部151に記憶させる。続いてステップ4に処理が進むと、案文カウンタMAXに受信した案文書データの件数がセットされ、案文カウンタに"0"がセットされる。
次に、CPU11は、処理をステップ5に進めて、指定先行技術データ記憶部151に指定先行技術データが記憶されているかどうかによって、予測モードがサーチ有りモードかサーチ無しモードなのかを判定する。そして、指定先行技術データ記憶部151に指定先行技術データが記憶されているときは、CPU11が予測処理制御部としての動作を行い、サーチ無しモードによる要件適否の予測を行うためステップ6Aに処理を進め、一方、指定先行技術データ記憶部151に指定先行技術データが記憶されていなければ、サーチ有りモードによる要件適否の予測を行うため、CPU11はステップ6に処理を進める。
そして、CPU11は、処理をステップ6に進めると予測終了条件が成立しているか否かを判定する。ここで、CPU11は予測終了条件が成立しているときはステップ8に進むが、そうでないときはステップ7に進む。CPU11はステップ7に進むと、後述する特許要件適否予測ルーチンを実行するが、ステップ8に進むと、終了処理を実行し、そのユーザに対する特許要件適否予測処理を終了する。このようにすることで、サーチ有りモードでは、予測終了条件が成立するまでの間、特許要件適否予測処理が自動的かつ継続的に実行される。
また、ステップ6Aに進んだ場合も、ステップ6と同様、予測終了条件の成否が判定され、予測終了条件が成立すればステップ8に進むが、そうでないときはステップ9に進み、CPU11が後述するサーチ無し特許要件適否予測ルーチンを実行して、その後、ステップ6Aにもどる。このようにすることで、サーチ無しモードでは、予測終了条件が成立するまでの間、サーチ無し特許要件適否予測処理が自動的かつ継続的に実行される。
そして、CPU11はステップ7に進むときは、図13に示すフローチャートに沿って特許要件適否予測ルーチンを実行する。
(特許要件適否予測ルーチン)
CPU11は特許要件適否予測ルーチンを開始すると、ステップ11に進み、案文カウンタに"1"を加算する。続くステップ12では、案文カウンタが案文カウンタMAXよりも大きいか否かを判定し、大きくなければ処理をステップ13に進めるが、そうでなければ(案文カウンタが案文カウンタMAXより大きいとき)はステップ16に処理を進める。
CPU11は、ステップ13に処理を進めると、対象公報抽出部104としての動作を行って案文書データの出願日(ステップ3でマシン日付がセットされている)を基準にして公開公報データの抽出を行い、抽出したデータを検索対象公報データとして対象公報記憶部155に記憶させる。また、CPU11は、要旨データ抽出部102としての動作を行って前述した要旨データおよびCTデータを生成し、それぞれ要旨データ記憶部153、CTデータ記憶部154に記憶させる。対象公報抽出部104は、出願日が案文書データの出願日よりも前の公開公報データを抽出する。
続いてCPU11は、ステップ14に処理を進めて後述する新規性・拡大先願予測ルーチンを実行してからステップ15に進み、進歩性予測ルーチンを実行する。その後、CPU11は、ステップ11に戻って上記同様の処理を繰り返す。ステップ16では、CPU11が予測結果編集処理部105としての動作を行い、後述する予測結果リストL1を編集出力する。その後、ステップ17のポイント消費処理を実行して、特許要件適否予測を行った案文書データの件数に応じて、ポイント残高を減らす。その後、特許要件適否予測ルーチンが終了する。
(サーチ無し特許要件適否予測ルーチン)
一方、CPU11は、図32に示すように、サーチ無し特許要件適否予測ルーチンを開始すると、ステップ11、ステップ12を特許要件適否予測ルーチンと同様に実行した後、ステップ13Aを実行する。ステップ13Aでは、CPU11が要旨データ抽出部102としての動作を行って前述した要旨データおよびCTデータを生成し、それぞれ要旨データ記憶部153、CTデータ記憶部154に記憶させる。また、続いてCPU11はステップ125に処理を進めて後述するサーチ無し進歩性予測ルーチンを実行し、その後、ステップ11に戻る。処理がステップ12から、ステップ16,17に進む場合も、それらステップ16,17を特許要件適否予測ルーチンと同様に実行する。
(新規性・拡大先願予測ルーチン)
そして、図13に戻り、CPU11は、ステップ14に処理を進めると、前述した新規性・拡大先願予測処理部125としての動作を行い、図14、図15に示すフローチャートに沿って、新規性・拡大先願予測ルーチンを実行する。
この場合、CPU11は、新規性・拡大先願予測ルーチンをスタートするとステップ21に処理を進め、文献カウンタ(文献ct)および文献MAXに"0"をセットし、項番カウンタ(項番ct)に"1"をセットする。続いてステップ22に処理が進み、要旨データ記憶部153に記憶されている要旨データの項番ctに応じたデータを検索タームに用いて、対象公報記憶部155の検索対象公報データについて全文検索が行われ、ヒットした文献の件数が文献MAXにセットされる。この場合、ステップ21で項番カウンタに"1"がセットされているので、項番エリア153bが"1"のデータ、すなわち請求項1の要旨データを用いて検索タームが設定される。
続いて処理がステップ23に進み、ステップ22でヒットした文献があったか否か(文献MAXが1以上か否か)が判定され、ヒットした文献があればステップ24に処理が進み、そうでなければ新規性・拡大先願予測ルーチンが終了する。
ステップ24では、文献カウンタに"1"が加算され、続くステップ25では、文献カウンタが文献MAX以下であるか否かが判定され、これが成立しているときはステップ26に処理が進み、そうでなければステップ29に処理が進む。ステップ26では、ヒットした文献の出願公開日(ヒット文献公開日)が案文書データの出願日(対象出願日)よりも小さいか否か(ヒット文献公開日<対象出願日 が成立するか否か)が判定され、これが成立しているときはステップ27に処理が進み、そうでなければステップ28に処理が進む。ステップ27では、新規性無しを示す新規性フラグ"N1"を含むように新規性・拡大先願予測データNdが生成される。その後、ステップ24に戻り、上記同様の処理が繰り返えされる。
そして、ステップ28では、後述する拡大先願予測ルーチンが実行される。ステップ29では、CTデータ記憶部154を参照して、他の独立項が有るか否かが判定され、他の独立項があるときはステップ30に処理が進み、そうでなければステップ31で新規性・拡大先願予測データNdが出力された後、新規性・拡大先願予測ルーチンが終了する。ステップ30では、CPU11が文献カウンタおよび文献MAXに"0"をセットし、項番カウンタに"1"よりも大きい請求項ナンバがセットされる。その後、処理がステップ22に戻り、上記同様の処理が繰り返される。
一方、CPU11は、図15に示すフローチャートに沿って拡大先願予測ルーチンを実行する。拡大先願予測ルーチンがスタートすると、ステップ41に処理が進み、ヒットした文献の出願日(文献出願日)が対象出願日よりも前であるか否か(文献出願日<対象出願日 が成立するか否か)が判定され、これが成立しているときはステップ42に処理が進むが、そうでなければ拡大先願予測ルーチンを終了する。ステップ42では、予測対象発明とヒットした文献とで発明者が同一であるか否かが判定され、これが成立していないときはステップ43に処理が進むが、成立していれば拡大先願予測ルーチンを終了する。ステップ43では、予測対象発明とヒットした文献とで出願人が同一であるか否かが判定され、これが成立していないときはステップ44に処理が進むが、成立していれば拡大先願予測ルーチンを終了する。そして、CPU11は、ステップ44に処理を進めると、拡大先願の要件(特許法第29条の2に規定される要件)を満たしていないことを示す拡大先願フラグ"F1"を含むように新規性・拡大先願予測データNdを生成する。その後、拡大先願予測ルーチンが終了する。
以上で新規性・拡大先願予測ルーチンが終了すると、図13において処理がステップ14からステップ15に進み、CPU11が進歩性予測処理部126としての動作を行い、進歩性予測ルーチンを実行する。CPU11は、図16〜図22に示すフローチャートに沿って進歩性予測ルーチンを実行する。
(進歩性予測ルーチン)
CPU11は、進歩性予測ルーチンをスタートするとステップ51に処理を進め、CTデータ記憶部154から、独立区分エリア154aの独立区分がスペースのレコードにつき、そのナンバエリア154bの請求項ナンバを取得して、後述する独立項テーブル165のナンバエリア(Noエリア)165bにセットする。続くステップ52では、CTデータ記憶部154から、サーチフラグエリア154eのサーチフラグがスペースで、MAX区分エリア154cのMAX区分が"M"のレコードからそのナンバエリア154bの請求項ナンバを取得したうえで、取得した請求項ナンバの最小値(MIN)を求め、それをMAXカウンタにセットする。図9(B)のように、MAX区分が"M"のレコードが複数あるときはそのうちの最も小さい請求項ナンバがMAXカウンタにセットされる。
そして、CPU11は、ステップ53に処理を進めて独立項テーブル165のNoエリア165bをサーチし、続くステップ54で、"1"よりも大きい請求項ナンバがあるか否かを判定し、"1"よりも大きい請求項ナンバがあるか否かで処理が分岐する。この場合、"1"よりも大きい請求項ナンバがなければ処理がステップ55に進み、あれば処理がステップ56に進む。ステップ55は予測対象発明の案文書に含まれる請求項の中で独立項が1つだけの場合の処理(単一独立項ルーチン)、ステップ56は独立項が複数の場合の処理(複数独立項ルーチン)に相当している。前者は例えば予測対象発明が特開2008−62282号公報に開示されている発明の場合、後者は例えば予測対象発明が特開2011−186735号公報に開示されている発明の場合に相当している。
独立項テーブル165は、図24に示すように、カウンタエリア165a,Noエリア165bおよびサーチフラグエリア165cを有している。カウンタエリア165aには、記憶されるデータの件数に応じた数値が記憶されている。Noエリア165bには、独立項の番号が記憶される。サーチフラグエリア165cにはサーチフラグが記憶されている。図24には、一例として、予測対象発明が特開2011−186735号公報に開示されている発明の場合が示されている。
そして、CPU11は、ステップ55に処理を進めると、図17に示すフローチャートに沿って単一独立項ルーチンを実行する。CPU11は、単一独立項ルーチンを開始すると、ステップ61に処理を進め、CTデータ記憶部154から、サーチフラグエリア154eのサーチフラグがスペースのレコードについて、そのナンバエリア154bから請求項ナンバを取得して、そのうちの最小値(MIN)を項番カウンタにセットする。続くステップ62では、後述する独立項検索処理が行われる。続くステップ63で検索フラグ(検索flag)が"VX"または"VY"であるか否かが判定され、検索フラグが"VX"または"VY"であれば処理がステップ64に進み、そうでなければ単一独立項ルーチンを終了する。
CPU11は、ステップ64に処理を進めると項番カウンタに"1"を加算する。続くステップ65では、項番カウンタが、ステップ52でセットしたMAXカウンタ以下であるか否かが判定され、項番カウンタがMAXカウンタ以下ならステップ66に処理を進めて後述する従属項検索処理が実行されるが、そうでなければ独立項検索処理が終了する。
そして、CPU11は図18に示すフローチャートに沿って、複数独立項ルーチンを実行する。CPU11は処理をスタートすると、ステップ52に処理を進め、前述同様の処理を実行し、その後、ステップ55に進んで、上記同様にして単一独立項ルーチンを実行する。その後、CPU11は処理をステップ67に進め、CTデータ記憶部154に、サーチフラグエリア154eのサーチフラグがスペースのレコードがあるか否か(すなわち、検索処理が行われていないレコードがあるか否か)が判定され、あればステップ52に戻って上記同様の処理が実行されるが、そうでなければ複数独立項ルーチンが終了する。
また、CPU11は図19に示すフローチャートに沿って、独立項検索処理を実行する。独立項検索処理では、CPU11が引用発明検索部131としての動作を行い、独立項について主引用発明検索および副引用発明検索を行う。
CPU11は、独立項検索処理を開始すると、ステップ71に処理を進めて後述する主引用発明検索処理を実行する。続くステップ72では、主引用発明検索処理で主引用発明があったか否か(後述する主引用文献がセットされているか否か)が判定され、主引用発明があればステップ73に処理が進むが、主引用発明がなければステップ76に処理が進む。続くステップ73では、後述する副用発明検索処理が実行され、そのあとのステップ74で、副引用発明検索処理で副引用発明があったか否か(後述する副引用文献がセットされているか否か)が判定される。副引用発明があればステップ75に処理が進み、副引用発明がなければステップ77に処理が進む。
CPU11はステップ75に処理を進めると、該当する請求項ナンバの検索フラグ(検索flag)に"VX"をセットし、ステップ77では、検索フラグ(検索flag)に"VY"をセットする。また、CPU11はステップ76に処理を進めると、CTデータ記憶部154に記憶されているレコードのうち、ナンバエリア154bの請求項ナンバが項番カウンタに一致しているレコードについて、サーチフラグエリア154eのサーチフラグEfにサーチ済み(検索済み)を示す"9"をセットする。また、CPU11はセットされた検索フラグを含むように進歩性予測データVd1を生成して、それを予測結果ファイル生成部127に出力する。また、CPU11は検索結果に応じた請求項要旨データiedと概念検索データVd2を入力ベクトル生成部132に出力する。この場合、請求項要旨データiedは、検索の対象となった請求項の要旨データとすることができるが、予測対象TR記憶部152に記憶されている予測対象発明の検索の対象となった請求項のデータでもよい。検索フラグは、主引用発明が見つかった場合に"VX"または"VY"がセットされるが、主引用発明が見つかると、それによって、進歩性の要件を満たさないと判断される可能性が高いため、進歩性違反の拒絶理由が見つかるか否かは主引用発明が見つかるか否かに大きく左右される。進歩性予測データVd1は、このような検索フラグを含むことによって、進歩性の要件適否を示すものとなる。
そして、CPU11は図20に示すフローチャートに沿って、主引用発明検索処理を実行する。主引用発明検索処理は、予測対象発明に最も近い主引用発明を検索する処理である。
CPU11は、主引用発明検索処理を開始すると、ステップ81に処理を進めて、展開度カウンタtcに"0"をセットする。続いてCPU11は、ステップ82に処理を進め、要旨データ記憶部153から、次のデータを読みだして主検索文書データ(主引用発明を概念検索で検索するときの文書データ)を設定する。1つは、データ種別が"C"で、項番エリア153bの番号が項番カウンタに相当するレコード(項番カウンタには、ステップ61で独立項の最小値がセットされている)から必須フラグEfが"X"で、展開度Edが展開度の最大値(展開度MAX)−展開度カウンタtcの用語(例えば、展開度MAXが"5"なら、展開度Edが"5"−tcの用語)であり、もう1つは、課題データ、すなわち、データ種別が"P"のレコードのデータである。
続くステップ83では、CPU11が主引用発明の検索処理、すなわち、主検索文書データを入力文書に用いて、対象公報記憶部155に記憶されている検索対象公報データについて概念検索を行う。この概念検索では、主検索文書データと、検索される文書それぞれを特徴語の抽出、重み付けを行う等してそれぞれの文書に応じたベクトル(文書ベクトル)が生成され、各ベクトルの内積が求められて類似度が算出される。次にステップ84では、ステップ83の概念検索の結果から、最も大きい類似度が一定値以上になっているか否かが判定され、一定値以上の場合はステップ85に処理が進むが、そうでなければステップ87に処理が進む。ステップ85では、類似度が一定値以上の文献が複数あったか否かが判定され、なければステップ86に処理が進み、あれば処理がステップ89に進む。主引用発明検索処理では、類似度が一定値以上の文献があったときだけ主引用文献がセットされる。
ステップ86では、ヒットした文献が主引用文献(主引用発明が開示されている先行技術文献)にセットされて主引用発明検索処理が終了する。ステップ87では、展開度カウンタtcに"1"が加算され、その後のステップ88では、展開度MAX−展開度カウンタtcが"0"以下であるか否かが判定され、"0"以下なら主引用発明検索処理を終了するが、そうでなければステップ82に戻って上記の処理を繰り返す。
こうすることで、はじめに展開度Edが展開度MAXのより重要な用語で概念検索が行される。概念検索では、文献の類似度に応じて、複数の文献が抽出され得るが、最も高い類似度が一定値に達していないときは、その文献が主引用文献に該当しないおそれが高い。そのため、類似度が一定値以上の文献が見つからなかった場合に展開度Edが展開度MAXよりも小さい用語を含めて再び概念検索が実行される。
ステップ89では、類似度の最も大きい文献(最類似文献ともいう)を主引用文献にセットし、その後、主引用発明検索処理が終了する。
そして、CPU11は図21に示すフローチャートに沿って、副引用発明検索処理を実行する。副引用発明検索処理は、予測対象発明と主引用発明との相違点を含む副引用発明を検索する処理であり、主引用発明検索処理で主引用発明が見つかったときだけ実行される。
CPU11は、副引用発明検索処理を開始すると、ステップ91に処理を進めて、要旨データ記憶部153から、データ種別が"C"で、項番エリア153bの番号が項番カウンタに相当するレコードの主検索文書データに含まれていない用語(検索未使用データ)と、データ種別が"P"のレコードのデータとを読み出し、それらを副検索ターム(副引用発明を全文検索で検索するときのキーワード)に設定する。
続くステップ92では、CPU11が副引用発明の検索処理、すなわち、副検索タームを検索キーワードに用いて、対象公報記憶部155に記憶されている検索対象公報データについて全文検索を行う。続くステップ93では、ステップ92でヒットした文献があったか否かが判定され、ヒットした文献があればステップ94に処理が進み、そうでなければ処理がステップ96に進む。ステップ94では、ヒットした文献が複数あったか否かが判定され、ヒットした文献が複数なければステップ95に処理が進み、ヒットした文献が複数あれば処理がステップ98に進む。
ステップ95では、ヒットした文献が副引用文献(副引用発明が開示されている先行技術文献)にセットされて副引用発明検索処理が終了する。ステップ96では、副検索タームが変更されて再び全文検索が行われる。ここでは、副検索タームが、データ種別が"C"で、項番エリア153bの番号が項番カウンタに相当するレコードの主検索文書データに含まれていない検索未使用データと、データ種別が"T"のレコードのデータに変更される。次のステップ97でヒットした文献があったか否かが判定され、ヒットした文献があればステップ94に処理が進み、なければ副引用発明検索処理が終了する。さらに、ステップ98では、ヒットした文献のそれぞれについて、データ種別が"C"で、項番エリア153bの番号が項番カウンタに相当するレコードの必須フラグEfが"X"の用語との一致数がカウントされ、その一致数が副引用ファイルにセットされる。次のステップ99で副引用ファイルが一致数の降順にソートされ、続くステップ100で副引用ファイルの先頭から3件が副引用文献にセットされ、その後、副引用発明検索処理が終了する。副引用発明検索で複数の文献がヒットしたときは、そのそれぞれについて、予測対象発明の特徴部分がどの程度開示されているのかが、必須フラグEfが"X"の用語との一致数で調べられ、その一致数の多い文献が副引用文献にセットされる。
そして、CPU11は図22に示すフローチャートに沿って、従属項検索処理を実行する。従属項検索処理は、検索フラグ(検索flag)が"VX"または"VY"であったとき(主引用発明がみつかったとき)だけ実行される。CPU11が従属項検索処理を開始すると、ステップ111に処理が進み、要旨データ記憶部153から、データ種別が"C"で、項番エリア153bの番号が項番カウンタに相当するレコード(項番カウンタには、ステップ64で独立項の最小値に順次"1"が加算される)から必須フラグEfが"X"の用語が読み出され、それが従属検索ターム(従属項に記載されている発明を全文検索で検索するときのキーワード)に設定される。次のステップ112でCPU11が従属検索タームを検索キーワードに用いて、主引用文献について全文検索を行い、従属項に記載されている発明が主引用文献に開示されているか否かを調べる。
次のステップ113で、ヒットした文献があったか否かが判定され、ヒットした文献があればステップ114に処理が進み、そうでなければ処理がステップ116に処理が進む。ステップ114では、該当する請求項ナンバの検索フラグ(検索flag)に"VX"がセットされ、ヒットした文献が該当する請求項ナンバの主引用文献にセットされる。その後、処理がステップ115に進み、CTデータ記憶部154に記憶されているレコードのうち、ナンバエリア154bの請求項ナンバが項番カウンタに一致するレコードについて、サーチフラグエリア154eのサーチフラグEfに"9"がセットされ、その後、従属項検索処理が終了する。また、ステップ116では、従属検索タームで副引用文献について全文検索が行われ、次のステップ117で、ヒットした文献があったか否かが判定される。ヒットした文献があればステップ118を実行したあとステップ115に進み、なければ従属項検索処理が終了する。ステップ118では、該当する請求項ナンバの検索フラグ(検索flag)に"VY"がセットされ、ヒットした文献が該当する請求項ナンバの副引用文献にセットされる。
以上のようにして、新規性・拡大先願予測ルーチンと、進歩性予測ルーチンとが実行されると、それぞれの結果に応じて、新規性・拡大先願予測データNdと、進歩性予測データVd1とが予測結果ファイル生成部127に出力される。また、機械学習部133から要件適否文書ベクトルV4が出力されるので、これらを用いて予測結果ファイル生成部127が図10に示した予測結果ファイルを生成し、予測結果記憶部156に記憶させる。
予測結果ファイルは、図10に示すように、案文書番号、請求項、主検索文書データ、副検索ターム、検索フラグ、ヒット文献、マシン予測の各項目のデータが予測対象発明ごとに記憶されている。マシン予測とは、機械学習記憶部133からの要件適否文書ベクトルV4に応じたデータであって、進歩性予測ルーチンで見つかった主引用文献および副引用文献を引用した進歩性違反の拒絶理由が見つかる可能性が高いか低いか(高い場合は"H"、低い場合は"L")を示している。
また、予測結果編集部105が予測結果ファイルを読み込み、図25に示すような特許要件適否予測リストL1を編集および出力して、ユーザ端末装置30に送信する。特許要件適否予測リストL1には、予測対象発明の案文書番号、請求項の番号とともに、新規性(拡大先願)、進歩性の要件適否がその根拠となる文献(主引用文献、副引用文献)とともに示されている。新規性(拡大先願)、進歩性の要件に適合しない(満たさない)と予測される場合は、"X"、適合する(満たす)と予測される場合は"A"が記載される。これらは、予測結果ファイルの検索フラグで判断される。
進歩性の要件に適合しないと予測される場合の"X"(主引用文献、副引用文献有り)、"Y"(主引用文献のみ有り)、には、"H"、"L"が併記される(図25では、"H"が併記されるばあいのみ例示)これは、機械学習部133の要件適否文書ベクトルV4にしたがったもので、"H"は主引用文献で進歩性違反の拒絶理由が発行される可能性が高い場合、"L"は低い場合を示している。
(サーチ無し進歩性予測ルーチン)
CPU11は、サーチ無し進歩性予測ルーチンをスタートすると、図33に示すように、進歩性予測ルーチンと同様にして、ステップ51、52,53、54を実行する。ステップ54で、"1"よりも大きい請求項ナンバがあるか否かで処理が分岐する。この場合、"1"よりも大きい請求項ナンバがなければ処理がステップ126に進み、あれば処理がステップ127に進む。ステップ126はサーチ無し単一独立項ルーチン、ステップ127はサーチ無し複数独立項ルーチンである。前者は図34に沿って実行されるが、後者は図35に沿って実行される。
(サーチ無し単一独立項ルーチン)
CPU11は、サーチ無し単一独立項ルーチンをスタートすると、図34に示すように、図17と同様にステップ61を実行したあと、指定予測データ生成部134としての動作を行い、ステップ130,131を実行する。CPU11は、ステップ130に処理を進めると、要旨データ記憶部153から項番153bが最小値MINに応じたレコードと、データ種別が"P"のレコードを読み出して請求項要旨データiedを生成する。CPU11は、続くステップ131では、指定先行技術データ記憶部151に記憶されている指定先行技術データを読み出して、進歩性予測データVs1と指定先行技術データVs2sを生成し、それぞれ予測結果ファイル生成部127、入力ベクトル生成部132に出力する。続くステップ132で、サーチフラグエリア154eのサーチフラグEfに"9"をセットすると、サーチ無し単一独立項ルーチンが終了する。
(サーチ無し複数独立項ルーチン)
CPU11は、サーチ無し複数独立項ルーチンをスタートすると、図35に示すように、ステップ126に進んで上記同様にしてサーチ無し単一独立項ルーチンを実行する。その後、図18と同様のステップ67に処理が進み、CTデータ記憶部154に、サーチフラグエリア154eのサーチフラグがスペースのレコードがあるか否かが判定され、レコードがあればステップ126に戻ってサーチ無し単一独立項ルーチンが上記同様に実行されるが、無ければサーチ無し複数独立項ルーチンが終了する。
以上のように、本発明の実施の形態にかかる特許要件適否予測サーバ10では、サーチ有りモードの場合は、予測対象発明が記載されている案文書の案文書データから要旨データを生成し、これを用いて主引用発明検索、副引用発明検索を行っている。主引用発明検索は、予測対象発明とその骨格において共通する、すなわち、先行技術発明のうち、予測対象発明に最も近い主引用発明を要旨データで探し出す処理であり、特許法や特許・実用新案審査基準に沿って行われる。副引用発明検索は、主引用発明検索で主引用発明が見つかった場合に、発明が解決しようとする課題や、技術分野を特定する用語を用いた全文検索で行われており、これも特許法や特許・実用新案審査基準に沿って行われる。したがって、本発明の実施の形態にかかる特許要件適否予測サーバ10では、特許要件の適否に関する予測が審査実務に適合した内容で行われるので、特許出願の出願書類の準備負担を有効に軽減することができる。
一方、前述したように、特許要件適否予測処理部103が機械学習部133を有しているが、その機械学習部133は過去の審査実績に基づく学習データで訓練された人工知能プログラムで構築されている。
ところで、平成26年の実績ベースで年間32万数千件程度の特許出願が出されており、その一部またはそれ以前の多数の特許出願について1stアクションがすでに発行されている。その中には、拒絶理由通知で進歩性違反の拒絶理由が指摘されている出願(進歩性拒絶出願)が多数存在している。
進歩性拒絶出願では、審査結果が、審査時点の請求項に記載された発明と主引用発明とに相違点があったものの、その相違点だけでは、進歩性があるとは審査官によって判断されなかったということを意味している。これに対し、特許出願の中には、1stアクションが発行されることなく特許査定が発行された出願や、拒絶理由通知が発行されたものの、その理由に進歩性違反の拒絶理由が指摘されていなかった出願(進歩性拒絶無し出願)も存在している。
そして、例えば図23に示すように、審査対象となる特許出願Pdがあり、その出願日がt0であったとすると、特許出願Pdに対する主引用発明または副引用発明となりえるのは、公知、公用、文献公知およびインターネット公知の発明であり、主に出願日t0より前にすでに公開されている出願の特許公開公報(図23では、rf1〜rf6)に開示されている発明である。
ここで、仮に、審査の結果、公報rf6に開示されている発明が主引用発明に該当すると判断されたとする。すると、その場合、特許出願Pdに係る発明と、その公報rf6に開示されている発明とに相違点があったものの、その相違点に応じた距離dpが、特許出願Pdに係る発明の進歩性を肯定するに足りる大きさではなかったと考えられる。逆に、公報rf6に開示されている発明が主引用発明には該当しないと判断されていたとすれば、距離dpが、出願Pdに係る発明の進歩性を肯定するに足りる大きさであったと考えられる。
もし、発明の進歩性が肯定されるときの相違がどの程度で、否定されるときの相違がどの程度なのかが割り出せれば、それが特許要件適否の客観的な判断材料になると考えられるが、以上を考慮すると、そのためには、2つの発明の相違に応じた距離dpがどの程度なのかを割り出すのが有効であると考えられる。これを過去の審査実績に基づく訓練データの学習によって割り出し、進歩性が否定されるおそれが高いのか、それとも低いのかの目安を付けるのが機械学習部133である。
機械学習部133の学習において、本件出願にかかる発明(本願発明)では、距離dpを2つの文書ベクトルの差分と捉え、進歩性の拒絶理由有りの場合、無しの場合それぞれの距離dpを学習するため、前述のHLパターンによる訓練データで学習が行われている。
そして、特許要件の適否を予測する場合は、予測対象発明について、その要旨データを求め、それを用いて概念検索で最類似文献を探し出す。最類似文献は、予測対象発明の文書ベクトル(正確には、独立項の記載事項などから求めた文書ベクトル)に最も類似度が高い文書ベクトルを有しているので、公開済出願の中で主引用文献になる可能性が最も高いと認められる。
その最類似文献から求めた引用候補ベクトルRfVと、予測対象発明の要旨データから求めた要旨ベクトルEVとの差分を求めて要旨移動ベクトルV3を生成し、これを機械学習部133に入力して、主引用発明検索で見つかった主引用文献を引用する進歩性違反の拒絶理由が有るのか、無いのかが出力されるようにしている。これにより、進歩性違反の拒絶理由が見つかる可能性が高いのか、低いのかの目安を付けることが可能になる。
以上のように、特許要件適否予測サーバ10では、機械学習部133を備えていることによって、特許庁の審査実績を反映させる形で特許要件適否の予測が行われることになる。従前のような審査官や弁理士などの専門家の経験や勘だけに頼らざるを得ない判断結果に人工知能の判断結果を生かせるようになるため、予測結果に客観性を持たせることが可能になり、出願書類の準備負担の軽減を通じて権利化業務の効率向上が期待できる。
特にサーチ無しモードの場合は、指定先行技術発明との関係による特許要件の適否予測が行われるため、ユーザが自ら指定した先行技術発明からみて、予測対象発明が進歩性の要件を具備しているのかどうかが予測される。出願書類が準備される際には、先行技術調査で見つかった文献に記載されている先行技術と出願しようとする発明との相違が明確になるようにするものであるが、その相違で、果たしてその発明が進歩性を具備するのか、確信が持てない場合が多々ある。また、進歩性を具備するように出願書類を準備したものの、進歩性違反の拒絶理由が指摘されることもある。この点、特許要件適否予測サーバ10では、機械学習部133によって、進歩性適否の目安を付けることができるので、それを出願書類の準備の段階で生かすことで、出願書類の準備負担の軽減に加え、出願書類の品質向上が期待できる。
また、進歩性予測処理部126が主引用発明検索では概念検索を行い、副引用発明検索で全文検索を行っている。進歩性違反の拒絶理由が有るのかどうかは主引用発明が見つかるか否かが大きく左右するが、その主引用発明を探す主引用発明検索で全文検索を行うと、複数の文献がヒットする可能性があり、主引用発明(主引用文献)を特定できない場合がある。この点、概念検索では、文書ベクトルの内積から求めた類似度にしたがい類似している文献が順番付けされるので、最も類似度の高い文献を選ぶことで主引用文献を特定できる。こうして見つけた主引用文献に機械学習部133による予測を併用することで、その主引用文献を引用した進歩性違反の拒絶理由が出るおそれが高いのか、低いのかを予測することができる。また、副引用発明検索で全文検索を行うことで、副引用文献があるのかどうかを明確にすることができる。
以上の説明では、より好ましい実施の形態として、進歩性予測処理部126の引用発明検索部131が主引用発明検索部および副引用発明検索部を有している場合を示している。前述したように、主引用発明検索によって主引用発明が見つかると、進歩性無しの拒絶理由が見つかる可能性が高いから、主引用発明が見つかったら、その後は副引用発明検索を行うことなく入力ベクトル生成部132と、機械学習部133を作動させて要件適否文書ベクトルV4を出力するようにしてもよい。この場合でも、前述のステップ89でセットされる主引用文献に関する進歩性予測データVd1と、機械学習部133により生成される要件適否文書ベクトルV4とを併用することで、審査実務に適合した内容の予測が行えるのであって、しかもその予測は人工知能の判断結果を生かしたものとなるから、予測結果に客観性を持たせることができる。したがって、進歩性予測処理部126が主引用発明検索部を有していればよく、副引用発明検索部を有していなくてもよいが、上記のように、副引用発明検索部を有する進歩性予測処理部126の方がより好ましい。
第2の実施の形態
続いて、第2の実施の形態に係る特許要件適否予測サーバ200について、図26〜図30を参照して説明する。特許要件適否予測サーバ200は、図26に示すように、前述した特許要件適否予測サーバ10と比較して、特許要件適否予測処理部103、予測結果編集処理部105、予測結果記憶部156の代わりに特許要件適否予測処理部203、予測結果編集処理部205、予測結果記憶部256を有する点と、予測結果リストL1の代わりに予測結果リストL2を出力する点とで相違している。
特許要件適否予測処理部203は、図27に示すように、特許要件適否予測処理部103と比較して、進歩性予測処理部126と予測結果ファイル生成部127の代わりに進歩性予測処理部226と予測結果ファイル生成部227を有する点で相違している。
そして、進歩性予測処理部226は、進歩性予測処理部126と比較して、引用発明検索部131と機械学習部133の代わりに引用発明検索部231と機械学習部233を有する点と、入力ベクトル生成部132の動作が異なる点とで相違している。
前述した第1の実施の形態に係る進歩性予測処理部126では、主引用発明検索を行うことによって、最類似文献だけを主引用文献にセットしているが(ステップ89)、第2の実施の形態に係る進歩性予測処理部226では、類似度の降順に最類似文献を含むn件の文献(nは2以上の整数)を類似文献として抽出し、それら各類似文献を主引用文献にセットしている。また、機械学習部233が、n件の要旨移動ベクトルV31〜V3nをそれぞれ後述するSクラス、Hクラス、Lクラスの3つのクラスに分類する。
引用発明検索部231は、引用発明検索部131と同様に主引用発明検索部および副引用発明検索部を有しているが、引用発明検索部131と比較して、主引用発明検索部の動作が異なり、出力されるデータも異なる。引用発明検索部131では、主引用発明検索部が主引用発明検索を行うことによって、最類似文献を主引用文献にセットしているが(前述した主引用発明検索処理のステップ89)、引用発明検索部231の主引用発明検索部は、ステップ89において、類似度の降順に最類似文献を含むn件の文献を類似文献として抽出し、それらを主引用文献(doc1〜docn)にセットする。また、主引用発明検索部の動作が異なることに伴い、前述した独立項検索処理におけるステップ76でCPU11が各類似文献に応じたn件の進歩性予測データVd11〜Vd1nを生成して、それらを予測結果ファイル生成部227に出力する。また、独立項検索処理において、CPU11は請求項要旨データiedを入力ベクトル生成部132に出力するが、各類似文献に応じたn件の概念検索データVd21〜Vd2nを入力ベクトル生成部132に出力する。
機械学習部233は、機械学習部133と比較して、次に述べるSHLパターンを学習パターンに用いた機械学習(教師付き学習)によって、各類似文献に応じたn件の要旨移動ベクトルV31〜V3nをそれぞれSクラス、Hクラス、Lクラスのいずれかに分類し、その分類結果に応じたn件の出力信号(要件適否文書ベクトルV41〜V4n)を出力するように構築されている。Sクラス、Hクラス、Lクラスは、それぞれ、進歩性の要件に適合しない可能性が極めて高いクラス、適合しない可能性が高いクラス、適合するクラス(予測対象発明について、進歩性違反の拒絶理由が見つかる可能性が極めて高いクラス、高いクラス、無いクラス)に相当している。
また、SHLパターンは、次のパターンS、H、Lの3つのパターンの組み合わせである。
パターンS:学習文書ベクトルが第1の学習文書ベクトルで教師ベクトルが新規性および進歩性の拒絶理由有りを示すベクトル(例えば、正解のクラスに対応した次元だけが"1"で、他が"0"のベクトル)との組み合わせ
パターンH:学習文書ベクトルが第2の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由有りで新規性の拒絶理由無しを示すベクトル(例えば、正解のクラスに対応した上記とは別の次元だけが"1"で、他が"0"のベクトル)との組み合わせ
パターンL:学習文書ベクトルが第3の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由無しを示すベクトル(例えば、上記2つとは別の次元だけが"1"で、他が"0"のベクトル)との組み合わせのパターンである。
第1の学習文書ベクトルは、公開済出願の中で特許庁の審査の結果、初めての拒絶理由通知(1stアクション)が発行された出願であって、その1stアクションで、同じ文献を引用して新規性および進歩性違反の拒絶理由(特許法第29条第1項第3号および同条第2項の要件を満たしていないとする拒絶理由)が指摘されていた出願(新規性・進歩性拒絶出願)の該拒絶理由が指摘されていた(拒絶理由通知発行時点の)請求項に応じた文書ベクトルと、そのときの引用文献1(主たる刊行物として引用されていた第1の主引用刊行物)に応じた文書ベクトル(第1の引用文書ベクトル)との差分に応じた第1の移動文書ベクトルである。
第2の学習文書ベクトルは、公開済出願の中で特許庁の審査の結果、初めての拒絶理由通知(1stアクション)が発行された出願であって、その1stアクションで、新規性の拒絶理由(特許法第29条第1項第3号の要件を満たしていないとする拒絶理由)は指摘されていないが、進歩性違反の拒絶理由(同条第2項の要件を満たしていないとする拒絶理由)が指摘されていた出願(進歩性拒絶出願)の該拒絶理由が指摘されていた(拒絶理由通知発行時点の)請求項に応じた文書ベクトルと、そのときの引用文献1(主たる刊行物として引用されていた第2の主引用刊行物)に応じた文書ベクトル(第2の引用文書ベクトル)との差分に応じた第2の移動文書ベクトルである。
第3の学習文書ベクトルは、公開済出願の中で審査の結果、1stアクションが発行されずに特許査定が発行された出願(拒絶無し出願)または1stアクションは発行されたがその拒絶理由に進歩性違反の拒絶理由が指摘されていなかった出願(進歩性拒絶無し出願)の(拒絶理由通知が発行された時点の)請求項1に応じた文書ベクトルと、それら拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる文献(学習用最類似文献)に応じた文書ベクトル(非引用文書ベクトル)との差分に応じた第3の移動文書ベクトルである。
機械学習部233は、機械学習部133と同様、情報処理に脳神経回路網をモデルにしたニューラルネットワークを適用することができるが、そのうちのBP(バックプロパゲーション)ネットワークを適用することが好ましい。
そして、進歩性予測処理部126の入力ベクトル生成部132は図28に示すように、要旨ベクトル生成部132aと、引用候補ベクトル生成部132bと、移動ベクトル生成部132cとを有しているが、そのうちの引用候補ベクトル生成部132bと、移動ベクトル生成部132cの動作が異なっている。すなわち、引用候補ベクトル生成部132bは、引用発明検索部231からn件の概念検索データVd21〜Vd2nが入力されるので、そのそれぞれに含まれる各類似文献の公開公報データを入力してその特徴語を抽出し、各語に応じた重み付けを行って各類似文献に応じたn件の文書ベクトル(引用候補ベクトル)RfV1〜RfVnを生成する。移動ベクトル生成部132cは、要旨ベクトルEVと、各引用候補ベクトルRfV1〜RfVnとの差分を計算して、双方の文書ベクトルの差分に応じたn件の要旨移動ベクトルV31〜V3nを生成する。
前述したように、各類似文献は、主引用発明検索部による概念検索によって、最も高い類似度からその降順に抽出した文献であるため、そのいずれも予測対象発明の審査で、主引用発明の開示文献として引用される確率が高いと推測される。そのため、各類似文献を引用候補として引用候補ベクトルRfV1〜RfVnを求め、これらと要旨ベクトルEVとの差分を計算して要旨移動ベクトルV31〜V3nを求めれば、予測対象発明と、各類似文献に開示されている発明との相違に応じた要旨移動ベクトルV31〜V3nが生成される。
予測結果ファイル生成部227は、予測結果ファイル生成部127と比較して、図29に示したレイアウトを有する予測結果ファイルを生成してそれを予測結果記憶部256に記憶させる点と、本発明の実施の形態にかかる非適合率算出部としての動作を行い、予測対象発明に関する非適合率Vrを算出する点とで相違している。
非適合率Vrは、予測対象発明についての進歩性の要件に適合しない可能性であって、予測対象発明について、進歩性違反の拒絶理由が見つかる可能性を示している。機械学習部233から出力される要件適否文書ベクトルV41〜V4nは、進歩性の要件に適合しない可能性が極めて高い、高い、無いといった内容で生成されるので、予測対象発明について、各類似文献との関係でみた進歩性違反の拒絶理由が見つかる可能性を示している。そのため、これらを用いて予測結果ファイル生成部227が予測対象発明に関する非適合率Vrを算出する。この場合、予測結果ファイル生成部227は、その非適合率Vrを非適合率算出規則にしたがい算出する。非適合率算出規則とは、予測結果ファイル生成部227が非適合率Vrを算出する規則であって、本実施の形態では、要件適否文書ベクトルV41〜V4nの中に含まれるSクラス、Hクラス、Mクラスそれぞれの件数に応じて、非適合率Vrの数値が決定されるように、図示しない算出規則テーブルに設定されている。非適合率算出規則は例えば次のようにすることができる。
Sクラスが2件以上:Vr≧85%
Sクラスが1件で、Hクラスの件数が50%以上:Vr≧75%
Sクラスが1件で、Hクラスの件数が50%未満:Vr≧65%
Sクラスが0件で、Hクラスの件数が50%以上:Vr≧50%
Sクラスが0件で、Hクラスの件数が50%未満:Vr≧40%
Sクラス、Hクラスがともに0件:Vr≧15%
上記非適合率算出規則によれば、例えば、類似文献が5件(前述の整数nが"5")の場合、Sクラスが2件あればVr≧85%である。また、Sクラスが1件で、Hクラスが3件ならVr≧75%になるが、Hクラスが2件だとVr≧65%、Sクラス、Hクラスがともに0件(全件がLクラス)だとVr≧15%になる。
そして、図29に示すように、予測結果ファイル生成部227が生成する予測結果ファイルは、予測結果ファイル生成部127が生成する予測結果ファイルと比較して、非適合率Vrが含まれている点で相違している。
また、予測結果編集処理部205は、予測結果編集処理部105と比較して、予測結果ファイルを読み込み、図30に示すような特許要件適否予測リストL2を編集および出力する点で相違している。特許要件適否予測リストL2は、特許要件適否予測リストL1と比較して、OA率が追加されている点で相違している。OA率とは、予測対象発明について、審査過程で特許要件(新規性または進歩性)に違反する拒絶理由が見つかり、それを示す拒絶理由通知書が発行される可能性を示していて、前述した非適合率Vrに相当する数値が示されている。
以上のように、第2の実施の形態に係る特許要件適否予測サーバ200では、特許要件適否予測処理部203の進歩性予測処理部226において、引用発明検索部231が最類似文献を含むn件の類似文献を主引用文献にセットしている。また、機械学習部233が各類似文献に応じた要旨移動ベクトルV31〜V3nをSクラス、Hクラス、Lクラスの3つに分類し、その分類結果に応じた要件適否文書ベクトルV41〜V4nを出力する。
第1の実施の形態に係る特許要件適否予測サーバ10では、特許要件適否に関する予測が審査実務に適合した内容で、しかも特許庁の審査実績を反映させる形で行われる。この点は、特許要件適否予測サーバ200も同様である。
しかし、特許要件適否予測サーバ10では、主引用発明検索で、主引用文献として、最類似文献だけが抽出されるに過ぎなかった。最類似文献は、概念検索の結果、予測対象発明との類似度が最も高いとされた文献であるため、実際の審査の結果、主引用文献として引用される可能性が最も高いと考えられる。とはいえ、最類似文献が実際の審査で引用されるとは限らないし、最類似文献と、その次の類似度の文献(次類似文献)とで類似度の相違がごくわずかでしかなく、その次類似文献の方が最類似文献よりも主引用文献として適切な場合も十分に考えられる。そのため、主引用発明検索で最類似文献を含む複数の文献を抽出し、これらを対象として機械学習部233による文書ベクトルの分類を行えば、次類似文献をも考慮に入れた形で特許要件適否に関する予測が行われる。そのため、特許要件適否予測サーバ10の予測の精度よりも、特許要件適否予測サーバ200の予測の精度が向上する。
また、実際の審査実務では、ある特許出願について、進歩性違反の拒絶理由が見つかるとき、進歩性違反の拒絶理由と新規性違反の拒絶理由とが同じ文献(この場合に引用される文献を新規性・進歩性拒絶引用文献ともいう)を引用して指摘される場合がある。このような場合、その特許出願にかかる請求項にかかる発明と、新規性・進歩性拒絶引用文献に開示されている発明とに相違がないと審査官によって判断されているから、要旨移動ベクトルV31〜V3nの中にSクラスへ分類される文書ベクトルが含まれているときは、進歩性違反の拒絶理由が見つかる可能性がそうでない場合に比べてより高くなっていると考えられる。したがって、新規性・進歩性拒絶出願からみた距離dpと、進歩性拒絶出願からみた距離dpとが区別できるように、SHLパターンによる機械学習を行って機械学習部233を構築しておくことで、進歩性違反の拒絶理由が見つかる可能性が極めて高い場合とそうでない場合とを区別した予測が可能になる。こうすることで、特許要件適否予測サーバ200による予測精度の向上と、業務効率のより一層の改善が期待できる。
(変形例1)
上記の進歩性予測処理部226では、一つの機械学習部233がn件の要旨移動ベクトルV31〜V3nの分類を行っていたが、図31に示した特許要件適否予測処理部213における進歩性予測処理部227のように、要旨移動ベクトルV31〜V3nに応じた複数の機械学習部2331〜233nを有し、そのそれぞれが要旨移動ベクトルV31〜V3nを分類するようにしてもよい。また、図示はしないが、入力ベクトル生成部132も、概念検索データVd21〜Vd2nの件数に応じて複数設けてもよい。これらのようにすると、各機械学習部2331〜233nまたは各入力ベクトル生成部132が並行に処理を実行するので、処理時間を短縮することができる。なお、図示はしないが、指定先行技術データ記憶部151に複数の指定先行技術データが記憶されているとき(複数の指定先行技術データを受信して)に、指定予測データ生成部134がそれらに応じて複数の進歩性予測データVs1、指定先行技術データVs2を生成してもよい。
(変形例2)
以上述べた各実施の形態では、特許要件適否予測サーバ10,200に特許要件適否予測プログラムがインストールされることによって、特許要件適否予測サーバ10,200が特許要件適否予測装置として機能する場合を例にとって説明している。その他、本発明は、ユーザ端末装置30が特許要件適否予測装置として機能する場合についても適用がある。この場合、前述した特許要件適否予測プログラムについて少なくとも以下の変更点1)、2)にしたがった変更を行い、その変更後の特許要件適否予測プログラムを特許要件適否予測サーバ10,200からユーザ端末装置30にダウンロードし、ユーザ端末装置30にインストールすればよい。
変更点1) 指定ナンバなどの入力操作を行うための画像データを特許要件適否予測サーバ10,200からユーザ端末装置30に送信することなくユーザ端末装置30に表示させる。
変更点2) 特許要件適否予測リストをユーザ端末装置30が出力する。
以上の説明は、本発明の実施の形態についての説明であって、この発明の装置及び方法を限定するものではなく、様々な変形例を容易に実施することができる。また、各実施形態における構成要素、機能、特徴あるいは方法ステップを適宜組合わせて構成される装置又は方法も本発明に含まれるものである。
例えば、ユーザ端末装置は高機能携帯電話機や、タブレット型の端末装置ではなく、ノートパソコンや、PDAでもよい。なお、CPU11が実行する特許要件適否予測プログラムは、磁気記録媒体、CD−ROM,DVD等の各種記録媒体に記録することができるし、ネットワークを介して図示しないサーバからダウンロードすることもできる。
また、上記の実施形態では、ユーザ端末装置30が案文書データを特許要件適否予測サーバ10に送信している。案文書データによって特定される予測対象発明は、未だ出願されていないため、公知にならないようにする必要がある。そのためには、案文書データから要旨データを抽出する要旨データ抽出手段(要旨データ抽出部102に相当)をユーザ端末装置30に設けて、ユーザ端末装置30が要旨データを生成し、ユーザ端末装置30から要旨データを暗号化通信によって特許要件適否予測サーバ10に送信することが好ましい。この場合、特許要件適否予測サーバ10は、受信した要旨データを記憶する要旨データ記憶部153を有していればよく、要旨データ抽出部102を有していなくてもよい。