JP2017201489A - 請求の範囲の構文解析構成方法 - Google Patents

請求の範囲の構文解析構成方法 Download PDF

Info

Publication number
JP2017201489A
JP2017201489A JP2016093366A JP2016093366A JP2017201489A JP 2017201489 A JP2017201489 A JP 2017201489A JP 2016093366 A JP2016093366 A JP 2016093366A JP 2016093366 A JP2016093366 A JP 2016093366A JP 2017201489 A JP2017201489 A JP 2017201489A
Authority
JP
Japan
Prior art keywords
configuration
dependent
independent
main
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016093366A
Other languages
English (en)
Other versions
JP6417359B2 (ja
Inventor
宏興 蔡
Hong-Shin Tsai
宏興 蔡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Integral Search Int Ltd
Integral Search International Ltd
Original Assignee
Integral Search Int Ltd
Integral Search International Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Integral Search Int Ltd, Integral Search International Ltd filed Critical Integral Search Int Ltd
Priority to JP2016093366A priority Critical patent/JP6417359B2/ja
Publication of JP2017201489A publication Critical patent/JP2017201489A/ja
Application granted granted Critical
Publication of JP6417359B2 publication Critical patent/JP6417359B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】
メモリ空間及びアクセス時間において簡単で効率的且つ直接的な請求の範囲の構文解析構成方法を提供する。
【解決手段】
本発明は、特許請求の範囲を自動的に読み込み、自動的に以下の工程を実行する請求の範囲の構文解析構成方法であって、独立項及び従属項判断工程と、請求の範囲分隔工程と、序文取出し工程と、独立項の構成分析工程と、従属項の構成分析工程とを含む。これにより、特許請求の範囲が構文解析構成がなされる。
【選択図】 図1

Description

本発明は特許明細書の構文解析構成方法に関するものであって、特に請求の範囲の構文解析構成方法に関するものである。
特許出願の請求の範囲が、複数の請求項によりそれぞれ前記特許出願の技術特徴が定義されている。各請求項がそれぞれ序文及び含まれている構成を定義し、前記構成が主要構成及び副次構成を有する際に、前記主要構成と副次構成の間の対応関係が定義され、前記対応関係が連接関係、従属関係及び位置関係等を含む。各請求項中の序文、構成及び構成の間の対応関係により、一つの特許出願の技術特徴が定義される。
従って、各請求項中の序文、構成及び構成の間の対応関係を有効的に解析しデータベースに記憶することができるのであれば、使用者が前記データベースを検索することにより前記序文および/または構成および/または構成の間の対応関係に対応する特許出願を捜し出すことができ、効率よく特許検索が達成できる。
しかしながら、単一国の特許データベースがかなり厖大であり、米国特許商標庁(USPTO)の特許データベースの面で言うと、公開特許公報の数が約512万件に達しており、他の公開公報も396万件に達している。各特許出願がおよそ数十個から数百個の請求項を有し、そのため請求項が合計一億以上を超えている。このような厖大なデータベースに対し、雑多且つ不要なプロセス処理による処理時間の無駄を回避するために、効率的な請求の範囲の解析方法をどうやって捜し出すのかが課題になる。効率性の観点から、単一の請求項毎に一個のプロセスが増加すると七千万個の余計なプロセスを実行してしまうため、非常に時間の無駄である。その他、自動化処理において、各プロセス処理後の結果は、プログラムでの自動化プロセスにおいて、結果を再検査することが必要である。これによりプログラムの正確さを確認し、前のプロセス処理ミスで発生した連続ミスの処理が回避される。従って、プロセスが一個だけ増加した場合でも、不要なプロセス処理が発生し、人間の検査による無駄が発生してしまう。
台湾特許番号第I347561号及び第I400621号明細書で言えば、接続用語のテーブル(表)を使って自動的に分析してみると、前記接続用語のテーブルが例えば:有する、含む、備える、によって構成され、によって組成され、次の工程を含む等、数えきれないほどある。しかしながら、全ての接続用語を含むのは簡単ではなく、前記接続用語テーブルの作成するのも簡単ではない。漏れる可能性が非常に高いため、前記テーブルを参考する際の複雑さ及び人間検査の雑多が発生してしまう。また、前記二つの特許は接続用語の後の部分(前記二つの特許にボディ部分と呼ばれている)をさらに分段されて分析されることであって、事実上ボディ部分を分段されて分析されることが請求項の分析にはあまり役に立たないため、余計に分析された資料が別のテーブルでの記憶処理の複雑度を増加させ、また他のデータメモリ空間及びデータアクセス時間を増加させてしまう。他には、前記二つの特許がわざと序文及びボディ部分を隔離されるため、この状態でも他のデータメモリでそれぞれ隔離された序文及びボディ部分を記憶することが必要である。また、前記二つの特許には序文の詳細解析を提供してない為、全体の序文の記述しか提供できないので、特許分析時の検索に対するこれ以上の支援が提供できない。
本発明は、メモリ空間及びアクセス時間でより効率的且つ簡単で直接的な特許出願の請求の範囲の構文解析方法を提供し、これによって、従来の雑多且つ効率が悪い特許解析方法でメモリ空間、アクセス時間、人間の検査などによる無駄を回避することができる。
従って、本発明は、上記問題点に鑑みてなされたものであって、メモリ空間及びアクセス時間で効率的且つ簡単で直接的な請求の範囲の構文解析構成方法を提供することを目的とする。これによって、従来の雑多且つ効率が悪い特許解析方法でメモリ空間、アクセス時間、人間の検査などによる無駄を回避することができる。
上記目的を達成し得た本発明の請求の範囲の構文解析構成方法は、特許請求の範囲を自動的に読み込み、自動的に以下の工程を実行する請求の範囲の構文解析構成方法であって、
独立項及び従属項判断機構により前記請求の範囲の各請求項が独立項か従属項かを判断する独立項及び従属項判断工程と、
請求項の項次番号及びドット記号(.)により前記請求の範囲の各請求項を分隔する請求の範囲分隔工程と、
前記請求の範囲分隔工程から分隔された請求項に対して、コロンで序文を取り出す序文取出し工程と、
前記独立項及び従属項判断工程から判断された独立項に対して、コロンの後の定義の中の主要構成及び副次構成を分解する独立項の構成分析工程と、
前記独立項及び従属項判断工程から判断された従属項に対して、コンマの後の定義の中の主要構成及び副次構成を分解する従属項の構成分析工程と、を含む点に要旨を有するものである。
本発明の一態様として、前記序文取出し工程が、前記序文の主要序文及び副次序文を取り出することが好ましい。
本発明の一態様として、前記独立項の構成分析工程および/または前記従属項の構成分析工程が、前記主要構成及び前記副次構成の間の対応関係を分析することが好ましい。
本発明の一態様として、コロン及びコンマを利用することにより、前記序文の前記主要序文及び前記副次序文を取り出することが好ましい。
本発明の一態様として、独立項の序文及び前記独立項の全ての主要構成及び副次構成を対応的に独立項記憶テーブルに記憶する独立項記憶工程と、をさらに含むことが好ましい。
本発明の一態様として、従属項の序文、前記従属項の全ての主要構成及び前記副次構成、及び独立項に従属する前記従属項の全ての主要構成及び副次構成を対応的に従属項記憶テーブルに記憶する従属項項記憶工程と、をさらに含むことが好ましい。
本発明の一態様として、前記独立項記憶テーブルおよび/または前記従属項記憶テーブルを検索し、前記独立項記憶テーブルおよび/または前記従属項記憶テーブルに所属する特許明細書データを取り出す検索工程と、をさらに含むことが好ましい。
本発明の一態様として、前記対応関係が連接関係および/または従属関係および/または位置関係を含むことが好ましい。
本発明の一態様として、前記独立項の構成分析工程および/または前記従属項の構成分析工程が、前記コロンの後の定義をさらに分隔することはせず、前記コロンの後の定義を直接全ての主要構成及び各前記主要構成に対応する副次構成を分解することが好ましい。
本発明の請求の範囲の構文解析構成方法では、メモリ空間及びアクセス時間でより効率的且つ簡単で直接的な請求の範囲の構文解析構成方法を提供することができ、これによって、従来の雑多且つ効率が悪い特許解析方法でメモリ空間、アクセス時間、人間の検査などによる無駄を回避することができる。
本発明の実施形態に係わる請求の範囲の構文解析構成方法の工程を示す図である。 本発明の実施形態に係わる請求の範囲の構文解析構成方法において、独立請求項の構造を示すサンプル図である。 本発明に係わる品詞テーブルにより作成したロジック表である。 本発明の別実施形態に係わる請求の範囲の構文解析構成方法を示す図である。 本発明の別実施形態に係わる請求の範囲の構文解析構成方法を示す図である。 本発明の別実施形態に係わる請求の範囲の構文解析構成方法を示す図である。
以下は図1から図6に基いて、本発明の実施形態について説明する。該当説明は本発明の実施形態の一つの例示にすぎず、本発明の実施形態を限定するものではない。
図1が示すように、本発明の請求の範囲の構文解析構成方法の工程を示す図である。本発明の請求の範囲の構文解析構成方法は、特許請求の範囲を自動的に読み込み(工程11)、自動的に以下の工程を実行する請求の範囲の構文解析構成方法であって、独立項及び従属項判断機構により前記請求の範囲の各請求項が独立項か従属項かを判断する独立項及び従属項判断工程と(工程12)、請求項の項次番号及びドット記号(.)により前記請求の範囲の各請求項を分隔する請求の範囲分隔工程と(工程13)、前記請求の範囲分隔工程から分隔された各請求項に対して、コロンで序文を取り出す序文取出し工程と(工程14)、前記独立項及び従属項判断工程から判断された独立項に対して、コロンの後の定義の中の主要構成及び副次構成を分解する独立項の構成分析工程と(工程15)、前記独立項及び従属項判断工程から判断された従属項に対して、コンマの後の定義の中の主要構成及び副次構成を分解する従属項の構成分析工程と(工程16)、を含む点に要旨を有するものである。
前記特許の請求の範囲を自動的に読み込みの工程(工程11)は、ファイルを読み込む方式により、認識された又は請求の範囲の単位で記憶した請求の範囲を読み込むことである。前記請求の範囲が複数の請求項により構成されている。構成された各請求項は本発明の構文解析構成するの目標である。且つ請求項が独立項及び従属項を区別されている。本発明では請求項を独立項または従属項を区別することによって、それぞれの請求項の重要性を区別される。単独の独立項の所属構成は従属項の所属構成に対するより暗示的に高い重要性を有する。
図2が示すように、独立請求項の構造を示すサンプル図である。前記請求項が序文と謂う、一般には前記序文の後にコロンを有し、コロンで前記序文が有した主要構成または複数の主要構成を構文解析構成する。図2では、前記「第一連接機構」と呼ばれている主要構成は「伸縮部材」と呼ばれている副次構成を有し、そして前記「第二連接機構」と呼ばれている主要構成は「延伸部材」と呼ばれている副次構成を有する。そして前記「伸縮部材」と呼ばれている副次構成と前記「第一連接機構」と呼ばれているの主要構成が「有する」と呼ばれているの従属関係で対応関係を発生させる。そして前記「延伸部材」と呼ばれている副次構成と前記「第二連接機構」と呼ばれている主要構成も「有する」と呼ばれている従属関係で対応関係を発生させる。
本発明の目的は、より高効率で請求の範囲の各請求項中の「序文」、「主要構成」、「副次構成」、「主要構成と副次構成の対応関係」が分解されて分析され、これによって、使用者が請求の範囲を検索し、より精確な検査結果を捜し出すことで、より正確な検索分析結果を得ることができる。
図1の前記独立項及び従属項判断工程と(工程12)では、独立項及び従属項判断機構により前記請求の範囲の各請求項が独立項か従属項かを判断する。前記独立項及び従属項判断機構が、「アラビア数字」、「.」、「請求の範囲」、「請求項」、「一種」を含む。その判断ロジックが、先ず前記請求項の始まりは「数字」、続きが「.」、続きが「一種」であるの場合では独立項と判断し、次は「数字」、続きが「.」、続きが「請求の範囲」である場合では従属項と判断する。この判断方式はとてもシンプルなので、テーブルの必要がなく、文字結合態様で判断を実行させ、判断スピードを上昇させることができる。
図1の前記請求の範囲分隔工程(工程13)は、請求項の項次番号及びドット記号(.)により前記請求の範囲の各請求項を分隔することである。前記ドット記号(.)が英語請求項では英語のピリオドと同じである。しかし中国語請求項では中国語の句点(。)と異なる。従って、分かりやすいように、本明細書では「ドット記号」で(.)記号を謂う。この工程では、単純に請求項の始まりの番号または直接繋ぐ「ドット記号(.)」を分隔することによって、各請求項の文字範囲を判断され、ここでは句点を使用するではない。従来のような句点を使用する分隔工程では、全部の請求項から文字を読み出す必要があるため、従来より多くの時間が必要である。従って、直接請求項の始まりの番号または直接繋ぐ「ドット記号(.)」で行われた分解のロジック方式が、直接SQL言語で使用可能なため、更に時間が節約できる。さらに、改行記号、請求項の数字番号または後の直接繋ぐ「ドット記号(.)」を使って分隔してもよく、これにより、請求項の始まりの番号及び直接繋ぐの「ドット記号(.)」だけで分隔する際に、いくつの数字形式で誤判定することを回避することができる。
前記独立項及び従属項判断工程(工程12)及び前記請求の範囲分隔工程(工程13)の間の順番を交換することができ、前記独立項及び従属項判断工程(工程12)の順序が必ず前記請求の範囲分隔工程(工程13)の前とは限らない。
図1の前記序文取出し工程(工程14)では、前記請求の範囲分隔工程から分隔した各請求項に対して、コロンで序文を取り出す。本発明は直接「コロン」を使って序文を取出し、テーブルが必要ない。従来ではテーブルを使用し、前記テーブルがいわゆる「接続用語」のテーブルであって、前記接続用語が例えば:有する、含む、備える、によって構成され、によって組成され等、数えきれないほどある。前記テーブルの準備が非常に複雑で、且つ漏れる可能性が非常に高い。このような可能性の広い範囲のテーブルの作成が非現実的であり、パソコンでの実行も効率的ではなく、且つ実行した後の結果の検査時間も掛かるため、効率性が低い。本発明では直接「コロン」を使って序文を取り出すことによって十分な効率性が得られる。
図1の前記独立項の構成分析工程(工程15)では、前記独立項及び従属項判断工程から判断された独立項に対して、コロンの後の定義を主要構成及び副次構成を分解する。図2が示すように、本工程ではコロン後に接続している「一」(英語ではa/an)後の名詞を一主要構成の始めと認識し、前記主要構成がどこまで終了するかに関する処理ロジックについては、本発明が英語の特許請求の範囲の構文解析構成を例として説明し、中国語の特許請求の範囲の構文解析構成については、「名詞テーブル」、「修飾用語」(例えば:「は」、「が」)、又は「対応用語」(例えば:「連接」、「に設ける」等)で使用するが、ここでは説明を省略する。前記英語の特許請求の範囲の構文解析構成方式では、様々な品詞テーブルに基づいて、規則的な構文解析構成を進行させ、詳細は以下の通りである。
前記品詞テーブルが、名詞接頭語テーブルと、関係代名詞テーブルと、従属動詞テーブルと、第一分詞テーブルと、第二分詞(Ving)テーブルと、前置詞テーブルと、中断テーブルと、例外テーブルと、を含む。前記第一分詞テーブルがVed及びVing等二種類分詞のテーブルを含む。前記品詞テーブルにより作成したロジック表を図3に示す。以下は図3のロジック表により、文字:"a circuit board provided with edges extending in a longitudinal direction of said circuit board;"を文章として構文解析構成する。
文章"「a」circuit board provided with edges extending in a longitudinal direction of said circuit board;"を読み込む時、「」中の文字は読み込んだ文字であって、「a」という名詞は「名詞接頭語テーブル」に所属しているため、第三列の先頭列に「1」を表示した前記列が示すように、引き続き読み込みを実行する(即ち1+の動作);
続いて"a 「circuit」 board provided with edges extending in a longitudinal direction of said circuit board;を読み込む。この「circuit」がいずれのテーブルにも属していない為、引き続き読み込みを実行する;
続いて"a circuit 「board」 provided with edges extending in a longitudinal direction of said circuit board;を読み込む、この「board」がいずれかのテーブルに属していない為、引き続き読み込みを実行する;
続いて"a circuit board 「provided」 with edges extending in a longitudinal direction of said circuit board; "を読み込む、この「provided」が第一分詞テーブルに属している為、即ち、動詞の分詞形態の第一分詞である。その為、前記ロジック表により、項次番号が「5」から「10」の列の処理に進行すべきである。前記六種類の列の処理が一つの共通点がある。即ち前記第一分詞で区切りポイントとして選択し、引き続き読み込みを実行することによって、次にどの列の処理を選択するかを決定する;
続いて"a circuit board provided 「with」 edges extending in a longitudinal direction of said circuit board; "を読み込む。この「with」が前置詞テーブルに属している為、前記ロジック表により、項次番号が「6」の列の処理に進行すべきである。前記列の処理が前記第一分詞で決めた区切りポイントを「成立」と表示し、前記第一分詞で区切りポイントとして選択し、前記区切りポイント前の部分、即ち「a circuit board」を主要構成として扱うべきである。この時前記主要構成が既に識別されるため、本来の前記第一分詞で決めた区切りポイントを解除し、この時は区切りポイントがないので、引き続き読み込みを実行する;
続いて"a circuit board provided with 「edges」 extending in a longitudinal direction of said circuit board; "を読み込む、この「edges」が「s」で終了した為、名詞接頭語テーブルでは「with」、「having」、「has」、「have」の後に接続し且つ「s」で終了するの文字を名詞接頭語テーブルに所属し、引き続き読み込みを実行する;
続いて"a circuit board provided with edges 「extending」 in a longitudinal direction of said circuit board; "を読み込む。この「extending」が第一分詞テーブルに属している為、前記ロジック表により、項次番号が「5」から「10」の列の処理に進行すべきである。前記「extending」を区切りポイントとして選択し、この時は次に接続する読み込み字句での判断が必要がある;
続いて"a circuit board provided with edges extending 「in」 a longitudinal direction of said circuit board; "を読み込む。この「in」が前置詞テーブルに属している為、前記ロジック表により、「6」の列に符合するため、前記extendingで区切りポイントとして選択し、副次構成として「arms」を取出し、続き読み込みを実行する;
続いて"a circuit board provided with edges extending in 「a」 longitudinal direction of said circuit board; "を読み込む。前記「a」が「名詞接頭語テーブル」に属し、且つ二回目で出現しているため、判定では副次構成の始めとして認識されている。そこで前記「a」を起点として前記副次構成を読み始める。その読み込むロジックが前記主要構成の読み込みと同じであるため、前記ロジックを引用してもよい;
続いて"a circuit board provided with edges extending in a 「longitudinal」 direction of said circuit board; "を読み込む。前記「longitudinal」がいずれかのテーブルに属していない為、引き続き読み込みを実行する;
続いて"a circuit board provided with edges extending in a longitudinal 「direction」 of said circuit board; "を読み込む。前記「direction」がいずれかのテーブルに属していない為、引き続き読み込むを実行する;
続いて"a circuit board provided with edges extending in a longitudinal direction 「of」 said circuit board; "を読み込む。前記「of」が前置詞テーブルに属している為、前記ロジック表により、項次番号が「11」から「13」の列の処理に進行すべきである。前記四種類の列の処理が一つの共通点がある。即ち前記前置詞で区切りポイントとして選択し、引き続き読み込みを実行することによって、次にどの列の処理を選択するかを決定する;
続いて"a circuit board provided with edges extending in a longitudinal direction of 「said」 circuit board; "を読み込む。前記「said」が「名詞接頭語テーブル」に所属しているため、項次番号が「11」の列の処理を選択し、即ち、前記前置詞(in)を決めた区切りポイントとして成立させることによって、前記前置詞(in)の後ろから前記「名詞接頭語テーブル」の「said」の間の文字を副次構成として取出し、引き続き読み込みを実行し、且つこの時に前記「said」の出現によって、前記「said」が既に出現した名詞なので、これに基づいて、「said」の後ろから出現した名詞を「例外処理テーブル」に分類して放棄する。即ち、前記「said」の後ろの名詞を区切りすることはしない。;
続いて"a circuit board provided with edges extending in a longitudinal direction of said 「circuit」 board; "を読み込む。前記「circuit」がいずれかのテーブルに属していない為、引き続き読み込みを実行する;
続いて"a circuit board provided with edges extending in a longitudinal direction of said circuit 「board」; "を読み込む。前記「board」がいずれかのテーブルに属していない為、引き続き読み込みを実行する;
続いて"a circuit board provided with edges extending in a longitudinal direction of said circuit board「;」"を読み込む。前記「;」が中断テーブルに属している為、中断してもよいという表示で、次の主要構成の構文解析構成を実行する。
図1の従属項の構成分析工程(工程16)では、前記独立項及び従属項判断工程から判断された従属項に対して、コンマの後の定義から主要構成及び副次構成を分解する。ここではコンマで境目として主要構成及び副次構成の分解を進行し、従来のような特定テーブル、例えば:これらのうち、さらに、またなどの作成の必要がないため、より効率よく構文解析構成の効率を上昇させることができる。従属項の主要構成及び副次構成の分解で使用するロジック方式が、前記独立項の主要構成及び副次構成で使用するロジック方式と同じであるため、ここでは説明を省略する。
さらに、本発明が序文から主要序文及び副次序文を区別する。その区別方式が特定名詞に基づいて、又は例外の特定名詞との組合せに基づいて実行する。例えば前置詞withの前は主要序文として定義し、その後は副次序文として定義する。特定名詞と前置詞及び動名詞と名詞の組合せが主要序文であり、他の序文が副次序文として定義する。又は独立項の構成分析工程(工程15)で又は従属項の構成分析工程(工程16)で使用するロジック方式を使って、前記主要序文及び副次序文を取り出す。実施方法は数えきれないほどあるが、当該分野の技術を熟知するものが上述によって、多くの方法を取得することができるが、ここではその説明を省略する。
さらに、本発明の実施形態の請求の範囲の構文解析構成方法により、前記独立項の構成分析工程および/または従属項の構成分析工程で主要構成及び副次構成の間の対応関係を分析する。前記対応関係は取り出した主要構成と取り出した副次構成の文章位置を捜し出し、前記主要構成位置と前記副次構成位置の間の前記第一分詞テーブルまたは第二分詞(Ving)テーブルに所属するワードを対応関係として選択する。前記"a circuit board provided with edges extending in a longitudinal direction 「of」 said circuit board; "を例として、「a circuit board」が主要構成であって、「edges」が副次構成であり、間にある「provided」が第一分詞テーブルに属している為、「provided」は前記主要構成位置及び前記副次構成位置の間の対応関係である。前記対応関係は連接関係および/または従属関係および/または位置関係を含む。前記連接関係は連接、接続などを含む;前記従属関係は有する、含むなどを含む;前記位置関係は設ける、構成などを含む。
図2が示すように、本発明の実施形態の請求の範囲の構文解析構成方法では、コロン及びコンマを利用することにより、直接前記序文の前記主要序文及び前記副次序文を取り出す。何のテーブルを作成する必要がないため、アクセス時間及びパソコン処理後の人間の検査時間が節約できる。
図4が示すように、本発明の実施形態の請求の範囲の構文解析構成方法では、独立項記憶工程(工程17)をさらに含む。前記独立項記憶工程が、前記独立項の序文及び前記独立項の全ての主要構成及び副次構成を対応的に独立項記憶テーブルに記憶する。
また、図5が示すように、本発明の実施形態の請求の範囲の構文解析構成方法では、従属項記憶工程(工程18)をさらに含む。前記従属項記憶工程が、従属項の序文、前記従属項の全ての主要構成及び前記副次構成、及び独立項に従属する前記従属項の全ての主要構成及び副次構成を対応的に従属項記憶テーブルに記憶する。
図6が示すように、本発明の実施形態の請求の範囲の構文解析構成方法では、検索工程(工程19)をさらに含む。前記検索工程が、前記独立項記憶テーブルおよび/または前記従属項記憶テーブルを検索し、前記独立項記憶テーブルおよび/または前記従属項記憶テーブルに所属する特許明細書データを取り出す。
本発明の実施形態の請求の範囲の構文解析構成方法により、そのユニークで、快速で、且つ効率的な理由は、本発明の前記独立項の構成分析工程および/または従属項の構成分析工程が、前記コロンの後の定義をさらに分隔することはせず、前記コロンの後の定義を直接全ての主要構成及び各前記主要構成に対応する副次構成を分解するからである。
当該分野の技術を熟知するものが理解できるように、本発明の好適な実施形態を前述の通り開示したが、これらは決して本発明を限定するものではない。本発明の主旨と領域を逸脱しない範囲内で各種の調節や修正を加えることができる。従って、本発明の特許請求の範囲は、このような変更や修正を含めて広く解釈されるべきである。
特許出願の請求の範囲が、複数の請求項によりそれぞれ前記特許出願の技術特徴が定義されている。各請求項がそれぞれ序文及び含まれている構成を定義し、前記構成が主要要素名詞及び副次要素名詞を有する際に、前記主要要素名詞と副次要素名詞の間の対応関係が定義され、前記対応関係が連接関係、従属関係及び位置関係等を含む。各請求項中の序文、構成及び構成の間の対応関係により、一つの特許出願の技術特徴が定義される。
上記目的を達成し得た本発明の請求の範囲の構文解析構成方法は、特許請求の範囲を自動的に読み込み、自動的に以下の工程を実行する請求の範囲の構文解析構成方法であって、
独立項及び従属項判断機構により前記請求の範囲の各請求項が独立項か従属項かを判断する独立項及び従属項判断工程と、
請求項の項次番号及びドット記号(.)により前記請求の範囲の各請求項を分隔する請求の範囲分隔工程と、
前記請求の範囲分隔工程から分隔された請求項に対して、コロンで序文を取り出す序文取出し工程と、
前記独立項及び従属項判断工程から判断された独立項に対して、コロンの後の定義の中の主要要素名詞及び副次要素名詞を分解する独立項の構成分析工程と、
前記独立項及び従属項判断工程から判断された従属項に対して、コンマの後の定義の中の主要要素名詞及び副次要素名詞を分解する従属項の構成分析工程と、を含む点に要旨を有するものである。
本発明の一態様として、前記独立項の構成分析工程および/または前記従属項の構成分析工程が、前記主要要素名詞及び前記副次要素名詞の間の対応関係を分析することが好ましい。
本発明の一態様として、独立項の序文及び前記独立項の全ての主要要素名詞及び副次要素名詞を対応的に独立項記憶テーブルに記憶する独立項記憶工程と、をさらに含むことが好ましい。
本発明の一態様として、従属項の序文、前記従属項の全ての主要要素名詞及び前記副次要素名詞、及び独立項に従属する前記従属項の全ての主要要素名詞及び副次要素名詞を対応的に従属項記憶テーブルに記憶する従属項記憶工程と、をさらに含むことが好ましい。
本発明の一態様として、前記独立項の構成分析工程および/または前記従属項の構成分析工程が、前記コロンの後の定義をさらに分隔することはせず、前記コロンの後の定義を直接全ての主要要素名詞及び各前記主要要素名詞に対応する副次要素名詞を分解することが好ましい。
図1が示すように、本発明の請求の範囲の構文解析構成方法の工程を示す図である。本発明の請求の範囲の構文解析構成方法は、特許請求の範囲を自動的に読み込み(工程11)、自動的に以下の工程を実行する請求の範囲の構文解析構成方法であって、独立項及び従属項判断機構により前記請求の範囲の各請求項が独立項か従属項かを判断する独立項及び従属項判断工程と(工程12)、請求項の項次番号及びドット記号(.)により前記請求の範囲の各請求項を分隔する請求の範囲分隔工程と(工程13)、前記請求の範囲分隔工程から分隔された各請求項に対して、コロンで序文を取り出す序文取出し工程と(工程14)、前記独立項及び従属項判断工程から判断された独立項に対して、コロンの後の定義の中の主要要素名詞及び副次要素名詞を分解する独立項の構成分析工程と(工程15)、前記独立項及び従属項判断工程から判断された従属項に対して、コンマの後の定義の中の主要要素名詞及び副次要素名詞を分解する従属項の構成分析工程と(工程16)、を含む点に要旨を有するものである。
図2が示すように、独立請求項の構造を示すサンプル図である。前記請求項が序文と謂う、一般には前記序文の後にコロンを有し、コロンで前記序文が有した主要要素名詞または複数の主要要素名詞を構文解析構成する。図2では、前記「第一連接機構」と呼ばれている主要要素名詞は「伸縮部材」と呼ばれている副次要素名詞を有し、そして前記「第二連接機構」と呼ばれている主要要素名詞は「延伸部材」と呼ばれている副次要素名詞を有する。そして前記「伸縮部材」と呼ばれている副次要素名詞と前記「第一連接機構」と呼ばれている主要要素名詞が「有する」と呼ばれている従属関係で対応関係を発生させる。そして前記「延伸部材」と呼ばれている副次要素名詞と前記「第二連接機構」と呼ばれている主要要素名詞も「有する」と呼ばれている従属関係で対応関係を発生させる。
本発明の目的は、より高効率で請求の範囲の各請求項中の「序文」、「主要要素名詞」、「副次要素名詞」、「主要要素名詞と副次要素名詞の対応関係」が分解されて分析され、これによって、使用者が請求の範囲を検索し、より精確な検査結果を捜し出すことで、より正確な検索分析結果を得ることができる。
図1の前記独立項の構成分析工程(工程15)では、前記独立項及び従属項判断工程から判断された独立項に対して、コロンの後の定義を主要要素名詞及び副次要素名詞を分解する。図2が示すように、本工程ではコロン後に接続している「一」(英語ではa/an)後の名詞を一主要要素名詞の始めと認識し、前記主要要素名詞がどこまで終了するかに関する処理ロジックについては、本発明が英語の特許請求の範囲の構文解析構成を例として説明し、中国語の特許請求の範囲の構文解析構成については、「名詞テーブル」、「修飾用語」(例えば:「は」、「が」)、又は「対応用語」(例えば:「連接」、「に設ける」等)で使用するが、ここでは説明を省略する。前記英語の特許請求の範囲の構文解析構成方式では、様々な品詞テーブルに基づいて、規則的な構文解析構成を進行させ、詳細は以下の通りである。
文章"「a」circuit board provided with edges extending in a longitudinal direction of said circuit board;"を読み込む時、「」中の文字は読み込んだ文字であって、「a」という名詞は「名詞接頭語テーブル」に所属しているため、第三列の先頭列に「1」を表示した前記列が示すように、引き続き読み込みを実行する(即ち1+の動作);
続いて"a 「circuit」 board provided with edges extending in a longitudinal direction of said circuit board;を読み込む。この「circuit」がいずれのテーブルにも属していない為、引き続き読み込みを実行する;
続いて"a circuit 「board」 provided with edges extending in a longitudinal direction of said circuit board;を読み込む、この「board」がいずれかのテーブルに属していない為、引き続き読み込みを実行する;
続いて"a circuit board 「provided」 with edges extending in a longitudinal direction of said circuit board; "を読み込む、この「provided」が第一分詞テーブルに属している為、即ち、動詞の分詞形態の第一分詞である。その為、前記ロジック表により、項次番号が「5」から「10」の列の処理に進行すべきである。前記六種類の列の処理が一つの共通点がある。即ち前記第一分詞で区切りポイントとして選択し、引き続き読み込みを実行することによって、次にどの列の処理を選択するかを決定する;
続いて"a circuit board provided 「with」 edges extending in a longitudinal direction of said circuit board; "を読み込む。この「with」が前置詞テーブルに属している為、前記ロジック表により、項次番号が「6」の列の処理に進行すべきである。前記列の処理が前記第一分詞で決めた区切りポイントを「成立」と表示し、前記第一分詞で区切りポイントとして選択し、前記区切りポイント前の部分、即ち「a circuit board」を主要要素名詞として扱うべきである。この時前記主要要素名詞が既に識別されるため、本来の前記第一分詞で決めた区切りポイントを解除し、この時は区切りポイントがないので、引き続き読み込みを実行する;
続いて"a circuit board provided with 「edges」 extending in a longitudinal direction of said circuit board; "を読み込む、この「edges」が「s」で終了した為、名詞接頭語テーブルでは「with」、「having」、「has」、「have」の後に接続し且つ「s」で終了する文字を名詞接頭語テーブルに所属し、引き続き読み込みを実行する;
続いて"a circuit board provided with edges 「extending」 in a longitudinal direction of said circuit board; "を読み込む。この「extending」が第一分詞テーブルに属している為、前記ロジック表により、項次番号が「5」から「10」の列の処理に進行すべきである。前記「extending」を区切りポイントとして選択し、この時は次に接続する読み込み字句での判断が必要がある;
続いて"a circuit board provided with edges extending 「in」 a longitudinal direction of said circuit board; "を読み込む。この「in」が前置詞テーブルに属している為、前記ロジック表により、「6」の列に符合するため、前記extendingで区切りポイントとして選択し、副次要素名詞として「arms」を取出し、続き読み込みを実行する;
続いて"a circuit board provided with edges extending in 「a」 longitudinal direction of said circuit board; "を読み込む。前記「a」が「名詞接頭語テーブル」に属し、且つ二回目で出現しているため、判定では副次要素名詞の始めとして認識されている。そこで前記「a」を起点として前記副次要素名詞を読み始める。その読み込むロジックが前記主要要素名詞の読み込みと同じであるため、前記ロジックを引用してもよい;
続いて"a circuit board provided with edges extending in a 「longitudinal」 direction of said circuit board; "を読み込む。前記「longitudinal」がいずれかのテーブルに属していない為、引き続き読み込みを実行する;
続いて"a circuit board provided with edges extending in a longitudinal 「direction」 of said circuit board; "を読み込む。前記「direction」がいずれかのテーブルに属していない為、引き続き読み込むを実行する;
続いて"a circuit board provided with edges extending in a longitudinal direction 「of」 said circuit board; "を読み込む。前記「of」が前置詞テーブルに属している為、前記ロジック表により、項次番号が「11」から「13」の列の処理に進行すべきである。前記四種類の列の処理が一つの共通点がある。即ち前記前置詞で区切りポイントとして選択し、引き続き読み込みを実行することによって、次にどの列の処理を選択するかを決定する;
続いて"a circuit board provided with edges extending in a longitudinal direction of 「said」 circuit board; "を読み込む。前記「said」が「名詞接頭語テーブル」に所属しているため、項次番号が「11」の列の処理を選択し、即ち、前記前置詞(in)を決めた区切りポイントとして成立させることによって、前記前置詞(in)の後ろから前記「名詞接頭語テーブル」の「said」の間の文字を副次要素名詞として取出し、引き続き読み込みを実行し、且つこの時に前記「said」の出現によって、前記「said」が既に出現した名詞なので、これに基づいて、「said」の後ろから出現した名詞を「例外処理テーブル」に分類して放棄する。即ち、前記「said」の後ろの名詞を区切りすることはしない。;
続いて"a circuit board provided with edges extending in a longitudinal direction of said 「circuit」 board; "を読み込む。前記「circuit」がいずれかのテーブルに属していない為、引き続き読み込みを実行する;
続いて"a circuit board provided with edges extending in a longitudinal direction of said circuit 「board」; "を読み込む。前記「board」がいずれかのテーブルに属していない為、引き続き読み込みを実行する;
続いて"a circuit board provided with edges extending in a longitudinal direction of said circuit board「;」"を読み込む。前記「;」が中断テーブルに属している為、中断してもよいという表示で、次の主要要素名詞の構文解析構成を実行する。
図1の従属項の構成分析工程(工程16)では、前記独立項及び従属項判断工程から判断された従属項に対して、コンマの後の定義から主要要素名詞及び副次要素名詞を分解する。ここではコンマで境目として主要要素名詞及び副次要素名詞の分解を進行し、従来のような特定テーブル、例えば:これらのうち、さらに、またなどの作成の必要がないため、より効率よく構文解析構成の効率を上昇させることができる。従属項の主要要素名詞及び副次要素名詞の分解で使用するロジック方式が、前記独立項の主要要素名詞及び副次要素名詞で使用するロジック方式と同じであるため、ここでは説明を省略する。
さらに、本発明の実施形態の請求の範囲の構文解析構成方法により、前記独立項の構成分析工程および/または従属項の構成分析工程で主要要素名詞及び副次要素名詞の間の対応関係を分析する。前記対応関係は取り出した主要要素名詞と取り出した副次要素名詞の文章位置を捜し出し、前記主要要素名詞位置と前記副次要素名詞位置の間の前記第一分詞テーブルまたは第二分詞(Ving)テーブルに所属するワードを対応関係として選択する。前記"a circuit board provided with edges extending in a longitudinal direction 「of」 said circuit board; "を例として、「a circuit board」が主要要素名詞であって、「edges」が副次要素名詞であり、間にある「provided」が第一分詞テーブルに属している為、「provided」は前記主要要素名詞位置及び前記副次要素名詞位置の間の対応関係である。前記対応関係は連接関係および/または従属関係および/または位置関係を含む。前記連接関係は連接、接続などを含む;前記従属関係は有する、含むなどを含む;前記位置関係は設ける、構成などを含む。
図4が示すように、本発明の実施形態の請求の範囲の構文解析構成方法では、独立項記憶工程(工程17)をさらに含む。前記独立項記憶工程が、前記独立項の序文及び前記独立項の全ての主要要素名詞及び副次要素名詞を対応的に独立項記憶テーブルに記憶する。
また、図5が示すように、本発明の実施形態の請求の範囲の構文解析構成方法では、従属項記憶工程(工程18)をさらに含む。前記従属項記憶工程が、従属項の序文、前記従属項の全ての主要要素名詞及び前記副次要素名詞、及び独立項に従属する前記従属項の全ての主要要素名詞及び副次要素名詞を対応的に従属項記憶テーブルに記憶する。
本発明の実施形態の請求の範囲の構文解析構成方法により、そのユニークで、快速で、且つ効率的な理由は、本発明の前記独立項の構成分析工程および/または従属項の構成分析工程が、前記コロンの後の定義をさらに分隔することはせず、前記コロンの後の定義を直接全ての主要要素名詞及び各前記主要要素名詞に対応する副次要素名詞に分解するからである。

Claims (9)

  1. 特許請求の範囲を自動的に読み込み、自動的に以下の工程を実行する請求の範囲の構文解析構成方法であって、
    独立項及び従属項判断機構により前記請求の範囲の各請求項が独立項か従属項かを判断する独立項及び従属項判断工程と、
    請求項の項次番号及びドット記号により前記請求の範囲の各請求項を分隔する請求の範囲分隔工程と、
    前記請求の範囲分隔工程から分隔された各請求項に対して、コロンで序文を取り出す序文取出し工程と、
    前記独立項及び従属項判断工程から判断された独立項に対して、コロンの後の定義の中の主要構成及び副次構成を分解する独立項の構成分析工程と、
    前記独立項及び従属項判断工程から判断された従属項に対して、コンマの後の定義の中の主要構成及び副次構成を分解する従属項の構成分析工程と、
    を含み、
    前記独立項の構成分析工程及び前記従属項の構成分析工程において、前記請求の範囲の請求項中の各請求項センテンスに対して、所定の英語センテンス構造のロジックに基づいて、分析した前記請求項センテンス中の名詞接頭語の出現位置、前記名詞接頭語の後の単語の品詞、及び前記名詞接頭語の後の特定の品詞を有する単語の排列順序により、前記請求項センテンス中から前記主要構成及び前記副次構成を分解することを特徴とする請求の範囲の構文解析構成方法。
  2. 前記序文取出し工程が、前記序文の主要序文及び副次序文を取り出すことを含むことを特徴とする請求項1に記載の請求の範囲の構文解析構成方法。
  3. 前記独立項の構成分析工程および/または前記従属項の構成分析工程が、前記主要構成及び前記副次構成の間の対応関係を分析することを特徴とする請求項1に記載の請求の範囲の構文解析構成方法。
  4. コロン及びコンマを利用することにより、前記序文の前記主要序文及び前記副次序文を取り出すことを特徴とする請求項2に記載の請求の範囲の構文解析構成方法。
  5. 独立項の序文及び前記独立項の全ての主要構成及び副次構成を対応的に独立項記憶テーブルに記憶する独立項記憶工程と、をさらに含むことを特徴とする請求項1に記載の請求の範囲の構文解析構成方法。
  6. 従属項の序文、前記従属項の全ての主要構成及び前記副次構成、及び独立項に従属する前記従属項の全ての主要構成及び副次構成を対応的に従属項記憶テーブルに記憶する従属項項記憶工程と、をさらに含むことを特徴とする請求項1に記載の請求の範囲の構文解析構成方法。
  7. 前記独立項記憶テーブルおよび/または前記従属項記憶テーブルを検索し、前記独立項記憶テーブルおよび/または前記従属項記憶テーブルに所属する特許明細書データを取り出す検索工程と、をさらに含むことを特徴とする請求項1に記載の請求の範囲の構文解析構成方法。
  8. 前記対応関係が連接関係および/または従属関係および/または位置関係を含むことを特徴とする請求項3に記載の請求の範囲の構文解析構成方法。
  9. 前記独立項の構成分析工程および/または前記従属項の構成分析工程が、前記コロンの後の定義をさらに分隔することはせず、前記コロンの後の定義を直接全ての主要構成及び各前記主要構成に対応する副次構成を分解することを特徴とする請求項1に記載の請求の範囲の構文解析構成方法。
JP2016093366A 2016-05-06 2016-05-06 請求の範囲の構文解析構成方法 Expired - Fee Related JP6417359B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016093366A JP6417359B2 (ja) 2016-05-06 2016-05-06 請求の範囲の構文解析構成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016093366A JP6417359B2 (ja) 2016-05-06 2016-05-06 請求の範囲の構文解析構成方法

Publications (2)

Publication Number Publication Date
JP2017201489A true JP2017201489A (ja) 2017-11-09
JP6417359B2 JP6417359B2 (ja) 2018-11-07

Family

ID=60264648

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016093366A Expired - Fee Related JP6417359B2 (ja) 2016-05-06 2016-05-06 請求の範囲の構文解析構成方法

Country Status (1)

Country Link
JP (1) JP6417359B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200075539A (ko) * 2018-12-18 2020-06-26 (주)아이브릭스 특허 청구항 구조화를 위한 방법 및 장치

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0982586A (ja) * 1995-09-14 1997-03-28 Gyoseiin Kokka Kagaku Iinkai 弗素酸化層ウエーハの製造方法
JP2001306561A (ja) * 1996-04-22 2001-11-02 Adc Technology Kk 機械翻訳装置及び翻訳処理方法
JP2004094528A (ja) * 2002-08-30 2004-03-25 Inpatekku Kk 特許情報の請求項分析装置
JP2005031813A (ja) * 2003-07-08 2005-02-03 Japan Patent Information Organization 抄録作成支援システム、プログラム、抄録作成支援方法及び特許文献検索システム並びにその検索方法
JP2005258831A (ja) * 2004-03-11 2005-09-22 Patolis Corp 類似文書検索方法
JP2014199476A (ja) * 2013-03-29 2014-10-23 株式会社エヌ・ティ・ティ・データ 機械翻訳装置、機械翻訳方法およびプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0982586A (ja) * 1995-09-14 1997-03-28 Gyoseiin Kokka Kagaku Iinkai 弗素酸化層ウエーハの製造方法
JP2001306561A (ja) * 1996-04-22 2001-11-02 Adc Technology Kk 機械翻訳装置及び翻訳処理方法
JP2004094528A (ja) * 2002-08-30 2004-03-25 Inpatekku Kk 特許情報の請求項分析装置
JP2005031813A (ja) * 2003-07-08 2005-02-03 Japan Patent Information Organization 抄録作成支援システム、プログラム、抄録作成支援方法及び特許文献検索システム並びにその検索方法
JP2005258831A (ja) * 2004-03-11 2005-09-22 Patolis Corp 類似文書検索方法
JP2014199476A (ja) * 2013-03-29 2014-10-23 株式会社エヌ・ティ・ティ・データ 機械翻訳装置、機械翻訳方法およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
樫山 武浩 外4名: "特徴語句の修飾関係を考慮した特許請求の範囲の構造解析に関する研究", 第70回(平成20年)全国大会講演論文集(2) 人工知能と認知科学, JPN6017012407, 13 March 2008 (2008-03-13), JP, pages 2 - 199, ISSN: 0003884129 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200075539A (ko) * 2018-12-18 2020-06-26 (주)아이브릭스 특허 청구항 구조화를 위한 방법 및 장치
KR102181677B1 (ko) 2018-12-18 2020-11-24 (주)아이브릭스 특허 청구항 구조화를 위한 방법 및 장치

Also Published As

Publication number Publication date
JP6417359B2 (ja) 2018-11-07

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
Maynard et al. Architectural elements of language engineering robustness
KR101500617B1 (ko) 한국어 어휘 의미망을 이용한 문맥 철자오류 교정 장치 및 방법
Pettersson et al. A multilingual evaluation of three spelling normalisation methods for historical text
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
CN102214189A (zh) 基于数据挖掘获取词用法知识的***及方法
Khairova et al. The Aligned Kazakh-Russian Parallel Corpus Focused on the Criminal Theme.
Liyanapathirana et al. Sinspell: A comprehensive spelling checker for sinhala
Ganfure et al. Design and implementation of morphology based spell checker
Biba et al. Boosting text classification through stemming of composite words
JP2005038395A (ja) データベース検索装置
Pouliquen et al. Automatic construction of multilingual name dictionaries
JP4431759B2 (ja) 未登録語自動抽出装置及びプログラム、並びに未登録語自動登録装置及びプログラム
JP6417359B2 (ja) 請求の範囲の構文解析構成方法
Altarawneh Spelling detection errors techniques in NLP: A survey
US20170344533A1 (en) Patent claims disassembling and analyzing method
KR20070059869A (ko) 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의대역어 사전 구축 장치 및 방법
CN107168950B (zh) 一种基于双语语义映射的事件短语学习方法及装置
Salam et al. Developing the bangladeshi national corpus-a balanced and representative bangla corpus
TWI537863B (zh) 申請專利範圍之解構分析方法
Jaf A simple approach to unify ambiguously encoded Kurdish characters
Sedlácek et al. Automatic Processing of Czech Inflectional and Derivative Morphology
Huang et al. GRASP: grammar-and syntax-based pattern-finder in CALL
CN109271392B (zh) 快速判别和抽取关系型数据库实体及属性的方法及设备
Jindal et al. A Framework for Grammatical Error Detection and Correction System for Punjabi Language Using Stochastic Approach

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180521

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20180727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180928

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181005

R150 Certificate of patent or registration of utility model

Ref document number: 6417359

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees