JP5710317B2 - 情報処理装置、自然言語解析方法、プログラムおよび記録媒体 - Google Patents
情報処理装置、自然言語解析方法、プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP5710317B2 JP5710317B2 JP2011046709A JP2011046709A JP5710317B2 JP 5710317 B2 JP5710317 B2 JP 5710317B2 JP 2011046709 A JP2011046709 A JP 2011046709A JP 2011046709 A JP2011046709 A JP 2011046709A JP 5710317 B2 JP5710317 B2 JP 5710317B2
- Authority
- JP
- Japan
- Prior art keywords
- function
- sentence
- pattern
- node
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
以下まず、本発明の実施形態で使用する用語について説明する。図1は、統計的係り受け構文解析の結果を説明する図である。図1は、解析対象の文「エンジンが|走行中に|突然|煙を|噴いた」に対し、係り受け構文解析を実施した場合の解析結果を模式的に表す。解析対象の文は、事前に形態素解析等の事前処理が施されており、単語列または文節列(単語および文節は、いずれも文から区分される言語単位である。以下、言語単位として文節を例に説明するが、言語に応じてまたは任意に、単語または文節を選択することができる。)として与えられる。
以下、上述した用語の説明を踏まえて、本発明の第1の実施形態による照会パターンに対する文のマッチング・スコアを演算するコンピュータ装置について説明する。図3は、本発明の第1の実施形態によるコンピュータ装置100の機能ブロックを示す。図3に示すコンピュータ装置100は、概ねパーソナル・コンピュータ、ワークステーションまたはメインフレームなどの汎用コンピュータとして構成されている。コンピュータ装置100は、図示しないCPU(Central Processing Unit)と、RAM(Random Access Memory)と、HDD(Hard Disk Drive)やSSD(Solid State Drive)などの記憶装置と、必要に応じてNIC(Network Interface Card)とを備え、Windows(登録商標)、UNIX(登録商標)、AIX(登録商標)、Linux(登録商標)などのOSの制御下で稼働する。図3に示す各機能部(詳細は後述する。)は、CPUの作業領域を提供するメモリ上にプログラムを展開し、CPUの制御の下プログラムを実行させて、各ハードウェア資源を動作制御することによって、コンピュータ装置100上に実現される。
(1)親ノードPAR(n)がr番目の文節に対応しており、
(2)注目ノードnおよびその子孫が、l,…,r−1の範囲に存在し、
(3)注目ノードnがPAR(n)の左側に存在する
ときの当該文の範囲における係り受け周辺確率の積の最大値を出力する関数である。つまり、左シーケンス関数122は、注目ノードnに関し、最左子孫(LCH(n)の子孫の左側末端)と親ノードPAR(n)との間の部分構造を、変数lおよび変数rで規定される文の範囲に対応付けする関数である。
(1)親ノードPAR(n)がl番目の文節に対応しており、
(2)注目ノードnおよびその子孫が、l+1,…,rの範囲に存在し、
(3)注目ノードnがPAR(n)の右側に存在する
ときの当該文の範囲における係り受け周辺確率の積の最大値を出力する関数である。
(1)親ノードPAR(n)がr番目の文節に対応しており、
(2)注目ノードnがl番目の文節に対応しており、
(3)注目ノードnの最右子ノードRCH(n)およびその子孫、並びに兄弟ノードSIB(n)およびその子孫が、l+1,…,r−1の間に存在し、
(4)注目ノードnがPAR(n)の左側に存在する
ときの当該文の範囲における係り受け周辺確率の積の最大値を出力する関数である。つまり、左リンク関数126は、注目ノードnに関し、当該注目ノードnと親ノードPAR(n)との間の部分構造を、変数lおよび変数rで規定される文の範囲に対応付けする関数である。
(1)親ノードPAR(n)がl番目の文節に対応しており、
(2)注目ノードnがr番目の文節に対応しており、
(3)注目ノードnの最左子ノードLCH(n)およびその子孫、並びに兄弟ノードSIB(n)およびその子孫が、l+1,…,r−1の間に存在し、
(4)注目ノードnがPAR(n)の右側に存在する
ときの当該文の範囲における係り受け周辺確率の積の最大値を出力する関数である。
以下、本発明の第2の実施形態によるマッチング・スコアを演算するコンピュータ装置について説明する。第2の実施形態によるコンピュータ装置は、第1の実施形態で算出したパターン周辺確率に代えて、パターン出現回数期待値をマッチング・スコアとして算出する。図18は、本発明の第2の実施形態によるコンピュータ装置200の機能ブロックを示す。図18に示すコンピュータ装置200は、第1の実施形態と同様の構成を有しているが、入力部210に入力される入力データと、スコア演算部220が備える関数群と、出力部240が出力する演算結果が相違する。
(1)親ノードPAR(n)がr番目の文節に対応しており、
(2)文の構文木上でのPAR(n)の左子孫末端がlで、したがってnとその子孫はl,…r−1の範囲に存在し、
(3)注目ノードnがPAR(n)の左側に存在する
ときの当該文の範囲における重みの積の総和を出力する関数である。つまり、左シーケンス関数222は、注目ノードnに関し、注目ノードnの親ノードPAR(n)の左子孫末端と親ノードPAR(n)との間の部分構造を、変数lおよび変数rで規定される文の範囲に対応付けする関数である。
(1)親ノードPAR(n)がr番目の文節に対応しており、
(2)文の構文木上でのPAR(n)の最左子ノードがl番目の文節に対応しており、かつ、注目ノードnとマッチしておらず、
(3)文の構文木上でのPAR(n)の最左子ノード(l番目の文節)の右子孫と、最左子ノードの兄弟とが、非交差条件より、l+1,…,r−1の間に存在し、
(4)注目ノードnがPAR(n)の左側に存在する
ときの当該文の範囲における重みの積の総和を出力する関数である。つまり、左リンク関数226は、注目ノードnに関し、親ノードPAR(n)の最左子ノードの左側末端と親ノードPAR(n)との間の部分構造を、変数lおよび変数rで規定される文の範囲に対応付けする関数である。
(1)親ノードPAR(n)がr番目の文節に対応しており、
(2)文の構文木上でのPAR(n)の最左子ノードがl番目の文節に対応しており、かつ、注目ノードnとマッチしており、
(3)文の構文木上でのPAR(n)の最左子ノードの右子孫と、最左子ノードの兄弟とが、非交差条件より、l+1,…,r−1の間に存在し、
(4)注目ノードnがPAR(n)の左側に存在する
ときの当該文の範囲における重みの積の総和を出力する関数である。つまり、左マッチ関数230は、注目ノードnに関し、注目ノードnの左側末端と親ノードPAR(n)との間の部分構造を、変数lおよび変数rで規定される文の範囲に対応付けする関数である。
1.コンピュータにおける実装
クロック数3.0GHzのマルチコア・プロセッサ(インテル(登録商標)Core(登録商標)2Duo)と2GBのRAMを備えるThinkStation(登録商標)を用いて、本発明の第1実施形態によるマッチング・スコア演算のプログラムを実装するコンピュータ・システムを実装した。このコンピュータ・システムのオペレーティング・システムは、WINDOWS(登録商標)XPとした。上記プログラムは、Java(登録商標)のプログラミング言語によって記述した。
2.1.実験例1および比較例1
解析対象データとして毎日新聞(登録商標)の95年データを用い、照会パターンは、「首相…発言…[動詞]」(首相と発言とが[動詞]に係っていることを意味する。)を用いた。マッチング・スコアとしてパターン周辺確率を用いて、上記解析対象データの各文に対してマッチング・スコア演算プログラムを適用し、マッチング・スコア順にソートし、上位k件のFalse−PositiveおよびTrue−positiveの件数をプロットし、ROC(Receiver Operating Characteristic)グラフを作成した。なお、図25は、実験例1の結果および1ベスト法による比較例1の結果を示す。
解析対象データとして同じく毎日新聞(登録商標)の95年データを用い、照会パターンは、「首相…選挙…[動詞]」(首相と選挙とが[動詞]に係っていることを意味する。)を用いた。マッチング・スコアとしてパターン周辺確率を用いて、上記解析対象データの各文に対してマッチング・スコア演算のプログラムを適用し、マッチング・スコア順にソートし、上位k件のFalse−PositiveおよびTrue−Positiveの件数をプロットし、ROCグラフを作成した。なお、図26(A)は、実験例2の結果および1ベスト法による比較例2の結果を示す。図26(B)は、実験例2の結果および5ベスト法による比較例3の結果を示す。図26(C)は、実験例2の結果および10ベスト法による比較例4の結果を示す。なお、上記条件では、単純な文字列一致の場合302件ヒットした。また、Nベスト法では、出力されたN個の構文木それぞれとマッチングを行い、マッチした構文木のスコアの総和をマッチング・スコアとした。さらに、上記Nベストのマッチング・スコアを、N個の構文木のスコアの総和で割り、正規化したものを比較例3’、比較例4’で示す。
解析対象データとして同じく毎日新聞(登録商標)の95年データを用い、照会パターンは、「首相(…の…に)…を…[動詞]」(「…の」が「…に」に係り、「首相」、「…に」、「…を」は[動詞]に係っていることを意味する。)を用いた。マッチング・スコアとしてパターン周辺確率を用いて、上記データの各文に対してマッチング・スコア演算のプログラムを適用し、マッチング・スコア順にソートし、上位k件のFalse−PositiveおよびTrue−Positiveの件数をプロットし、ROCグラフを作成した。なお、図27(A)は、実験例3の結果および1ベスト法による比較例5の結果を示す。図27(B)は、実験例2の結果および5ベスト法による比較例6の結果を示す。図27(C)は、実験例2の結果および10ベスト法による比較例7の結果を示す。なお、単純な文字列一致の場合2054件ヒットした。Nベストの比較例6および比較例7のマッチング・スコアを正規化したものを比較例6’、比較例7’で示す。
Claims (22)
- 照会パターンに対する文のマッチングのスコアを算出する情報処理装置であって、
解析対象の前記文と、該文内の言語単位間の係り易さを指標する指標値と、前記照会パターンとを入力として取得する入力部と、
前記文が前記照会パターンにマッチする程度を指標するマッチングのスコアを、前記照会パターンに含まれる各係り受け関係が対応付けられる各指標値を含む関数で表して、演算するスコア演算部と
を含み、
前記スコア演算部は、前記照会パターンの部分構造と前記文の範囲との対応付けを試行して、前記マッチングのスコアを表す関数の部分演算結果を、再利用するため記憶領域に格納しながら、前記部分構造および前記範囲の内部に関して再帰的に演算することによって、前記スコアを算出し、前記部分演算結果は、前記マッチングのスコアを表す関数の一部を構成する関数であって、前記照会パターンの部分構造を前記文の範囲に対応付けたときの該部分構造内の各係り受け関係に対応付けられる各指標値を含む関数で表されて演算される、部分スコアである、情報処理装置。 - 前記指標値は、前記文の統計的構文解析で与えられ、
前記マッチングのスコアを表す関数は、前記対応付けられる各指標値の積を含む関数であり、
前記部分スコアを表す関数は、前記照会パターンの部分構造を前記文の範囲に対応付けたときの該部分構造内の各係り受け関係に対応付けられる各指標値の積を含む関数であり、
前記スコア演算部は、前記再帰的な演算によって前記照会パターンの構造を辿る、請求項1に記載の情報処理装置。 - 前記指標値は、前記文内の各言語単位間の係り受け周辺確率であり、
前記マッチングのスコアは、前記文に対する解析候補中の前記照会パターンを部分木として有する候補が生成されるパターン周辺確率であり、
前記マッチングのスコアを表す関数は、前記対応付けられる各係り受け周辺確率の積であり、前記パターン周辺確率を近似し、
前記部分スコアは、前記部分構造内の各係り受け関係に対応付けられる各係り受け周辺確率の積の局所最大値であり、
前記スコア演算部は、前記再帰的な演算によって、前記照会パターンの構造を辿りながら、前記パターン周辺確率を大域的に最大化することを特徴とする、請求項2に記載の情報処理装置。 - 前記指標値は、前記文内の各言語単位ペア間の係り易さを指標する重みであり、
前記マッチングのスコアは、前記文に対する解析候補中の前記照会パターンが部分木として出現する見込みを意味するパターン出現回数期待値であり、
前記照会パターンが出現する解析候補に含まれる各係り受け関係の各重みの積を規格化したものが該解析候補の確率を表すとして、前記マッチングのスコアを表す関数は、前記照会パターンが出現する解析候補にわたる該解析候補の確率と出現回数との積の総和であり、
前記部分スコアは、前記文の範囲内側の各対応付けの組み合わせにわたる前記各重みの積の総和であり、
前記スコア演算部は、前記再帰的な演算によって、前記照会パターンの構造および前記文の構造を辿りながら、前記照会パターンが出現する事象を数え上げ、前記照会パターンが出現した解析候補の確率を加算して、前記パターン出現回数期待値を算出することを特徴とする、請求項2に記載の情報処理装置。 - 前記照会パターンは、言語単位にマッチさせるノードと係り受け関係を表すエッジとからなる木構造を構成し、前記スコア演算部は、前記再帰的な演算により前記マッチングのスコアを表す関数の演算結果を得るために呼び出され、前記照会パターンの部分構造と前記文の範囲との対応付けを試行する関数群として、
前記照会パターン内の第1注目ノードの子孫親反対側末端と親ノードと間の部分構造を文の第1範囲に対応付けて、前記第1注目ノードをマッチさせ得る各試行位置に関して、該試行位置から前記親ノードの位置への係り受け関係に対応付けられる前記指標値を与えるとともに、前記第1範囲内の該試行位置を境界とした親反対側範囲について順方向の第1型関数を再帰的に呼び出し、全試行位置にわたる前記部分スコアを出力するとともに、再利用するため記憶領域に格納する前記第1型関数を含む、請求項2に記載の情報処理装置。 - 前記スコア演算部は、前記再帰的な演算により前記マッチングのスコアを表す関数の演算結果を得るために呼び出され、前記照会パターンの部分構造と前記文の範囲との対応付けを試行する関数群として、さらに、
前記照会パターン内の第2注目ノードと親ノードとの間の部分構造を文の第2範囲に対応付けて、前記第2注目ノードの親側末端の子ノードと兄弟ノードとの子孫間を境界させる各試行位置に関して、前記第2範囲内の該試行位置を境界とした親反対側範囲について逆方向の前記第1型関数を再帰的に呼び出し、前記第2範囲内の該試行位置を境界とした親側範囲について順方向の前記第1型関数を再帰的に呼び出し、全試行位置にわたる部分スコアを出力するとともに、再利用するため記憶領域に格納する第2型関数を含み、
前記第1型関数は、前記順方向の第1型関数の呼び出しとともに、前記第1範囲の前記試行位置を境界とした親側範囲について順方向の前記第2型関数を再帰的に呼び出すことを特徴とする、請求項5に記載の情報処理装置。 - 前記第1型関数は、前記順方向の第1型関数の呼び出しの際に前記第1注目ノードの親反対側末端の子ノードを与え、前記順方向の第2型関数の呼び出しの際に当該第1注目ノードを与え、
前記第2型関数は、前記逆方向の第1型関数の呼び出しの際に前記第2注目ノードの親側末端の子ノードを与え、前記順方向の第1型関数の呼び出しの際に前記第2注目ノードの兄弟ノードを与えることを特徴とする、請求項6に記載の情報処理装置。 - 前記スコア演算部は、前記再帰的な演算により前記マッチングのスコアを表す関数の演算結果を得るために呼び出され、前記照会パターンの部分構造と前記文の範囲との対応付けを試行する関数群として、さらに、
前記照会パターン内の第3注目ノードの親ノード子孫末端と該親ノードとの間の部分構造を文の第3範囲に対応付けて、前記第3注目ノードの子孫の親反対側末端を境界させる各試行位置に関して、前記第3範囲の試行位置を境界とした親側範囲について順方向の前記第1型関数を再帰的に呼び出し、全試行位置にわたる部分スコアを出力するとともに、再利用するため記憶領域に格納する第3型関数を含み、
前記第1型関数は、前記第1注目ノードがマッチしない場合の各試行位置に関して、前記第1範囲内の該試行位置を境界とした親側範囲について順方向の前記第3型関数を再帰的に呼び出すことを特徴とする、請求項6に記載の情報処理装置。 - 前記第1型関数は、前記順方向の第1型関数の呼び出しの際に前記第1注目ノードの親反対側末端の子ノードを与え、前記順方向の第2型関数の呼び出しの際に当該第1注目ノードを与え、
前記第2型関数は、前記照会パターンの部分構造の内側に処理を進めて、前記逆方向の第1型関数の呼び出しの際に前記第2注目ノードの親側末端の子ノードを与え、前記順方向の第1型関数の呼び出しの際に前記第2注目ノードの兄弟ノードを与え、
前記第3型関数は、前記照会パターンの部分構造の内側に処理を進めず、前記順方向の第1型関数の呼び出しの際に前記第3注目ノードを与えることを特徴とする、請求項8に記載の情報処理装置。 - 前記関数群は、それぞれ、前記照会パターンの部分構造の右端に注目ノードの親ノードが位置する左方向関数と、前記照会パターンの部分構造の左端に注目ノードの親ノードが位置する右方向関数とを含む、請求項5に記載の情報処理装置。
- 前記解析対象の文は、複数の文からなる文集合の各要素として与えられ、
前記照会パターンの検索依頼に応答して、前記文集合の要素のうち、該照会パターンを用いて該要素である解析対象の文に対して演算された前記マッチングのスコアが閾値以上のものを検索結果として出力する情報検索インタフェースをさらに含むことを特徴とする、請求項1に記載の情報処理装置。 - 前記情報検索インタフェースは、前記閾値を受け付けることを特徴とする、請求項11に記載の情報処理装置。
- 前記解析対象の文は、複数の文からなる文集合の各要素として与えられ、
前記文集合の各要素に対して演算された前記マッチングのスコアの総和を求めて出力する機能部をさらに含むことを特徴とする、請求項1に記載の情報処理装置。 - 前記解析対象の文は、非交差であり、双方向または単方向であり、前記照会パターンは、非交差係り受け木の部分木である、請求項1に記載の情報処理装置。
- 照会パターンに対する文のマッチングのスコアを算出する情報処理装置であって、
解析対象の前記文と、該文内の各言語単位間の係り受け周辺確率と、前記照会パターンとを入力として取得する入力部と、
前記文に対する解析候補中の前記照会パターンを部分木として有する候補が生成されるパターン周辺確率を、前記照会パターンに規定される各係り受け関係が対応付けられる各係り受け周辺確率の関数で表して、前記スコアとして演算するスコア演算部と
を含み、
前記スコア演算部は、前記照会パターンの部分構造と前記文の範囲との対応付けを試行して、前記関数の部分演算結果を、再利用のため記憶領域に格納しながら前記部分構造および前記範囲の内側に関して再帰的に演算することによって、前記パターン周辺確率を算出する、情報処理装置。 - 前記パターン周辺確率を表す関数は、前記各係り受け周辺確率の積であり、前記パターン周辺確率を近似し、
前記関数の部分演算結果は、前記照会パターンの部分構造を前記文の範囲に対応付けたときの該部分構造内の各係り受け関係が対応付けられる各係り受け周辺確率の積の局所最大値であり、
前記スコア演算部は、前記再帰的な演算によって前記パターン周辺確率を大域的に最大化することを特徴とする、請求項15に記載の情報処理装置。 - 照会パターンに対する文のマッチングのスコアを算出する情報処理装置であって、
解析対象の前記文と、該文内の各言語単位間の係り易さを指標する重みと、前記照会パターンとを入力として取得する入力部と、
前記文に対する解析候補中の前記照会パターンが部分木として出現するパターン出現回数期待値を、前記照会パターンが出現する候補に含まれる各係り受け関係の各重みを変数とする関数で表して、前記スコアとして演算するスコア演算部と
を含み、
前記スコア演算部は、前記照会パターンの部分構造と前記文の範囲との対応付けを試行して、前記関数の部分演算結果を、再利用するため記憶領域に格納しながら前記部分構造および前記範囲の内部に関して再帰的に算出することによって、前記パターン出現回数期待値の演算する、情報処理装置。 - 前記照会パターンが出現する解析候補に含まれる各係り受け関係の各重みの積を規格化したものが該解析候補の確率を表すとして、前記パターン出現回数期待値を表す関数は、前記照会パターンが出現する解析候補にわたる該解析候補の確率と出現回数との積の総和であり、
前記関数の部分演算結果は、前記文の範囲内側の各対応付けの組み合わせにわたる前記各重みの積の総和であり、
前記スコア演算部は、前記再帰的な演算によって前記照会パターンが出現する事象を数え上げながら、前記照会パターンが出現した解析候補の確率を加算して、前記パターン出現回数期待値を算出することを特徴とする、請求項17に記載の情報処理装置。 - コンピュータ・システムが実行する、係り受け構造を有する照会パターンに対する自然言語で記述された文のマッチングのスコアを算出する自然言語解析方法であって、
コンピュータ・システムが、解析対象の前記文と、該文内の言語単位間の係り易さを指標する指標値と、前記照会パターンとを入力として取得し、記憶領域に記憶するステップと、
コンピュータ・システムが、前記文が前記照会パターンにマッチする程度を指標するマッチングのスコアを、前記照会パターンに含まれる各係り受け関係が対応付けられる各指標値を含む関数で表して、プロセッサにより演算するステップと
を含み、
前記演算するステップは、
前記照会パターンの部分構造と前記文の範囲との対応付けを試行して、前記マッチングのスコアを表す関数の部分演算結果を、再利用するため記憶領域に格納しながら演算するサブステップを前記部分構造および前記範囲の内部に関して再帰的に呼び出すステップを含み、前記部分演算結果は、前記マッチングのスコアを表す関数の一部を構成する関数であって、前記照会パターンの部分構造を前記文の範囲に対応付けたときの該部分構造内の各係り受け関係に対応付けられる各指標値を含む関数で表されて演算される、部分スコアである、自然言語解析方法。 - 前記指標値は、前記文の統計的構文解析で与えられ、
前記マッチングのスコアを表す関数は、前記対応付けられる各指標値の積を含む関数であり、
前記部分スコアを表す関数は、前記照会パターンの部分構造を前記文の範囲に対応付けたときの該部分構造内の各係り受け関係に対応付けられる各指標値の積を含む関数であり、
前記再帰的に呼び出すステップにより、前記照会パターンの構造が辿られることを特徴とする、請求項19に記載の自然言語解析方法。 - コンピュータ・システム上に、照会パターンに対する文のマッチングのスコアを算出する情報処理装置を実現するためのコンピュータ実行可能なプログラムであって、前記コンピュータ・システムを、
解析対象の前記文と、該文内の言語単位間の係り易さを指標する指標値と、前記照会パターンとを入力として取得する入力部、および
前記文が前記照会パターンにマッチする程度を指標するマッチングのスコアを、前記照会パターンに含まれる各係り受け関係が対応付けられる各指標値を含む関数で表して、演算するスコア演算部であって、前記照会パターンの部分構造と前記文の範囲との対応付けを試行して、前記マッチングのスコアを表す関数の部分演算結果を、再利用するため記憶領域に格納しながら前記部分構造および前記範囲の内部に関して再帰的に演算することによって、前記スコアを算出する、当該スコア演算部
として機能させるためのプログラムであり、
前記部分演算結果は、前記マッチングのスコアを表す関数の一部を構成する関数であって、前記照会パターンの部分構造を前記文の範囲に対応付けたときの該部分構造内の各係り受け関係に対応付けられる各指標値を含む関数で表されて演算される、部分スコアである、プログラム。 - 請求項21に記載のコンピュータ実行可能なプログラムをコンピュータ読取可能に格納する記録媒体。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011046709A JP5710317B2 (ja) | 2011-03-03 | 2011-03-03 | 情報処理装置、自然言語解析方法、プログラムおよび記録媒体 |
US13/406,709 US20120226492A1 (en) | 2011-03-03 | 2012-02-28 | Information processing apparatus, natural language analysis method, program and recording medium |
US13/599,588 US8793121B2 (en) | 2011-03-03 | 2012-08-30 | Information processing apparatus, natural language analysis method, program and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011046709A JP5710317B2 (ja) | 2011-03-03 | 2011-03-03 | 情報処理装置、自然言語解析方法、プログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012185561A JP2012185561A (ja) | 2012-09-27 |
JP5710317B2 true JP5710317B2 (ja) | 2015-04-30 |
Family
ID=46753825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011046709A Expired - Fee Related JP5710317B2 (ja) | 2011-03-03 | 2011-03-03 | 情報処理装置、自然言語解析方法、プログラムおよび記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (2) | US20120226492A1 (ja) |
JP (1) | JP5710317B2 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5681041B2 (ja) * | 2011-06-03 | 2015-03-04 | 富士通株式会社 | 名寄せ規則生成方法、装置、およびプログラム |
US10095692B2 (en) * | 2012-11-29 | 2018-10-09 | Thornson Reuters Global Resources Unlimited Company | Template bootstrapping for domain-adaptable natural language generation |
US10354677B2 (en) * | 2013-02-28 | 2019-07-16 | Nuance Communications, Inc. | System and method for identification of intent segment(s) in caller-agent conversations |
KR102074734B1 (ko) * | 2013-02-28 | 2020-03-02 | 삼성전자주식회사 | 시퀀스 데이터에서의 패턴 검색 방법 및 장치 |
US9317260B2 (en) * | 2013-08-09 | 2016-04-19 | Vmware, Inc. | Query-by-example in large-scale code repositories |
US9396235B1 (en) * | 2013-12-13 | 2016-07-19 | Google Inc. | Search ranking based on natural language query patterns |
DE102013022268A1 (de) | 2013-12-31 | 2015-07-02 | Markus Lenzing | Verfahren zur Abwicklung eines Kaufvorgangs mittels Nachrichten in natürlicher Sprache über ein Kommunikationsnetzwerk |
WO2015151157A1 (ja) * | 2014-03-31 | 2015-10-08 | 三菱電機株式会社 | 意図理解装置および方法 |
WO2016006021A1 (ja) * | 2014-07-07 | 2016-01-14 | 株式会社Ubic | データ分析装置、データ分析装置の制御方法、およびデータ分析装置の制御プログラム |
US9798801B2 (en) * | 2014-07-16 | 2017-10-24 | Microsoft Technology Licensing, Llc | Observation-based query interpretation model modification |
US9836529B2 (en) | 2014-09-22 | 2017-12-05 | Oracle International Corporation | Semantic text search |
US10237148B2 (en) * | 2014-10-17 | 2019-03-19 | Robin Systems, Inc. | Providing a data set for tracking and diagnosing datacenter issues |
US10579589B2 (en) * | 2014-11-06 | 2020-03-03 | Sap Se | Data filtering |
CN105989027A (zh) * | 2015-01-30 | 2016-10-05 | 华为技术有限公司 | 匹配语句的方法和设备 |
US9697103B2 (en) * | 2015-07-30 | 2017-07-04 | International Business Machines Corporation | Automatic knowledge base generation for root cause in application performance management |
US20170124152A1 (en) | 2015-11-02 | 2017-05-04 | LeapYear Technologies, Inc. | Differentially private processing and database storage |
TWI639927B (zh) * | 2016-05-27 | 2018-11-01 | 雲拓科技有限公司 | 將一申請專利範圍中的申請專利範圍元件名詞所屬元件名詞對應標號予以對應之對應方法 |
US10402499B2 (en) * | 2016-11-17 | 2019-09-03 | Goldman Sachs & Co. LLC | System and method for coupled detection of syntax and semantics for natural language understanding and generation |
KR102594625B1 (ko) * | 2017-03-19 | 2023-10-25 | 오펙-에슈콜롯 리서치 앤드 디벨롭먼트 엘티디 | K-부정합 검색을 위한 필터를 생성하는 시스템 및 방법 |
CN110019722B (zh) * | 2017-12-21 | 2023-11-24 | 株式会社理光 | 对话模型的回复排序方法、装置及计算机可读存储介质 |
US11055432B2 (en) | 2018-04-14 | 2021-07-06 | LeapYear Technologies, Inc. | Budget tracking in a differentially private database system |
US10665228B2 (en) * | 2018-05-23 | 2020-05-26 | Bank of America Corporaiton | Quantum technology for use with extracting intents from linguistics |
US10430605B1 (en) * | 2018-11-29 | 2019-10-01 | LeapYear Technologies, Inc. | Differentially private database permissions system |
US11755769B2 (en) | 2019-02-01 | 2023-09-12 | Snowflake Inc. | Differentially private query budget refunding |
US10642847B1 (en) | 2019-05-09 | 2020-05-05 | LeapYear Technologies, Inc. | Differentially private budget tracking using Renyi divergence |
CN111027331B (zh) * | 2019-12-05 | 2022-04-05 | 百度在线网络技术(北京)有限公司 | 用于评估翻译质量的方法和装置 |
CA3108956C (en) | 2020-02-11 | 2023-09-05 | LeapYear Technologies, Inc. | Adaptive differentially private count |
CN112528001B (zh) * | 2020-12-23 | 2023-07-25 | 北京百度网讯科技有限公司 | 一种信息查询方法、装置及电子设备 |
US20230229440A1 (en) * | 2022-01-18 | 2023-07-20 | Jpmorgan Chase Bank, N.A. | Systems and methods for multi-signal pattern matching with graph propagation |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0449141A (ja) | 1990-06-15 | 1992-02-18 | Hitachi Ltd | 動力伝達装置 |
JPH04341077A (ja) | 1991-05-17 | 1992-11-27 | Matsushita Electric Ind Co Ltd | 固体撮像素子パッケージ |
US6760695B1 (en) * | 1992-08-31 | 2004-07-06 | Logovista Corporation | Automated natural language processing |
JP2000516749A (ja) * | 1997-06-26 | 2000-12-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 語構成源テキストを語構成目標テキストに翻訳する機械構成の方法及び装置 |
US5963742A (en) * | 1997-09-08 | 1999-10-05 | Lucent Technologies, Inc. | Using speculative parsing to process complex input data |
JP3781561B2 (ja) * | 1998-08-13 | 2006-05-31 | 日本電気株式会社 | 自然言語解析装置、システム及び記録媒体 |
JP2001134575A (ja) | 1999-10-29 | 2001-05-18 | Internatl Business Mach Corp <Ibm> | 頻出パターン検出方法およびシステム |
US6999917B1 (en) * | 2000-02-22 | 2006-02-14 | Microsoft Corporation | Left-corner chart parsing system |
US7603267B2 (en) * | 2003-05-01 | 2009-10-13 | Microsoft Corporation | Rules-based grammar for slots and statistical model for preterminals in natural language understanding system |
JP4049141B2 (ja) | 2004-09-27 | 2008-02-20 | 日本電気株式会社 | 文書処理装置、文書処理方法、および、文書処理プログラム |
JP4341077B2 (ja) | 2007-10-03 | 2009-10-07 | 日本電気株式会社 | 文書処理装置、文書処理方法、および、文書処理プログラム |
KR20110036385A (ko) * | 2009-10-01 | 2011-04-07 | 삼성전자주식회사 | 사용자 의도 분석 장치 및 방법 |
US20110131033A1 (en) * | 2009-12-02 | 2011-06-02 | Tatu Ylonen Oy Ltd | Weight-Ordered Enumeration of Referents and Cutting Off Lengthy Enumerations |
JP4967037B2 (ja) * | 2010-02-08 | 2012-07-04 | 株式会社エヌ・ティ・ティ・データ | 情報検索装置、情報検索方法、端末装置、およびプログラム |
-
2011
- 2011-03-03 JP JP2011046709A patent/JP5710317B2/ja not_active Expired - Fee Related
-
2012
- 2012-02-28 US US13/406,709 patent/US20120226492A1/en not_active Abandoned
- 2012-08-30 US US13/599,588 patent/US8793121B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20120226492A1 (en) | 2012-09-06 |
US8793121B2 (en) | 2014-07-29 |
JP2012185561A (ja) | 2012-09-27 |
US20130060562A1 (en) | 2013-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5710317B2 (ja) | 情報処理装置、自然言語解析方法、プログラムおよび記録媒体 | |
CN110502621B (zh) | 问答方法、问答装置、计算机设备及存储介质 | |
CN111353310B (zh) | 基于人工智能的命名实体识别方法、装置及电子设备 | |
US9710547B2 (en) | Natural language semantic search system and method using weighted global semantic representations | |
US20070010990A1 (en) | Method for sentence structure analysis based on mobile configuration concept and method for natural language search using of it | |
US11113470B2 (en) | Preserving and processing ambiguity in natural language | |
JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
CN110727839A (zh) | 自然语言查询的语义解析 | |
CN109783806B (zh) | 一种利用语义解析结构的文本匹配方法 | |
US20230014700A1 (en) | Pre-emptive graph search for guided natural language interactions with connected data systems | |
CN108763529A (zh) | 一种智能检索方法、装置和计算机可读存储介质 | |
CN113591457A (zh) | 文本纠错方法、装置、设备及存储介质 | |
CN110929498A (zh) | 一种短文本相似度的计算方法及装置、可读存储介质 | |
CN109840255A (zh) | 答复文本生成方法、装置、设备及存储介质 | |
CN111581365B (zh) | 一种谓词抽取方法 | |
CN110750967B (zh) | 一种发音的标注方法、装置、计算机设备和存储介质 | |
Yeh et al. | Chinese spelling checker based on an inverted index list with a rescoring mechanism | |
US9104755B2 (en) | Ontology enhancement method and system | |
Lee | Natural Language Processing: A Textbook with Python Implementation | |
CN115831117A (zh) | 实体识别方法、装置、计算机设备和存储介质 | |
CN111767388B (zh) | 一种候选池生成方法 | |
KR102559806B1 (ko) | 기계학습 기반의 지능형 법률 판례 검색 및 통합형 법률 서비스 방법 및 장치 | |
CN115879460A (zh) | 面向文本内容的新标签实体识别方法、装置、设备及介质 | |
CN112651590B (zh) | 一种指令处理流程推荐的方法 | |
JPH117447A (ja) | 話題抽出方法及びこれに用いる話題抽出モデルとその作成方法、話題抽出プログラム記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140804 |
|
TRDD | Decision of grant or rejection written | ||
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20150217 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150304 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5710317 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |