JP6867963B2 - 要約評価装置、方法、プログラム、及び記憶媒体 - Google Patents

要約評価装置、方法、プログラム、及び記憶媒体 Download PDF

Info

Publication number
JP6867963B2
JP6867963B2 JP2018032553A JP2018032553A JP6867963B2 JP 6867963 B2 JP6867963 B2 JP 6867963B2 JP 2018032553 A JP2018032553 A JP 2018032553A JP 2018032553 A JP2018032553 A JP 2018032553A JP 6867963 B2 JP6867963 B2 JP 6867963B2
Authority
JP
Japan
Prior art keywords
word
tuple
tuples
class
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018032553A
Other languages
English (en)
Other versions
JP2019148933A (ja
Inventor
平尾 努
努 平尾
永田 昌明
昌明 永田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2018032553A priority Critical patent/JP6867963B2/ja
Priority to US16/975,365 priority patent/US11520994B2/en
Priority to PCT/JP2019/005374 priority patent/WO2019163642A1/ja
Publication of JP2019148933A publication Critical patent/JP2019148933A/ja
Application granted granted Critical
Publication of JP6867963B2 publication Critical patent/JP6867963B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • G06V30/2272Character recognition characterised by the type of writing of cursive writing using stroke segmentation with lexical matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

本発明は、要約評価装置、方法、プログラム、及び記憶媒体に係り、特に、システム要約を評価するための要約評価装置、方法、プログラム、及び記憶媒体に関する。
従来より、計算機を用いて自動的に言語を処理する自然言語処理分野において、人間が作成した正解の要約(以降、参照要約)が与えられた際にそれを用いてシステム要約を自動的に採点する技術がある。
要約の自動評価法として、参照要約と候補要約との間で共通するかかり受け関係にある単語ペアとその関係のタプルt=<h,m,rel>に基づき決定されるBasic Elementsスコアがある.h,m,relはそれぞれ、かかり先単語、かかり元単語、及びかかり受け関係である。たとえば、"The dog likes eating sausage."という文からは、<dog,The,det>,<likes,dog,nsubj>,<likes,eating,xcomp>,<eating,sausage,dobj>というタプル集合が得られる。
いま、参照要約の集合
Figure 0006867963

が与えられ、i番目の参照要約から得たタプル集合をTとし、参照要約全体でのタプル集合を
Figure 0006867963

とする。このとき、システム要約SのBEスコアは以下(1)式で計算される。
Figure 0006867963

・・・(1)
N(t,R)はj番目のタプルのi番目の参照要約における頻度、N(t,S)はj番目のタプルのシステム要約における頻度を表す。
Hovy, E., Lin, C.Y. Zhou, L. and Fukumoto, J. "Automated Summarization Evaluation with Basic Elements". In Proceedings of the 5th International Conference on Language Resource and Evaluation(LREC), 2006
上記(1)式より明らかであるが、BEスコアは複数の参照要約にまたがって出現するタプルに対して高いスコアを与える。つまり、複数の参照要約に出現するタプルと1つの参照要約にしか出現しないタプルでは、タプルが獲得するスコアに大きな格差がある。たとえば、要約の主題となるような名詞は冠詞を伴って多くの参照要約に出現するため、こうしたタプルをシステムが含むとその要約は高いスコアを獲得する傾向にある。いま、<dog,The,det> というタプルがK個の参照要約に出現し、"dog"が動詞"likes"の主語であるという重要な文脈情報をあらわす<likes,dog,nsubj>というタプルはある1つの参照要約に1回しか出現していないとする。この場合、システム要約が<dog,The,det>をどのような文脈であれ1回でも含むと最低でもK点を得る。一方、<likes,dog,nsubj>しか含まないシステム要約は1点しか得ることができず両者の得点の差は最低でもK−1点となり、非常に大きい。一般的に、冠詞+名詞というタプルはそれ自体が文脈情報を含むようなものではないので、これがあるだけで高得点を獲得するということは問題である。また、システム要約のタプルと参照要約のタプルの一致は文字列の完全一致により行われる。よって、<John,killed,nsubjpass>,<John,murdered,nsubjpass>という意味的にはほぼおなじタプルを同一視することができない。
本発明は、上記問題点を解決するために成されたものであり、精度良くシステム要約を評価することができる要約評価装置、方法、プログラム、及び記憶媒体を提供することを目的とする。
上記目的を達成するために、第1の発明に係る要約評価装置は、要約対象の文書について予め求められた複数の参照要約と、前記要約対象の文書についてシステムにより生成されたシステム要約との各々について、かかり受け関係にある、かかり先単語及びかかり受け単語からなる単語ペア、及び前記かかり受け関係を表すラベルの組であるタプルを抽出し、抽出されたタプルの各々について、前記タプルの前記単語ペアのかかり先単語、及びかかり受け単語の各々を、単語について予め定められたクラスに置き換えるタプル抽出部と、前記クラスに置き換えられた、前記複数の参照要約の全体についてのタプルの集合と、前記システム要約のタプルの集合とに基づいて、前記システム要約のスコアを計算するスコア計算部と、を含んで構成されている。
第2の発明に係る要約評価方法は、タプル抽出部が、要約対象の文書について予め求められた複数の参照要約と、前記要約対象の文書についてシステムにより生成されたシステム要約との各々について、かかり受け関係にある、かかり先単語及びかかり受け単語からなる単語ペア、及び前記かかり受け関係を表すラベルの組であるタプルを抽出し、抽出されたタプルの各々について、前記タプルの前記単語ペアのかかり先単語、及びかかり受け単語の各々を、単語について予め定められたクラスに置き換えるステップと、スコア計算部が、前記クラスに置き換えられた、前記複数の参照要約の全体についてのタプルの集合と、前記システム要約のタプルの集合とに基づいて、前記システム要約のスコアを計算するステップと、を含んで実行することを特徴とする。
第3の発明に係るプログラムは、コンピュータを、第1の発明に係る要約評価装置の各部として機能させるためのプログラムである。
第4の発明に係る記憶媒体は、コンピュータを、第1の発明に係る要約評価装置の各部として機能させるためのプログラムを格納する記憶媒体である。
本発明の要約評価装置、方法、プログラム、及び記憶媒体によれば、要約対象の文書について予め求められた複数の参照要約と、要約対象の文書についてシステムにより生成されたシステム要約との各々について、かかり受け関係にある、かかり先単語及びかかり受け単語からなる単語ペア、及びかかり受け関係を表すラベルの組であるタプルを抽出し、抽出されたタプルの各々について、タプルの単語ペアのかかり先単語、及びかかり受け単語の各々を、単語について予め定められたクラスに置き換え、クラスに置き換えられた、複数の参照要約の全体についてのタプルの集合と、システム要約のタプルの集合とに基づいて、システム要約のスコアを計算することにより、精度良くシステム要約を評価することができる、という効果が得られる。
本発明の実施の形態に係る要約評価装置の構成を示すブロック図である。 依存構造解析を行ってタプルを抽出する一例を示す図である。 タプル中の単語をクラスIDに置き換える一例を示す図である。 本発明の実施の形態に係る要約評価装置における要約評価処理ルーチンを示すフローチャートである。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<本発明の実施の形態に係る概要>
本発明の実施の形態では、上記の2つの課題に対し、(1)スコア計算時にタプルの頻度を考慮せず、(2)タプルのマッチングにおいて単語の意味クラスを考慮する、という手法によって解決する。具体的には以下(2)式でシステム要約を評価する。
Figure 0006867963

・・・(2)
はシステム要約から得たタプル集合である。なお、
Figure 0006867963

に含まれるタプルの単語は単語に対応するクラスのクラスIDに置き換えられているものとする。単語からクラスIDへの変換は単語ベクトルをもとにK-means法、階層クラスタリング法などを用いて単語をクラスタリングし、クラスタIDにより単語のクラスIDを決定すればよい。
<本発明の実施の形態に係る要約評価装置の構成>
次に、本発明の実施の形態に係る要約評価装置の構成について説明する。図1に示すように、本発明の実施の形態に係る要約評価装置100は、CPUと、RAMと、後述する要約評価処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この要約評価装置100は、機能的には図1に示すように入力部10と、演算部20と、出力部50とを備えている。
入力部10は、要約対象の文書について予め求められたK個の参照要約と、要約対象の文書についてシステムにより生成されたシステム要約との各々を受け付ける。
演算部20は、文分割部30と、単語クラスタリング部32と、タプル抽出部34と、スコア計算部36とを含んで構成されている。
文分割部30は、入力部10受け付けたK個の参照要約、及びシステム要約を1文ごとに分割する。文の分割は、既存の文分割ツールを用いても良いし、句読点のような情報を参考に分割ルールを作成し、分割器を実装しても良い。
単語クラスタリング部32は、文分割部30で分割されたK個の参照要約、及びシステム要約に含まれる単語を、単語の意味ベクトルを用いてクラスタリングする。単語のクラスタリングは単語をn次元ベクトルとして表現し、ベクトル間のコサイン類似度に基づきK-means法、階層クラスタリング法などを用いれば実現できる。単語をn次元ベクトルとして表現するためには、word2vecのようなツールを利用すれば良い。
タプル抽出部34は、文分割部30で分割されたK個の参照要約と、システム要約との各々について、かかり受け関係にある、かかり先単語及びかかり受け単語からなる単語ペア、及びかかり受け関係を表すラベルの組であるタプルを抽出する。例えば、図2に示すような依存構造解析を行うことでタプルを抽出する。次に、タプル抽出部34は、抽出されたタプルの各々について、タプルの単語ペアのかかり先単語、及びかかり受け単語の各々を、単語クラスタリング部32の単語についてのクラスタリング結果のクラスに置き換える。例えば、図3に示すように、タプル中の単語をクラスタのインデックスへと置き換えて、単語が属するクラスタのクラスIDとする。
スコア計算部36は、タプル抽出部34でクラスに置き換えられた、K個の参照要約の全体についてのタプルの集合と、システム要約のタプルの集合との重複度合いに応じたスコアを以下(3)式に従って計算し、出力部50に出力する。
Figure 0006867963

・・・(3)
以上のように、参照要約、及びシステム要約とも依存構造から得られるタプルの集合としてとらえ、それぞれのタプルがもとの要約における頻度を考慮しないスコア計算式を導入することにより、一部の単語が高得点を獲得できてしまう状況を抑制できる。また、タプルを構成する単語を単語クラスタのクラスIDで置き換えることにより、意味的に類似したタプルを同一のものとみなす。これにより、単語の意味クラスを考慮して要約を評価できる。
<本発明の実施の形態に係る要約評価装置の作用>
次に、本発明の実施の形態に係る要約評価装置100の作用について説明する。入力部10において要約対象の文書について予め求められたK個の参照要約と、要約対象の文書についてシステムにより生成されたシステム要約との各々を受け付けると、要約評価装置100は、図4に示す要約評価処理ルーチンを実行する。
まず、ステップS100では、入力部10受け付けたK個の参照要約、及びシステム要約を1文ごとに分割する。
次に、ステップS102では、ステップS100で分割されたK個の参照要約、及びシステム要約に含まれる単語を、単語の意味ベクトルを用いてクラスタリングする。
ステップS104では、ステップS100で分割されたK個の参照要約と、システム要約との各々について、かかり受け関係にある、かかり先単語及びかかり受け単語からなる単語ペア、及びかかり受け関係を表すラベルの組であるタプルを抽出する。
ステップS106では、ステップS104で抽出されたタプルの各々について、タプルの単語ペアのかかり先単語、及びかかり受け単語の各々を、ステップS102の単語についてのクラスタリング結果のクラスに置き換える。
ステップS108では、タプル抽出部34でクラスに置き換えられた、K個の参照要約の全体についてのタプルの集合と、システム要約のタプルの集合との重複度合いに応じたスコアを上記(3)式に従って計算し、出力部50に出力する。
以上説明したように、本発明の実施の形態に係る要約評価装置によれば、要約対象の文書について予め求められた複数の参照要約と、要約対象の文書についてシステムにより生成されたシステム要約との各々について、かかり受け関係にある、かかり先単語及びかかり受け単語からなる単語ペア、及びかかり受け関係を表すラベルの組であるタプルを抽出し、抽出されたタプルの各々について、タプルの単語ペアのかかり先単語、及びかかり受け単語の各々を、単語について予め定められたクラスに置き換え、クラスに置き換えられた、複数の参照要約の全体についてのタプルの集合と、システム要約のタプルの集合とに基づいて、システム要約のスコアを計算することにより、精度良くシステム要約を評価することができる。
なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上述した実施の形態では、かかり先単語、及びかかり受け単語をクラスIDに置き換える場合を例に説明したが、これに限定されるものではなく、単語が属するクラスタに対応する値などに置き換えるようにしてもよい。
例えば、上述した実施の形態では、文分割部30により分割し、単語クラスタリング部32によりクラスタリングする場合を例に説明したが、これに限定されるものではなく、文分割部30、及び単語クラスタリング部32を設けずに、予め分割した参照要約、及びシステム要約と、クラスタリング結果とを受け付けるようにしてもよい。
また、上述した実施の形態では、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記憶媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。
10 入力部
20 演算部
30 文分割部
32 単語クラスタリング部
34 タプル抽出部
36 スコア計算部
50 出力部
100 要約評価装置

Claims (8)

  1. 要約対象の文書について予め求められた複数の参照要約と、前記要約対象の文書についてシステムにより生成されたシステム要約との各々について、かかり受け関係にある、かかり先単語及びかかり受け単語からなる単語ペア、及び前記かかり受け関係を表すラベルの組であるタプルを抽出し、抽出されたタプルの各々について、前記タプルの前記単語ペアのかかり先単語、及びかかり受け単語の各々を、単語について予め定められたクラスに置き換えるタプル抽出部と、
    前記クラスに置き換えられた、前記複数の参照要約の全体についてのタプルの集合と、前記システム要約のタプルの集合とに基づいて、前記システム要約のスコアを計算するスコア計算部と、
    を含む要約評価装置。
  2. 前記単語のクラスは、単語の意味ベクトルを用いたクラスタリングにより定められたクラスである請求項1記載の要約評価装置。
  3. 前記スコア計算部は、前記クラスに置き換えられた、前記複数の参照要約の全体についてのタプルの集合と、前記システム要約のタプルの集合との重複度合いに応じた前記スコアを計算する請求項1又は2記載の要約評価装置。
  4. タプル抽出部が、要約対象の文書について予め求められた複数の参照要約と、前記要約対象の文書についてシステムにより生成されたシステム要約との各々について、かかり受け関係にある、かかり先単語及びかかり受け単語からなる単語ペア、及び前記かかり受け関係を表すラベルの組であるタプルを抽出し、抽出されたタプルの各々について、前記タプルの前記単語ペアのかかり先単語、及びかかり受け単語の各々を、単語について予め定められたクラスに置き換えるステップと、
    スコア計算部が、前記クラスに置き換えられた、前記複数の参照要約の全体についてのタプルの集合と、前記システム要約のタプルの集合とに基づいて、前記システム要約のスコアを計算するステップと、
    を含む要約評価方法。
  5. 前記単語のクラスは、単語の意味ベクトルを用いたクラスタリングにより定められたクラスである請求項4に記載の要約評価方法。
  6. 前記スコア計算部が計算するステップは、前記クラスに置き換えられた、前記複数の参照要約の全体についてのタプルの集合と、前記システム要約のタプルの集合との重複度合いに応じた前記スコアを計算する請求項4又は請求項5に記載の要約評価方法。
  7. コンピュータを、請求項1〜3の何れか1項に記載の要約評価装置の各部として機能させるためのプログラム。
  8. コンピュータを、請求項1〜3の何れか1項に記載の要約評価装置の各部として機能させるためのプログラムを格納する記憶媒体。
JP2018032553A 2018-02-26 2018-02-26 要約評価装置、方法、プログラム、及び記憶媒体 Active JP6867963B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018032553A JP6867963B2 (ja) 2018-02-26 2018-02-26 要約評価装置、方法、プログラム、及び記憶媒体
US16/975,365 US11520994B2 (en) 2018-02-26 2019-02-14 Summary evaluation device, method, program, and storage medium
PCT/JP2019/005374 WO2019163642A1 (ja) 2018-02-26 2019-02-14 要約評価装置、方法、プログラム、及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018032553A JP6867963B2 (ja) 2018-02-26 2018-02-26 要約評価装置、方法、プログラム、及び記憶媒体

Publications (2)

Publication Number Publication Date
JP2019148933A JP2019148933A (ja) 2019-09-05
JP6867963B2 true JP6867963B2 (ja) 2021-05-12

Family

ID=67687567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018032553A Active JP6867963B2 (ja) 2018-02-26 2018-02-26 要約評価装置、方法、プログラム、及び記憶媒体

Country Status (3)

Country Link
US (1) US11520994B2 (ja)
JP (1) JP6867963B2 (ja)
WO (1) WO2019163642A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7363107B2 (ja) * 2019-06-04 2023-10-18 コニカミノルタ株式会社 発想支援装置、発想支援システム及びプログラム
US20220027578A1 (en) * 2020-07-27 2022-01-27 Nvidia Corporation Text string summarization
CN112528598B (zh) * 2020-12-07 2022-04-05 上海交通大学 基于预训练语言模型和信息论的自动化文本摘要评测方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9626348B2 (en) * 2011-03-11 2017-04-18 Microsoft Technology Licensing, Llc Aggregating document annotations
CA2851772C (en) * 2011-10-14 2017-03-28 Yahoo! Inc. Method and apparatus for automatically summarizing the contents of electronic documents
US20140156264A1 (en) * 2012-11-19 2014-06-05 University of Washington through it Center for Commercialization Open language learning for information extraction
US9575961B2 (en) * 2014-08-28 2017-02-21 Northern Light Group, Llc Systems and methods for analyzing document coverage
US10977573B1 (en) * 2015-05-07 2021-04-13 Google Llc Distantly supervised wrapper induction for semi-structured documents
US11514244B2 (en) * 2015-11-11 2022-11-29 Adobe Inc. Structured knowledge modeling and extraction from images
US10585930B2 (en) * 2016-07-29 2020-03-10 International Business Machines Corporation Determining a relevancy of a content summary
US10474709B2 (en) * 2017-04-14 2019-11-12 Salesforce.Com, Inc. Deep reinforced model for abstractive summarization
US11170158B2 (en) * 2018-03-08 2021-11-09 Adobe Inc. Abstractive summarization of long documents using deep learning
US10599722B1 (en) * 2019-05-17 2020-03-24 Fmr Llc Systems and methods for automated document comparison

Also Published As

Publication number Publication date
JP2019148933A (ja) 2019-09-05
WO2019163642A1 (ja) 2019-08-29
US20200401767A1 (en) 2020-12-24
US11520994B2 (en) 2022-12-06

Similar Documents

Publication Publication Date Title
CN111222305B (zh) 一种信息结构化方法和装置
US10503828B2 (en) System and method for answering natural language question
US20200192727A1 (en) Intent-Based Organisation Of APIs
US8407253B2 (en) Apparatus and method for knowledge graph stabilization
US9965459B2 (en) Providing contextual information associated with a source document using information from external reference documents
US10528664B2 (en) Preserving and processing ambiguity in natural language
US9645988B1 (en) System and method for identifying passages in electronic documents
JP2020191075A (ja) Web APIおよび関連エンドポイントの推薦
JP6663826B2 (ja) 計算機及び応答の生成方法
JP2015060243A (ja) 検索装置、検索方法、およびプログラム
JP6729095B2 (ja) 情報処理装置及びプログラム
CN111291177A (zh) 一种信息处理方法、装置和计算机存储介质
Cordobés et al. Graph-based techniques for topic classification of tweets in Spanish
JP6867963B2 (ja) 要約評価装置、方法、プログラム、及び記憶媒体
JP2014120053A (ja) 質問応答装置、方法、及びプログラム
JP2011118689A (ja) 検索方法及びシステム
TW201826145A (zh) 從中文語料庫提取知識的方法和系統
JP2019082931A (ja) 検索装置、類似度算出方法、およびプログラム
Gómez-Adorno et al. A graph based authorship identification approach
Panda Developing an efficient text pre-processing method with sparse generative Naive Bayes for text mining
JP2006065387A (ja) テキスト文検索装置、テキスト文検索方法、及びテキスト文検索プログラム
JP4979637B2 (ja) 複合語の区切り位置を推定する複合語区切り推定装置、方法、およびプログラム
CN114391142A (zh) 使用结构化和非结构化数据的解析查询
CN111680146A (zh) 确定新词的方法、装置、电子设备及可读存储介质
US9104755B2 (en) Ontology enhancement method and system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210406

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210409

R150 Certificate of patent or registration of utility model

Ref document number: 6867963

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150