JP7228662B2 - イベント抽出方法、装置、電子機器及び記憶媒体 - Google Patents

イベント抽出方法、装置、電子機器及び記憶媒体 Download PDF

Info

Publication number
JP7228662B2
JP7228662B2 JP2021191869A JP2021191869A JP7228662B2 JP 7228662 B2 JP7228662 B2 JP 7228662B2 JP 2021191869 A JP2021191869 A JP 2021191869A JP 2021191869 A JP2021191869 A JP 2021191869A JP 7228662 B2 JP7228662 B2 JP 7228662B2
Authority
JP
Japan
Prior art keywords
event
argument
question sentence
description text
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021191869A
Other languages
English (en)
Other versions
JP2022031804A (ja
Inventor
シンユウ リー,
ファユアン リー,
ルー パン,
ユガン チェン,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022031804A publication Critical patent/JP2022031804A/ja
Application granted granted Critical
Publication of JP7228662B2 publication Critical patent/JP7228662B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

本願は、コンピュータ技術の分野に関し、具体的には、自然言語処理、深層学習、知識グラフなどの人工知能技術の分野に関し、特に、イベント抽出方法、装置、電子機器及び記憶媒体に関する。
人工知能は、コンピュータに、人間のある思考過程や知能的行動(例えば、学習、推論、思考、計画など)をシミュレートさせることを研究する学科であり、ハードウェアレベルの技術とソフトウェアレベルの技術の両方がある。人工知能ハードウェア技術には、一般的に、センサ、専用の人工知能チップ、クラウドコンピューティング、分散ストレージ、ビッグデータ処理などのような技術が含まれており、人工知能ソフトウェア技術には、主に、コンピュータビジョン技術、音声認識技術、自然言語処理技術及び機械学習/深層学習、ビッグデータ処理技術、知識グラフ技術などのいくつかの主要な方向性がある。
イベント抽出(Event Extraction)技術とは、イベント記述の自然テキストを解析して、構造化されたイベント記述情報を取得することを指し、イベント抽出は、客観的な世界の豊富な非構造化テキストを構造化知識に変換する重要な手法であり、金融リスク管理、世論のモニタリングなどに幅広く応用される見込みがある。
イベント抽出方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品を提供する。
第1態様によれば、イベント抽出方法を提供し、前記方法は、イベント記述テキストを取得するステップと、前記イベント記述テキストに基づいて、少なくとも1つの候補イベントタイプを決定するステップであって、前記候補イベントタイプが1組の質問文に対応するステップと、前記質問文に基づいて、前記イベント記述テキストから対応するイベント要素を抽出するステップと、を含む。
第2態様によれば、イベント抽出装置を提供し、前記装置は、イベント記述テキストを取得するための取得モジュールと、前記イベント記述テキストに基づいて、少なくとも1つの候補イベントタイプを決定するための決定モジュールであって、前記候補イベントタイプが1組の質問文に対応する決定モジュールと、前記質問文に基づいて、前記イベント記述テキストから対応するイベント要素を抽出するための抽出モジュールと、を備える。
第3態様によれば、電子機器を提供し、前記電子機器は、少なくとも1つのプロセッサと、該少なくとも1つのプロセッサに通信可能に接続されるメモリと、を備え、前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令が、前記少なくとも1つのプロセッサが本願の実施例のイベント抽出方法を実行できるように、前記少なくとも1つのプロセッサによって実行される。
第4態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提案し、前記コンピュータ命令が、コンピュータに本願の実施例によって開示されるイベント抽出方法を実行させる。
第5態様によれば、コンピュータプログラムを含むコンピュータプログラム製品を提案し、前記コンピュータプログラムがプロセッサによって実行される場合、本願の実施例によって開示されるイベント抽出方法が実現される。
第6態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムがプロセッサによって実行される場合、本願の実施例によって開示されるイベント抽出方法が実現される。
なお、この部分に記載されている内容は、本願の実施例の肝心なまたは重要な特徴を特定することを意図しておらず、本願の範囲を限定するものでもない。本願の他の特徴は、以下の説明を通じて容易に理解される。
図面は、本技術案をよりよく理解するために使用され、本願を限定するものではない。
本願の第1実施例の概略図である。 本願の第2実施例の概略図である。 本願の第3実施例の概略図である。 本願の第4実施例の概略図である。 本願の実施例に係るイベント抽出方法を実現するための電子機器のブロック図である。
以下、図面と組み合わせて本願の例示的な実施例を説明し、理解を容易にするためにその中には本願の実施例の様々な詳細事項が含まれており、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本願の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができる。同様に、わかりやすくかつ簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。
図1は、本願の第1実施例の概略図である。
なお、本実施例に係るイベント抽出方法の実行主体は、イベント抽出装置であり、当該装置は、ソフトウェア及び/又はハードウェアの形態で実装されてもよく、当該装置は、電子機器に配置されてもよく、電子機器は、端末、サーバなどを含み得るが、これらに限定されない。
本願の実施例は、自然言語処理、深層学習、知識グラフなどの人工知能技術の分野に関する。
ここで、人工知能(Artificial Intelligence)は、英文でAIと略される。人工知能は、人間の智能をシミュレート、展開、及び拡張するための理論、方法、技術及び応用システムを研究及び開発する新しい技術科学である。
深層学習は、サンプルデータの内在法則及び表現レベルを学習することであり、これらの学習過程で取得される情報は、文字、画像及び音声などのデータの解釈に大きく寄与する。深層学習の究極的な目標は、機械が人間のように分析学習能力を有することができ、文字、画像及び音声などのデータを認識することができるようにすることである。
自然言語処理は、人間とコンピュータとの間の自然言語による効率的な通信を可能にする様々な理論や方法が実現できる。深層学習は、サンプルデータの内在法則及び表現レベルを学習することであり、これらの学習過程で取得される情報は、文字、画像及び音声などのデータの解釈に大きく寄与する。深層学習の究極的な目標は、機械が、人間のように分析学習能力を有することができ、文字、画像及び音声などのデータを認識することができるようにすることである。
知識グラフは、応用数学、グラフィックス、情報可視化技術、情報科学等の学科の理論及び方法を、計測学引用分析、共起分析などの方法と組み合わせて、可視化グラフを利用して学科のコア構造、発展歴史、最新分野及び全体的な知識アーキテクチャを視覚的に展示して、多学科の融合という目的を達成する現代理論である。
図1に示すように、当該イベント抽出方法は、ステップS101~S103を含む。
S101:イベント記述テキストを取得する。
ここで、イベント記述テキストは、例えば、対応する意味を有するテキストであり、当該イベント記述テキストの意味は、イベントを記述し、イベント記述テキストは、例えば「悲劇!紹興市の世茂で35歳の女性がビルから転落死!」である。
本願の実施例において、電子機器を介してテキスト入力画面を提供し、ユーザによって入力されたテキストを受信して、当該テキストをイベント記述テキストとすることができ、又は、ユーザによって音声で入力された音声のセグメントを解析し、当該音声のセグメントを対応するテキストに変換してイベント記述テキストとすることもでき、これに対して限定しない。
S102:イベント記述テキストに基づいて、少なくとも1つの候補イベントタイプを決定し、候補イベントタイプが1組の質問文に対応する。
上記イベント記述テキストが取得された後、例えば、当該イベント記述テキストに対して意味解析を行って、対応する意味結果を取得することにより、大量の候補イベントタイプから、意味結果にマッチングする少なくとも1つの候補イベントタイプを決定してもよいし、既存の候補イベントタイプを直接決定してもよく、候補イベントタイプは、[イベント死亡]、[イベント結婚]、[イベント教育]、[イベント旅行]などであり得る。
本願の実施例において、各候補イベントタイプは、1組の質問文に対応し、当該質問文は、イベント記述テキストから対応するイベント要素をマッチングするために用いられ、質問文の各組には1つまたは複数の質問文が含まれてもよく、例えば、異なる質問文を用いて、イベント記述テキストから異なるタイプのイベント要素をマッチングすることができる。
例を挙げると、質問文は、例えば[イベント死亡のトリガワードは?]で、また例えば[イベント結婚のトリガワードは?]であり、異なる質問文は、候補イベントタイプに対応してもよく、例えば[イベント死亡のトリガワードは?]は、候補イベントタイプ[イベント死亡]に対応し、[イベント結婚のトリガワードは?]は、候補イベントタイプ[イベント結婚]に対応し、これに対しては限定しない。
S103:質問文に基づいて、イベント記述テキストから対応するイベント要素を抽出する。
上記イベント記述テキストに基づいて、少なくとも1つの候補イベントタイプを決定した後、質問文に基づいて、イベント記述テキストから対応するイベント要素を抽出することができる。
つまり、本願の実施例において、候補イベントタイプに対応する質問文を用いて、イベント記述テキストから対応するイベント要素をマッチングし、質問文に基づいて、イベント記述テキストから対応するイベント要素を抽出するとき、具体的には、意味認識と意味マッチングの方法を用いてイベント記述テキストから対応するイベント要素を抽出することができる。
例を挙げると、質問文が例えば[イベント死亡のトリガワードは?]である場合、イベント記述テキストからマッチングするコンテンツを認識して、抽出されたイベント要素とすることができ、例えば、[イベント死亡のトリガワードは?]にマッチングするコンテンツは、[死亡]である場合、[死亡]を認識されたイベント要素とすることができる。
また例えば、質問文が例えば[イベント結婚のトリガワードは?]である場合、イベント記述テキストからマッチングするコンテンツを認識して、抽出されたイベント要素とすることができ、例えば、上記例示のイベント記述テキストにおける[イベント結婚のトリガワードは?]にマッチングするコンテンツは空である場合、当該イベント記述テキストと質問文[イベント結婚のトリガワードは?]とがマッチングしないこと、即ち、イベント記述テキストに対応するイベントタイプと質問文[イベント結婚のトリガワードは?]に対応する候補イベントタイプとが適合しないことを表す。
いくつかの実施例において、質問文に基づいて、イベント記述テキストから対応するイベント要素を抽出することは、質問文に基づいて、イベント記述テキストからイベントトリガワード、イベントタイプ、イベント引数、及び引数役割を抽出することであってもよく、イベントトリガワード、イベントタイプ、イベント引数、及び引数役割を対応するイベント要素とすることにより、質問文を用いて意味マッチングする方法によるイベントトリガワード、イベントタイプ、イベント引数、及び引数役割の認識をサポートし、質問文に基づいて、イベント記述テキストから完全なイベント要素を認識することができ、イベント要素抽出の完全性を効果的に向上させる。
ここで、イベントトリガワードは、イベントの発生を表すコアワードであり、動詞又は名詞である場合が多く、イベントタイプは、イベントが属する分類であり、イベント引数は、イベントの参加者を表し、主に、エンティティ、値、及び時間から構成される。引数役割は、イベントにおけるイベント引数の役割を表す。
本願の実施例において、質問文を用いて意味マッチングする方法で、イベント記述テキストからイベントトリガワード、イベントタイプ、イベント引数、及び引数役割をマッチングして、イベントトリガワード、イベントタイプ、イベント引数、及び引数役割を対応するイベント要素とする。
イベント記述テキストからイベントトリガワード、イベントタイプ、イベント引数、及び引数役割を迅速で正確に認識することを実現するために、本願の実施例において、さらに、少なくとも1つの第1質問文を含み、第1質問文が1つのイベントタイプに対応し、イベントタイプが少なくとも1つの第2質問文に対応し、第2質問文が1つの引数役割に対応し、第1質問文は、イベント記述テキスト内のイベントトリガワード及びイベントタイプを抽出するために用いられ、第2質問文は、イベント引数及び引数役割を抽出するために用いられるように質問文を構成してもよい。
つまり、本願の実施例における質問文の各組には第1質問文及び第2質問文が含まれ、そして、第1質問文の数は少なくとも1つであり、第1質問文の数が複数である場合、各質問文が1つのイベントタイプに対応し、イベントタイプが少なくとも1つの第2質問文に対応し、第2質問文が1つの引数役割に対応する。
例を挙げると、第1質問文が[イベント死亡のトリガワードは?]であり、対応するイベントタイプが[イベント死亡]である場合、[イベント死亡]は、さらに、少なくとも1つの第2質問文[死亡 死者は誰?]に対応し、第2質問文に対応する引数役割は[死者]であり、ここでの[死亡]は、イベントタイプ[イベント死亡]の略語であってもよく、即ち、各イベントタイプには複数の引数役割が含まれており、[引数役割]は、さらに、例えば時間、場所、シナリオなどの他のコンテンツであってもよく、異なる第2質問文は、イベント記述テキストから、時間、場所、シナリオなどの他の引数役割に対応するイベント引数をマッチングするために用いられることができる。
本実施例において、イベント記述テキストを取得し、イベント記述テキストに基づいて、少なくとも1つの候補イベントタイプを決定し、候補イベントタイプが1組の質問文に対応し、質問文に基づいて、イベント記述テキストから対応するイベント要素を抽出することにより、イベント要素抽出のイベント定義体系への依存性を効果的に低減し、イベント要素の抽出効果を効果的に向上させることができ、優れた一般化能力を有する。
図2は、本願の第2実施例の概略図である。
図2に示すように、当該イベント抽出方法は、ステップS201~S207を含む。
S201:イベント記述テキストを取得する。
S202:イベント記述テキストに基づいて、少なくとも1つの候補イベントタイプを決定し、候補イベントタイプが1組の質問文に対応する。
S201~S202の説明については、上記実施例を参照することができ、ここでは、詳細な説明を省略する。
S203:イベント記述テキストから第1質問文にマッチングするトリガワードを認識し、マッチングするトリガワードをイベントトリガワードとする。
本実施例では、少なくとも1つの第1質問文を含み、第1質問文が1つのイベントタイプに対応し、イベントタイプが少なくとも1つの第2質問文に対応し、第2質問文が1つの引数役割に対応し、第1質問文は、イベント記述テキスト内のイベントトリガワード及びイベントタイプを抽出するために用いられ、第2質問文は、イベント引数及び引数役割を抽出するために用いられるように質問文を構成する実施形態を例示したが、これに対しては限定しない。
例えば、実際の抽出の適用ニーズに応じて、他のコンテンツの質問文を開発し、他のコンテンツの質問文を用いてイベント記述テキストから任意のイベント要素を認識することができ、これに対しては限定しない。
少なくとも1つの第1質問文及び少なくとも1つの第2質問文を含み、第1質問文は、イベント記述テキスト内のイベントトリガワード及びイベントタイプを抽出するために用いられ、第2質問文は、イベント引数及び引数役割を抽出するために用いられるように質問文が構成される場合、イベント記述テキストから第1質問文にマッチングするトリガワードを認識し、マッチングするトリガワードをイベントトリガワードとすることができる。
例を挙げると、第1質問文が[イベント死亡のトリガワードは?]であり、対応するイベントタイプが[イベント死亡]である場合、イベント記述テキスト「悲劇!紹興市の世茂で35歳の女性がビルから転落死!」から認識された第1質問文[イベント死亡のトリガワードは?]にマッチングするトリガワードは[死亡]であり、[イベント死亡のトリガワードは?]の第1質問文に基づいて認識されたコンテンツが空ではないことを表し、[イベント死亡のトリガワードは?]の第1質問文に基づいて認識されたコンテンツが空である場合、第1質問文を用いて対応するトリガワードをマッチングするまで、次の第1質問文をトラバースすることができ、空でない場合、認識されたトリガワードを直接イベントトリガワードとする。
選択可能に、いくつかの実施例において、イベント記述テキストから第1質問文にマッチングするトリガワードを認識することは、イベント記述テキスト及び第1質問文を事前に訓練されたイベントトリガワード抽出モデルに入力して、イベントトリガワード抽出モデルによって出力されたマッチングするトリガワードを取得することであってもよく、事前に訓練されたイベントトリガワード抽出モデルに基づいて、イベント記述テキスト及び第1質問文に対してそれぞれ意味認識、及びトリガワードのマッチング処理を行うため、マッチングするトリガワードを迅速で正確に取得することができる。
イベントトリガワード抽出モデルは、大量の訓練データに基づいて事前に訓練して得られるものであってもよく、例えば、まず、イベント抽出アノテーションデータセットを取得し、イベント抽出アノテーションデータ内のイベントトリガワード及びイベントタイプを認識し、その後、イベント抽出アノテーションデータ内のイベントトリガワード及びイベントタイプのフォーマットを読解質疑と応答フォーマットのイベントトリガワード抽出データセットに変換し、イベント記述テキストを段落とし、イベントタイプによって質問文を構造し、当該イベントタイプで対応するトリガワードを回答とし(現在のイベントが対応するイベントタイプに属しない場合、回答は空)、それにより、読解質疑と応答方式のイベントトリガワード抽出及び対応するイベントタイプ分類モデルを形成し、そして、訓練して得られたモデルをイベントトリガワード抽出モデルとし、当該イベントトリガワード抽出モデルが大量のイベント抽出アノテーションデータセットに基づいて訓練して得られるものであるため、良いトリガワードの認識効果を得ることができる。
S204:第1質問文に対応するイベントタイプを、抽出されたイベントタイプとする。
上記イベント記述テキストから第1質問文にマッチングするトリガワードを認識し、マッチングするトリガワードをイベントトリガワードとすることは、第1質問文に対応するイベントタイプを直接、抽出されたイベントタイプとすることができる。
それにより、質問文とモデル認識とを組み合わせて認識する方式に基づき、イベント記述テキストからイベントトリガワード及びイベントタイプを直接抽出し、イベントトリガワード及びイベントタイプの抽出処理ロジックを簡素化し、イベントトリガワード及びイベントタイプの抽出効率及び抽出精度を向上させ、そして、イベント定義体系における大量のデータアノテーション情報に依存する必要がないため、抽出効果を向上させるとともに、イベントトリガワード及びイベントタイプの抽出のイベント定義体系への依存性を低減した。
S205:抽出されたイベントタイプに対応する少なくとも1つの第2質問文を決定する。
上記イベント記述テキストから第1質問文にマッチングするトリガワードを認識し、マッチングするトリガワードをイベントトリガワードとし、第1質問文に対応するイベントタイプを直接、抽出されたイベントタイプとした後、さらに、抽出されたイベントタイプに対応する少なくとも1つの第2質問文を決定することができ、当該対応する第2質問文は、大量の第2質問文から選択された、抽出されたイベントタイプに対応する第2質問文であってもよい。
つまり、本願の実施例において、まず、イベントトリガワード及びイベントタイプを抽出し、その後、イベントタイプに基づいて対応する第2質問文を決定し、第2質問文がイベント引数及び引数役割を抽出するために用いられ、さらに、第2質問文を用いてイベント引数及び引数役割を効率的に抽出することを効果的にサポートし、そして、第2質問文のデータ量を適時に減らして、イベントタイプを認識した上で、イベント引数及び引数役割を認識するときにより強い目的性を持つことができ、それによってイベント引数及び引数役割の認識効率を大幅に向上させる。
S206:イベント記述テキストから第2質問文にマッチングするイベント引数を認識し、マッチングするイベント引数を、抽出されたイベント引数とする。
上記抽出されたイベントタイプに対応する少なくとも1つの第2質問文を決定した後、イベント記述テキスト及び第2質問文を事前に訓練されたイベント引数抽出モデルに入力して、イベント引数抽出モデルによって出力されたマッチングするイベント引数を取得することができ、事前に訓練されたイベント引数抽出モデルに基づいて、イベント記述テキスト及び少なくとも1つの第2質問文に対してそれぞれ意味認識、及びイベント引数のマッチング処理を行うため、マッチングするイベント引数を迅速で正確に取得することができる。
イベント引数抽出モデルは、大量の訓練データに基づいて事前に訓練して得られるものであってもよく、例えば、まず、イベント抽出アノテーションデータセットを取得し、イベント抽出アノテーションデータ内のイベント引数及び引数役割を認識し、その後、イベント抽出アノテーションデータ結果内のイベント引数及び引数役割のフォーマットを読解質疑と応答フォーマットのイベント引数抽出データセットに変換し、イベント記述テキストを段落とし、イベントタイプと引数役割とを用いて問題を構造し、対応するイベント引数を回答として、初期のイベント引数抽出モデル(例えば、人工知能におけるニューラルネットワークモデル)を訓練し、訓練して得られたモデルをイベント引数抽出モデルとし、当該イベント引数抽出モデルが大量のイベント抽出アノテーションデータセットに基づいて訓練して得られるものであるため、イベント引数及び引数役割の良い認識効果を得ることができる。
S207:第2質問文に対応する引数役割を、抽出された引数役割とする。
例を挙げると、イベント記述テキストが「悲劇!紹興市の世茂で35歳の女性がビルから転落死!」であり、第2質問文が[死者は?]であり、第2質問文に対応する引数役割が[死者]である場合、マッチングするイベント引数は[紹興市の世茂で35歳の女性]であり、抽出された引数役割は[死者]であると認識される。
上記イベント記述テキストから第2質問文にマッチングするイベント引数を認識することは、第2質問文に対応する引数役割を直接、抽出された引数役割とすることができる。
それにより、質問文とモデルとを組み合わせて認識する方式に基づき、イベント記述テキストから引数役割及びイベント引数を直接抽出し、引数役割及びイベント引数の抽出処理ロジックを簡素化し、引数役割及びイベント引数の抽出効率及び抽出精度を向上させ、そして、イベント定義体系における大量のデータアノテーション情報に依存する必要がないため、抽出効果を向上させるとともに、引数役割及びイベント引数の抽出のイベント定義体系への依存性を低減した。
本実施例において、イベント記述テキストを取得し、イベント記述テキストに基づいて、少なくとも1つの候補イベントタイプを決定し、候補イベントタイプが1組の質問文に対応し、質問文に基づいて、イベント記述テキストから対応するイベント要素を抽出することにより、イベント要素抽出のイベント定義体系への依存性を効果的に低減し、イベント要素の抽出効果を効果的に向上させることができ、そして、優れた一般化能力を有する。まず、イベントトリガワード及びイベントタイプを抽出し、その後、イベントタイプに基づいて対応する第2質問文を決定し、第2質問文がイベント引数及び引数役割を抽出するために用いられ、さらに、第2質問文を用いてイベント引数及び引数役割を効率的に抽出することを効果的にサポートし、第2質問文のデータ量を適時に減らして、イベントタイプを認識した上で、イベント引数及び引数役割を認識するときにより強い目的性を持つことができ、それによってイベント引数及び引数役割の認識効率を大幅に向上させる。質問文とモデルとを組み合わせて認識する方式に基づき、イベント記述テキストからイベントトリガワード、イベントタイプ、引数役割及びイベント引数を直接抽出し、前記イベント要素の抽出処理ロジックを簡素化し、イベント要素の抽出効率及び抽出精度を向上させ、そして、イベント定義体系における大量のデータアノテーション情報に依存する必要がないため、抽出効果を向上させるとともに、イベント要素抽出のイベント定義体系への依存性を低減した。
図3は、本願の第3実施例の概略図である。
図3に示すように、当該イベント抽出装置30は、イベント記述テキストを取得するための取得モジュール301と、イベント記述テキストに基づいて、少なくとも1つの候補イベントタイプを決定するための決定モジュール302であって、候補イベントタイプが1組の質問文に対応する決定モジュール302と、質問文に基づいて、イベント記述テキストから対応するイベント要素を抽出するための抽出モジュール303と、を備える。
選択可能に、いくつかの実施例において、図4を参照すると、図4は、本願の第4実施例の概略図であり、当該イベント抽出装置40は、取得モジュール401、決定モジュール402、及び抽出モジュール403を備え、ここで、抽出モジュール403は、質問文に基づいて、イベント記述テキストからイベントトリガワード、イベントタイプ、イベント引数、及び引数役割を抽出するための抽出サブモジュール4031と、イベントトリガワード、イベントタイプ、イベント引数、及び引数役割を対応するイベント要素とするための取得サブモジュール4032と、を備える。
選択可能に、いくつかの実施例において、質問文が少なくとも1つの第1質問文を含み、第1質問文が1つのイベントタイプに対応し、イベントタイプが少なくとも1つの第2質問文に対応し、第2質問文が1つの引数役割に対応し、第1質問文は、イベント記述テキスト内のイベントトリガワード及びイベントタイプを抽出するために用いられ、第2質問文は、イベント引数及び引数役割を抽出するために用いられる。
選択可能に、いくつかの実施例において、抽出サブモジュール4031は、具体的には、イベント記述テキストから第1質問文にマッチングするトリガワードを認識し、マッチングするトリガワードをイベントトリガワードとし、第1質問文に対応するイベントタイプを、抽出されたイベントタイプとする。
選択可能に、いくつかの実施例において、抽出サブモジュール4031は、さらに、抽出されたイベントタイプに対応する少なくとも1つの第2質問文を決定し、イベント記述テキストから第2質問文にマッチングするイベント引数を認識し、マッチングするイベント引数を、抽出されたイベント引数とし、第2質問文に対応する引数役割を、抽出された引数役割とする。
選択可能に、いくつかの実施例において、抽出サブモジュール4031は、さらに、イベント記述テキスト及び第1質問文を事前に訓練されたイベントトリガワード抽出モデルに入力して、イベントトリガワード抽出モデルによって出力されたマッチングするトリガワードを取得する。
選択可能に、いくつかの実施例において、抽出サブモジュール4031は、さらに、イベント記述テキスト及び第2質問文を事前に訓練されたイベント引数抽出モデルに入力して、イベント引数抽出モデルによって出力されたマッチングするイベント引数を取得する。
本実施例において、図4のイベント抽出装置40と上記実施例のイベント抽出装置30、取得モジュール401と上記実施例の取得モジュール301、決定モジュール402と上記実施例の決定モジュール302、抽出モジュール403と上記実施例の抽出モジュール303は、同じ機能及び構造を有してもよい。
なお、イベント抽出方法に対する上記の解釈と説明は、本実施例のイベント抽出装置にも適用でき、ここでは詳細な説明を省略する。
本実施例において、イベント記述テキストを取得し、イベント記述テキストに基づいて、少なくとも1つの候補イベントタイプを決定し、候補イベントタイプが1組の質問文に対応し、質問文に基づいて、イベント記述テキストから対応するイベント要素を抽出することにより、イベント要素抽出のイベント定義体系への依存性を効果的に低減し、イベント要素の抽出効果を効果的に向上させることができ、そして、優れた一般化能力を有する。
本願の実施例によれば、本願は、電子機器及び読み取り可能な記憶媒体をさらに提供する。
本願の実施例によれば、本願は、コンピュータプログラムを提供し、コンピュータプログラムがプロセッサによって実行される場合、本願によって提供されるイベント抽出方法が実現される。
図5に示すように、図5は、本願の実施例のイベント抽出方法を実施するための電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタルプロセッサ、携帯電話、スマートフォン、ウェアラブルデバイス、他の類似するコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び/又は要求される本願の実現を制限することを意図したものではない。
図5に示すように、当該電子機器は、1つ又は複数のプロセッサ501と、メモリ502と、高速インターフェース及び低速インターフェースを備える各コンポーネントを接続するためのインターフェースと、を備える。各コンポーネントは、異なるバスで相互に接続され、共通のマザーボードに取り付けられるか、又は必要に応じて他の方式で取り付けることができる。プロセッサは、電子機器内で実行される命令を処理することができ、当該命令は、外部入力/出力装置(例えば、インターフェースに結合されたディスプレイデバイスなど)にGUIの図形情報をディスプレイするためにメモリ内又はメモリに記憶されている命令を含む。他の実施形態では、必要に応じて、複数のプロセッサ及び/又は複数のバスを、複数のメモリと一緒に使用することができる。同様に、複数の電子機器を接続することができ、各電子機器は、一部の必要な操作(例えば、サーバアレイ、1グループのブレードサーバ、又はマルチプロセッサシステムとする)を提供することができる。図5では、1つのプロセッサ501を例とする。
メモリ502は、本願により提供される非一時的なコンピュータ読み取り可能な記憶媒体である。ここで、前記メモリには、少なくとも1つのプロセッサが本願により提供されるイベント抽出方法を実行するように、少なくとも1つのプロセッサによって実行可能な命令が記憶されている。本願の非一時的なコンピュータ読み取り可能な記憶媒体には、コンピュータに本願により提供されるイベント抽出方法を実行させるためのコンピュータ命令が記憶されている。
メモリ502は、非一時的なコンピュータ読み取り可能な記憶媒体として、本願の実施例におけるイベント抽出方法に対応するプログラム命令/モジュール(例えば、図3に示す取得モジュール301、決定モジュール302、抽出モジュール303)のような、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶する。プロセッサ501は、メモリ502に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち上記の方法の実施例におけるイベント抽出方法を実現する。
メモリ502は、プログラムストレージエリアとデータストレージエリアとを含むことができ、ここで、プログラムストレージエリアは、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションプログラムを記憶することができ、データストレージエリアは、イベント抽出方法を実行する電子機器の使用によって作成されたデータなどを記憶することができる。また、メモリ502は、高速ランダムアクセスメモリを備えることができ、非一時的なメモリをさらに備えることができ、例えば、少なくとも1つの磁気ディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスである。いくつかの実施例では、メモリ502は、プロセッサ501に対して遠隔に設定されたメモリを選択的に備えることができ、これらの遠隔メモリは、ネットワークを介して電子機器に接続されることができる。上記のネットワークの例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びその組み合わせを含むが、これらに限定されない。
当該電子機器は、入力装置503と出力装置504とをさらに備えることができる。プロセッサ501、メモリ502、入力装置503、及び出力装置504は、バス又は他の方式を介して接続することができ、図5では、バスを介して接続することを例とする。
入力装置503は、入力された数字又は文字情報を受信し、当該電子機器のユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置504は、ディスプレイデバイス、補助照明装置(例えば、LED)、及び触覚フィードバックデバイス(例えば、振動モータ)などを備えることができる。当該ディスプレイデバイスは、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを備えることができるが、これらに限定されない。いくつかの実施形態で、ディスプレイデバイスは、タッチスクリーンであってもよい。
本明細書で説明されるシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムで実施され、当該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを備えるプログラム可能なシステムで実行及び/又は解釈されることができ、当該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってもよく、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも1つの入力装置、及び当該少なくとも1つの出力装置に伝送することができる。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含むことができ、高レベルのプロセス及び/又は対象指向プログラミング言語、及び/又はアセンブリ/機械言語でこれらのコンピューティングプログラムを実施することができる。本明細書に使用されるような、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。
ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータ上で実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、任意の形態(音響入力と、音声入力と、触覚入力とを含む)でユーザからの入力を受信することができる。
ここで説明されるシステム及び技術は、バックエンドコンポーネントを備えるコンピューティングシステム(例えば、データサーバとする)、又はミドルウェアコンポーネントを備えるコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンドコンポーネントを備えるコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータであり、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする)、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを備えるコンピューティングシステムで実施することができる。任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットとを含む。
コンピュータシステムは、クライアントとサーバとを備えることができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、かつ互いにクライアント-サーバの関係を有するコンピュータプログラムによって、クライアントとサーバとの関係が生成される。サーバは、クラウドコンピューティングサーバまたはクラウドホストとも呼ばれるクラウドサーバであってもよく、従来の物理ホスト及びVPSサービス(“Virtual Private Server”、略称“VPS”)は、管理が難しく、サービス拡張性が弱いという欠点を解決するための、クラウドコンピューティングサービスシステムにおけるホスト製品の1つである。サーバは、分散システムのサーバであっても、ブロックチェーンと組み合わせたサーバであってもよい。
上記に示される様々な形態のフローを使用して、ステップを並べ替え、追加、又は削除することができる。例えば、本願に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本願で開示されている技術案が所望の結果を実現することができれば、本明細書では限定しない。
上記の具体的な実施形態は、本願の保護範囲を制限するものではない。当業者は、設計要件と他の要因に基づいて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。本願の精神と原則内で行われる任意の修正、同等の置換、及び改善などは、いずれも本願の保護範囲内に含まれるべきである。

Claims (15)

  1. コンピュータによって実行されるイベント抽出方法であって、
    イベント記述テキストを取得するステップと、
    前記イベント記述テキストに基づいて、少なくとも1つの候補イベントタイプを決定するステップであって、前記候補イベントタイプが1組の質問文に対応するステップと、
    前記質問文に基づいて、前記イベント記述テキストから対応するイベント要素を抽出するステップと、
    を含み、
    前記質問文に基づいて、前記イベント記述テキストから対応するイベント要素を抽出するステップが、
    前記質問文に基づいて、前記イベント記述テキストからイベントトリガワード、イベントタイプ、イベント引数及び引数役割を抽出するステップと、
    前記イベントトリガワード、前記イベントタイプ、前記イベント引数及び前記引数役割を前記対応するイベント要素とするステップと、
    を含むイベント抽出方法。
  2. 前記質問文が、少なくとも1つの第1質問文を含み、前記第1質問文が1つの前記イベントタイプに対応し、前記イベントタイプが少なくとも1つの第2質問文に対応し、前記第2質問文が1つの引数役割に対応し、前記第1質問文が、前記イベント記述テキスト内の前記イベントトリガワード及び前記イベントタイプを抽出するために用いられ、前記第2質問文が、前記イベント引数及び前記引数役割を抽出するために用いられる請求項に記載の方法。
  3. 前記質問文に基づいて、前記イベント記述テキストからイベントトリガワード及びイベントタイプを抽出するステップが、
    前記イベント記述テキストから前記第1質問文にマッチングするトリガワードを認識し、前記マッチングするトリガワードを前記イベントトリガワードとするステップと、
    前記第1質問文に対応する前記イベントタイプを、抽出されたイベントタイプとするステップと、
    を含む請求項に記載の方法。
  4. 前記質問文に基づいて、前記イベント記述テキストから前記イベント引数及び前記引数役割を抽出するステップが、
    前記抽出されたイベントタイプに対応する少なくとも1つの第2質問文を決定するステップと、
    前記イベント記述テキストから前記第2質問文にマッチングするイベント引数を認識し、前記マッチングするイベント引数を、抽出されたイベント引数とするステップと、
    前記第2質問文に対応する前記引数役割を、抽出された引数役割とするステップと、
    を含む請求項に記載の方法。
  5. 前記イベント記述テキストから前記第1質問文にマッチングするトリガワードを認識するステップが、
    前記イベント記述テキスト及び前記第1質問文を事前に訓練されたイベントトリガワード抽出モデルに入力して、前記イベントトリガワード抽出モデルによって出力された前記マッチングするトリガワードを取得するステップを含む請求項に記載の方法。
  6. 前記イベント記述テキストから前記第2質問文にマッチングするイベント引数を認識するステップが、
    前記イベント記述テキスト及び前記第2質問文を事前に訓練されたイベント引数抽出モデルに入力して、前記イベント引数抽出モデルによって出力された前記マッチングするイベント引数を取得するステップを含む請求項に記載の方法。
  7. イベント記述テキストを取得するための取得モジュールと、
    前記イベント記述テキストに基づいて、少なくとも1つの候補イベントタイプを決定するための決定モジュールであって、前記候補イベントタイプが1組の質問文に対応する決定モジュールと、
    前記質問文に基づいて、前記イベント記述テキストから対応するイベント要素を抽出するための抽出モジュールと、
    を備え、
    前記抽出モジュールが、
    前記質問文に基づいて、前記イベント記述テキストからイベントトリガワード、イベントタイプ、イベント引数及び引数役割を抽出するための抽出サブモジュールと、
    前記イベントトリガワード、前記イベントタイプ、前記イベント引数及び前記引数役割を前記対応するイベント要素とするための取得サブモジュールと、
    を備えるイベント抽出装置。
  8. 前記質問文が、少なくとも1つの第1質問文を含み、前記第1質問文が1つの前記イベントタイプに対応し、前記イベントタイプが少なくとも1つの第2質問文に対応し、前記第2質問文が1つの引数役割に対応し、前記第1質問文が、前記イベント記述テキスト内の前記イベントトリガワード及び前記イベントタイプを抽出するために用いられ、前記第2質問文が、前記イベント引数及び前記引数役割を抽出するために用いられる請求項に記載の装置。
  9. 前記抽出サブモジュールが、
    前記イベント記述テキストから前記第1質問文にマッチングするトリガワードを認識し、前記マッチングするトリガワードを前記イベントトリガワードとし、
    前記第1質問文に対応する前記イベントタイプを、抽出されたイベントタイプとする請求項に記載の装置。
  10. 前記抽出サブモジュールが、
    前記抽出されたイベントタイプに対応する少なくとも1つの第2質問文を決定し、
    前記イベント記述テキストから前記第2質問文にマッチングするイベント引数を認識し、前記マッチングするイベント引数を、抽出されたイベント引数とし、
    前記第2質問文に対応する前記引数役割を、抽出された引数役割とする請求項に記載の装置。
  11. 前記抽出サブモジュールが、
    前記イベント記述テキスト及び前記第1質問文を事前に訓練されたイベントトリガワード抽出モデルに入力して、前記イベントトリガワード抽出モデルによって出力された前記マッチングするトリガワードを取得する請求項に記載の装置。
  12. 前記抽出サブモジュールが、
    前記イベント記述テキスト及び前記第2質問文を事前に訓練されたイベント引数抽出モデルに入力して、前記イベント引数抽出モデルによって出力された前記マッチングするイベント引数を取得する請求項10に記載の装置。
  13. 少なくとも1つのプロセッサと、
    該少なくとも1つのプロセッサに通信可能に接続されるメモリと、
    を備え、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令が、前記少なくとも1つのプロセッサが請求項1からのいずれか一項に記載の方法を実行できるように、前記少なくとも1つのプロセッサによって実行される電子機器。
  14. コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ命令が、コンピュータに請求項1からのいずれか一項に記載の方法を実行させる非一時的なコンピュータ読み取り可能な記憶媒体。
  15. プロセッサによって実行される場合、請求項1からのいずれか一項に記載の方法が実現されるコンピュータプログラム。
JP2021191869A 2020-11-26 2021-11-26 イベント抽出方法、装置、電子機器及び記憶媒体 Active JP7228662B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011356616.4 2020-11-26
CN202011356616.4A CN112507700A (zh) 2020-11-26 2020-11-26 事件抽取方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
JP2022031804A JP2022031804A (ja) 2022-02-22
JP7228662B2 true JP7228662B2 (ja) 2023-02-24

Family

ID=74966798

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021191869A Active JP7228662B2 (ja) 2020-11-26 2021-11-26 イベント抽出方法、装置、電子機器及び記憶媒体

Country Status (5)

Country Link
US (1) US20220004714A1 (ja)
EP (1) EP3910492A3 (ja)
JP (1) JP7228662B2 (ja)
KR (1) KR20210124938A (ja)
CN (1) CN112507700A (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112905868A (zh) * 2021-03-22 2021-06-04 京东方科技集团股份有限公司 事件抽取方法、装置、设备及存储介质
US11893345B2 (en) 2021-04-06 2024-02-06 Adobe, Inc. Inducing rich interaction structures between words for document-level event argument extraction
CN113392213B (zh) * 2021-04-19 2024-05-31 合肥讯飞数码科技有限公司 事件抽取方法以及电子设备、存储装置
CN113241138B (zh) * 2021-06-21 2022-06-17 中国平安人寿保险股份有限公司 医疗事件信息的抽取方法、装置、计算机设备及存储介质
CN114118049B (zh) * 2021-10-28 2023-09-22 北京百度网讯科技有限公司 信息获取方法、装置、电子设备及存储介质
CN114741516A (zh) * 2021-12-08 2022-07-12 商汤国际私人有限公司 一种事件抽取方法和装置、电子设备及存储介质
CN114492377B (zh) * 2021-12-30 2024-04-16 永中软件股份有限公司 一种事件角色的标注方法和计算机设备、计算机可读存储介质
CN114676271A (zh) * 2022-03-07 2022-06-28 上海安硕企业征信服务有限公司 事件抽取方法、装置、电子设备及存储介质
CN115062137B (zh) * 2022-08-15 2022-11-04 中科雨辰科技有限公司 一种基于主动学习确定异常文本的数据处理***
CN115238685B (zh) * 2022-09-23 2023-03-21 华南理工大学 一种基于位置感知的建筑工程变更事件联合抽取方法
CN115827848B (zh) * 2023-02-10 2023-06-23 天翼云科技有限公司 一种知识图谱事件抽取方法、装置、设备和存储介质
CN116451787B (zh) * 2023-02-16 2023-12-26 阿里巴巴(中国)有限公司 内容风险识别方法、装置、***及设备
CN116628210B (zh) * 2023-07-24 2024-03-19 广东美的暖通设备有限公司 基于对比学习对智慧楼宇故障事件抽取的故障确定方法
CN116701576B (zh) * 2023-08-04 2023-10-10 华东交通大学 无触发词的事件检测方法和***
CN117454987B (zh) * 2023-12-25 2024-03-19 临沂大学 基于事件自动抽取的矿山事件知识图谱构建方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150154263A1 (en) 2013-12-02 2015-06-04 Qbase, LLC Event detection through text analysis using trained event template models
CN111401033A (zh) 2020-03-19 2020-07-10 北京百度网讯科技有限公司 事件抽取方法、事件抽取装置和电子设备
CN111414482A (zh) 2020-03-20 2020-07-14 北京百度网讯科技有限公司 一种事件论元抽取方法、装置以及电子设备
CN111967268A (zh) 2020-06-30 2020-11-20 北京百度网讯科技有限公司 文本中的事件抽取方法、装置、电子设备和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3322313B2 (ja) * 1991-09-13 2002-09-09 日本電信電話株式会社 事象解析器
CN104156352B (zh) * 2014-08-15 2017-04-19 苏州大学 一种中文事件的处理方法及***
CN111325020B (zh) * 2020-03-20 2023-03-31 北京百度网讯科技有限公司 一种事件论元抽取方法、装置以及电子设备
US11687385B2 (en) * 2020-05-21 2023-06-27 International Business Machines Corporation Unsupervised event extraction
CN111651581A (zh) * 2020-06-05 2020-09-11 腾讯科技(深圳)有限公司 文本处理方法、装置、计算机设备及计算机可读存储介质
CN111753522A (zh) * 2020-06-29 2020-10-09 深圳壹账通智能科技有限公司 事件抽取方法、装置、设备以及计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150154263A1 (en) 2013-12-02 2015-06-04 Qbase, LLC Event detection through text analysis using trained event template models
CN111401033A (zh) 2020-03-19 2020-07-10 北京百度网讯科技有限公司 事件抽取方法、事件抽取装置和电子设备
CN111414482A (zh) 2020-03-20 2020-07-14 北京百度网讯科技有限公司 一种事件论元抽取方法、装置以及电子设备
CN111967268A (zh) 2020-06-30 2020-11-20 北京百度网讯科技有限公司 文本中的事件抽取方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
US20220004714A1 (en) 2022-01-06
EP3910492A3 (en) 2022-03-16
KR20210124938A (ko) 2021-10-15
JP2022031804A (ja) 2022-02-22
EP3910492A2 (en) 2021-11-17
CN112507700A (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
JP7228662B2 (ja) イベント抽出方法、装置、電子機器及び記憶媒体
JP7223785B2 (ja) 時系列ナレッジグラフ生成方法、装置、デバイス及び媒体
EP3933660A1 (en) Method and apparatus for extracting event from text, electronic device, and storage medium
JP7292321B2 (ja) イベント引数抽出方法、イベント引数抽出装置、電子デバイス、記憶媒体及びコンピュータプログラム製品
JP7283009B2 (ja) 対話理解モデルの訓練方法、装置、デバイス及び記憶媒体
CN111325020B (zh) 一种事件论元抽取方法、装置以及电子设备
JP7264866B2 (ja) イベント関係の生成方法、装置、電子機器及び記憶媒体
JP2021184237A (ja) データセット処理方法、装置、電子機器及び記憶媒体
CN112347769B (zh) 实体识别模型的生成方法、装置、电子设备及存储介质
JP7178441B2 (ja) 要約生成方法、装置、プログラム、電子デバイス及び記憶媒体
EP4113357A1 (en) Method and apparatus for recognizing entity, electronic device and storage medium
JP2021099890A (ja) 因果関係の判別方法、装置、電子機器及び記憶媒体
JP2021184255A (ja) 語義表現モデルの生成方法、語義表現モデルの生成装置、電子機器、記憶媒体及びコンピュータプログラム
JP7397903B2 (ja) インテリジェント対話方法、装置、電子機器及び記憶媒体
CN113220836A (zh) 序列标注模型的训练方法、装置、电子设备和存储介质
KR20210127120A (ko) 의료 데이터 검증 방법, 장치 및 전자 기기
JP7395553B2 (ja) 文章翻訳方法、装置、電子機器及び記憶媒体
JP2022003537A (ja) 対話意図の認識方法及び装置、電子機器並びに記憶媒体
CN114281968A (zh) 一种模型训练及语料生成方法、装置、设备和存储介质
JP2022106980A (ja) クエリ文の生成方法、装置、電子機器及び記憶媒体
EP3869382A2 (en) Method and device for determining answer of question, storage medium and computer program product
CN112269884B (zh) 信息抽取方法、装置、设备及存储介质
JP2022028889A (ja) 対話生成方法、装置、電子機器及び記憶媒体
JP7242797B2 (ja) 語句処理方法、機器及び記憶媒体
CN113902005A (zh) 语言模型的预训练方法、装置、设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230213

R150 Certificate of patent or registration of utility model

Ref document number: 7228662

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150