CN111639494A - 案件事理关系确定方法及*** - Google Patents

案件事理关系确定方法及*** Download PDF

Info

Publication number
CN111639494A
CN111639494A CN202010312498.0A CN202010312498A CN111639494A CN 111639494 A CN111639494 A CN 111639494A CN 202010312498 A CN202010312498 A CN 202010312498A CN 111639494 A CN111639494 A CN 111639494A
Authority
CN
China
Prior art keywords
event
case
word segmentation
determining
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010312498.0A
Other languages
English (en)
Inventor
张世琨
李皓辰
乔子乐
李伟平
赵文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202010312498.0A priority Critical patent/CN111639494A/zh
Publication of CN111639494A publication Critical patent/CN111639494A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Technology Law (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供了一种案件事理关系确定方法及***,所述方法包括采集案件的描述文本,并确定所述案件的属性对应的所有事件类型;对所述描述文本进行分词处理,得到分词结果,并从所述分词结果中提取所述案件中的实体信息;基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息;基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系。本发明实施例通过将案件以事件为核心结构化拆解,并以此确定案件事理关系的方法,充分使用了事件信息,可以用于构造事件逻辑链条、元事件预测、动机分析等下游任务,可以进一步达到完成相关法条查找、自动判决等智慧法学任务的效果。

Description

案件事理关系确定方法及***
技术领域
本发明涉及法律信息处理技术领域,更具体地,涉及案件事理关系确定方法及***。
背景技术
在案件侦查过程中,对案件信息进行分析至关重要。现有技术中通常采用结构表的形式对案件信息进行分析,使用时间、案件当事人、地点以及行为等关键词进行案件信息提取,构建表格,并通过查找表格的方式进行后续案情分析、相关法查找、自动判决等后续任务。
但是现有技术中提供的这种方法,并没有考虑案件中一系列事件之间的事理关系,将同一案件下事件与事件进行割裂,进而无法进行当事人动机分析、情感分析等深层分析,在进行相关法条查找、自动判决等任务时丢失了大量信息。
因此,现急需提供一种案件事理关系确定方法及***。
发明内容
为克服上述问题或者至少部分地解决上述问题,本发明实施例提供了一种案件事理关系确定方法及***。
第一方面,本发明实施例提供了一种案件事理关系确定方法,包括:
采集案件的描述文本,并确定所述案件的属性对应的所有事件类型;
对所述描述文本进行分词处理,得到分词结果,并从所述分词结果中提取所述案件中的实体信息;
基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息;
基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系。
优选地,所述从所述分词结果中提取所述案件中的实体信息,具体包括:
将所述分词结果输入至长短期记忆神经网络模型,由所述长短期记忆神经网络模型输出所述案件中的实体信息;
所述长短期记忆神经网络模型采用基于自注意力的特征提取器进行特征提取,且由样本词及所述样本词对应的实体信息训练得到。
优选地,所述长短期记忆神经网络模型的输出层基于Softmax函数或条件随机场构建。
优选地,所述基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息,具体包括:
将所述分词结果输入至目标神经网络模型,由所述目标神经网络模型输出所述案件中每一事件对应的事件信息;
所述目标神经网络模型由样本词所属的事件以及所述样本词所属的事件对应的事件信息训练得到,所述样本词所属的事件对应于所有事件类型以及所述实体信息。
优选地,所述事件信息包括事件触发、事件类型和事件论元;相应地,
所述将所述分词结果输入至目标神经网络模型,由所述目标神经网络模型输出所述案件中每一事件对应的事件信息,具体包括:
所述目标神经网络模型基于管道模型,首先识别出所述分词结果中每一事件对应的事件触发,然后确定与所述事件触发对应的事件类型,最后确定与所述事件触发对应的事件论元。
优选地,所述目标神经网络模型具体为卷积神经网络模型和/或循环神经网络模型。
优选地,所述事件信息包括事件触发、事件类型和事件论元;
相应地,所述基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系,具体包括:
根据所述案件中每一事件对应的事件类型,基于事件类型的上下位关系,确定所述案件中所有事件之间的上下位关系;
根据所述案件中每一事件对应的事件触发、事件类型和事件论元,确定所述案件中所有事件之间的顺承关系。
第二方面,本发明实施例提供了一种案件事理关系确定***,包括:事件类型确定模块、实体信息提取模块、事件信息提取模块以及事理关系确定模块。其中,
事件类型确定模块用于采集案件的描述文本,并确定所述案件中包含的所有事件类型;
实体信息提取模块用于对所述描述文本进行分词处理,得到分词结果,并从所述分词结果中提取所述案件中的实体信息;
事件信息提取模块用于基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息;
事理关系确定模块用于基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系。
第三方面,本发明实施例提供了一种电子设备,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述的案件事理关系确定方法的步骤。
第四方面,本发明实施例提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所述的案件事理关系确定方法的步骤。
本发明实施例提供的一种案件事理关系确定方法及***,所述方法包括采集案件的描述文本,并确定所述案件的属性对应的所有事件类型;对所述描述文本进行分词处理,得到分词结果,并从所述分词结果中提取所述案件中的实体信息;基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息;基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系。本发明实施例通过将案件以事件为核心结构化拆解,并以此确定案件事理关系的方法,充分使用了事件信息,可以用于构造事件逻辑链条、元事件预测、动机分析等下游任务,可以进一步达到完成相关法条查找、自动判决等智慧法学任务的效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种案件事理关系确定方法的流程示意图;
图2为本发明实施例提供的一种案件事理关系确定方法中构成的有向无环图的示意图;
图3为本发明实施例提供的一种案件事理关系确定***的结构示意图;
图4为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种案件事理关系确定方法,包括:
S1,采集案件的描述文本,并确定所述案件中包含的所有事件类型;
S2,对所述描述文本进行分词处理,得到分词结果,并从所述分词结果中提取所述案件中的实体信息;
S3,基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息;
S4,基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系。
具体地,本发明实施例中提供的案件事理关系确定方法,其执行主体为服务器,具体可以是本地服务器,也可以是云端服务器,本地服务器可以为电脑,本发明实施例中对此不作具体限定。
首先执行步骤S1,采集案件的描述文本,案件是指包含有若干事件的组合,案件的属性是指案件的类型,可以是行政处罚案件,也可以是刑事案件,还可以是其他需要确定内部包含的事件之间的事理关系的案件,本发明实施例中对此不作具体限定。案件中包含的每个事件均是由事件当事人、事件发生时间和事件发生地点等事件论元以及事件触发组成,事件触发是指事件涉及的动作行为。本发明实施例中,案件的描述文本是指将案件的事件论元以及事件触发等通过文本的方式记录得到的内容。在采集案件的描述文本后,可以通过专家讨论的形式确定出案件的属性对应的所有事件类型,例如若案件的属性为行政处罚案件,则对应的所有事件类型可以包括攻击事件、盗窃事件、诈骗事件、处罚事件、罚款事件、没收事件等。本发明实施例中可以在确定出案件的属性对应的所有事件类型后,使所有事件类型组成一个集合,该集合即为事件类型集合。还可以确定出事件类型集合内所有事件类型的上下位关系,形成树状图。事件类型的上下位关系是指事件类型之间的包含或者被包含关系,例如处罚事件是罚款事件、没收事件等的上位概念,罚款事件、没收事件等是处罚事件的下位概念,即处罚事件中包含有罚款事件以及没收事件等。
然后执行步骤S2,对描述文本进行分句处理以及分词处理,描述文本中的每句内容中均可能包含一个或多个事件类型,使用中文法律事件抽取技术进行事件的发现和事件论元的提取;使用添加法律字典的中文分词技术对描述文本中的每句内容进行分词,将描述文本中的每句内容拆分成若干个词的列表,所有单个词构成分词结果。将每个词进行分类,确定案件中的实体信息。其中,实体信息是指整个案件中涉及的时间、地点、人物、动作等信息,确定案件中实体信息的过程就是确定每个词所属类别的过程。
然后执行步骤S3,基于所有事件类型以及案件中的实体信息,从分词结果中提取案件中每一事件对应的事件信息。即根据所有事件类型,在分词结果中以事件为单位,抽取出若干事件,每一事件对应的事件信息包括事件触发、事件类型以及事件论元等。本发明实施例中还可以对抽取出的事件进行编号,即每一事件对应的事件信息还包括事件编号。本发明实施例中可以对每一事件对应的事件信息进行存储,存储方式可以是将该事件对应的事件编号、事件类型、事件触发以及事件论元联合进行存储。需要说明的是,事件触发、事件以及事件编号是一一对应的,即一个事件只有一个编号,也只有一个事件触发,不同事件触发对应不同的事件。同一事件类型可以对应不同的事件触发,即对应不同的事件。也就是说,不同的事件可以具有相同的事件类型。
最后执行步骤S4,根据步骤S3确定的案件中每一事件对应的事件信息,确定出案件中所有事件之间的事理关系。其中,事理关系可以包括上下位关系和顺承关系,上下位关系是指事件的包含或者被包含关系,顺承关系是指事件的条件关系和因果关系。
本发明实施例中还可以根据案件中所有事件之间的事理关系,构造出所有事件之间的有向无环图(Directed Acyclic Graph,DAG),使得事理关系更加直观。例如,经过本发明实施例中提供的方法确定案件中包括超载事件、没收事件、缴纳事件、罚款事件以及归还事件,则构造的有向无环图如图2所示。
本发明实施例中提供的案件事理关系确定方法,包括采集案件的描述文本,并确定所述案件的属性对应的所有事件类型;对所述描述文本进行分词处理,得到分词结果,并从所述分词结果中提取所述案件中的实体信息;基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息;基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系。本发明实施例通过将案件以事件为核心结构化拆解,并以此确定案件事理关系的方法,充分使用了事件信息,可以用于构造事件逻辑链条、元事件预测、动机分析等下游任务,可以进一步达到完成相关法条查找、自动判决等智慧法学任务的效果。
在上述实施例的基础上,本发明实施例中提供的案件事理关系确定方法,从所述分词结果中提取所述案件中的实体信息,具体包括:
将所述分词结果输入至长短期记忆神经网络模型,由所述长短期记忆神经网络模型输出所述案件中的实体信息;
所述长短期记忆神经网络模型采用基于自注意力的特征提取器进行特征提取,且由样本词及所述样本词对应的实体信息训练得到。
具体地,本发明实施例中在执行步骤S2中从分词结果中提取案件中的实体信息时,具体可以通过长短期记忆神经网络(Long Short-TermMemory,LSTM)模型实现,将分词结果输入至LSTM模型,由LSTM模型进行实体抽取,并输出实体信息。其中,LSTM模型可以结合基于自注意力的特征提取器(Transformer),通过Transformer进行特征提取。LSTM模型的输出层可以采用Softmax函数实现,也可以采用条件随机场(Conditional RandomFields,CRF)实现,本发明实施例中对此不作具体限定。
本发明实施例中提供的案件事理关系确定方法,采用长短期记忆神经网络模型,并结合基于自注意力的特征提取器以及条件随机场,使得实体信息的提取效率更高,且提取的实体信息更准确。
在上述实施例的基础上,本发明实施例中提供的案件事理关系确定方法,所述基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息,具体包括:
将所述分词结果输入至目标神经网络模型,由所述目标神经网络模型输出所述案件中每一事件对应的事件信息;
所述目标神经网络模型由样本词所属的事件以及所述样本词所属的事件对应的事件信息训练得到,所述样本词所属的事件对应于所有事件类型以及所述实体信息。
具体地,本发明实施例中,在执行步骤S3时,通过目标神经网络模型对分词结果进行处理,确定每一事件对应的事件信息。目标神经网络模型具体可以是卷积神经网络(Convolutional Neural Networks,CNN)模型或循环神经网络(Recurrent NeuralNetwork,RNN)模型,还可以是CNN模型与RNN模型的结合。本发明实施例中还可以采用基于注意力机制的CNN模型或RNN模型,或者二者的结合。
在上述实施例的基础上,本发明实施例中提供的案件事理关系确定方法,所述事件信息包括事件触发、事件类型和事件论元;相应地,所述将所述分词结果输入至目标神经网络模型,由所述目标神经网络模型输出所述案件中每一事件对应的事件信息,具体包括:
所述目标神经网络模型基于管道模型,首先识别出所述分词结果中每一事件对应的事件触发,然后确定与所述事件触发对应的事件类型,最后确定与所述事件触发对应的事件论元。
具体地,本发明实施例中,可以在目标神经网络模型中引入管道模型(Pipeline),首先识别出每一事件对应的事件触发,然后确定与事件触发对应的事件类型,最后根据事件类型的特点,抽取出与事件触发对应的事件论元,形成案件中事件的结构化表达。
在上述实施例的基础上,本发明实施例中提供的案件事理关系确定方法,所述事件信息包括事件触发、事件类型和事件论元;
相应地,所述基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系,具体包括:
根据所述案件中每一事件对应的事件类型,基于事件类型的上下位关系,确定所述案件中所有事件之间的上下位关系;
根据所述案件中每一事件对应的事件触发、事件类型和事件论元,确定所述案件中所有事件之间的顺承关系。
具体地,本发明实施例中,在执行步骤S4时,具体可以先通过案件中每一事件对应的事件类型,对比事件类型,结合事件类型的上下位关系,确定出每一事件的上下位关系,本发明实施例中事件类型的上下位关系与事件的上下位关系是一致的。然后对比事件类型、事件触发以及事件时间、人物、地点等事件论元,确定案件中所有事件之间的顺承关系。得到案件中所有事件之间的上下位关系以及顺承关系,即确定了案件中所有事件之间的事理关系。
如图3所示,在上述实施例的基础上,本发明实施例中提供了一种案件事理关系确定***,包括:事件类型确定模块31、实体信息提取模块32、事件信息提取模块33和事理关系确定模块34。
事件类型确定模块31用于采集案件的描述文本,并确定所述案件中包含的所有事件类型;
实体信息提取模块32用于对所述描述文本进行分词处理,得到分词结果,并从所述分词结果中提取所述案件中的实体信息;
事件信息提取模块33用于基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息;
事理关系确定模块34用于基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系。
具体地,本发明实施例中提供的案件事理关系确定***中各模块的作用与上述方法类实施例中各步骤的操作流程是一一对应的,实现的效果也是一致的,具体参见上述实施例,本发明实施例中对此不再赘述。
图4所示,在上述实施例的基础上,本发明实施例中提供了一种电子设备,包括:处理器(processor)401、存储器(memory)402、通信接口(Communications Interface)403和通信总线404;其中,
所述处理器401、存储器402、通信接口403通过通信总线404完成相互间的通信。所述存储器402存储有可被所述处理器401执行的程序指令,处理器401用于调用存储器402中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:采集案件的描述文本,并确定所述案件的属性对应的所有事件类型;对所述描述文本进行分词处理,得到分词结果,并从所述分词结果中提取所述案件中的实体信息;基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息;基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系。
需要说明的是,本实施例中的电子设备在具体实现时可以为服务器,也可以为PC机,还可以为其他设备,只要其结构中包括如图4所示的处理器401、通信接口403、存储器402和通信总线404,其中处理器401、通信接口403和存储器402通过通信总线404完成相互间的通信,且处理器401可以调用存储器402中的逻辑指令以执行上述方法即可。本实施例不对电子设备的具体实现形式进行限定。
存储器402中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
进一步地,本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:采集案件的描述文本,并确定所述案件的属性对应的所有事件类型;对所述描述文本进行分词处理,得到分词结果,并从所述分词结果中提取所述案件中的实体信息;基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息;基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系。
在上述实施例的基础上,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:采集案件的描述文本,并确定所述案件的属性对应的所有事件类型;对所述描述文本进行分词处理,得到分词结果,并从所述分词结果中提取所述案件中的实体信息;基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息;基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种案件事理关系确定方法,其特征在于,包括:
采集案件的描述文本,并确定所述案件的属性对应的所有事件类型;
对所述描述文本进行分词处理,得到分词结果,并从所述分词结果中提取所述案件中的实体信息;
基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息;
基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系。
2.根据权利要求1所述的案件事理关系确定方法,其特征在于,所述从所述分词结果中提取所述案件中的实体信息,具体包括:
将所述分词结果输入至长短期记忆神经网络模型,由所述长短期记忆神经网络模型输出所述案件中的实体信息;
所述长短期记忆神经网络模型采用基于自注意力的特征提取器进行特征提取,且由样本词及所述样本词对应的实体信息训练得到。
3.根据权利要求2所述的案件事理关系确定方法,其特征在于,所述长短期记忆神经网络模型的输出层基于Softmax函数或条件随机场构建。
4.根据权利要求1所述的案件事理关系确定方法,其特征在于,所述基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息,具体包括:
将所述分词结果输入至目标神经网络模型,由所述目标神经网络模型输出所述案件中每一事件对应的事件信息;
所述目标神经网络模型由样本词所属的事件以及所述样本词所属的事件对应的事件信息训练得到,所述样本词所属的事件对应于所有事件类型以及所述实体信息。
5.根据权利要求4所述的案件事理关系确定方法,其特征在于,所述事件信息包括事件触发、事件类型和事件论元;相应地,
所述将所述分词结果输入至目标神经网络模型,由所述目标神经网络模型输出所述案件中每一事件对应的事件信息,具体包括:
所述目标神经网络模型基于管道模型,首先识别出所述分词结果中每一事件对应的事件触发,然后确定与所述事件触发对应的事件类型,最后确定与所述事件触发对应的事件论元。
6.根据权利要求4所述的案件事理关系确定方法,其特征在于,所述目标神经网络模型具体为卷积神经网络模型和/或循环神经网络模型。
7.根据权利要求1-6中任一项所述的案件事理关系确定方法,其特征在于,所述事件信息包括事件触发、事件类型和事件论元;
相应地,所述基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系,具体包括:
根据所述案件中每一事件对应的事件类型,基于事件类型的上下位关系,确定所述案件中所有事件之间的上下位关系;
根据所述案件中每一事件对应的事件触发、事件类型和事件论元,确定所述案件中所有事件之间的顺承关系。
8.一种案件事理关系确定***,其特征在于,包括:
事件类型确定模块,用于采集案件的描述文本,并确定所述案件中包含的所有事件类型;
实体信息提取模块,用于对所述描述文本进行分词处理,得到分词结果,并从所述分词结果中提取所述案件中的实体信息;
事件信息提取模块,用于基于所有事件类型以及所述实体信息,从所述分词结果中提取所述案件中每一事件对应的事件信息;
事理关系确定模块,用于基于每一事件对应的事件信息,确定所述案件中所有事件之间的事理关系。
9.一种电子设备,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的案件事理关系确定方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的案件事理关系确定方法的步骤。
CN202010312498.0A 2020-04-20 2020-04-20 案件事理关系确定方法及*** Pending CN111639494A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010312498.0A CN111639494A (zh) 2020-04-20 2020-04-20 案件事理关系确定方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010312498.0A CN111639494A (zh) 2020-04-20 2020-04-20 案件事理关系确定方法及***

Publications (1)

Publication Number Publication Date
CN111639494A true CN111639494A (zh) 2020-09-08

Family

ID=72330782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010312498.0A Pending CN111639494A (zh) 2020-04-20 2020-04-20 案件事理关系确定方法及***

Country Status (1)

Country Link
CN (1) CN111639494A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113626618A (zh) * 2021-10-12 2021-11-09 深圳前海环融联易信息科技服务有限公司 基于跨篇章事件提取的案件串联方法、装置及相关组件
CN114707004A (zh) * 2022-05-24 2022-07-05 国网浙江省电力有限公司信息通信分公司 基于图像模型和语言模型的事理关系抽取处理方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130226844A1 (en) * 2005-12-12 2013-08-29 Qin Zhang Content Summarizing and Search Method and System Using Thinking System
CN110457443A (zh) * 2019-08-12 2019-11-15 贵州大学 一种基于刑事案件的犯罪行为链构建方法
CN110738039A (zh) * 2019-09-03 2020-01-31 平安科技(深圳)有限公司 一种案件辅助信息的提示方法、装置、存储介质和服务器
CN110858269A (zh) * 2018-08-09 2020-03-03 清华大学 刑事罪名预测方法及装置
CN110969549A (zh) * 2018-09-30 2020-04-07 北京国双科技有限公司 一种司法数据处理方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130226844A1 (en) * 2005-12-12 2013-08-29 Qin Zhang Content Summarizing and Search Method and System Using Thinking System
CN110858269A (zh) * 2018-08-09 2020-03-03 清华大学 刑事罪名预测方法及装置
CN110969549A (zh) * 2018-09-30 2020-04-07 北京国双科技有限公司 一种司法数据处理方法及***
CN110457443A (zh) * 2019-08-12 2019-11-15 贵州大学 一种基于刑事案件的犯罪行为链构建方法
CN110738039A (zh) * 2019-09-03 2020-01-31 平安科技(深圳)有限公司 一种案件辅助信息的提示方法、装置、存储介质和服务器

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113626618A (zh) * 2021-10-12 2021-11-09 深圳前海环融联易信息科技服务有限公司 基于跨篇章事件提取的案件串联方法、装置及相关组件
CN113626618B (zh) * 2021-10-12 2022-02-15 深圳前海环融联易信息科技服务有限公司 基于跨篇章事件提取的案件串联方法、装置及相关组件
WO2023060634A1 (zh) * 2021-10-12 2023-04-20 深圳前海环融联易信息科技服务有限公司 基于跨篇章事件提取的案件串联方法、装置及相关组件
CN114707004A (zh) * 2022-05-24 2022-07-05 国网浙江省电力有限公司信息通信分公司 基于图像模型和语言模型的事理关系抽取处理方法及***
CN114707004B (zh) * 2022-05-24 2022-08-16 国网浙江省电力有限公司信息通信分公司 基于图像模型和语言模型的事理关系抽取处理方法及***

Similar Documents

Publication Publication Date Title
EP3832488A2 (en) Method and apparatus for generating event theme, device and storage medium
CN108073568A (zh) 关键词提取方法和装置
CN108536681A (zh) 基于情感分析的智能问答方法、装置、设备及存储介质
KR20200007969A (ko) 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체
Udanor et al. Combating the challenges of social media hate speech in a polarized society: A Twitter ego lexalytics approach
CN113449204B (zh) 基于局部聚合图注意力网络的社会事件分类方法、装置
CN111581956A (zh) 基于bert模型和k近邻的敏感信息识别方法及***
CN115033668B (zh) 故事脉络构建方法、装置、电子设备和存储介质
CN110929520A (zh) 非命名实体对象抽取方法、装置、电子设备及存储介质
CN111178701B (zh) 一种基于特征衍生技术的风险控制方法方法、装置和电子设备
CN111639494A (zh) 案件事理关系确定方法及***
EP3477575A1 (en) Computer implemented method and system for detecting a set of relevant communities
CN111966792A (zh) 一种文本处理方法、装置、电子设备及可读存储介质
CN115063035A (zh) 基于神经网络的客户评估方法、***、设备及存储介质
CN116340606A (zh) 重大突发事件的分析方法、装置、存储介质和设备
Suhas Bharadwaj et al. A novel multimodal hybrid classifier based cyberbullying detection for social media platform
AlAjlan et al. Machine learning approach for threat detection on social media posts containing Arabic text
Gupta et al. Real-time sentiment analysis of tweets: A case study of Punjab elections
CN112507214B (zh) 基于用户名的数据处理方法、装置、设备及介质
CN113807920A (zh) 基于人工智能的产品推荐方法、装置、设备及存储介质
KR20220105792A (ko) 동적 텍스트 소스를 활용한 ai 기반 의사결정지원 시스템
Barrows et al. Sentiment and Objectivity in Iranian State-Sponsored Propaganda on Twitter
CN112487165A (zh) 一种基于关键词的问答方法、装置及介质
Sandaka et al. Sentiment Analysis and Time-series Analysis for the COVID-19 vaccine Tweets
Rifa'i et al. Sentiment Analysis Using Text Mining Techniques On Social Media Using the Support Vector Machine Method Case Study Seagames 2023 Football Final

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200908