CN113779976B - 裁判规则提取方法及***及装置及介质 - Google Patents
裁判规则提取方法及***及装置及介质 Download PDFInfo
- Publication number
- CN113779976B CN113779976B CN202111132644.2A CN202111132644A CN113779976B CN 113779976 B CN113779976 B CN 113779976B CN 202111132644 A CN202111132644 A CN 202111132644A CN 113779976 B CN113779976 B CN 113779976B
- Authority
- CN
- China
- Prior art keywords
- referee
- causal
- rule
- judge
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了裁判规则提取方法及***及装置及介质,涉及自然语言处理信息抽取领域,包括:从若干个历史裁判文书中提取获得裁判因果关系提及;从所述裁判因果关系提及中提取获得裁判因果事件,基于所述裁判因果事件构建裁判因果网络;对所述裁判因果网络进行一般化处理,获得一般裁判规则网络;构建预测模型,将所述一般裁判规则网络嵌入所述预测模型中获得裁判规则提取模型,所述裁判规则提取模型的输入为裁判文书,输出为裁判规则;获得待处理裁判文书,将所述待处理裁判文书输入所述裁判规则提取模型,输出所述待处理裁判文书对应的裁判规则。本发明实现基于事件因果关系的裁判规则自动提取。
Description
技术领域
本发明涉及自然语言处理信息抽取领域,具体地,涉及裁判规则提取方法及***及装置及介质。
背景技术
裁判规则是通过对案件争议焦点所涉及的法律问题进行评析后形成的并为裁判结论所确立的规则,是案例的核心内容、灵魂所在,对法官在同类案件中认定事实、适用法律具有启发、引导、规范和参考作用。
裁判规则自动提取任务是从裁判文书提取法院判决的裁判规则。这是法律援助制度的一项关键技术。一方面,可以为不熟悉法律术语和复杂审判程序的群众提供低成本但高质量的法律咨询服务。另一方面,它可以作为专业人员(如律师和法官)的便捷参考,提高他们的工作效率。
然而,现有的裁判规则自动抽取方法只关注特定事件之间的因果关系,而没有发现一般的法律裁判规则,并且利用一般裁判规则进行审判预测时,会遇到一些问题:1)元组匹配或短语匹配的潜在符号性极大地限制了匹配的灵活性;2)因果关系的符号形式很难推广到审判预测应用中。
发明内容
本发明目的是为了实现基于事件因果关系的裁判规则自动提取,本发明不仅能够抽取出裁判文本中的一般裁判规则,而且可以将一般裁判规则嵌入到连续的向量空间中,以简化审判预测,本发明有助于法律援助和审判预测等。
为实现上述目的,本发明提供了裁判规则提取方法,所述方法包括:
从若干个历史裁判文书中提取获得裁判因果关系提及;
从所述裁判因果关系提及中提取获得裁判因果事件,基于所述裁判因果事件构建裁判因果网络;
对所述裁判因果网络进行一般化处理,获得一般裁判规则网络;
构建预测模型,将所述一般裁判规则网络嵌入所述预测模型中获得裁判规则提取模型,所述裁判规则提取模型的输入为裁判文书,输出为裁判规则;
获得待处理裁判文书,将所述待处理裁判文书输入所述裁判规则提取模型,输出所述待处理裁判文书对应的裁判规则。
其中,本方法能够获得一般裁判规则网络,并且能够将一般裁判规则网络嵌入预测模型中获得裁判规则提取模型,利用裁判规则提取模型来对裁判规则进行提取。
优选的,本方法中从裁判文书中提取获得裁判因果关系提及具体包括:
基于第一因素、第二因素以及所述第一因素与所述第二因素之间的优先级构建第一提取规则,所述第一因素为裁判文书中预设因果连接词的正则表达式,所述第二因素为裁判文书中句子语句约束;
基于所述第一提取规则从裁判文书中提取获得裁判因果关系提及。
其中,通过上述方式能够从裁判文书中提取获得裁判因果关系提及,便于后续提取获得裁判因果关系。
优选的,本方法中所述第一因素的获取方式包括:
从裁判文书中识别获得若干个裁判因果对信息;
基于所述裁判因果对信息判断因果连接词是否使用准确,获得使用准确的若干个第一因果连接词;
统计每个所述第一因果连接词在裁判文书中的出现频率,基于出现频率由大到小对所述第一因果连接词进行排序,获得第一序列;
从所述第一序列中抽取排序前若干位的所述第一因果连接词,获得所述预设因果连接词。
其中,本方法首先从裁判文书中识别获得若干个裁判因果对信息,然后获得获得使用准确的若干个第一因果连接词,然后统计第一因果连接词在裁判文书中的出现频率,然后提取出出现频率较高的第一因果连接词,通过上述方式能够获得准确的具有代表意义的正则表达式,进而能够使得后续使用正则表达式能够基从裁判文书中提取获得准确且具有代表意义的裁判因果关系提及。
优选的,本方法中从所述第一序列中抽取排序前4位的所述第一因果连接词,获得所述预设因果连接词。
其中,抽取排序前4位的原因是给定了一定标注数据,发现给定数据中80%以上的事件因果关系由这四个连接词构成,若设定为3个,需要考虑因果关系连接词覆盖率的问题,5个是可以的,但需要考虑之后的提取难度,后续难度会加大,因此综合考虑抽取排序前4位是较佳的选择。
优选的,本方法中所述裁判因果网络的构建方式包括:
从所述裁判因果关系提及中提取获得动词和名词,以及所述动词和所述名词之间的先后顺序;
基于所述动词和所述名词,以及所述动词和所述名词之间的先后顺序,获得裁判因果事件;
基于所述裁判因果事件构建所述裁判因果网络;其中,所述裁判因果事件对应所述裁判因果网络中的一个节点,所述裁判因果网络的边与所述裁判因果对信息相关联,从原因指向结果。
其中,通过上述方式能够基于基于裁判因果事件构建裁判因果网络,通过这种方式构建的裁判因果网络能够准确的反映裁判因果事件,便于后续裁判规则的准确提取。
优选的,本方法中所述对所述裁判因果网络进行一般化处理,获得一般裁判规则网络,具体包括:
使用预设词典一般化若干个所述裁判因果事件中的单词,获得一般化处理后的若干个第一裁判因果事件;
统计每个所述第一裁判因果事件在预设裁判文书中的出现次数,基于出现次数由大到小进行排序,获得第二序列;
将所述第二序列中排序前若干位的第一裁判因果事件作为所述一般裁判规则网络中的节点;其中,所述一般裁判规则网络的边与所述裁判因果对信息相关联,从原因指向结果。
其中,为了使得裁判因果网络具有一般性,对其进行一般化处理,便于后续在实际中应用。
优选的,本方法中所述预设词典包括WordNet词典和VerbNet词典,所述WordNet词典用于一般化处理名词,所述VerbNet词典用于一般化处理动词。
优选的,本方法中将所述一般裁判规则网络嵌入所述预测模型中获得裁判规则提取模型,具体包括:
将所述一般裁判规则网络嵌入到连续的向量空间中,利用裁判因果事件因果关系的关键属性进行编码,所述关键属性包括:裁判因果事件因果关系的不对称性、裁判因果事件因果关系的多对多关系和裁判因果事件因果关系的传递性。
该模型对裁判因果关系的关键属性进行编码,将裁判因果关系网络嵌入到一个连续的向量空间中。未来事件和审判结果的预测被表述为使用嵌入的裁判因果关系网络上的链接预测任务。通过学习和操作潜在的连续表示,嵌入方法可以大大提高匹配的灵活性,从而提高预测的准确性。
优选的,本方法中所述方法还包括训练所述裁判规则提取模型,所述裁判规则提取模型通过能量函数f(c,e)学习嵌入裁判因果对中的原因向量和结果向量以及转移向量{t,τ};
f(c,e)=||c+t-e||1+||e+τ-c||1;
c为裁判因果对中的原因向量,e为裁判因果对中的结果向量,t为因果关系中原因到结果的转移向量,τ为裁判因果关系中结果到原因的转移向量,||c+t-e||1表示原因映射到结果的损失,||e+τ-c||1表示结果映射到原因的损失。
优选的,本方法中所述裁判规则提取模型的损失函数为:
其中,{x}为裁判因果对中的原因向量和结果向量,P+为在所述一般裁判规则网络中发现的真实裁判因果对的集合,P-是通过替换(c,e)中的原因或结果而构建的损坏裁判因果对,γ>0是分隔真实裁判因果对和损坏裁判因果对的边界,[γ+f(c,e)-f(c',e')]+=max(0,γ+f(c,e)-f(c',e'))表示γ+f(c,e)-f(c',e')的正部分,α为正则化超参数。
本发明还提供了裁判规则提取***,所述***包括:
裁判因果关系提及获得单元,用于从若干个历史裁判文书中提取获得裁判因果关系提及;
裁判因果网络构建单元,用于从所述裁判因果关系提及中提取获得裁判因果事件,基于所述裁判因果事件构建裁判因果网络;
一般化单元,用于对所述裁判因果网络进行一般化处理,获得一般裁判规则网络;
裁判规则提取模型获得单元,用于构建预测模型,将所述一般裁判规则网络嵌入所述预测模型中获得裁判规则提取模型,所述裁判规则提取模型的输入为裁判文书,输出为裁判规则;
裁判规则获得单元,用于获得待处理裁判文书,将所述待处理裁判文书输入所述裁判规则提取模型,输出所述待处理裁判文书对应的裁判规则。
本发明还提供了一种裁判规则提取装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述裁判规则提取方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述裁判规则提取方法的步骤。
本发明提供的一个或多个技术方案,至少具有如下技术效果或优点:
本发明研究了从裁判文本中建立一个基于事件因果关系抽取的裁判规则网络,并利用该裁判规则网络对未来事件和审判结果进行预测。首先提出了一般裁判规则网络和层次化的裁判因果关系生成方法,在一个具体的裁判因果关系网络之上建立一般裁判规则网络。从这个网络中,获得法院判决的审判逻辑。此外,设计了一个新的双重因果转换模型,该模型对裁判因果关系的关键属性进行编码,将裁判因果关系网络嵌入到一个连续的向量空间中。未来事件和审判结果的预测被表述为使用嵌入的裁判因果关系网络上的链接预测任务。通过学习和操作潜在的连续表示,嵌入方法可以大大提高匹配的灵活性,从而提高预测的准确性。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本发明的一部分,并不构成对本发明实施例的限定;
图1为裁判规则提取方法示意图;
图2为裁判规则构建及嵌入流程示意图;
图3为裁判规则提取***的组成示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在相互不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述范围内的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
应当理解,本文使用的“***”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书使用流程图说明根据本说明书的实施例的***所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
实施例一
请参考图1,图1为裁判规则提取方法示意图,本实施例一提供了裁判规则提取方法,所述方法包括:
从若干个历史裁判文书中提取获得裁判因果关系提及;
从所述裁判因果关系提及中提取获得裁判因果事件,基于所述裁判因果事件构建裁判因果网络;
对所述裁判因果网络进行一般化处理,获得一般裁判规则网络;
构建预测模型,将所述一般裁判规则网络嵌入所述预测模型中获得裁判规则提取模型,所述裁判规则提取模型的输入为裁判文书,输出为裁判规则;
获得待处理裁判文书,将所述待处理裁判文书输入所述裁判规则提取模型,输出所述待处理裁判文书对应的裁判规则。
下面对本方法的步骤进行详细介绍:
本发明的目标在于从裁判文本中自动抽取裁判规则。本发明主要包括两个大部分:一般裁判规则构建以及一般裁判规则嵌入模型。
裁判规则构建:
从裁判文书中构建一个基于层次化事件裁判因果关系的裁判规则,分为以下几个完成构建,具体流程图见附图2:
(1)裁判因果关系提及提取:该步骤从裁判文书中识别潜在的因果对。(因果对表示具有因果关系的、由原因结果组成的事件对,如在裁判文书中(李某,劳务)→(王某,未支付),这样由原因推导结果的事件对,称为因果对。)利用人类注释者判断因果连接词正确的频率(因果连接词表示词、短语、分句或句子之间具有原因和结果关系的连词,如因为、由于、所以、导致、之后。),得到最高频率的四个因果连接词。构建规则<包含所选因果连接词的正则表达式,句子语句约束,多个规则匹配时规则的优先级>来提取裁判因果关系提及。
其中,所选的因果连接词即得到的最高频率的四个因果连接词。
其中,句子语句约束是除了满足包含因果连词的正则表达式外,需要制定一些其他的语法约束,根据书写习惯人为制定。给定连接器“after”,使用包含“after”的正则表达式“after[sentence1],[sentence2]”来提取带有约束的裁判因果关系提及,其中[sentence1]不能以数字开头,这就是句子约束。因为如果不设置句子语句约束,“2年后,美国国会大厦修复工程完成”,会被“after[sentence1],[sentence2]”提取出,但它不是因果关系。
其中,多个规则匹配时规则的优先级中的多个规则指同时满足正则表达式和句子语句约束,制定优先级选取满足多个规则时更明显的因果关系。如当一个句子都包含因果连接词“because”、“after”因为“because”表示因果关系提及的概率大于“after”,所以在之后的裁判因果关系提及中按“because”的结构去提取事件的原因跟结果,而不是“after”。
其中,裁判因果关系提及提取表示利用因果关系连接词提取裁判文书包含因果关系的句子。如“2019年2月3日,原告与二被告共同进行结算,经结算,二被告尚欠付原告劳务费6700元,二被告向原告出具《欠条》一张。《欠条》出具后,经原告多次催要,二被告至今未支付欠款。”可以由“after”提取裁判因果关系提及“《欠条》出具后,经原告多次催要,二被告至今未支付欠款。”
其中,这里选择得到最高频率的四个因果连接词的原因是:给定了一定标注数据,发现给定数据中80%以上的事件因果关系由这四个连接词构成,若设定为3个,需要考虑因果关系连接词覆盖率的问题,5个是可以的,但需要考虑之后的提取难度。
其中,构建上述规则来提取裁判因果关系提及的目的是:提取出因果连接词后,想要利用因果连接词提取包含裁判因果关系的句子,所以构造了包含因果连接词的正则表达式,句子语句约束是对模式可以应用到的句子的语法约束,优先级是多个规则匹配时规则的优先级。
例如,给定连接器“after”,我们使用包含“after”的正则表达式“after[sentence1],[sentence2]”来提取带有约束的因果关系提及,其中[sentence1]不能以数字开头(句子约束)。因此,这种模式可以匹配“***战争后,油价下跌”这句话,但不会匹配“2年后,美国国会大厦修复工程完成”这句话。很明显,(***战争后,油价下跌)是因果关系,但(2年后,美国国会大厦恢复项目完成)不是因果关系。在应用规则之后,我们获得了成对的因果关系提及,其中一个被标记为原因,另一个被标记为结果。
(2)裁判因果关系提取:
该步骤从步骤(1)确定的裁判因果关系提及中提取裁判因果事件。用动词和名词的原始顺序表示特定的裁判因果事件(从因果关系提及中提取动词和名词以及其在因果关系提及中的先后顺序,基于提取出的动词和名词获得特定的事件),提取裁判因果事件后,构建一个特定的裁判因果网络。网络的每个节点对应于一个特定的事件,边与裁判因果对相关联,从原因指向结果,其中,边指两个节点之间的连线。
其中,裁判因果关系提取是从上一步确定的裁判因果提及语句中提取裁判因果事件,之前的工作中,因果事件更多被表示为从(主语、谓语、宾语)三元组扩展而来的元组或名词短语,我们认为,简单地用一组动词和名词的原始顺序来表示每个特定的事件是一个更好的选择。提取手段会借助自然语言处理词性标注跟实体识别的NLP工具提取动词跟名词,在利用动词和名词的原始顺序建立事件。如“政府采取有效措施维护学校安全”,无论是主谓宾三元组(政府,采取,有效措施)还是名词短语“学校安全”都不包含关于事件的完整信息。然而,如果我们使用动词和名词表示法(政府、采取、措施、维护、学校、安全),不会丢失任何重要信息。
其中,裁判因果关系网络由节点和边组成,其中节点表示裁判因果事件,由(动词,名词,动词名词原始顺序)构成,边表示是否存在存在因果关系;如(赵某,谋杀,王某)→(赵某,被送进,监狱);(钱某,杀死,孙某)→(钱某,被送进,监狱)→(钱某,监狱,逃跑)→(警察,抓住,钱某);()表示一个节点(事件),→表示边(因果关系),由原因指向结果。
(3)裁判因果事件一般化:该步骤一般化步骤(2)中的裁判因果关系网络从而得到一般的裁判规则网络。首先使用WordNet和VerbNet来一般化(一般化对应Generalization,概括)特定裁判因果事件中出现的单词,其次用频繁共现的词对表示一般裁判规则网络的节点,再利用特定的裁判因果关系网络的边,在一般裁判规则网络中对应的规则之间创建一个边。
其中,WordNet是针对名词的,VerbNet针对动词,该步骤消除了单词多样性的负面影响,并且可以帮助我们从大量特定的因果事件中发现频繁模式。
其中,频数超过预设次数,如5的词我们认为是频繁共现的词;网络中的节点对应为(名词,动词,名词名词原始顺序)的事件,是名词动词组成的词对;频繁共现是在给定文本中出现次数5的事件,网络具有多个节点时,频繁出现5次的词对即事件都放入一般裁判规则网络。
一般裁判规则嵌入模型:
设计一个双重因果转换模型将步骤A得到的裁判规则网络嵌入到连续的向量空间中,利用事件因果关系的关键属性即事件因果关系的不对称性、事件因果关系的多对多关系和事件因果关系的传递性进行编码。通过能量函数:
f(c,e)=||c+t-e||1+||e+τ-c||1
学习嵌入{x}和转移向量{t,τ},x为为f(c,e)中的c和e。其中,c为表示原因向量(cause),e为表示影响(effect)的向量,也可理解为结果,t为因果关系中原因到结果的转移向量,τ为因果关系中结果到原因的转移向量,双重因果转移向量模型中向量空间中原因到结果的双向映射收到因果关系转移向量的影响,||c+t-e||1表示原因映射到结果的损失;||e+τ-c||1表示结果映射到原因的损失,减少两种损失和,使能量函数最小。
给定一个真实的因果对(c,e),如果原因c或结果e缺失,我们希望模型能够预测正确的事件和审判结果。训练的目的是学习能量函数f,以便它能够成功地将真正的对(c,e)排在所有其他可能的对之下,即最小化:
其中,P+是在裁判规则网络中发现的真实因果事件对的集合,P-是通过替换(c,e)中的原因或结果而构建的损坏对,γ>0是分隔真实因果对和损坏对的边界,并且[x]+=max(0,x)表示x的正部分,α>0是正则化超参数。c’为假设原因cause丢失后,我们任意选择其他原因组成损失对(c’,e),e’假设结果effect丢失后,我们任意选择其他结果组成损失对(c,e’),f(c’,e’)与上个式子定义一样,||t+τ||2表示希望使得原因到结果的转移向量t与结果到原因的转移向量τ相差较大。直观地说,给定一个真实的因果对(c,e),如果原因c或结果e缺失,我们希望模型能够预测正确的事件。训练的目标是学习能量函数f,使其真对(c,e)的能量函数小于负样本;对于真正的因果对来说,比损坏对具有更低的能量,因此是预期标准的自然实现。
下面举例对本方法的应用进行介绍:
裁判文书为:
“本院经审理认定事实如下:2018年,原告在二被告处从事劳务工作。2019年2月3日,原告与二被告共同进行结算,经结算,二被告尚欠付原告劳务费6700元,二被告向原告出具《欠条》一张。《欠条》出具后,经原告多次催要,二被告至今未支付欠款。”
“本院认为:民事活动应遵守诚实信用原则,原告为二被告提供劳务,二被告理应按照约定支付劳务费。原、被告并未约定支付,原告可随时要求二被告支付,故对原告要求二被告支付欠款6700元的诉讼请求本院予以支持。二被告怠于履行支付责任,确会给原告造成资金占用损失,本院确定二被告自起诉之日(2020年5月15日)起至欠款付清之日止按全国银行同业拆借中心公布的贷款市场报价利率计算资金占用损失。综上所述,对原告的诉讼请求本院予以支持。”
“依照《中华人民共和国合同法》第八条、第六十条、第一百零九条,《中华人民共和国民事诉讼法》第一百四十四条之规定,判决如下:限被告徐×、田××于本判决生效后十日内支付原告蒲××劳务费6700元。”
实施例二
请参考图3,图3为裁判规则提取***的组成示意图,本发明实施例二本发明还提供了裁判规则提取***,所述***包括:
裁判因果关系提及获得单元,用于从若干个历史裁判文书中提取获得裁判因果关系提及;
裁判因果网络构建单元,用于从所述裁判因果关系提及中提取获得裁判因果事件,基于所述裁判因果事件构建裁判因果网络;
一般化单元,用于对所述裁判因果网络进行一般化处理,获得一般裁判规则网络;
裁判规则提取模型获得单元,用于构建预测模型,将所述一般裁判规则网络嵌入所述预测模型中获得裁判规则提取模型,所述裁判规则提取模型的输入为裁判文书,输出为裁判规则;
裁判规则获得单元,用于获得待处理裁判文书,将所述待处理裁判文书输入所述裁判规则提取模型,输出所述待处理裁判文书对应的裁判规则。
实施例三
本发明实施例三提供了一种裁判规则提取装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述裁判规则提取方法的步骤。
其中,所述处理器可以是中央处理器(CPU,Central Processing Unit),还可以是其他通用处理器、数字信号处理器(digital signal processor)、专用集成电路(Application Specific Integrated Circuit)、现成可编程门阵列(Fieldprogrammablegate array)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的数据,实现发明中裁判规则提取装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等。此外,存储器可以包括高速随机存取存储器、还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡,安全数字卡,闪存卡、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
实施例四
本发明实施例四提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述裁判规则提取方法的步骤。
所述裁判规则提取装置如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序可存储于一计算机可读存介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码、对象代码形式、可执行文件或某些中间形式等。所述计算机可读取介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存储器、点载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。
本发明已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“***”。此外,本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行***、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的***组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的***。
同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.裁判规则提取方法,其特征在于,所述方法包括:
从若干个历史裁判文书中提取获得裁判因果关系提及;
从所述裁判因果关系提及中提取获得裁判因果事件,基于所述裁判因果事件构建裁判因果网络;
对所述裁判因果网络进行一般化处理,获得一般裁判规则网络;
构建预测模型,将所述一般裁判规则网络嵌入所述预测模型中获得裁判规则提取模型,所述裁判规则提取模型的输入为裁判文书,输出为裁判规则;
获得待处理裁判文书,将所述待处理裁判文书输入所述裁判规则提取模型,输出所述待处理裁判文书对应的裁判规则;
所述裁判因果网络的构建方式包括:
从所述裁判因果关系提及中提取获得动词和名词,以及所述动词和所述名词之间的先后顺序;
基于所述动词和所述名词,以及所述动词和所述名词之间的先后顺序,获得裁判因果事件;
基于所述裁判因果事件构建所述裁判因果网络;其中,所述裁判因果事件对应所述裁判因果网络中的一个节点,所述裁判因果网络的边与裁判因果对信息相关联,从原因指向结果;
所述对所述裁判因果网络进行一般化处理,获得一般裁判规则网络,具体包括:
使用预设词典一般化若干个所述裁判因果事件中的单词,获得一般化处理后的若干个第一裁判因果事件;
统计每个所述第一裁判因果事件在预设裁判文书中的出现次数,基于出现次数由大到小进行排序,获得第二序列;
将所述第二序列中排序前若干位的第一裁判因果事件作为所述一般裁判规则网络中的节点;其中,所述一般裁判规则网络的边与所述裁判因果对信息相关联,从原因指向结果;
将所述一般裁判规则网络嵌入所述预测模型中获得裁判规则提取模型,具体包括:
将所述一般裁判规则网络嵌入到连续的向量空间中,利用裁判因果事件因果关系的关键属性进行编码,所述关键属性包括:裁判因果事件因果关系的不对称性、裁判因果事件因果关系的多对多关系和裁判因果事件因果关系的传递性。
2.根据权利要求1所述的裁判规则提取方法,其特征在于,从裁判文书中提取获得裁判因果关系提及具体包括:
基于第一因素、第二因素以及所述第一因素与所述第二因素之间的优先级构建第一提取规则,所述第一因素为裁判文书中预设因果连接词的正则表达式,所述第二因素为裁判文书中句子语句约束;
基于所述第一提取规则从裁判文书中提取获得裁判因果关系提及。
3.根据权利要求2所述的裁判规则提取方法,其特征在于,所述第一因素的获取方式包括:
从裁判文书中识别获得若干个裁判因果对信息;
基于所述裁判因果对信息判断因果连接词是否使用准确,获得使用准确的若干个第一因果连接词;
统计每个所述第一因果连接词在裁判文书中的出现频率,基于出现频率由大到小对所述第一因果连接词进行排序,获得第一序列;
从所述第一序列中抽取排序前若干位的所述第一因果连接词,获得所述预设因果连接词。
4.根据权利要求3所述的裁判规则提取方法,其特征在于,从所述第一序列中抽取排序前4位的所述第一因果连接词,获得所述预设因果连接词。
5.根据权利要求1所述的裁判规则提取方法,其特征在于,所述预设词典包括WordNet词典和VerbNet词典,所述WordNet词典用于一般化处理名词,所述VerbNet词典用于一般化处理动词。
6.根据权利要求1所述的裁判规则提取方法,其特征在于,所述方法还包括训练所述裁判规则提取模型,所述裁判规则提取模型通过能量函数f(c,e)学习嵌入裁判因果对中的原因向量和结果向量以及转移向量{t,τ};
f(c,e)=||c+t-e||1+||e+τ-c||1;
c为裁判因果对中的原因向量,e为裁判因果对中的结果向量,t为因果关系中原因到结果的转移向量,τ为裁判因果关系中结果到原因的转移向量,||c+t-e||1表示原因映射到结果的损失,||e+τ-c||1表示结果映射到原因的损失。
8.裁判规则提取***,其特征在于,所述***包括:
裁判因果关系提及获得单元,用于从若干个历史裁判文书中提取获得裁判因果关系提及;
裁判因果网络构建单元,用于从所述裁判因果关系提及中提取获得裁判因果事件,基于所述裁判因果事件构建裁判因果网络;
一般化单元,用于对所述裁判因果网络进行一般化处理,获得一般裁判规则网络;
裁判规则提取模型获得单元,用于构建预测模型,将所述一般裁判规则网络嵌入所述预测模型中获得裁判规则提取模型,所述裁判规则提取模型的输入为裁判文书,输出为裁判规则;
裁判规则获得单元,用于获得待处理裁判文书,将所述待处理裁判文书输入所述裁判规则提取模型,输出所述待处理裁判文书对应的裁判规则;
所述裁判因果网络的构建方式包括:
从所述裁判因果关系提及中提取获得动词和名词,以及所述动词和所述名词之间的先后顺序;
基于所述动词和所述名词,以及所述动词和所述名词之间的先后顺序,获得裁判因果事件;
基于所述裁判因果事件构建所述裁判因果网络;其中,所述裁判因果事件对应所述裁判因果网络中的一个节点,所述裁判因果网络的边与裁判因果对信息相关联,从原因指向结果;
所述对所述裁判因果网络进行一般化处理,获得一般裁判规则网络,具体包括:
使用预设词典一般化若干个所述裁判因果事件中的单词,获得一般化处理后的若干个第一裁判因果事件;
统计每个所述第一裁判因果事件在预设裁判文书中的出现次数,基于出现次数由大到小进行排序,获得第二序列;
将所述第二序列中排序前若干位的第一裁判因果事件作为所述一般裁判规则网络中的节点;其中,所述一般裁判规则网络的边与所述裁判因果对信息相关联,从原因指向结果;
将所述一般裁判规则网络嵌入所述预测模型中获得裁判规则提取模型,具体包括:
将所述一般裁判规则网络嵌入到连续的向量空间中,利用裁判因果事件因果关系的关键属性进行编码,所述关键属性包括:裁判因果事件因果关系的不对称性、裁判因果事件因果关系的多对多关系和裁判因果事件因果关系的传递性。
9.一种裁判规则提取装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7中任意一个所述裁判规则提取方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任意一个所述裁判规则提取方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111132644.2A CN113779976B (zh) | 2021-09-27 | 2021-09-27 | 裁判规则提取方法及***及装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111132644.2A CN113779976B (zh) | 2021-09-27 | 2021-09-27 | 裁判规则提取方法及***及装置及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113779976A CN113779976A (zh) | 2021-12-10 |
CN113779976B true CN113779976B (zh) | 2023-07-07 |
Family
ID=78853493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111132644.2A Active CN113779976B (zh) | 2021-09-27 | 2021-09-27 | 裁判规则提取方法及***及装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113779976B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2003254737A1 (en) * | 1999-06-30 | 2003-11-13 | Silverbrook Research Pty Ltd | Method and systems for collaborative document markup using processing |
CN102945230A (zh) * | 2012-10-17 | 2013-02-27 | 刘运通 | 一种基于语义匹配驱动的自然语言知识获取方法 |
CN103544242A (zh) * | 2013-09-29 | 2014-01-29 | 广东工业大学 | 面向微博的情感实体搜索*** |
CN108763485A (zh) * | 2018-05-25 | 2018-11-06 | 南京大学 | 一种基于文本相似度的裁判文书的证据链关系模型构建方法 |
CN110069609A (zh) * | 2019-03-15 | 2019-07-30 | 平安科技(深圳)有限公司 | 裁判文书分析方法、装置、计算机设备及存储介质 |
CN110717332A (zh) * | 2019-07-26 | 2020-01-21 | 昆明理工大学 | 基于非对称孪生网络的新闻与案件相似度计算方法 |
CN111597229A (zh) * | 2020-05-15 | 2020-08-28 | 上海明寰科技有限公司 | 一种基于高维点过程的金融时间序列的因果关系学习方法 |
CN112417880A (zh) * | 2020-11-30 | 2021-02-26 | 太极计算机股份有限公司 | 一种面向法院电子卷宗的案情信息自动抽取方法 |
CN112800776A (zh) * | 2021-03-10 | 2021-05-14 | 湖北工业大学 | 双向gru关系抽取数据处理方法、***、终端、介质 |
-
2021
- 2021-09-27 CN CN202111132644.2A patent/CN113779976B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2003254737A1 (en) * | 1999-06-30 | 2003-11-13 | Silverbrook Research Pty Ltd | Method and systems for collaborative document markup using processing |
CN102945230A (zh) * | 2012-10-17 | 2013-02-27 | 刘运通 | 一种基于语义匹配驱动的自然语言知识获取方法 |
CN103544242A (zh) * | 2013-09-29 | 2014-01-29 | 广东工业大学 | 面向微博的情感实体搜索*** |
CN108763485A (zh) * | 2018-05-25 | 2018-11-06 | 南京大学 | 一种基于文本相似度的裁判文书的证据链关系模型构建方法 |
CN110069609A (zh) * | 2019-03-15 | 2019-07-30 | 平安科技(深圳)有限公司 | 裁判文书分析方法、装置、计算机设备及存储介质 |
CN110717332A (zh) * | 2019-07-26 | 2020-01-21 | 昆明理工大学 | 基于非对称孪生网络的新闻与案件相似度计算方法 |
CN111597229A (zh) * | 2020-05-15 | 2020-08-28 | 上海明寰科技有限公司 | 一种基于高维点过程的金融时间序列的因果关系学习方法 |
CN112417880A (zh) * | 2020-11-30 | 2021-02-26 | 太极计算机股份有限公司 | 一种面向法院电子卷宗的案情信息自动抽取方法 |
CN112800776A (zh) * | 2021-03-10 | 2021-05-14 | 湖北工业大学 | 双向gru关系抽取数据处理方法、***、终端、介质 |
Non-Patent Citations (4)
Title |
---|
Automatic semantics extraction in law documents;Biagioli Carlo 等;《Proceedings of the 10th international conference on Artificial intelligence and law》;133-140 * |
Understanding electronic health records resistance: a revealed causal mapping approach;Samhan Bahae 等;《International Journal of Electronic Healthcare》;第9卷(第2-3期);100-128 * |
法律推理及其在行政裁判中的应用;华沁瑜;《中国优秀硕士学位论文全文数据库社会科学Ⅰ辑》(第09期);G120-5 * |
法律文本检索与分类***的设计与实现;徐仁娜;《中国优秀硕士学位论文全文数据库社会科学Ⅰ辑》(第04期);G120-170 * |
Also Published As
Publication number | Publication date |
---|---|
CN113779976A (zh) | 2021-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10817941B2 (en) | Modeling asset transfer flow relationships discovered in unstructured data | |
US11816439B2 (en) | Multi-turn dialogue response generation with template generation | |
CN108959246A (zh) | 基于改进的注意力机制的答案选择方法、装置和电子设备 | |
JP2022177242A (ja) | テキスト認識モデルの訓練方法、テキスト認識方法及び装置 | |
CN104462057A (zh) | 用于产生语言分析的词汇资源的方法和*** | |
CN111062217A (zh) | 语言信息的处理方法、装置、存储介质及电子设备 | |
CN113779227B (zh) | 案情事实抽取方法及***及装置及介质 | |
CN113779976B (zh) | 裁判规则提取方法及***及装置及介质 | |
CN114020774A (zh) | 多轮问答语句的处理方法、装置、设备及存储介质 | |
AU2019290658B2 (en) | Systems and methods for identifying and linking events in structured proceedings | |
CN113095078A (zh) | 关联资产确定方法、装置和电子设备 | |
Wang et al. | A Relation Extraction Model Based on BERT Model in the Financial Regulation Field | |
CN112395406A (zh) | 庭审笔录的检索方法及装置 | |
CN117874261B (zh) | 基于课程学习的问答式事件抽取方法以及相关设备 | |
US10169074B2 (en) | Model driven optimization of annotator execution in question answering system | |
CN117573848B (zh) | 对话方法、装置、电子设备及介质 | |
KR102559806B1 (ko) | 기계학습 기반의 지능형 법률 판례 검색 및 통합형 법률 서비스 방법 및 장치 | |
CN117591666B (zh) | 针对桥梁管养文档的摘要抽取方法 | |
Zámečníková et al. | Business Rules Definition for Decision Support System Using Matrix Grammar | |
CN116975227A (zh) | 专利申请前评估与技术机会识别方法、存储介质及装置 | |
CN117634490A (zh) | 信息抽取方法、装置、设备、介质和程序产品 | |
Skepetaris | Deep learning-Object detection | |
CN114386433A (zh) | 基于情感分析的数据处理方法、装置、设备及存储介质 | |
Islam | An AI Design of Robot Communication using Natural Language Processing (NLP) | |
Rafaiejokandan | Attention in the Faithful Self-Explanatory NLP Models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 610042 No. 270, floor 2, No. 8, Jinxiu street, Wuhou District, Chengdu, Sichuan Applicant after: Chengdu shuzhilian Technology Co.,Ltd. Address before: No.2, floor 4, building 1, Jule road crossing, Section 1, West 1st ring road, Wuhou District, Chengdu City, Sichuan Province 610041 Applicant before: CHENGDU SHUZHILIAN TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |