CN110827177A - 类案文书查找方法及装置 - Google Patents
类案文书查找方法及装置 Download PDFInfo
- Publication number
- CN110827177A CN110827177A CN201810915510.XA CN201810915510A CN110827177A CN 110827177 A CN110827177 A CN 110827177A CN 201810915510 A CN201810915510 A CN 201810915510A CN 110827177 A CN110827177 A CN 110827177A
- Authority
- CN
- China
- Prior art keywords
- document
- legal
- case
- documents
- existing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000003860 storage Methods 0.000 claims description 14
- 238000009960 carding Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 14
- 238000004590 computer program Methods 0.000 description 10
- 208000014674 injury Diseases 0.000 description 9
- 208000027418 Wounds and injury Diseases 0.000 description 8
- 230000006378 damage Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 208000037974 severe injury Diseases 0.000 description 1
- 230000009528 severe injury Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Engineering & Computer Science (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种类案文书查找方法及装置,该方法先确定既有法律文书的文书类型,然后解析该既有法律文书的文书内容得到文书要素。从与既有法律文书的文书类型相匹配的法律文书中,搜索与该既有法律文书的文书要素相匹配的类案文书。利用该方法能够搜索多种类型法律文书的类案文书,而且,该方法根据既有法律文书的文书要素查找类案文书,保证查找到的类案文书在文书要素上与既有法律文书相似,从而提高了查找类案文书的准确率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及类案文书查找方法及装置。
背景技术
类案文书是指法律文书之间的案由、文书类型、案件主要事实、说理等方面总体上相似度高,属于同一类案件的法律文书。
本文中的法律文书是指不具有普遍约束力的非规范性法律文件即狭义的法律文书,是指国家司法机关、律师及律师事务所、仲裁机关、公证机关和案件当事人依法制作的处理各类诉讼案件以及非诉讼案件的具有法律效力或法律意义的非规范性文件的总称。其中,非规范性法律文件只适用于特定的人和特定的事。
目前的类案文书查找方式,仅针对裁判文书这一种类型的法律文书进行类案文书查找,即,所能查找、推送的法律文书类型单一。
发明内容
鉴于上述问题,提出了本发明提供了一种类案文书查找方法及装置,以解决相关的类案文书查找方法能够查找的法律文书类型单一的技术问题。其具体技术方案如下:
第一方面,本申请提供了一种类案文书查找方法,包括:
依据既有法律文书的内容确定文书类型;
解析所述既有法律文书的文书内容获得文书要素,所述文书要素为体现案件特征、影响裁判结果的事实、让法官对之进行法律认定与说理的内容;
从与所述既有法律文书的文书类型相匹配的法律文书中,搜索与所述既有法律文书的文书要素相匹配的类案文书。
在本申请一种可能的实现方式中,所述依据既有法律文书的内容确定文书类型,包括:
利用关键词识别规则或正则表达式规则识别所述既有法律文书中指定段落的内容,得到表征文书类型的内容特征;
依据所述内容特征确定所述既有法律文书的文书类型。
在本申请一种可能的实现方式中,所述解析所述既有法律文书的文书内容获得文书要素,包括:
根据所述既有法律文书的文书类型,对所述既有法律文书进行分段;
解析所述既有法律文书分段得到的指定段落的内容,获得所述既有法律文书的文书要素。
在本申请一种可能的实现方式中,所述文书要素包括至少一个文书要素项;
从与所述文书类型相匹配的法律文书中,搜索与所述既有法律文书的文书要素相匹配的类案文书,包括:
从文书库中搜索与所述既有法律文书的文书类型相匹配的待选法律文书;
确定与所述既有法律文书的文书类型相对应的类案搜索模型,所述类案搜索模型包括文书要素项及与所述文书要素项所对应的识别特征;
利用所述类案搜索模型所包含的与所述既有法律文书的每一所述文书要素项对应的识别特征,从所述待选法律文书中识别出包含所述文书要素项的法律文书,得到类案文书。
在本申请一种可能的实现方式中,所述方法还包括:
对一案由对应的法律法规内容进行拆解梳理,得到所述案由对应的文书要素项;
确定每一文书要素项对应的文书要素识别特征,以及,
确定每一文书要素项在一文书类型对应的法律文书的段落中的匹配权重,得到所述文书类型对应的类案搜索模型。
在本申请一种可能的实现方式中,所述方法还包括:
推送查找到的与所述既有法律文书的文书要素相匹配的类案文书。
在本申请一种可能的实现方式中,所述方法还包括:
标记每一所述类案文书所包含的与所述既有法律文书相匹配的文书要素;
对比展示所述既有法律文书所包含的文书要素及每一类案文书包含的与所述既有法律文书相匹配的文书要素;
按所述类案文书与既有法律文书的文书要素相匹配的数量由多到少的顺序推送所述类案文书。
第二方面,本申请还提供了一种类案文书查找装置,包括:
确定模块,用于依据既有法律文书的内容确定文书类型;
解析模块,用于解析所述既有法律文书的文书内容获得文书要素,所述文书要素为体现案件特征、影响裁判结果的事实、让法官对之进行法律认定与说理的内容;
查找模块,用于从与所述既有法律文书的文书类型相匹配的法律文书中,搜索与所述既有法律文书的文书要素相匹配的类案文书。
第三方面,本申请还提供了一种存储介质,其上存储有程序,所述程序被处理器执行时实现第一方面任一种可能的实现方式所述的类案文书查找方法。
第四方面,本申请还提供了一种处理器,所述处理器用于运行程序,所述程序运行时执行第一方面任一种可能的实现方式所述的类案文书查找方法。
本发明提供的类案文书查找方法,确定既有法律文书的文书类型,然后解析该既有法律文书的文书内容得到文书要素。从与既有法律文书的文书类型相匹配的法律文书中,搜索与该既有法律文书的文书要素相匹配的类案文书。利用该方法能够搜索多种类型法律文书的类案文书,而且,该方法根据既有法律文书的文书要素查找类案文书,保证查找到的类案文书在文书要素上与既有法律文书相似,从而提高了查找类案文书的准确率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请实施例一种法律文书推送方法的流程图;
图2示出了本申请实施例另一种法律文书推送方法的流程图;
图3示出了本申请实施例又一种法律文书推送方法的流程图;
图4示出了本申请实施例一种对比展示文书要素的示意图;
图5示出了本申请实施例一种类案文书查找装置的框图;
图6示出了本申请实施例另一种类案文书查找装置的框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
请参见图1,示出了本申请实施例一种类案文书查找方法的流程图,该方法应用于服务器中,该方法用于根据输入的既有法律文书,查找与该既有法律文书的文书类型相同,且文书要素相匹配的类案文书。
如图1所示,该方法可以包括以下步骤:
S110,获取既有法律文书。
既有法律文书通常是用户选择的座位推送依据的一篇法律文书。
S120,依据既有法律文书的内容确定文书类型。
例如,本申请涉及的法律文书可以包括裁判文书、起诉意见书、起诉书、起诉状、答辩状、庭审笔录等。
针对每一种法律文书,司法规范规定了相应的法律文书格式,因此,根据法律文书的格式特点识别法律文书的文书类型。
每一种法律文书,在标题或前几段内容中,运用关键词识别规则或正则表达式规则识别具体的关键词内容、诉讼地位内容等能够表征文书类型的内容特征,然后,根据该内容特征确定既有法律文书的文书类型。
例如,当识别出法律文书的标题和指定短路中包含关键词“起诉书”且包含关键词“检察机关”或“检察院”时,则确定该法律文书的文书类型为“起诉书”。
S130,解析既有法律文书的文书内容获得文书要素。
文书要素包括体现案件特征、影响裁判结果的事实、让法官对之进行法律认定与说理的内容。
对于既有法律文书,根据该法律文书的文书类型的格式特点,进行分段,不同的文书类型有各自的内容特点,分段的段落标题、分段内容可能都不同。然后,解析分段得到的指定段落的内容得到该既有法律文书的文书要素。
例如,如果既有法律文书是起诉书,则根据起诉书的格式特点进行分段,具体分为检察院段、文书类型段、起诉书号段、被告人情况段、案件情况段、案件事实段、公诉证据段、起诉要求和根据段、此致段、审理法院段、检察人员段、起诉日期段。然后,解析案件情况段、案件事实段、审理法院段等与文书要素相关段落的内容,最终得到起诉书的文书要素。
既有法律文书是裁判文书,则根据裁判文书的格式特点进行分段得到诉请段、辩称段、事实认定段、本院认为段、判决如下段,解析这些段落的内容,得到裁判文书的文书要素。
S140,从与既有法律文书的文书类型相匹配的法律文书中,搜索与所述既有法律文书的文书要素相匹配的类案文书。
从文书库中选择与既有法律文书的文书类型相匹配的法律文书,然后,识别这些法律文书的文书要素,确定与既有法律文书的文书要素相匹配的法律文书为该既有法律文书的类案文书。
可选地,在查找到与既有法律文书相匹配的类案文书后,向客户端推送该类案文书。本实施例提供的类案文书查找方法,确定既有法律文书的文书类型,然后解析该既有法律文书的文书内容得到文书要素。从与既有法律文书的文书类型相匹配的法律文书中,搜索与该既有法律文书的文书要素相匹配的类案文书。利用该方法能够查找多种类型法律文书的类案文书,而且,该查找方式根据既有法律文书的文书要素来查找类案文书,保证查找的类案文书在文书要素上与既有法律文书相似,从而提高了查找类案文书的准确率。
请参见图2,示出了本申请实施例另一种类案文书查找方法的流程图,该方法包括以下步骤:
S210,对一案由对应的法律法规内容进行拆解梳理,得到该案由对应的文书要素项。
预先根据案由对法律法规进行拆解梳理,得到该案由对应的文书要素项,然后,确定每一文书要素项所对应的识别特征。
案由是具体诉讼案件所涉及的法律关系的性质、内容的概括提要。不同的案件类型涉及的案由不同:
例如,刑事案件的案由中至少包括被告人的犯罪名称,例如,故意伤害罪。民事案件所涉及的案由有上千个,需要对民事案由进行梳理得到一级案由、二级案由、三级案由,其中,一级案由通常不会直接在裁判文书中出现,例如,“婚姻家庭纠纷”,二级案由和三级案由通常是裁判文书中表述的案由。行政案件的案由分为:作为类案件、不作为类案件、行政赔偿类案件等,例如,“治安行政处罚”、“税务行政赔偿”等。
例如,对于刑事案件的案由“非法拘禁罪”,搜集该案由相关的法律条款,《刑法》第二百三十八条、地方法规的实时细则,《湖北省高级人民法院<关于常见范围的量刑指导意见>实施细则》(四)中非法拘禁罪第1、2、3、4、5条。
然后,对“非法拘禁罪”的相关法律法规内容逐条进行拆解提取文书要素项,例如,《刑法》第二百三十八条“非法拘禁他人或者以其他方法非法剥夺他人人身自由的,处三年以下***、拘役、管制或者***。具有殴打、侮辱情节的,从重处罚。犯前款罪,致人重伤的,处三年以上十年以下***;致人死亡的,处十年以上***。使用暴力致人伤残、死亡的,依照本法第二百三十四条、第二百三十二条的规定定罪处罚。为索取债务非法扣押、拘禁他人的,依照前两款的规定处罚。机关工作人员利用职权犯前三款罪的,依照前三款的规定从重处罚。”可拆解出“具有殴打、侮辱情节的”、“致人重伤的”、“使用暴力致人伤残、死亡的”等,整理成如表1所示的文书要素表。
表1
文书要素项 |
非法拘禁 |
冒充军警|司法人员非法拘禁 |
国家机关工作人员利用职权非法拘禁 |
持凶器非法拘禁 |
具有殴打|侮辱|***情节 |
多次非法拘禁 |
索取非法债务非法拘禁 |
索取合法债务非法拘禁 |
非法拘禁超24小时 |
非法拘禁致人轻微伤 |
非法拘禁致人轻伤 |
非法拘禁致人重伤 |
非法拘禁致人死亡 |
伤残X级(依文书变动,如伤残一级) |
被害人精神失常 |
S220,确定该案由下的每一文书要素项所对应的文书要素识别特征。
可以根据不同的文书类型针对各类案由分别搜集对应的法律文书样本、总结该案由下该文书类型的文书要素识别特征。
其中,每个文书要素项可以根据法律文书样本中出现的具体语句选择以下至少一种识别规则得到文书要素识别项,识别规则包括但不限于以下四种:
1)关键词规则:在裁判文书的某个段落中只要包含该关键词,确定该裁判文书符合该案件情节项所对应的案件情节;
2)正则表达式规则:在裁判文书的某个段落中,有符合正则表达式的描述语句,确定该裁判文书符合所述案件情节项所对应的案件情节;
例如,裁判文书样本中“凶器”可以是砍刀、械镐把、电警棍、械具等具体的器具;同理,裁判文书样本中“非法拘禁”可以包括很多具体的拘禁情节,例如,“扣押、关押、限制行为”等。
因此,不能通过单一关键词“凶器”涵盖上述的器具;也不能通过单一关键词“拘禁”涵盖上述的具体拘禁情节,可以选择正则表达式法作为该两项依据项对应的情节识别特征。例如,正则表达式可以是(凶器|砍刀|械镐把|电警棍|手铐|械具).{0,40}(拘禁|扣押|限制|剥夺|关押)。当裁判文书中某一段落中出现(凶器|砍刀|械镐把|电警棍|手铐|械具)中的任意一个词,以及,出现(拘禁|扣押|限制|剥夺|关押)中的任意一个词时,确定该裁判文书的段落符合正则表达式规则;该实例中的{0,40}是指两个特征词之间的字符数可以是0~40。
3)正则表达式内容规则:在裁判文书的某个段落中,有符合正则表达式的描述语句,而且,该描述语句中的内容符合规则,确定该裁判文书符合该案件情节项所对应的案件情节。
正则表达式内容规则,不仅能够识别出符合条件的语句,还能找到符合具体内容的语句。例如,重伤1人,盗窃金额5439元等数字信息。
例如,既有文书中的一个案件情节是“重伤2人”,则可以根据“重伤2人”作为正则表达式内容,从而搜索到包含“重伤2人”的裁判文书。
而且,表2所示的案件情节项中具体的内容项可以根据既有文书中的具体内容进行调整,例如,既有文书中是“伤残一级”,则可以将表2中的“伤残X级”调整为伤残一级,并根据该案件情节项对应的情节识别规则识别出包含该情节的裁判文书并推送给用户。
4)适用法律规则:在裁判文书的适用法条中包含该规则规定的法条,则确定该裁判文书符合该案件情节项所对应的案件情节。
利用S210~S230获得各个案由与案件情节项和情节识别特征之间的对应关系之后,根据该对应关系确定既有文书的案件情节相匹配的目标情节识别特征。
S230,确定在每一文书类型对应的法律文书进行文书要素匹配的段落,得到该文书类型对应的类案搜索模型。
针对不同的文书类型,确定该文书类型的法律文书进行文书要素匹配的段落,即,在待选法律文书的哪些段落搜索是否包含某个文书要素项。例如,对于起诉书,根据起诉书的内容格式规则,在起诉书的案件事实段和起诉要求和根据段进行文书要素的识别。
根据梳理出的文书要素项、文书要素识别特征及文书要素的匹配段落,得到该文书类型对应的类案搜索模型。
其中,S210~S230是预处理过程,通常在类案推送前执行。预处理得到各个文书类型对应的类案搜索模型,后续直接使用对应的类案搜索模型识别文书库中的法律文书包含的文书要素。
S240,获取既有法律文书,并依据该既有法律文书的内容确定文书类型。
S250,根据该既有法律文书的文书类型,对既有法律文书进行分段。
S260,解析该既有法律文书分段得到的指定段落的内容,得到该既有法律文书的文书要素。
本实施例中的S240~S260与图1所示实施例中的步骤S110~S140相同,此处不再赘述。
S270,从文书库中搜索与既有法律文书的文书类型相匹配的待选法律文书。
确定既有法律文书的文书类型后,从文书库中选择相同文书类型的法律文书作为待选法律文书。
S280,利用与既有法律文书的文书类型对应的类案搜索模型所包含的与既有法律文书的每一文书要素项对应的识别特征,从待选法律文书中识别出包含该文书要素项的法律文书,得到类案文书。
选择与既有法律文书的文书类型对应的类案搜索模型,利用该类案搜索模型所包含的与既有法律文书的每一文书要素项对应的识别特征,从待选法律文书中识别出包含既有法律文书的文书要素的法律文书,作为类案文书。
S290,推送类案文书。
在本申请的一个实施例中,当既有法律文书包含多个文书要素项时,针对既有法律文书包含的每一个文书要素项,逐个识别待选法律文书中包含该文书要素项的法律文书,遍历既有法律文书所包含的全部文书要素项后,找到多个类案文书。然后,根据多个类案文书所包含的与既有法律文书相匹配的文书要素项的数量由多到少的顺序进行排序,并按顺序推送类案文书。
本实施例提供的类案文书查找方法,预先针对案由拆解、梳理法律法规内容得到该案由对应的文书要素项,然后确定每一文书要素项对应的识别特征。获取既有法律文书,并确定既有法律文书的文书类型;然后,解析获得该既有法律文书所包含的文书要素。然后,从与既有法律文书的文书类型相匹配的法律文书中,利用预先获得的与文书类型相匹配的类案搜索模型搜索与该既有法律文书的文书要素相匹配的类案文书。利用该方法能够推送多种类型法律文书的类案文书,而且,该推送方式根据既有法律文书的文书要素推送类案文书,保证推送的类案文书在文书要素上与既有法律文书相似,从而提高了类案推送的准确率。
请参见图3,示出了本申请实施例又一种类案文书查找方法的流程图,该方法在上述任一种类案文书查找方法实施例的推送类案文书之前还包括以下步骤:
S310,标记每一类案文书所包含的与既有法律文书相匹配的文书要素。
利用类案搜索模型查找出每一类案文书,标记该类案文书包含的与既有法律文书相匹配的全部文书要素项。
S320,对比显示既有法律文书所包含的文书要素及每一类案文书包含的与既有法律文书相匹配的文书要素。
聚合可视化展示既有法律文书所包含的文书要素及推送出的每一类案文书所包含的与既有法律文书相匹配的文书要素。
如图4所示,对比展示文书要素的示意图,如图4所示,既有法律文书所涉及的案由是“故意伤害罪”,所包含的文书要素项分别为“致人重伤”、“使用凶器”、“取得被害人或家属谅解”、“被害人有过错”、“致人死亡”、“报复”;而类案文书1包含的文书要素项分别为“致人重伤”、“使用凶器”、“取得被害人或家属谅解”。
既有法律文书所包含的文书要素项优先排在前面,类案文书所包含的文书要素项排在后面,用“√”表示既有法律文书和类案文书都包含的文书要素项,“-”表示既有法律文书包含但类案文书不包含的文书要素项。聚合可视化对比展示文书要素,能够直观展示类案包含的文书要素与既有法律文书包含的文书要素的对比情况及类案与既有法律文书的相似度。
推送类案文书的过程可以采用S330所述的过程。
S330,按类案文书与既有法律文书的文书要素相匹配的数量由多到少的顺序推送类案文书。
可以按照类案文书与既有法律文书相匹配的文书要素项的数量由多到少的顺序推送类案文书。
本实施例提供的类案文书查找方法,在确定出与既有法律文书的文书要素相匹配的类案文书后,标注类案文书所包含的与既有法律文书相匹配的文书要素项。对比显示既有法律文书的文书要素及类案文书包含的与既有法律文书相匹配的文书要素。这样,能够直观展示类案包含的文书要素与既有法律文书包含的文书要素的对比情况,以及,类案与既有法律文书的相似度。此外,按照类案文书与既有法律文书相匹配的文书要素项的数量由多到少的顺序推送类案文书,从而保证优先推送与既有法律文书最接近的类案文书。
相应于上述的类案文书查找方法实施例,本申请还提供了类案文书查找装置实施例。
请参见图5,示出了本申请实施例一种类案文书查找装置的框图,该装置应用于服务器中,该装置根据输入的既有法律文书查找与该既有法律文书的文书类型相同,且文书要素相匹配的类案文书。如图5所示,该装置包括确定模块110、解析模块120和查找模块130。
确定模块110,用于依据既有法律文书的内容确定文书类型。
在本申请的一个实施例中,该确定模块具体用于:利用关键词识别规则或正则表达式规则识别既有法律文书中指定段落的内容,得到表征文书类型的内容特征;依据内容特征确定既有法律文书的文书类型。
解析模块120,用于解析所述既有法律文书的文书内容获得文书要素。
所述文书要素为体现案件特征、影响裁判结果的事实、让法官对之进行法律认定与说理的内容。
在本申请的一个实施例中,该解析模块120具体用于:根据既有法律文书的文书类型,对既有法律文书进行分段;解析既有法律文书分段得到的指定段落的内容,获得既有法律文书的文书要素。
查找模块130,用于从与所述既有法律文书的文书类型相匹配的法律文书中,搜索与所述既有法律文书的文书要素相匹配的类案文书。
在本申请的一个实施例中,文书要素包括至少一个文书要素项,该查找模块130具体用于:
从文书库中搜索与既有法律文书的文书类型相匹配的待选法律文书;确定与既有法律文书的文书类型相对应的类案搜索模型,类案搜索模型包括文书要素项及与所述文书要素项所对应的识别特征;利用类案搜索模型所包含的与既有法律文书的每一所述文书要素项对应的识别特征,从待选法律文书中识别出包含文书要素项的法律文书得到类案文书。
在本申请的一个实施例中,得到类案搜索模型的过程如下:
对一案由对应的法律法规内容进行拆解梳理,得到该案由对应的文书要素项;确定每一文书要素项对应的文书要素识别特征,以及,确定每一文书要素项在一文书类型对应的法律文书的段落中的匹配权重,得到文书类型对应的类案搜索模型。
本实施例提供的类案文书查找装置,确定既有法律文书的文书类型,然后解析该既有法律文书的文书内容得到文书要素。从与既有法律文书的文书类型相匹配的法律文书中,搜索与该既有法律文书的文书要素相匹配的类案文书。利用该装置能够查找多种类型法律文书的类案文书,而且,该查找方式根据既有法律文书的文书要素来查找类案文书,保证查找的类案文书在文书要素上与既有法律文书相似,从而提高了查找类案文书的准确率。
请参见图6,示出了本申请实施例另一种类案文书查找装置的框图,该装置在图5所示实施例的基础上还包括:标记模块210、展示模块220和推送模块230。
标记模块210,用于标记每一类案文书所包含的与既有法律文书相匹配的文书要素。
利用类案搜索模型查找出每一类案文书,标记该类案文书包含的与既有法律文书相匹配的全部文书要素项。
展示模块220,用于对比展示既有法律文书所包含的文书要素及每一类案文书包含的与既有法律文书相匹配的文书要素。
可以采用图4所示的方式展示既有法律文书所包含的文书要素及推送出的每一类案文书所包含的与既有法律文书相匹配的文书要素。
推送模块230,用于按类案文书与既有法律文书的文书要素相匹配的数量由多到少的顺序推送类案文书。
可以按照类案文书与既有法律文书相匹配的文书要素项的数量由多到少的顺序推送类案文书。
在本申请的另一个实施例中,可以直接推送查找模块查找到的类案文书,此处不再赘述。
本实施例提供的类案文书查找装置,在确定出与既有法律文书的文书要素相匹配的类案文书后,标注类案文书所包含的与既有法律文书相匹配的文书要素项。对比显示既有法律文书的文书要素及类案文书包含的与既有法律文书相匹配的文书要素。这样,能够直观展示类案包含的文书要素与既有法律文书包含的文书要素的对比情况,以及,类案与既有法律文书的相似度。此外,按照类案文书与既有法律文书相匹配的文书要素项的数量由多到少的顺序推送类案文书,从而保证优先推送与既有法律文书最接近的类案文书。
所述类案文书查找装置包括处理器和存储器,上述确定模块、解析模块和查找等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现针对多种文书类型的类案文书查找,而且,依据既有法律文书的文书要素查找类案文书,保证了查找的类案文书的准确率。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述类案文书查找方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述类案文书查找方法。
本发明实施例提供了一种设备,本文中的设备可以是服务器、PC、PAD、手机等。
该设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
依据既有法律文书的内容确定文书类型;
解析所述既有法律文书的文书内容获得文书要素,所述文书要素为体现案件特征、影响裁判结果的事实、让法官对之进行法律认定与说理的内容;
从与所述既有法律文书的文书类型相匹配的法律文书中,搜索与所述既有法律文书的文书要素相匹配的类案文书。
在本申请一种可能的实现方式中,所述依据既有法律文书的内容确定文书类型,包括:
利用关键词识别规则或正则表达式规则识别所述既有法律文书中指定段落的内容,得到表征文书类型的内容特征;
依据所述内容特征确定所述既有法律文书的文书类型。
在本申请一种可能的实现方式中,所述解析所述既有法律文书的文书内容获得文书要素,包括:
根据所述既有法律文书的文书类型,对所述既有法律文书进行分段;
解析所述既有法律文书分段得到的指定段落的内容,获得所述既有法律文书的文书要素。
在本申请一种可能的实现方式中,所述文书要素包括至少一个文书要素项;
从与所述文书类型相匹配的法律文书中,搜索与所述既有法律文书的文书要素相匹配的类案文书,包括:
从文书库中搜索与所述既有法律文书的文书类型相匹配的待选法律文书;
确定与所述既有法律文书的文书类型相对应的类案搜索模型,所述类案搜索模型包括文书要素项及与所述文书要素项所对应的识别特征;
利用所述类案搜索模型所包含的与所述既有法律文书的每一所述文书要素项对应的识别特征,从所述待选法律文书中识别出包含所述文书要素项的法律文书,得到类案文书。
在本申请一种可能的实现方式中,所述方法还包括:
对一案由对应的法律法规内容进行拆解梳理,得到所述案由对应的文书要素项;
确定每一文书要素项对应的文书要素识别特征,以及,
确定每一文书要素项在一文书类型对应的法律文书的段落中的匹配权重,得到所述文书类型对应的类案搜索模型。
在本申请一种可能的实现方式中,所述方法还包括:
推送查找到的与所述既有法律文书的文书要素相匹配的类案文书。
在本申请一种可能的实现方式中,所述方法还包括:
标记每一所述类案文书所包含的与所述既有法律文书相匹配的文书要素;
对比展示所述既有法律文书所包含的文书要素及每一类案文书包含的与所述既有法律文书相匹配的文书要素;
按所述类案文书与既有法律文书的文书要素相匹配的数量由多到少的顺序推送所述类案文书。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
依据既有法律文书的内容确定文书类型;
解析所述既有法律文书的文书内容获得文书要素,所述文书要素为体现案件特征、影响裁判结果的事实、让法官对之进行法律认定与说理的内容;
从与所述既有法律文书的文书类型相匹配的法律文书中,搜索与所述既有法律文书的文书要素相匹配的类案文书。
在本申请一种可能的实现方式中,所述依据既有法律文书的内容确定文书类型,包括:
利用关键词识别规则或正则表达式规则识别所述既有法律文书中指定段落的内容,得到表征文书类型的内容特征;
依据所述内容特征确定所述既有法律文书的文书类型。
在本申请一种可能的实现方式中,所述解析所述既有法律文书的文书内容获得文书要素,包括:
根据所述既有法律文书的文书类型,对所述既有法律文书进行分段;
解析所述既有法律文书分段得到的指定段落的内容,获得所述既有法律文书的文书要素。
在本申请一种可能的实现方式中,所述文书要素包括至少一个文书要素项;
从与所述文书类型相匹配的法律文书中,搜索与所述既有法律文书的文书要素相匹配的类案文书,包括:
从文书库中搜索与所述既有法律文书的文书类型相匹配的待选法律文书;
确定与所述既有法律文书的文书类型相对应的类案搜索模型,所述类案搜索模型包括文书要素项及与所述文书要素项所对应的识别特征;
利用所述类案搜索模型所包含的与所述既有法律文书的每一所述文书要素项对应的识别特征,从所述待选法律文书中识别出包含所述文书要素项的法律文书,得到类案文书。
在本申请一种可能的实现方式中,所述方法还包括:
对一案由对应的法律法规内容进行拆解梳理,得到所述案由对应的文书要素项;
确定每一文书要素项对应的文书要素识别特征,以及,
确定每一文书要素项在一文书类型对应的法律文书的段落中的匹配权重,得到所述文书类型对应的类案搜索模型。
在本申请一种可能的实现方式中,所述方法还包括:
推送查找到的与所述既有法律文书的文书要素相匹配的类案文书。
在本申请一种可能的实现方式中,所述方法还包括:
标记每一所述类案文书所包含的与所述既有法律文书相匹配的文书要素;
对比展示所述既有法律文书所包含的文书要素及每一类案文书包含的与所述既有法律文书相匹配的文书要素;
按所述类案文书与既有法律文书的文书要素相匹配的数量由多到少的顺序推送所述类案文书。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种类案文书查找方法,其特征在于,包括:
依据既有法律文书的内容确定文书类型;
解析所述既有法律文书的文书内容获得文书要素,所述文书要素为体现案件特征、影响裁判结果的事实、让法官对之进行法律认定与说理的内容;
从与所述既有法律文书的文书类型相匹配的法律文书中,搜索与所述既有法律文书的文书要素相匹配的类案文书。
2.根据权利要求1所述的方法,其特征在于,所述依据既有法律文书的内容确定文书类型,包括:
利用关键词识别规则或正则表达式规则识别所述既有法律文书中指定段落的内容,得到表征文书类型的内容特征;
依据所述内容特征确定所述既有法律文书的文书类型。
3.根据权利要求1所述的方法,其特征在于,所述解析所述既有法律文书的文书内容获得文书要素,包括:
根据所述既有法律文书的文书类型,对所述既有法律文书进行分段;
解析所述既有法律文书分段得到的指定段落的内容,获得所述既有法律文书的文书要素。
4.根据权利要求1所述的方法,其特征在于,所述文书要素包括至少一个文书要素项;
从与所述文书类型相匹配的法律文书中,搜索与所述既有法律文书的文书要素相匹配的类案文书,包括:
从文书库中搜索与所述既有法律文书的文书类型相匹配的待选法律文书;
确定与所述既有法律文书的文书类型相对应的类案搜索模型,所述类案搜索模型包括文书要素项及与所述文书要素项所对应的识别特征;
利用所述类案搜索模型所包含的与所述既有法律文书的每一所述文书要素项对应的识别特征,从所述待选法律文书中识别出包含所述文书要素项的法律文书,得到类案文书。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
对一案由对应的法律法规内容进行拆解梳理,得到所述案由对应的文书要素项;
确定每一文书要素项对应的文书要素识别特征,以及,
确定每一文书要素项在一文书类型对应的法律文书的段落中的匹配权重,得到所述文书类型对应的类案搜索模型。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
推送查找到的与所述既有法律文书的文书要素相匹配的类案文书。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
标记每一所述类案文书所包含的与所述既有法律文书相匹配的文书要素;
对比展示所述既有法律文书所包含的文书要素及每一类案文书包含的与所述既有法律文书相匹配的文书要素;
按所述类案文书与既有法律文书的文书要素相匹配的数量由多到少的顺序推送所述类案文书。
8.一种类案文书查找装置,其特征在于,包括:
确定模块,用于依据既有法律文书的内容确定文书类型;
解析模块,用于解析所述既有法律文书的文书内容获得文书要素,所述文书要素为体现案件特征、影响裁判结果的事实、让法官对之进行法律认定与说理的内容;
查找模块,用于从与所述既有法律文书的文书类型相匹配的法律文书中,搜索与所述既有法律文书的文书要素相匹配的类案文书。
9.一种存储介质,其上存储有程序,其特征在于,所述程序被处理器执行时实现权利要求1至7任一项所述的类案文书查找方法。
10.一种处理器,所述处理器用于运行程序,其特征在于,所述程序运行时执行权利要求1至7任一项所述的类案文书查找方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810915510.XA CN110827177A (zh) | 2018-08-13 | 2018-08-13 | 类案文书查找方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810915510.XA CN110827177A (zh) | 2018-08-13 | 2018-08-13 | 类案文书查找方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110827177A true CN110827177A (zh) | 2020-02-21 |
Family
ID=69546839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810915510.XA Pending CN110827177A (zh) | 2018-08-13 | 2018-08-13 | 类案文书查找方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110827177A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112507350A (zh) * | 2020-11-18 | 2021-03-16 | 中国工商银行股份有限公司 | 用于协助执行查控业务的认证方法和装置 |
CN112507079A (zh) * | 2020-12-15 | 2021-03-16 | 科大讯飞股份有限公司 | 文书间案情匹配方法、装置、设备及存储介质 |
CN113486158A (zh) * | 2021-09-08 | 2021-10-08 | 中国司法大数据研究院有限公司 | 基于案情比对的类案检索方法、装置、设备及存储介质 |
CN114547245A (zh) * | 2022-02-21 | 2022-05-27 | 山东大学 | 一种基于法律要素的类案检索方法及*** |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003263458A (ja) * | 2002-03-07 | 2003-09-19 | Ricoh Co Ltd | テキスト分析方法及び装置 |
CN106991092A (zh) * | 2016-01-20 | 2017-07-28 | 阿里巴巴集团控股有限公司 | 基于大数据挖掘相似裁判文书的方法和设备 |
CN107330071A (zh) * | 2017-06-30 | 2017-11-07 | 北京神州泰岳软件股份有限公司 | 一种法律咨询信息智能答复方法及平台 |
CN107590131A (zh) * | 2017-10-16 | 2018-01-16 | 北京神州泰岳软件股份有限公司 | 一种规范文书处理方法、装置及*** |
CN108009299A (zh) * | 2017-12-28 | 2018-05-08 | 北京市律典通科技有限公司 | 法律审判业务处理方法和装置 |
CN108038091A (zh) * | 2017-10-30 | 2018-05-15 | 上海思贤信息技术股份有限公司 | 一种基于图的裁判文书案件相似计算与检索方法及*** |
CN108334500A (zh) * | 2018-03-05 | 2018-07-27 | 上海思贤信息技术股份有限公司 | 一种基于机器学习算法的裁判文书标注方法及装置 |
-
2018
- 2018-08-13 CN CN201810915510.XA patent/CN110827177A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003263458A (ja) * | 2002-03-07 | 2003-09-19 | Ricoh Co Ltd | テキスト分析方法及び装置 |
CN106991092A (zh) * | 2016-01-20 | 2017-07-28 | 阿里巴巴集团控股有限公司 | 基于大数据挖掘相似裁判文书的方法和设备 |
CN107330071A (zh) * | 2017-06-30 | 2017-11-07 | 北京神州泰岳软件股份有限公司 | 一种法律咨询信息智能答复方法及平台 |
CN107590131A (zh) * | 2017-10-16 | 2018-01-16 | 北京神州泰岳软件股份有限公司 | 一种规范文书处理方法、装置及*** |
CN108038091A (zh) * | 2017-10-30 | 2018-05-15 | 上海思贤信息技术股份有限公司 | 一种基于图的裁判文书案件相似计算与检索方法及*** |
CN108009299A (zh) * | 2017-12-28 | 2018-05-08 | 北京市律典通科技有限公司 | 法律审判业务处理方法和装置 |
CN108334500A (zh) * | 2018-03-05 | 2018-07-27 | 上海思贤信息技术股份有限公司 | 一种基于机器学习算法的裁判文书标注方法及装置 |
Non-Patent Citations (1)
Title |
---|
张德: "自然语言处理技术在司法过程中的应用研究", 《信息与电脑》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112507350A (zh) * | 2020-11-18 | 2021-03-16 | 中国工商银行股份有限公司 | 用于协助执行查控业务的认证方法和装置 |
CN112507350B (zh) * | 2020-11-18 | 2023-11-17 | 中国工商银行股份有限公司 | 用于协助执行查控业务的认证方法和装置 |
CN112507079A (zh) * | 2020-12-15 | 2021-03-16 | 科大讯飞股份有限公司 | 文书间案情匹配方法、装置、设备及存储介质 |
CN112507079B (zh) * | 2020-12-15 | 2023-01-17 | 科大讯飞股份有限公司 | 文书间案情匹配方法、装置、设备及存储介质 |
CN113486158A (zh) * | 2021-09-08 | 2021-10-08 | 中国司法大数据研究院有限公司 | 基于案情比对的类案检索方法、装置、设备及存储介质 |
CN113486158B (zh) * | 2021-09-08 | 2021-12-14 | 中国司法大数据研究院有限公司 | 基于案情比对的类案检索方法、装置、设备及存储介质 |
CN114547245A (zh) * | 2022-02-21 | 2022-05-27 | 山东大学 | 一种基于法律要素的类案检索方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109446513B (zh) | 一种基于自然语言理解的文本中事件的抽取方法 | |
CN110827177A (zh) | 类案文书查找方法及装置 | |
CN111695033A (zh) | 企业舆情分析方法、装置、电子设备及介质 | |
CN109508373B (zh) | 企业舆情指数的计算方法、设备及计算机可读存储介质 | |
CN111310446A (zh) | 裁判文书的信息抽取方法及装置 | |
CN110765760B (zh) | 一种法律案件分配方法、装置、存储介质和服务器 | |
CN111104798A (zh) | 法律文书中的量刑情节的解析方法、***及计算机可读存储介质 | |
GB2449125A (en) | Metadata with degree of trust indication | |
CN111428466B (zh) | 法律文书解析方法及装置 | |
CN110032721B (zh) | 一种裁判文书推送方法及装置 | |
CN111553151A (zh) | 一种基于字段相似度计算的问题推荐方法、装置和服务器 | |
Beytía et al. | Visual gender biases in wikipedia: A systematic evaluation across the ten most spoken languages | |
EP3301603A1 (en) | Improved search for data loss prevention | |
CN111078828A (zh) | 一种企业历史信息抽取方法及*** | |
CN110020134B (zh) | 一种知识服务信息的推送方法、***、存储介质和处理器 | |
CN110580301A (zh) | 一种高效商标检索方法、***及平台 | |
Lawton et al. | eDiscovery in digital forensic investigations | |
CN111813947A (zh) | 开庭询问提纲自动生成方法及装置 | |
CN112559677A (zh) | 法律法规的检索方法及相关装置 | |
CN113971207A (zh) | 文档关联方法及装置、电子设备和存储介质 | |
Talbot et al. | Regulating 3D-printed guns post-heller: Why two steps are better than one | |
CN113051903A (zh) | 语句、案件经过、量刑情节和司法文书一致性比对方法 | |
Vesanto | Detecting and analyzing text reuse with BLAST | |
JP2006293616A (ja) | 文書集約方法及び装置及びプログラム | |
Plachouras et al. | Information extraction of regulatory enforcement actions: From anti-money laundering compliance to countering terrorism finance |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200221 |