CN111241274A - 刑事法律文书处理方法和装置、存储介质和电子设备 - Google Patents

刑事法律文书处理方法和装置、存储介质和电子设备 Download PDF

Info

Publication number
CN111241274A
CN111241274A CN201911421891.7A CN201911421891A CN111241274A CN 111241274 A CN111241274 A CN 111241274A CN 201911421891 A CN201911421891 A CN 201911421891A CN 111241274 A CN111241274 A CN 111241274A
Authority
CN
China
Prior art keywords
case
label
type
criminal
conditions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911421891.7A
Other languages
English (en)
Other versions
CN111241274B (zh
Inventor
李�根
郄妍飞
张晓东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisino Corp
Original Assignee
Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisino Corp filed Critical Aisino Corp
Priority to CN201911421891.7A priority Critical patent/CN111241274B/zh
Publication of CN111241274A publication Critical patent/CN111241274A/zh
Application granted granted Critical
Publication of CN111241274B publication Critical patent/CN111241274B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Alarm Systems (AREA)

Abstract

本公开涉及一种刑事法律文书处理方法和装置、存储介质和电子设备,所述方法包括:将刑事法律文书输入预训练的标签分类模型;获取所述标签分类模型输出的案件标签;其中,所述标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签。

Description

刑事法律文书处理方法和装置、存储介质和电子设备
技术领域
本公开涉及文本处理领域,具体地,涉及一种刑事法律文书处理方法和装置、存储介质和电子设备。
背景技术
在刑事案件的办理过程中,涉及到许多非结构化的法律文书,例如起诉书、判决书、刑事自述状等,在这些法律文书中,案情相关的信息散布在各种语段中,难以***地提取到案情相关的信息。当用户需要查看案情相关的信息时,需要将这些文件一一浏览并手动提取有用的信息,不仅效率较低,而且容易因漏读而忽略相关的信息。
发明内容
本公开的目的是提供一种刑事法律文书处理方法和装置、存储介质和电子设备,以解决上述的技术问题。
为了实现上述目的,本公开的第一方面,提供一种刑事法律文书处理方法。
可选地,所述方法包括:将刑事法律文书输入预训练的标签分类模型;获取所述标签分类模型输出的案件标签;其中,所述标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签。
可选地,所述方法还包括:将所述刑事法律文书和所述案件标签作为一个案件信息,存入案件数据库。
可选地,所述方法还包括:根据所述案件数据库中的案件信息,生成可视化的展示结果,所述展示结果用于展示所述案件数据库中的案件数量和/ 或所述案件信息的所述案件标签。
本公开的第二方面,提供一种刑事法律文书处理装置。所述装置包括:输入模块,用于将刑事法律文书输入预训练的标签分类模型;获取模块,用于获取所述标签分类模型输出的案件标签;其中,所述标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签。
可选地,所述装置还包括:存储模块,用于将所述刑事法律文书和所述案件标签作为一个案件信息,存入案件数据库。
可选地,所述装置还包括:展示模块,用于根据所述案件数据库中的案件信息,生成可视化的展示结果,所述展示结果用于展示所述案件数据库中的案件数量和/或所述案件信息的所述案件标签。
可选地,所述装置还包括:筛选模块,用于获取筛选条件,并根据所述筛选条件和所述案件标签,从案件数据库中确定目标案件信息;所述展示模块,用于根据目标案件信息生成可视化的展示结果;其中,所述筛选条件包括时间段条件、案件类型条件、涉案人员条件、案件地区条件、经案人员条件、涉案金额条件、作案次数条件。
本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开的第一方面中任一项所述方法的步骤。
本公开的第四方面,提供一种电子设备,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现本公开的第一方面中任一项所述方法的步骤。
通过上述技术方案,通过使用样本法律文书、样本案件类型和样本标签训练得到的标签分类模型自动从刑事法律文书中提取案情相关的案件标签,使用户在需要查看案件情况时能够快速地提取到案件中的有效信息,提高了用户对刑事法律文书中的信息的提取及处理效率,且整个过程减少了人工参与,从而减少了案件信息被遗漏的风险。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是根据一示例性公开实施例示出的一种刑事法律文书处理方法的流程图。
图2是根据一示例性公开实施例示出的一种刑事法律文书处理方法的流程图。
图3是根据一示例性公开实施例示出的一种刑事法律文书处理装置的框图。
图4是根据一示例性公开实施例示出的一种电子设备的框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
图1是根据一示例性公开实施例示出的一种刑事法律文书处理方法的流程图。该方法可以应用于检务相关的软件、应用程序、***中,如图1所示,该方法包括以下步骤:
S11、将刑事法律文书输入预训练的标签分类模型。
其中,刑事法律文书可以是起诉书、判决书、刑事自述状、逮捕状等各种在刑事案件中可能使用到的文书资料,并且,在本实施例中,对一个案件而言,不拘于是输入一个法律文书(如仅输入一份起诉书),还是输入案件相关的所有法律文书,标签分类模型可以对一次输入的所有文件进行处理,得到一个案件相关的案件标签。
S12、获取所述标签分类模型输出的案件标签。
案件标签可以是以“标签类型:标签结果值”的形式生成的,例如,对一个毒品犯罪案件而言,该案件标签可以包括以下的内容:
涉案人员(主犯):李某
涉案人员(从犯):无
毒品类型:***700g
毒品类型:***1000g
犯罪类型:走私毒品
作案时间:20XX年X月X日
量刑:死刑(缓期两年执行)
减轻情节:无
加重情节:累犯
经案人员:张某(法官)、王某(检察官)、徐某(书记员)
对于一个故意伤害罪而言,该案件标签可以包括以下的内容:
涉案人员(主犯):李某
涉案人员(从犯):无
作案时间:20XX年X月X日
作案工具:水果刀
被害人情况:死亡
量刑:***
减轻情节:自首
加重情节:致人死亡
经案人员:张某(法官)、王某(检察官)、徐某(书记员)
值得说明的是,上述案件类型和案件类型对应的标签类型仅作为举例说明,并非对本公开中的案件类型与标签类型的对应关系的限定。并且,对于不同案件类型的刑事法律文书,其得到的标签类型也不相同,例如只有毒品犯罪才会涉及毒品类型标签,只有人身伤害类型的犯罪才会涉及作案工具标签。案件类型与标签类型的对应关系可以是预先存储的对应表格,在输入了刑事法律文书时,标签分类模型先确定该刑事法律文书对应的案件类型,再从表格中查询该案件类型对应的标签类型;该案件类型与标签类型的对应关系也可以是通过标签分类模型对样本法律文书、样本案件类型及样本标签训练得到的。
标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签。
标签分类模型包括了语言表征模块、属性抽取模块、关系提取模块。
语言表征模块的其编码器由一个多头的自注意力机制和全连接的前馈网络构成,多头自注意力机制可以在多个文本信息子空间提取注意力信息,使得模型的注意力并不仅仅局限于单个的信息源,而是同时注意到输入序列的多个位置上的输入,并且在输入层加入了词向量的位置编码信息。解码器将编码器的输出馈送至另一个多头注意力机制,最后下层依然是一个前馈网络。通过语言表征模块,可以将刑事法律文书转换成模型的其他模块可以处理的文字编码文件。
属性抽取模块采用了基于层级注意力机制的弱监督属性抽取方法,先使用粗粒度的句子级别注意力机制选择几个与属性类型相关的句子,然后使用分段卷积神经网络和词级别的注意力机制提取每个句子的特征,最后使用细粒度的句子级别注意力机制筛选与实体之间的属性语义关系更相关的句子特征,得到整个句子集合的向量表示,并将该向量表示传给一个分类器来预测实体之间的属性语义关系。
关系提取模块首先使用双向长短期记忆网络来提取词之间的依赖信息;其次使用卷积神经网络来获取句子的更抽象的特征表示,并将该特征表示传给一个多标签分类器来预测句子中包含的语义关系;最后将双向长短期记忆网络提取的词向量与多标签分类器预测的关系向量进行联合,并传递给另一个长短期记忆网络来预测每个词的标签,得到每个关系对应的实体对。
通过上述三个模块对样本法律文书、样本案件类型和样本标签的学习,标签分类模型可以学习到不同的样本标签与文字表述之间的关系,从而在获取到输入的刑事法律文书后,通过分析刑事法律文书中的文字表述,生成对应的案件标签。
在一种可能的实施方式中,在获得了案件标签之后,还可以将所述刑事法律文书和所述案件标签作为一个案件信息,存入案件数据库。
案件数据库中存有多个案件信息,每个案件信息中都包括一组刑事法律文书以及对应的案件标签。
在应用时,可以直接对单个案件的案件信息进行展示,或者对单个案件的案件标签进行展示。还可以根据所述案件数据库中的案件信息,生成可视化的展示结果,所述展示结果用于展示所述案件数据库中的案件数量和/或所述案件信息的所述案件标签。
该可视化的展示结果可以以饼状图、折线图、柱状图、人物关系网络等方式展示。例如,可以根据数据库中的案件的涉案人员年龄段,生成犯罪年龄段占比的饼状图,可以根据数据库中的案件的数量变化,生成犯罪数量月变化折线图,可以根据数据库中的同类案件的量刑情况生成柱状图进行对比查看,还可以根据相同的涉案人员或经案人员生成标注了不同案件情况的人物关系网络图。这样,可以使生成的案件标签更直观地展示给用户,进一步提高用户提取刑事法律文书中的案情信息的效率。
通过上述技术方案,通过使用样本法律文书、样本案件类型和样本标签训练得到的标签分类模型自动从刑事法律文书中提取案情相关的案件标签,使用户在需要查看案件情况时能够快速地提取到案件中的有效信息,提高了用户对刑事法律文书中的信息的提取及处理效率,且整个过程减少了人工参与,从而减少了案件信息被遗漏的风险。
图2是根据一示例性公开实施例示出的一种刑事法律文书处理方法的流程图。该方法可以应用于检务相关的软件、应用程序、***中,如图2所示,该方法包括以下步骤:
S21、将刑事法律文书输入预训练的标签分类模型。
其中,刑事法律文书可以是起诉书、判决书、刑事自述状、逮捕状等各种在刑事案件中可能使用到的文书资料,并且,在本实施例中,对一个案件而言,不拘于是输入一个法律文书(如仅输入一份起诉书),还是输入案件相关的所有法律文书,标签分类模型可以对一次输入的所有文件进行处理,得到一个案件相关的案件标签。
S22、获取所述标签分类模型输出的案件标签。
案件标签可以是以“标签类型:标签结果值”的形式生成的,例如,对一个毒品犯罪案件而言,该案件标签可以包括以下的内容:
涉案人员(主犯):李某
涉案人员(从犯):无
毒品类型:***700g
毒品类型:***1000g
犯罪类型:走私毒品
作案时间:20XX年X月X日
量刑:死刑(缓期两年执行)
减轻情节:无
加重情节:累犯
经案人员:张某(法官)、王某(检察官)、徐某(书记员)
对于一个故意伤害罪而言,该案件标签可以包括以下的内容:
涉案人员(主犯):李某
涉案人员(从犯):无
作案时间:20XX年X月X日
作案工具:水果刀
被害人情况:死亡
量刑:***
减轻情节:自首
加重情节:致人死亡
经案人员:张某(法官)、王某(检察官)、徐某(书记员)
值得说明的是,上述案件类型和案件类型对应的标签类型仅作为举例说明,并非对本公开中的案件类型与标签类型的对应关系的限定。并且,对于不同案件类型的刑事法律文书,其得到的标签类型也不相同,例如只有毒品犯罪才会涉及毒品类型标签,只有人身伤害类型的犯罪才会涉及作案工具标签。案件类型与标签类型的对应关系可以是预先存储的对应表格,在输入了刑事法律文书时,标签分类模型先确定该刑事法律文书对应的案件类型,再从表格中查询该案件类型对应的标签类型;该案件类型与标签类型的对应关系也可以是通过标签分类模型对样本法律文书、样本案件类型及样本标签训练得到的。
标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签。
标签分类模型包括了语言表征模块、属性抽取模块、关系提取模块。
语言表征模块的其编码器由一个多头的自注意力机制和全连接的前馈网络构成,多头自注意力机制可以在多个文本信息子空间提取注意力信息,使得模型的注意力并不仅仅局限于单个的信息源,而是同时注意到输入序列的多个位置上的输入,并且在输入层加入了词向量的位置编码信息。解码器将编码器的输出馈送至另一个多头注意力机制,最后下层依然是一个前馈网络。通过语言表征模块,可以将刑事法律文书转换成模型的其他模块可以处理的文字编码文件。
属性抽取模块采用了基于层级注意力机制的弱监督属性抽取方法,先使用粗粒度的句子级别注意力机制选择几个与属性类型相关的句子,然后使用分段卷积神经网络和词级别的注意力机制提取每个句子的特征,最后使用细粒度的句子级别注意力机制筛选与实体之间的属性语义关系更相关的句子特征,得到整个句子集合的向量表示,并将该向量表示传给一个分类器来预测实体之间的属性语义关系。
关系提取模块首先使用双向长短期记忆网络来提取词之间的依赖信息;其次使用卷积神经网络来获取句子的更抽象的特征表示,并将该特征表示传给一个多标签分类器来预测句子中包含的语义关系;最后将双向长短期记忆网络提取的词向量与多标签分类器预测的关系向量进行联合,并传递给另一个长短期记忆网络来预测每个词的标签,得到每个关系对应的实体对。
通过上述三个模块对样本法律文书、样本案件类型和样本标签的学习,标签分类模型可以学习到不同的样本标签与文字表述之间的关系,从而在获取到输入的刑事法律文书后,通过分析刑事法律文书中的文字表述,生成对应的案件标签。
S23、将所述刑事法律文书和所述案件标签作为一个案件信息,存入案件数据库。
案件数据库中存有多个案件信息,每个案件信息中都包括一组刑事法律文书以及对应的案件标签。
S24、获取筛选条件。
在使用数据库中的数据生成可视化的展示结果前,可以先获取用户输入的筛选条件,其中,所述筛选条件包括时间段条件、案件类型条件、涉案人员条件、案件地区条件、经案人员条件、涉案金额条件、作案次数条件。
S25、根据所述筛选条件和所述案件标签,从案件数据库中确定目标案件信息。
通过筛选对案件标签的筛选,可以从案件数据库中确定多个目标案件信息。例如,当获取到用户输入的“涉案人员:张某”的筛选条件时,可以从案件数据库中筛选案件标签包括了“涉案人员:张某”标签的案件信息作为目标案件信息;当获取到用户输入的“案件地区:北京”的筛选条件时,可以从案件数据库中筛选案件标签包括了“案件地区:北京”标签的案件信息作为目标案件信息;当在2019年12月31日获取到了用户输入的“案件时间:一年内”的筛选条件时,可以从案件数据库中筛选案件标签的作案时间 (或判决时间)标签结果为“2018年12月31日”至“2019年12月31日”之间的案件信息作为目标案件信息。
S26、根据目标案件信息生成可视化的展示结果。
该可视化的展示结果可以以饼状图、折线图、柱状图、人物关系网络等方式展示。例如,可以根据数据库中的案件的涉案人员年龄段,生成犯罪年龄段占比的饼状图,可以根据数据库中的案件的数量变化,生成犯罪数量月变化折线图,可以根据数据库中的同类案件的量刑情况生成柱状图进行对比查看,还可以根据相同的涉案人员或经案人员生成标注了不同案件情况的人物关系网络图。这样,可以使生成的案件标签更直观地展示给用户,进一步提高用户提取刑事法律文书中的案情信息的效率。
通过上述技术方案,通过使用样本法律文书、样本案件类型和样本标签训练得到的标签分类模型自动从刑事法律文书中提取案情相关的案件标签,使用户在需要查看案件情况时能够快速地提取到案件中的有效信息,提高了用户对刑事法律文书中的信息的提取及处理效率,且整个过程减少了人工参与,从而减少了案件信息被遗漏的风险,并且,可以根据用户输入的筛选条件确定符合筛选条件的案件信息,并根据这些案件信息生成可视化的展示结果,使生成的案件标签更直观地展示给用户,进一步提高用户提取刑事法律文书中的案情信息的效率。
图3是根据一示例性公开实施例示出的一种刑事法律文书处理装置的框图。该装置可以应用于检务相关的软件、应用程序、***中,如图3所示,所述装置300包括:
输入模块301,用于将刑事法律文书输入预训练的标签分类模型。
获取模块302,用于获取所述标签分类模型输出的案件标签。
其中,所述标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签。
可选地,所述装置还包括:存储模块,用于将所述刑事法律文书和所述案件标签作为一个案件信息,存入案件数据库。
可选地,所述装置还包括:展示模块,用于根据所述案件数据库中的案件信息,生成可视化的展示结果,所述展示结果用于展示所述案件数据库中的案件数量和/或所述案件信息的所述案件标签。
可选地,所述装置还包括:筛选模块,用于获取筛选条件,并根据所述筛选条件和所述案件标签,从案件数据库中确定目标案件信息;所述展示模块,用于根据目标案件信息生成可视化的展示结果;其中,所述筛选条件包括时间段条件、案件类型条件、涉案人员条件、案件地区条件、经案人员条件、涉案金额条件、作案次数条件。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
通过上述技术方案,通过使用样本法律文书、样本案件类型和样本标签训练得到的标签分类模型自动从刑事法律文书中提取案情相关的案件标签,使用户在需要查看案件情况时能够快速地提取到案件中的有效信息,提高了用户对刑事法律文书中的信息的提取及处理效率,且整个过程减少了人工参与,从而减少了案件信息被遗漏的风险,并且,可以根据用户输入的筛选条件确定符合筛选条件的案件信息,并根据这些案件信息生成可视化的展示结果,使生成的案件标签更直观地展示给用户,进一步提高用户提取刑事法律文书中的案情信息的效率。
图4是根据一示例性实施例示出的一种电子设备400的框图。如图4所示,该电子设备400可以包括:处理器401,存储器402。该电子设备400 还可以包括多媒体组件403,输入/输出(I/O)接口404,以及通信组件405 中的一者或多者。
其中,处理器401用于控制该电子设备400的整体操作,以完成上述的刑事法律文书处理方法中的全部或部分步骤。存储器402用于存储各种类型的数据以支持在该电子设备400的操作,这些数据例如可以包括用于在该电子设备400上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器402可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称 EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件403可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器402或通过通信组件405发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口404为处理器401 和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件405用于该电子设备400与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G、4G、NB-IOT、 eMTC、或其他5G等等,或它们中的一种或几种的组合,在此不做限定。因此相应的该通信组件405可以包括:Wi-Fi模块,蓝牙模块,NFC模块等等。
在一示例性实施例中,电子设备400可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器 (DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的刑事法律文书处理方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的刑事法律文书处理方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器402,上述程序指令可由电子设备400的处理器401执行以完成上述的刑事法律文书处理方法。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

Claims (10)

1.一种刑事法律文书处理方法,其特征在于,所述方法包括:
将刑事法律文书输入预训练的标签分类模型;
获取所述标签分类模型输出的案件标签;
其中,所述标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述刑事法律文书和所述案件标签作为一个案件信息,存入案件数据库。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据所述案件数据库中的案件信息,生成可视化的展示结果,所述展示结果用于展示所述案件数据库中的案件数量和/或所述案件信息的所述案件标签。
4.根据权利要求3所述的方法,其特征在于,所述根据所述案件数据库中的案件信息,生成可视化的展示结果之前,所述方法还包括:
获取筛选条件;
根据所述筛选条件和所述案件标签,从案件数据库中确定目标案件信息;
所述根据所述案件数据库中的案件信息,生成可视化的展示结果,包括:
根据目标案件信息生成可视化的展示结果;
其中,所述筛选条件包括时间段条件、案件类型条件、涉案人员条件、案件地区条件、经案人员条件、涉案金额条件、作案次数条件。
5.一种刑事法律文书处理装置,其特征在于,所述装置包括:
输入模块,用于将刑事法律文书输入预训练的标签分类模型;
获取模块,用于获取所述标签分类模型输出的案件标签;
其中,所述标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
存储模块,用于将所述刑事法律文书和所述案件标签作为一个案件信息,存入案件数据库。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
展示模块,用于根据所述案件数据库中的案件信息,生成可视化的展示结果,所述展示结果用于展示所述案件数据库中的案件数量和/或所述案件信息的所述案件标签。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
筛选模块,用于获取筛选条件,并根据所述筛选条件和所述案件标签,从案件数据库中确定目标案件信息;
所述展示模块,用于根据目标案件信息生成可视化的展示结果;
其中,所述筛选条件包括时间段条件、案件类型条件、涉案人员条件、案件地区条件、经案人员条件、涉案金额条件、作案次数条件。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-4中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-4中任一项所述方法的步骤。
CN201911421891.7A 2019-12-31 2019-12-31 刑事法律文书处理方法和装置、存储介质和电子设备 Active CN111241274B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911421891.7A CN111241274B (zh) 2019-12-31 2019-12-31 刑事法律文书处理方法和装置、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911421891.7A CN111241274B (zh) 2019-12-31 2019-12-31 刑事法律文书处理方法和装置、存储介质和电子设备

Publications (2)

Publication Number Publication Date
CN111241274A true CN111241274A (zh) 2020-06-05
CN111241274B CN111241274B (zh) 2023-11-28

Family

ID=70865424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911421891.7A Active CN111241274B (zh) 2019-12-31 2019-12-31 刑事法律文书处理方法和装置、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN111241274B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967229A (zh) * 2020-09-01 2020-11-20 申建常 一种高效标签式数据分析方法及分析***
CN113160000A (zh) * 2021-04-22 2021-07-23 广州广电运通信息科技有限公司 法务信息分析方法、***、装置及存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006113660A (ja) * 2004-10-12 2006-04-27 Fujitsu Ltd プロセス可視化プログラム、プロセス可視化装置およびプロセス可視化方法
US20090144277A1 (en) * 2007-12-03 2009-06-04 Microsoft Corporation Electronic table of contents entry classification and labeling scheme
JP2012068844A (ja) * 2010-09-22 2012-04-05 Fuji Xerox Co Ltd 文書比較処理装置及び文書比較処理プログラム
CN106227863A (zh) * 2016-07-29 2016-12-14 浪潮软件集团有限公司 在案件串并和嫌疑人排查中的数据挖掘方法
US20170011481A1 (en) * 2014-02-04 2017-01-12 Ubic, Inc. Document analysis system, document analysis method, and document analysis program
CN108009284A (zh) * 2017-12-22 2018-05-08 重庆邮电大学 采用半监督卷积神经网络的法律文本分类方法
CN108038091A (zh) * 2017-10-30 2018-05-15 上海思贤信息技术股份有限公司 一种基于图的裁判文书案件相似计算与检索方法及***
CN108334500A (zh) * 2018-03-05 2018-07-27 上海思贤信息技术股份有限公司 一种基于机器学习算法的裁判文书标注方法及装置
CN108763542A (zh) * 2018-05-31 2018-11-06 中国华戎科技集团有限公司 一种基于联合学习的文本情报分类方法、装置及计算机设备
CN109344187A (zh) * 2018-08-28 2019-02-15 合肥工业大学 一种司法判决书案情信息结构化处理***
CN109460468A (zh) * 2018-10-23 2019-03-12 出门问问信息科技有限公司 法律相关文本的归类方法、归类装置及相应的电子设备
CN109471922A (zh) * 2018-09-29 2019-03-15 平安科技(深圳)有限公司 基于深度学习模型的案件类型识别方法、装置、设备及介质
CN109871452A (zh) * 2019-01-31 2019-06-11 深度好奇(北京)科技有限公司 确定犯罪特征的方法、装置以及存储介质
CN110209828A (zh) * 2018-02-12 2019-09-06 北大方正集团有限公司 案件查询方法及案件查询装置、计算机设备和存储介质
CN110309296A (zh) * 2018-03-09 2019-10-08 北京国双科技有限公司 一种事件提取方法及装置
WO2019242124A1 (zh) * 2018-06-19 2019-12-26 平安科技(深圳)有限公司 金额信息的提取方法、装置、终端设备及介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006113660A (ja) * 2004-10-12 2006-04-27 Fujitsu Ltd プロセス可視化プログラム、プロセス可視化装置およびプロセス可視化方法
US20090144277A1 (en) * 2007-12-03 2009-06-04 Microsoft Corporation Electronic table of contents entry classification and labeling scheme
JP2012068844A (ja) * 2010-09-22 2012-04-05 Fuji Xerox Co Ltd 文書比較処理装置及び文書比較処理プログラム
US20170011481A1 (en) * 2014-02-04 2017-01-12 Ubic, Inc. Document analysis system, document analysis method, and document analysis program
CN106227863A (zh) * 2016-07-29 2016-12-14 浪潮软件集团有限公司 在案件串并和嫌疑人排查中的数据挖掘方法
CN108038091A (zh) * 2017-10-30 2018-05-15 上海思贤信息技术股份有限公司 一种基于图的裁判文书案件相似计算与检索方法及***
CN108009284A (zh) * 2017-12-22 2018-05-08 重庆邮电大学 采用半监督卷积神经网络的法律文本分类方法
CN110209828A (zh) * 2018-02-12 2019-09-06 北大方正集团有限公司 案件查询方法及案件查询装置、计算机设备和存储介质
CN108334500A (zh) * 2018-03-05 2018-07-27 上海思贤信息技术股份有限公司 一种基于机器学习算法的裁判文书标注方法及装置
CN110309296A (zh) * 2018-03-09 2019-10-08 北京国双科技有限公司 一种事件提取方法及装置
CN108763542A (zh) * 2018-05-31 2018-11-06 中国华戎科技集团有限公司 一种基于联合学习的文本情报分类方法、装置及计算机设备
WO2019242124A1 (zh) * 2018-06-19 2019-12-26 平安科技(深圳)有限公司 金额信息的提取方法、装置、终端设备及介质
CN109344187A (zh) * 2018-08-28 2019-02-15 合肥工业大学 一种司法判决书案情信息结构化处理***
CN109471922A (zh) * 2018-09-29 2019-03-15 平安科技(深圳)有限公司 基于深度学习模型的案件类型识别方法、装置、设备及介质
CN109460468A (zh) * 2018-10-23 2019-03-12 出门问问信息科技有限公司 法律相关文本的归类方法、归类装置及相应的电子设备
CN109871452A (zh) * 2019-01-31 2019-06-11 深度好奇(北京)科技有限公司 确定犯罪特征的方法、装置以及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967229A (zh) * 2020-09-01 2020-11-20 申建常 一种高效标签式数据分析方法及分析***
CN113160000A (zh) * 2021-04-22 2021-07-23 广州广电运通信息科技有限公司 法务信息分析方法、***、装置及存储介质

Also Published As

Publication number Publication date
CN111241274B (zh) 2023-11-28

Similar Documents

Publication Publication Date Title
US11620455B2 (en) Intelligently summarizing and presenting textual responses with machine learning
CN107808011B (zh) 信息的分类抽取方法、装置、计算机设备和存储介质
CN104951099B (zh) 一种基于输入法的展示候选项的方法和装置
CN109800386B (zh) 突出显示文档内文本的关键部分
US20180157636A1 (en) Methods and systems for language-agnostic machine learning in natural language processing using feature extraction
US20160098480A1 (en) Author moderated sentiment classification method and system
DE202017105673U1 (de) Ikonografische Symbolvorhersagen für eine Konversation
CN105320652A (zh) 用于提供翻译内容的方法、设备和***
KR101982081B1 (ko) 대응 메시지 추천 시스템
CN108228808B (zh) 确定热点事件的方法、装置和存储介质以及电子设备
Sufi Identifying the drivers of negative news with sentiment, entity and regression analysis
CN107239447B (zh) 垃圾信息识别方法及装置、***
CN109145311A (zh) 处理方法、处理装置以及处理程序
CN111241274A (zh) 刑事法律文书处理方法和装置、存储介质和电子设备
CN110785762B (zh) 用于编写电子消息的***和方法
JP2017201437A (ja) ニュース素材抽出装置及びプログラム
CN111191893A (zh) 风控文本处理方法、装置及电子设备
US20200285324A1 (en) Character inputting device, and non-transitory computer readable recording medium storing character inputting program
CN112579733A (zh) 规则匹配方法、规则匹配装置、存储介质及电子设备
CN110232281B (zh) 充分利用自然语言处理改进集合内的访问控制
KR20230006601A (ko) 정렬 방법, 정렬 모델의 트레이닝 방법, 장치, 전자 기기 및 매체
Dashtipour et al. Public perception of the fifth generation of cellular networks (5G) on social media
CN114547252A (zh) 文本识别方法、装置、电子设备和介质
US20180046683A1 (en) Search word list providing device and method using same
CN117522538A (zh) 招投标信息处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant