CN110119905A - 一种基于双通道卷积神经网络的精准分案方法 - Google Patents

一种基于双通道卷积神经网络的精准分案方法 Download PDF

Info

Publication number
CN110119905A
CN110119905A CN201910433339.3A CN201910433339A CN110119905A CN 110119905 A CN110119905 A CN 110119905A CN 201910433339 A CN201910433339 A CN 201910433339A CN 110119905 A CN110119905 A CN 110119905A
Authority
CN
China
Prior art keywords
judge
case
division
indicates
neural networks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910433339.3A
Other languages
English (en)
Inventor
秦永彬
敖绍林
陈艳平
黄瑞章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GUIZHOU CLOUD PIONEER TECH Co.,Ltd.
Guizhou University
Original Assignee
Guizhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou University filed Critical Guizhou University
Priority to CN201910433339.3A priority Critical patent/CN110119905A/zh
Publication of CN110119905A publication Critical patent/CN110119905A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063112Skill-based matching of a person or a group to a task
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于双通道卷积神经网络的精准分案方法,包括以下步骤:一、建立判断法官擅长案件类型的评价指标;二、法官表示;三、案件表示;四、搭建分案模型:基于基准的神经网络模型,搭建双通道卷积神经网络模型,将法官及案件表示经过预训练的词向量矩阵,得到相应的向量矩阵表示作为数据输入模型,然后将两通道上池化层之后得到的特征向量进行拼接,最后得到输出结果,完成分案。结合数据挖掘、自然语言处理及神经网络方法,对法院数据进行处理,制定规则挖掘有价值的信息,进而为法院的智能化自动化分案提供技术支撑,大大提高了分案效率,实现自动化的,有效的避免了司法过程中的腐败现象,提高了分***率,取得了很好的效果。

Description

一种基于双通道卷积神经网络的精准分案方法
技术领域
本发明涉及一种法院案件分案方法,尤其涉及一种基于双通道卷积神经网络的精准分案方法,属于深度学习技术领域。
背景技术
在人工智能、大数据技术的快速发展前提下,自2014年至2019年,最高人民法院在相关文件接连针对各级法院推进“智慧法院”的建设提出了指导意见,通过提高案件分案、审判、执行等个各环节信息化水平,加快实现法院***智能化、自动化、阳光化。在法院立案、审判、执行等多而杂的诉讼程序中,分案步骤起着举足轻重的作用。法院正常受理案件过程是立案、分案、审判等,之前过程是之后过程的前提条件,所以分案是案件进入法院后下一诉讼程序的关键起点,精准有效合理公正的分案意味着对法院审判资源的合理配置,承载着司法公正与司法效率目标的实现。自2016年“智慧法院”命题被提出以来,虽然目前全国范围内都在建设智慧法院,但很多诉讼步骤还保持着传统的处理方法,比如分案,目前国内很多法院都还在大量依赖着人工分案,从而引生了很多不好的问题,比如加长了案件的审判周期、容易促成权钱交易、增大了法院人力成本。
发明内容
本发明要解决的技术问题是:提供一种基于双通道卷积神经网络的精准分案方法,结合数据挖掘、自然语言处理及神经网络方法,对法院历史审判数据进行清洗处理,制定规则挖掘其中有价值的信息,进而为法院的智能化自动化分案提供技术支撑,大大提高了分案效率,实现自动化的,有效的避免了司法过程中的腐败现象,提高了分***率,有效的解决了上述存在的问题。
本发明的技术方案为:一种基于双通道卷积神经网络的精准分案方法,所述方法包括以下步骤:一、建立判断法官擅长案件类型的评价指标;二、法官表示:利用自然语言处理技术,基于法官擅长类别案件文书数据的案情描述,得到每个法官的向量表示;三、案件表示:利用自然语言处理技术,对案件的案情部分进行处理,得出案件的向量表示;四、搭建分案模型:基于基准的神经网络模型,搭建双通道卷积神经网络模型,在卷积层使用多个尺寸不一的卷积核,将步骤二及步骤三得到的法官及案件的表示经过预训练的词向量矩阵,得到相应的向量矩阵表示作为数据输入模型,然后将两通道上池化层之后得到的特征向量进行拼接,然后将拼接后的结果经过全连接层,最后得到输出结果,完成分案。
所述步骤一中,法官的评价指标包括:一审改判发回重审率、案均审理时间、一审服判息诉率、法定审限内结案率。
所述步骤二中,法官表示的方法步骤为:A、利用数据挖掘技术分析挖掘案件数据中对法官评价指标计算有价值的信息;B、利用步骤A所得结果,计算法官在各类案件下的所有评价指标,基于统计的思想统一表示各个指标,并以此结果在各类案件背景下进行比较,从而得出法官擅长某类案件的结论;C、根据步骤B得出的结果,利用自然语言处理技术提取法官擅长类别案件的案情部分特征以得到法官的向量表示。
本发明的有益效果是:本发明结合数据挖掘、自然语言处理及神经网络方法,对法院历史审判数据进行清洗处理,制定规则挖掘其中有价值的信息,进而为法院的智能化自动化分案提供技术支撑。
本发明可实现对于法院受理的案件,将立案及分案步骤统一化操作,自动化智能化将案件分配给某个法官,有效节约了法院在立案、分案上的人力、财力资源,更加促进司法公正公平,缩短案件审理周期,提升法院智能化、阳光化、自动化服务水平,更快更好的增强了司法公信力、增强人民的幸福感。
本发明公开的方法有效的省去了法院立案阶段,使法院立案与分案统一化,通过法官及案件的向量化表示结合法官评价指标,通过模型,有效的、快速的实现了法院立案、分案整个过程的智能化,使用该方案可实现对法院审判资源的合理利用,有效缩短案件审理周期,从而加快实现国家“智慧法院”的建设,取得了很好的使用效果。
附图说明
图1为本发明的分案模型示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将参照本说明书附图对本发明作进一步的详细描述。
实施例1:如附图1所示,一种基于双通道卷积神经网络的精准分案方法,所述方法包括以下步骤:一、建立判断法官擅长案件类型的评价指标;二、法官表示:利用自然语言处理技术,基于法官擅长类别案件文书数据的案情描述,得到每个法官的向量表示;三、案件表示:利用自然语言处理技术,对案件的案情部分进行处理,得出案件的向量表示;四、搭建分案模型:基于基准的神经网络模型,搭建双通道卷积神经网络模型,在卷积层使用多个尺寸不一的卷积核,并且对于不同尺寸的卷积核设定卷积核数目为256个,将步骤二及步骤三得到的法官及案件的表示经过预训练的词向量矩阵,得到相应的向量矩阵表示作为数据输入模型,然后将两通道上池化层之后得到的特征向量进行拼接,然后将拼接后的结果经过全连接层,最后得到输出结果,完成分案。
本方案中,基于制定的法官擅长案件的指标,利用数据挖掘技术挖掘法官历史审判数据信息,再利用统计方法计算并比较各类案件下指标的大小,得出法官擅长某类案件的结论,最后利用自然语言处理技术处理法官擅长类别案件判决文书的案情描述以得到法官的向量表示;基于案件的裁判文书或起诉书中的案情部分信息,利用自然语言处理技术得到案件的向量表示。根据得到的法官及案件的向量表示,将其作为分案模型的输入,输出分案结果。
所述步骤一中,法官的评价指标包括:一审改判发回重审率、案均审理时间、一审服判息诉率、法定审限内结案率。
本步骤根据最高人民法院2016年发布的《中华人民共和国法院行业标准》及地方法院司法改革评估数据指标实现对法官个人擅长案件类别指标的制定,本发明制定的指标有:一审改判发回重审率,案均审理时间,一审服判息诉率,法定(正常)审限内结案率,具体的指标的计算方法如下:
一审改判发回重审率=上诉案件改判发回重审数/一审案件结案数*100%;
案均审理时间=审理总时间(天)/结案总数*100%;
法定(正常)审限内结案率=法定(正常)审限内结案数/结案总数*100%;
一审服判息诉率=1-(二审收案数/以判决方式结案的一审结案数)*100%。
因为法官的评价指标是判断法官更擅长某一类案件,而上述指标中存在着与法官擅长某类案件成正相关及负相关关系,那么比较单一指标是无法判断出法官更擅长哪类案件。故利用统计的思想,公式化统一表示各类案件下的各个指标值,本发明中,采用分式结果进行最终比较,其中分式分子是所有与法官擅长某类案件成正相关关系的指标的值相加,分母是所有与法官擅长某类案件成负相关关系的指标的值相加。最终结果越大,表示法官越擅长该结果代表的案件类型。
所述步骤二中,法官表示的方法步骤为:A、利用数据挖掘技术分析挖掘案件数据中对法官评价指标计算有价值的信息;B、利用步骤A所得结果,计算法官在各类案件下的所有评价指标,基于统计的思想统一表示各个指标,并以此结果在各类案件背景下进行比较,从而得出法官擅长某类案件的结论;C、根据步骤B得出的结果,利用自然语言处理技术提取法官擅长类别案件的案情描述部分以得到法官的向量表示。
在步骤二和步骤三中,由于不管是历史审判案件还是法院新受理的案件,关于案情部分的描述都是必有的,所以不管是案件的表示还是法官的表示,在本发明中都是提取案情特征来实现。精准分案模型不管是训练阶段还是测试阶段都是使用同一个字典,而字典的生成是使用自然语言处理技术,处理训练集进而生成维度为5000的高频字组成的字典,其中训练集是由法院历史审判文书数据中所有案件的案情部分按一定比列划分生成的。关于提取案情特征,也是统计字频,并由此根据字典查找生成案件或者法官的向量化表示,不同的是生成法官向量化是由法官擅长类别案件的所有案情描述部分生成,而案件的向量化表示只是由一个案件的案情描述部分生成。
卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,其仿造生物的视知觉机制构建,可以进行监督学习和半监督学习,其隐含层内的卷积核参数共享和层间链接的稀疏性使得卷积神经网络能够以较小的计算量提取有价值的特征。卷积神经网络在计算机视觉、自然语言处理等较多领域应用广泛。
在步骤四中,基于一般的卷积神经网络模型,搭建双通道多核卷积神经网络模型进行分案。模型有两个输入,一个输出。输入两通道是对称的,分别由输入层、卷积层、池化层组成,而在池化层之后将两输入通道提取的主要特征进行拼接,再经过全连接层,最后输出分案结果。模型的输入一端是法官的特征向量表示,一端是案件的特征表示,但此两个特征表示并不是由步骤二步骤三得到的,而是将步骤二步骤三得到的两特征向量表示,经过预训练的词向量矩阵,得到案件及法官的向量矩阵表示,最后以此作为输入通过模型。
下面具体采用数据进行验证:
运用python编程语言将本发明所述的精准分案算法进行实现,并以贵州省法院两百多万条历史审判数据进行验证实验。
在步骤二步骤三中,法官及案件特征表示如下:
利用自然语言处理技术,处理训练集生成的字典,把汉字用数字ID表示,根据法官擅长案件类别案件文书数据,生成的法官特征表示为600维的特征向量,根据个案案情文书数据,生成的案件特征为600维的特征向量。特征向量中每一个元素表示一个字。
在步骤一中,计算指标需要利用的数据为xml格式,该种格式是以字段标识的,比如上诉案件中由本案案号字段及一审案件字段,那么就可以根据字段内的案号信息匹配一审案件及二审案件,从而可支撑一审发改重审率的计算。所有计算指标需要的数据都是根据字段标识获取信息进而计算指标值。
在步骤四中,案件及法官的特征表示需先经过预训练的embedding层,将字映射为向量,从而得到法官及案件的向量表示矩阵,以此作为模型输入,经过尺寸为3*128,4*128,5*128,数目为256的不同卷积核,然后对卷积后的结果做最大池化,再利将两通道上池化后的特征拼接在一起,经过全连接层,从而得到分案的结果。
本发明的目的是将案件分配给更擅长判此类案件的法官,提高办案效率,而分案过程是以具体指标量化评价法官并通过神经网络模型实现自动化的,有效的避免了司法过程中的腐败现象,提高了分***率。本发明的思想是,首先将数据挖掘技术应用于法院长期积累的审判数据上,主要针对法官个人的历史审判数据,挖掘其中对计算衡量法官擅长某类案件指标的有价值的信息,然后利用统计方法比较法官在各类案件下的指标大小,由此得出法官擅长某类案件的结论。再接着利用自然语言处理技术,根据案件文本信息及法官擅长类别案件的信息提取特征得出案件及法官的向量表示,以此向量表示作为分案模型的输入。最终根据输入得到分案给某个法官的输出。
本发明未详述之处,均为本技术领域技术人员的公知技术。最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (3)

1.一种基于双通道卷积神经网络的精准分案方法,其特征在于:所述方法包括以下步骤:一、建立判断法官擅长案件类型的评价指标;二、法官表示:利用自然语言处理技术,基于法官擅长类别案件文书数据的案情描述,得到每个法官的向量表示;三、案件表示:利用自然语言处理技术,对案件的案情部分进行处理,得出案件的向量表示;四、搭建分案模型:基于基准的神经网络模型,搭建双通道卷积神经网络模型,在卷积层使用多个尺寸不一的卷积核,将步骤二及步骤三得到的法官及案件的表示经过预训练的词向量矩阵,将得到的结果作为模型输入,最终通过模型输出分案结果。
2.根据权利要求1所述的基于双通道卷积神经网络的精准分案方法,其特征在于:所述步骤一中,法官的评价指标包括:一审改判发回重审率、案均审理时间、一审服判息诉率、法定审限内结案率。
3.根据权利要求1所述的基于双通道卷积神经网络的精准分案方法,其特征在于:所述步骤二中,法官表示的方法步骤为:A、利用数据挖掘技术分析挖掘案件数据中对计算法官评价指标有价值的信息;B、利用步骤A所得结果,计算法官在各类案件下的所有评价指标,基于统计的思想统一表示各个指标,并以此结果在各类案件背景下进行比较,从而得出法官擅长某类案件的结论;C、根据步骤B得出的结果,利用自然语言处理技术提取法官擅长类别案件的案情部分以得到法官的向量表示。
CN201910433339.3A 2019-05-23 2019-05-23 一种基于双通道卷积神经网络的精准分案方法 Pending CN110119905A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910433339.3A CN110119905A (zh) 2019-05-23 2019-05-23 一种基于双通道卷积神经网络的精准分案方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910433339.3A CN110119905A (zh) 2019-05-23 2019-05-23 一种基于双通道卷积神经网络的精准分案方法

Publications (1)

Publication Number Publication Date
CN110119905A true CN110119905A (zh) 2019-08-13

Family

ID=67523049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910433339.3A Pending CN110119905A (zh) 2019-05-23 2019-05-23 一种基于双通道卷积神经网络的精准分案方法

Country Status (1)

Country Link
CN (1) CN110119905A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112163752A (zh) * 2020-09-21 2021-01-01 贵州大学 一种基于卷积神经网络的辅助分案方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103353888A (zh) * 2013-07-03 2013-10-16 福建榕基软件股份有限公司 一种法院审判自动分案***及方法
US9579397B1 (en) * 2009-05-05 2017-02-28 Hopkins Bruce Research Corporation Computer-implemented systems and methods for analyzing court activity
CN108009284A (zh) * 2017-12-22 2018-05-08 重庆邮电大学 采用半监督卷积神经网络的法律文本分类方法
CN108491835A (zh) * 2018-06-12 2018-09-04 常州大学 面向面部表情识别的双通道卷积神经网络
CN109299091A (zh) * 2018-09-05 2019-02-01 中国平安财产保险股份有限公司 基于数据分析的智能推荐律师的方法、装置及计算机设备
US20190079979A1 (en) * 2014-09-07 2019-03-14 Alex H Chan Systems and methods for assessing patent validity or invalidity using artificial intelligence, machine learning, and natural language processing
CN109783639A (zh) * 2018-12-24 2019-05-21 银江股份有限公司 一种基于特征提取的调解案件智能分派方法及***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9579397B1 (en) * 2009-05-05 2017-02-28 Hopkins Bruce Research Corporation Computer-implemented systems and methods for analyzing court activity
CN103353888A (zh) * 2013-07-03 2013-10-16 福建榕基软件股份有限公司 一种法院审判自动分案***及方法
US20190079979A1 (en) * 2014-09-07 2019-03-14 Alex H Chan Systems and methods for assessing patent validity or invalidity using artificial intelligence, machine learning, and natural language processing
CN108009284A (zh) * 2017-12-22 2018-05-08 重庆邮电大学 采用半监督卷积神经网络的法律文本分类方法
CN108491835A (zh) * 2018-06-12 2018-09-04 常州大学 面向面部表情识别的双通道卷积神经网络
CN109299091A (zh) * 2018-09-05 2019-02-01 中国平安财产保险股份有限公司 基于数据分析的智能推荐律师的方法、装置及计算机设备
CN109783639A (zh) * 2018-12-24 2019-05-21 银江股份有限公司 一种基于特征提取的调解案件智能分派方法及***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112163752A (zh) * 2020-09-21 2021-01-01 贵州大学 一种基于卷积神经网络的辅助分案方法

Similar Documents

Publication Publication Date Title
CN108460089A (zh) 基于Attention神经网络的多元特征融合中文文本分类方法
CN107315738B (zh) 一种文本信息的创新度评估方法
CN109472024A (zh) 一种基于双向循环注意力神经网络的文本分类方法
CN109977234A (zh) 一种基于主题关键词过滤的知识图谱补全方法
CN110162593A (zh) 一种搜索结果处理、相似度模型训练方法及装置
CN108595602A (zh) 基于浅层模型与深度模型结合的问句文本分类方法
CN109977199B (zh) 一种基于注意力池化机制的阅读理解方法
Yeung et al. Infinite horizon dynamic games: a new approach via information updating
CN107291688A (zh) 基于主题模型的裁判文书相似度分析方法
CN111310474A (zh) 基于激活-池化增强bert模型的在线课程评论情感分析方法
CN112149421A (zh) 一种基于bert嵌入的软件编程领域实体识别方法
CN108563703A (zh) 一种罪名的判定方法、装置及计算机设备、存储介质
CN108121702A (zh) 数学主观题评阅方法及***
CN110134946A (zh) 一种针对复杂数据的机器阅读理解方法
CN104794489A (zh) 一种基于深度标签预测的诱导式图像分类方法及***
CN107247751B (zh) 基于lda主题模型的内容推荐方法
CN108108468A (zh) 一种基于概念和文本情感的短文本情感分析方法和装置
CN109857846A (zh) 用户问句与知识点的匹配方法和装置
CN109947923A (zh) 一种基于词向量的初等数学题型自动提取方法及***
CN114519508A (zh) 基于时序深度学习和法律文书信息的信用风险评估方法
CN110119905A (zh) 一种基于双通道卷积神经网络的精准分案方法
Mahdin et al. Sentiment analysis on COVID-19 vaccine tweets using machine learning and deep learning algorithms
CN110245860A (zh) 一种基于虚拟实验平台的自动评分的方法
CN111400445B (zh) 一种基于相似文本的案件繁简分流方法
CN103440332B (zh) 一种基于关系矩阵正则化增强表示的图像检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: 550025 Huaxi North Campus science and Technology Department of Huaxi District, Huaxi District, Guiyang, Guizhou

Applicant after: Guizhou University

Applicant after: Higher people's Court of Guizhou Province

Applicant after: GUIZHOU CLOUD PIONEER TECH Co.,Ltd.

Address before: 550025 Huaxi North Campus science and Technology Department of Huaxi District, Huaxi District, Guiyang, Guizhou

Applicant before: Guizhou University

TA01 Transfer of patent application right