CN110119905A

CN110119905A - 一种基于双通道卷积神经网络的精准分案方法

Info

Publication number: CN110119905A
Application number: CN201910433339.3A
Authority: CN
Inventors: 秦永彬; 敖绍林; 陈艳平; 黄瑞章
Original assignee: Guizhou University
Current assignee: GUIZHOU CLOUD PIONEER TECH Co.,Ltd.; Guizhou University
Priority date: 2019-05-23
Filing date: 2019-05-23
Publication date: 2019-08-13

Abstract

本发明公开了一种基于双通道卷积神经网络的精准分案方法，包括以下步骤：一、建立判断法官擅长案件类型的评价指标；二、法官表示；三、案件表示；四、搭建分案模型：基于基准的神经网络模型，搭建双通道卷积神经网络模型，将法官及案件表示经过预训练的词向量矩阵，得到相应的向量矩阵表示作为数据输入模型，然后将两通道上池化层之后得到的特征向量进行拼接，最后得到输出结果，完成分案。结合数据挖掘、自然语言处理及神经网络方法，对法院数据进行处理，制定规则挖掘有价值的信息，进而为法院的智能化自动化分案提供技术支撑，大大提高了分案效率，实现自动化的，有效的避免了司法过程中的腐败现象，提高了分***率，取得了很好的效果。

Description

一种基于双通道卷积神经网络的精准分案方法

技术领域

本发明涉及一种法院案件分案方法，尤其涉及一种基于双通道卷积神经网络的精准分案方法，属于深度学习技术领域。

背景技术

在人工智能、大数据技术的快速发展前提下，自2014年至2019年，最高人民法院在相关文件接连针对各级法院推进“智慧法院”的建设提出了指导意见，通过提高案件分案、审判、执行等个各环节信息化水平，加快实现法院***智能化、自动化、阳光化。在法院立案、审判、执行等多而杂的诉讼程序中，分案步骤起着举足轻重的作用。法院正常受理案件过程是立案、分案、审判等，之前过程是之后过程的前提条件，所以分案是案件进入法院后下一诉讼程序的关键起点，精准有效合理公正的分案意味着对法院审判资源的合理配置，承载着司法公正与司法效率目标的实现。自2016年“智慧法院”命题被提出以来，虽然目前全国范围内都在建设智慧法院，但很多诉讼步骤还保持着传统的处理方法，比如分案，目前国内很多法院都还在大量依赖着人工分案，从而引生了很多不好的问题，比如加长了案件的审判周期、容易促成权钱交易、增大了法院人力成本。

发明内容

本发明要解决的技术问题是：提供一种基于双通道卷积神经网络的精准分案方法，结合数据挖掘、自然语言处理及神经网络方法，对法院历史审判数据进行清洗处理，制定规则挖掘其中有价值的信息，进而为法院的智能化自动化分案提供技术支撑，大大提高了分案效率，实现自动化的，有效的避免了司法过程中的腐败现象，提高了分***率，有效的解决了上述存在的问题。

本发明的技术方案为：一种基于双通道卷积神经网络的精准分案方法，所述方法包括以下步骤：一、建立判断法官擅长案件类型的评价指标；二、法官表示：利用自然语言处理技术，基于法官擅长类别案件文书数据的案情描述，得到每个法官的向量表示；三、案件表示：利用自然语言处理技术，对案件的案情部分进行处理，得出案件的向量表示；四、搭建分案模型：基于基准的神经网络模型，搭建双通道卷积神经网络模型，在卷积层使用多个尺寸不一的卷积核，将步骤二及步骤三得到的法官及案件的表示经过预训练的词向量矩阵，得到相应的向量矩阵表示作为数据输入模型，然后将两通道上池化层之后得到的特征向量进行拼接，然后将拼接后的结果经过全连接层，最后得到输出结果，完成分案。

所述步骤一中，法官的评价指标包括：一审改判发回重审率、案均审理时间、一审服判息诉率、法定审限内结案率。

所述步骤二中，法官表示的方法步骤为：A、利用数据挖掘技术分析挖掘案件数据中对法官评价指标计算有价值的信息；B、利用步骤A所得结果，计算法官在各类案件下的所有评价指标，基于统计的思想统一表示各个指标，并以此结果在各类案件背景下进行比较，从而得出法官擅长某类案件的结论；C、根据步骤B得出的结果，利用自然语言处理技术提取法官擅长类别案件的案情部分特征以得到法官的向量表示。

本发明的有益效果是：本发明结合数据挖掘、自然语言处理及神经网络方法，对法院历史审判数据进行清洗处理，制定规则挖掘其中有价值的信息，进而为法院的智能化自动化分案提供技术支撑。

本发明可实现对于法院受理的案件，将立案及分案步骤统一化操作，自动化智能化将案件分配给某个法官，有效节约了法院在立案、分案上的人力、财力资源，更加促进司法公正公平，缩短案件审理周期，提升法院智能化、阳光化、自动化服务水平，更快更好的增强了司法公信力、增强人民的幸福感。

本发明公开的方法有效的省去了法院立案阶段，使法院立案与分案统一化，通过法官及案件的向量化表示结合法官评价指标，通过模型，有效的、快速的实现了法院立案、分案整个过程的智能化，使用该方案可实现对法院审判资源的合理利用，有效缩短案件审理周期，从而加快实现国家“智慧法院”的建设，取得了很好的使用效果。

附图说明

图1为本发明的分案模型示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将参照本说明书附图对本发明作进一步的详细描述。

实施例1：如附图1所示，一种基于双通道卷积神经网络的精准分案方法，所述方法包括以下步骤：一、建立判断法官擅长案件类型的评价指标；二、法官表示：利用自然语言处理技术，基于法官擅长类别案件文书数据的案情描述，得到每个法官的向量表示；三、案件表示：利用自然语言处理技术，对案件的案情部分进行处理，得出案件的向量表示；四、搭建分案模型：基于基准的神经网络模型，搭建双通道卷积神经网络模型，在卷积层使用多个尺寸不一的卷积核，并且对于不同尺寸的卷积核设定卷积核数目为256个，将步骤二及步骤三得到的法官及案件的表示经过预训练的词向量矩阵，得到相应的向量矩阵表示作为数据输入模型，然后将两通道上池化层之后得到的特征向量进行拼接，然后将拼接后的结果经过全连接层，最后得到输出结果，完成分案。

本方案中，基于制定的法官擅长案件的指标，利用数据挖掘技术挖掘法官历史审判数据信息，再利用统计方法计算并比较各类案件下指标的大小，得出法官擅长某类案件的结论，最后利用自然语言处理技术处理法官擅长类别案件判决文书的案情描述以得到法官的向量表示；基于案件的裁判文书或起诉书中的案情部分信息，利用自然语言处理技术得到案件的向量表示。根据得到的法官及案件的向量表示，将其作为分案模型的输入，输出分案结果。

本步骤根据最高人民法院2016年发布的《中华人民共和国法院行业标准》及地方法院司法改革评估数据指标实现对法官个人擅长案件类别指标的制定，本发明制定的指标有：一审改判发回重审率，案均审理时间，一审服判息诉率，法定(正常)审限内结案率，具体的指标的计算方法如下：

一审改判发回重审率=上诉案件改判发回重审数/一审案件结案数*100%；

案均审理时间=审理总时间(天)/结案总数*100%；

法定(正常)审限内结案率=法定(正常)审限内结案数/结案总数*100%；

一审服判息诉率=1-(二审收案数/以判决方式结案的一审结案数)*100%。

因为法官的评价指标是判断法官更擅长某一类案件，而上述指标中存在着与法官擅长某类案件成正相关及负相关关系，那么比较单一指标是无法判断出法官更擅长哪类案件。故利用统计的思想，公式化统一表示各类案件下的各个指标值，本发明中，采用分式结果进行最终比较，其中分式分子是所有与法官擅长某类案件成正相关关系的指标的值相加，分母是所有与法官擅长某类案件成负相关关系的指标的值相加。最终结果越大，表示法官越擅长该结果代表的案件类型。

所述步骤二中，法官表示的方法步骤为：A、利用数据挖掘技术分析挖掘案件数据中对法官评价指标计算有价值的信息；B、利用步骤A所得结果，计算法官在各类案件下的所有评价指标，基于统计的思想统一表示各个指标，并以此结果在各类案件背景下进行比较，从而得出法官擅长某类案件的结论；C、根据步骤B得出的结果，利用自然语言处理技术提取法官擅长类别案件的案情描述部分以得到法官的向量表示。

在步骤二和步骤三中，由于不管是历史审判案件还是法院新受理的案件，关于案情部分的描述都是必有的，所以不管是案件的表示还是法官的表示，在本发明中都是提取案情特征来实现。精准分案模型不管是训练阶段还是测试阶段都是使用同一个字典，而字典的生成是使用自然语言处理技术，处理训练集进而生成维度为5000的高频字组成的字典，其中训练集是由法院历史审判文书数据中所有案件的案情部分按一定比列划分生成的。关于提取案情特征，也是统计字频，并由此根据字典查找生成案件或者法官的向量化表示，不同的是生成法官向量化是由法官擅长类别案件的所有案情描述部分生成，而案件的向量化表示只是由一个案件的案情描述部分生成。

卷积神经网络（Convolutional Neural Networks, CNN）是一类包含卷积计算且具有深度结构的前馈神经网络，其仿造生物的视知觉机制构建，可以进行监督学习和半监督学习，其隐含层内的卷积核参数共享和层间链接的稀疏性使得卷积神经网络能够以较小的计算量提取有价值的特征。卷积神经网络在计算机视觉、自然语言处理等较多领域应用广泛。

在步骤四中，基于一般的卷积神经网络模型，搭建双通道多核卷积神经网络模型进行分案。模型有两个输入，一个输出。输入两通道是对称的，分别由输入层、卷积层、池化层组成，而在池化层之后将两输入通道提取的主要特征进行拼接，再经过全连接层，最后输出分案结果。模型的输入一端是法官的特征向量表示，一端是案件的特征表示，但此两个特征表示并不是由步骤二步骤三得到的，而是将步骤二步骤三得到的两特征向量表示，经过预训练的词向量矩阵，得到案件及法官的向量矩阵表示，最后以此作为输入通过模型。

下面具体采用数据进行验证：

运用python编程语言将本发明所述的精准分案算法进行实现，并以贵州省法院两百多万条历史审判数据进行验证实验。

在步骤二步骤三中，法官及案件特征表示如下：

利用自然语言处理技术，处理训练集生成的字典，把汉字用数字ID表示，根据法官擅长案件类别案件文书数据，生成的法官特征表示为600维的特征向量，根据个案案情文书数据，生成的案件特征为600维的特征向量。特征向量中每一个元素表示一个字。

在步骤一中，计算指标需要利用的数据为xml格式，该种格式是以字段标识的，比如上诉案件中由本案案号字段及一审案件字段，那么就可以根据字段内的案号信息匹配一审案件及二审案件，从而可支撑一审发改重审率的计算。所有计算指标需要的数据都是根据字段标识获取信息进而计算指标值。

在步骤四中，案件及法官的特征表示需先经过预训练的embedding层，将字映射为向量，从而得到法官及案件的向量表示矩阵，以此作为模型输入，经过尺寸为3*128,4*128,5*128，数目为256的不同卷积核，然后对卷积后的结果做最大池化，再利将两通道上池化后的特征拼接在一起，经过全连接层，从而得到分案的结果。

本发明的目的是将案件分配给更擅长判此类案件的法官，提高办案效率，而分案过程是以具体指标量化评价法官并通过神经网络模型实现自动化的，有效的避免了司法过程中的腐败现象，提高了分***率。本发明的思想是，首先将数据挖掘技术应用于法院长期积累的审判数据上，主要针对法官个人的历史审判数据，挖掘其中对计算衡量法官擅长某类案件指标的有价值的信息，然后利用统计方法比较法官在各类案件下的指标大小，由此得出法官擅长某类案件的结论。再接着利用自然语言处理技术，根据案件文本信息及法官擅长类别案件的信息提取特征得出案件及法官的向量表示，以此向量表示作为分案模型的输入。最终根据输入得到分案给某个法官的输出。

本发明未详述之处，均为本技术领域技术人员的公知技术。最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种基于双通道卷积神经网络的精准分案方法，其特征在于：所述方法包括以下步骤：一、建立判断法官擅长案件类型的评价指标；二、法官表示：利用自然语言处理技术，基于法官擅长类别案件文书数据的案情描述，得到每个法官的向量表示；三、案件表示：利用自然语言处理技术，对案件的案情部分进行处理，得出案件的向量表示；四、搭建分案模型：基于基准的神经网络模型，搭建双通道卷积神经网络模型，在卷积层使用多个尺寸不一的卷积核，将步骤二及步骤三得到的法官及案件的表示经过预训练的词向量矩阵，将得到的结果作为模型输入，最终通过模型输出分案结果。

2.根据权利要求1所述的基于双通道卷积神经网络的精准分案方法，其特征在于：所述步骤一中，法官的评价指标包括：一审改判发回重审率、案均审理时间、一审服判息诉率、法定审限内结案率。

3.根据权利要求1所述的基于双通道卷积神经网络的精准分案方法，其特征在于：所述步骤二中，法官表示的方法步骤为：A、利用数据挖掘技术分析挖掘案件数据中对计算法官评价指标有价值的信息；B、利用步骤A所得结果，计算法官在各类案件下的所有评价指标，基于统计的思想统一表示各个指标，并以此结果在各类案件背景下进行比较，从而得出法官擅长某类案件的结论；C、根据步骤B得出的结果，利用自然语言处理技术提取法官擅长类别案件的案情部分以得到法官的向量表示。