CN110968662A - 司法数据处理的方法、装置、存储介质及处理器 - Google Patents

司法数据处理的方法、装置、存储介质及处理器 Download PDF

Info

Publication number
CN110968662A
CN110968662A CN201811130999.6A CN201811130999A CN110968662A CN 110968662 A CN110968662 A CN 110968662A CN 201811130999 A CN201811130999 A CN 201811130999A CN 110968662 A CN110968662 A CN 110968662A
Authority
CN
China
Prior art keywords
case
data
current
party
current party
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811130999.6A
Other languages
English (en)
Inventor
程高伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201811130999.6A priority Critical patent/CN110968662A/zh
Publication of CN110968662A publication Critical patent/CN110968662A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种司法数据处理的方法、装置、存储介质及处理器,其中,所述司法数据处理的方法包括:确定出当前当事人的个人信息、所属案件的案件数据以及多个历史案件的案件数据;其中,当前当事人是待处理案件中的当事人;以当前当事人的个人信息和所属案件的案件数据,分别与每一个历史案件的案件数据进行相似度计算,得到多个历史案件的案件数据中,与当前当事人的个人信息和所属案件的案件数据最相似案件的案件数据;并利用最相似案件的案件数据,生成当前当事人的用户画像。

Description

司法数据处理的方法、装置、存储介质及处理器
技术领域
本发明涉及数据处理技术领域,具体涉及一种司法数据处理的方法、装置、存储介质及处理器。
背景技术
在如今的互联网时代下,政府各部门的政务办理窗口相继开通了网上服务平台。而在我国的司法部门,也伴随着互联网的热潮,开通了网上立案审判***。当事人可以在立案审判***填写立案申请,法官可以在立案审判***进行案件处理工作。
立案审判***的开通,虽然方便了当事人立案申请和法官的政务处理工作,但是,立案审判***还存在一些急需完善的问题。法官在进行案件处理的过程中,为了提高案件处理进度,立案审判***会提供历史案件的案件数据,用作案件立案、审理以及判案等处理操作的参考。
但是,目前立案审判***是随机提供的历史案件的案件数据,导致提供的历史案件和待处理的案件的相关性并不稳定,在提供的历史案件与要处理的案件的相关性不高时,历史案件的案件数据对要处理案件的案件处理的参考性就较低。
发明内容
有鉴于此,本发明提供了一种司法数据处理的方法、装置、存储介质及处理器,以实现为要处理的案件提供参考性高的案件数据,提高案件的处理进度。
为了实现上述目的,本发明实施例提供了如下技术方案:
一种司法数据处理的方法,包括:
确定出当前当事人的个人信息、所属案件的案件数据以及多个历史案件的案件数据;其中,当前当事人是待处理案件中的当事人;
以当前当事人的个人信息和所属案件的案件数据,分别与每一个历史案件的案件数据进行相似度计算,得到多个历史案件的案件数据中,与当前当事人的个人信息和所属案件的案件数据最相似案件的案件数据;
利用最相似案件的案件数据,生成所述当前当事人的用户画像。
可选地,在上述方法中,所述确定出当前当事人的个人信息和所属案件的案件数据,包括:
采集当前当事人的基础数据、社会属性信息以及所属案件的案件信息。其中,基础数据是所述当前当事人的人口统计特征数据,社会属性信息是所述当前当事人的工作信息;
以所述当前当事人的基础数据和社会属性信息作为当前当事人的个人信息。
可选的,在上述方法中,所述以所述当前当事人的个人信息和所属案件的案件数据,分别与所述每一个所述历史案件的案件数据进行相似度计算,包括:
对当前当事人的个人信息和所属案件的案件数据进行分组,得到当前当事人的静态属性向量和动态属性向量;其中,静态属性向量包括当前当事人的个人信息,动态属性向量包括当前当事人的所属案件的案件数据;
对多个历史案件的案件数据进行分组,得到每一个历史案件所属的历史当事人的静态属性向量和动态属性向量;
以当前当事人的静态属性向量和动态属性向量分别与每一个所述历史当事人的静态属性向量和动态属性向量进行相似度计算,得到当前当事人和每一个历史当事人的相似度数据;
依据当前当事人和每一个历史当事人的相似度数据,得到最相似案件的案件数据。
可选的,在上述方法中,所述最相似案件的案件数据,生成当前当事人的用户画像,包括:
提取最相似案件的案件数据的共性数据,根据共性数据生成当前当事人的用户画像。
一种司法数据处理装置,包括:
确定单元,用于确定出当前当事人的个人信息、所属案件的案件数据以及多个历史案件的案件数据;其中,所述当前当事人是待处理案件中的当事人;
计算单元,用于以所述当前当事人的个人信息和所属案件的案件数据,分别与所述每一个所述历史案件的案件数据进行相似度计算,得到所述多个历史案件的案件数据中,与所述当前当事人的个人信息和所属案件的案件数据最相似案件的案件数据;
生成单元,用于利用所述最相似案件的案件数据,生成所述当前当事人的用户画像。
可选地,所述确定单元执行确定当前当事人的个人信息、所属案件的案件数据时,包括:
第一采集单元,用于采集所述当前当事人的基础数据、社会属性信息以及所属案件的案件信息;其中,所述基础数据是所述当前当事人的人口统计特征数据;所述社会属性信息是当前当事人的工作信息;
第一分组单元,用于以所述当前当事人的基础数据和社会属性信息作为所述当前当事人的个人信息。
可选地,所述计算单元,包括:
第二分组单元,用于对所述当前当事人的个人信息和所属案件的案件数据进行分组,得到所述当前当事人的静态属性向量和动态属性向量;其中,所述静态属性向量包括所述当前当事人的个人信息,所述动态属性向量包括所述当前当事人的所属案件的案件数据;
第三分组单元,用于对所述多个历史案件的案件数据进行分组,得到每一个历史案件所属的历史当事人的静态属性向量和动态属性向量;
第一计算单元,用于以所述当前当事人的静态属性向量和动态属性向量分别与每一个所述历史当事人的静态属性向量和动态属性向量进行相似度计算,得到所述当前当事人和每一个所述历史当事人的相似度数据;
第二计算单元,用于依据所述当前当事人和每一个所述历史当事人的相似度数据,得到所述最相似案件的案件数据。
可选地,所述生成单元,包括:
提取单元,用于提取所述最相似案件的案件数据的共性数据;
用户画像生成单元,用于根据所述共性数据生成所述当前当事人的用户画像。
一种存储介质,用于存储程序,所述程序被执行时,用于实现如上述任意一项所述的司法数据处理方法。
一种处理器,用于运行程序,其中,所述程序被运行时用于执行:如上述任意一项所述的司法数据处理方法。
借由上述技术方案,本发明提供的一种司法数据的处理方法中,利用相似度计算方法,计算当前当事人的个人信息和所属案件的案件数据,和每一个历史案件的案件数据的相似度,并根据相似度计算结果在多个历史案件中的得到最相似的历史案件;再依据最相似的历史案件的案件数据,生成当前当事人的用户画像,可以保证在当前当事人的案件处理过程中,当前当事人的用户画像提供与案件相关性高的案件数据作为参考,提高案件处理进度。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请实施例公开的司法数据处理方法的流程图;
图2示出了本申请实施例公开的司法数据处理方法中的采集数据方法的流程图;
图3示出了本申请实施例公开的司法数据处理方法中的数据处理流程的流程图;
图4示出了本申请实施例公开的司法数据处理方法中的生成用户画像流程图;
图5示出了本申请实施例公开的司法数据处理装置结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本申请文件实施例公开了一种司法数据的处理方法,参见图1,包括:
S101、确定出当前当事人的个人信息、所属案件的案件数据以及多个历史案件的案件数据。
其中,当前当事人是待处理案件中的当事人。
需要说明的是,案件的案件数据本身要包括:案件信息和案件的处理情况。其中,案件信息是案件的基础内容,包括双方当事人的描述信息、案件的基本描述信息;案件的处理情况是案件的审判的描述信息,主要涵盖案件在审查阶段中的文本数据,以及判决书中的内容。
S102、以当前当事人的个人信息和所属案件的案件数据,分别与每一个历史案件的案件数据进行相似度计算,得到多个历史案件的案件数据中,与当前当事人的个人信息和所属案件的案件数据最相似案件的案件数据。
其中,在得到多个历史案件的案件数据中,与当前当事人的个人信息和所属案件的案件数据最相似案件的案件数据后,可以对相似案件的案件数据的相似度按照由高到低的顺序进行排序,选取若干个排位靠前的相似案件的案件数据作为最相似案件的案件数据。并且,可以根据实际需求设置选择的数量。
当然,还可以将设定阈值,将大于阈值的最相似度案件的案件数据所对应相似案件的案件数据,作为最相似案件的案件数据。阈值也可以根据实际需求进行设置。
S103、利用所述最相似案件的案件数据,生成当前当事人的用户画像。
其中,用户画像的数据来源于最相似案件的案件数据,因此,用户画像是用于描述与当前当事人案件最为相似的历史案件。
还需要说明的是,所述用户画像还可以包括当前当事人所属案件的案件数据,即包括当前当事人所属案件的案件信息以及案件的处理情况。如此,法官可以从所述当前当事人的用户画像中,获知当前当事人所属案件的案件数据,对当前当事人所属案件进行基本了解,还可以获知与当前当事人所属案件最相似的历史案件的案件数据,以对当前当事人所属案件的处理过程进行参考。
本实施例中,利用相似度计算方法,计算当前当事人的个人信息和所属案件的案件数据,和每一个历史案件的案件数据的相似度,并根据相似度计算结果在多个历史案件的案件数据中的得到最相似的历史案件的案件数据;再依据最相似的历史案件的案件数,生成当前当事人的用户画像,可以保证在当前当事人的案件处理过程中,当前当事人的用户画像提供与案件相关性高的案件数据作为参考,提高案件处理进度。
可选地,本申请的另一实施例中,步骤S101的一种实施方式,如图2所示,包括:
201、采集当前当事人的基础数据、社会属性信息以及所属案件的案件信息。
其中,基础数据是当前当事人的人口统计特征数据。这里所指的人口统计特征数据是当前当事人的性别、年龄、地区、健康状况、婚姻状况、文化水平等数据。
在采集当前当事人的基础数据时,可以通过根据当前当事人的证件类型和证件号码在立案审判***中查到当前当事人的基础数据,并对其进行采集。
社会属性信息是当前当事人的工作信息。这里所指的工作信息是当前当事人的工作单位、工作单位的统一社会信用代码、工作单位注册地址、单位法人以及当事人的职务信息等数据。
在采集当前当事人的社会属性信息时,可以通过对接公安***或者对接工商行政管理***,以当前当事人的证件类型和证件号码对其进行社会属性信息的采集。
当事人所属案件的案件信息见上述实施例的内容。在采集当前当事人所属案件的案件信息也是根据当前当事人的证件类型和证件号码在立案审判***中查询得到并对其进行采集。
202、以当前当事人的基础数据和社会属性信息作为所述当前当事人的个人信息。
其中,以当前当事人的基础数据和社会属性信息作为当事人的个人信息,是为了在进行相似度计算时更好对数据类型进行分类,以便于可以准确快速对其进行相似度计算,得到最相似的数据。
其中,在上述本实施例中,还包括确定多个历史案件的案件数据,其中确定多个历史案件的案件数据过程具体如下:
采集多个历史案件的案件数据。
采集多个历史案件的案件数据,可以通过在立案审判***的案件数据库中采集。案件数据如上述实施例内容所述,包括案件信息和案件的处理情况。
可选地,本申请的另一实施例中,步骤S102的一种实施方式,如图3所示,包括:
S301、对当前当事人的个人信息和所属案件的案件数据进行分组,得到当前当事人的静态属性向量和动态属性向量。
其中,静态属性向量包括当前当事人的个人信息,动态属性向量包括当前当事人的所属案件的案件数据。因此,当前当事人的静态属性向量所指的是当前当事人的个人信息,同理,当前当事人的动态属性向量所指是当前当事人的所属案件的案件数据。
结合以上描述,下面通过一个具体的案例,对当前当事人的静态属性向量和动态属性向量分别进行说明:
在本案例中,采集到的当前当事人的基础数据为:姓名:张三,年龄:30;性别:男;文化水平:本科;婚姻状况:未婚。采集到当前当事人的社会属性信息为:姓名:张三;工作单位:指南贸易有限公司;职务:总经理;工作单位法人代表:李四;工作单位统一社会信用代码:10000001211。所属案件的案件信息为:案件类型为:民事案件;案由:侵害作品表演权纠纷;原告:王五,被告:张三。
在本案件中,可以以张三的年龄、性别、文化水平、婚姻状况、职务、工作单位等作为当前当事人的静态属性向量,可以以所属案件的案件信息中的案件类型、案由等作为当前当事人的动态属性向量。
S302、对多个历史案件的案件数据进行分组,得到每一个历史案件所属的历史当事人的静态属性向量和动态属性向量。
其中,历史当事人的静态属性向量是指历史当事人的个人信息,历史当事人的动态属性向量是所述案件的案件数据。
需要说明的是,每一个历史案件的案件数据所包括的案件信息,其包括双方当事人的描述信息。双方当事人的描述信息即为历史当事人的静态属性向量。每一个历史案件的案件数据的案件的处理情况,即被分组形成历史当事人的动态属性向量。
S303、以当前当事人的静态属性向量和动态属性向量分别与每一个历史当事人的静态属性向量和动态属性向量进行相似度计算,得到当前当事人和每一个所述历史当事人的相似度数据。
可选地,利用余弦相似度方法对当前当事人的静态属性向量和动态属性向量,和每一个历史当事人的静态属性向量和动态属性向量进行相似度计算。
其中,余弦相似度公式如下:
Figure BDA0001813510890000081
式中:
Figure BDA0001813510890000082
表示当前当事人的静态属性向量和动态属性向量组成的向量;
Figure BDA0001813510890000083
表示每一个历史当事人的静态属性向量和动态属性向量组成的向量。
可选的,当前当事人和历史当事人的静态属性向量和动态属性向量可以如下例所示:
Figure BDA0001813510890000084
S304、依据当前当事人和每一个历史当事人的相似度数据,得到最相似案件的案件数据。
可选地,本申请的另一实施例中,步骤S103的另一种实施方式,如图4所示,包括:
S401、提取所述最相似案件的案件数据的共性数据。
S402、根据共性数据生成当前当事人的用户画像。
通过上述方法,法官在立案审判***进行案件处理工作时,可以根据所生成的用户画像作为参考数据以辅助法官对案件的处理工作,该用户画像是以最为相近的历史案件的案件数据的共性数据得到的,与当前当事人案件的案件数据有着许多的共同的特征,法官在案件进行案件的处理工作时,可以所生成的用户画像作为本案的参考依据,极大的方便了法官进行案件的处理工作,提高了案件处理质量。
本发明另一实施例还公开了一种数据处理装置,如图5所示,包括:
确定单元501,用于确定出当前当事人的个人信息、所属案件的案件数据以及多个历史案件的案件数据。
其中,当前当事人是待处理案件中的当事人。
计算单元502,用于以当前当事人的个人信息和所属案件的案件数据,分别与每一个历史案件的案件数据进行相似度计算,得到多个历史案件的案件数据中,与当前当事人的个人信息和所属案件的案件数据最相似案件的案件数据。
生成单元503,用于利用最相似案件的案件数据,生成当前当事人的用户画像。
本实施例公开的司法数据的处理装置中,计算单元502利用相似度计算方法,计算确定单元501中当前当事人的个人信息和所属案件的案件数据,和每一个历案件的案件数据的相似度,并根据计算单元502的计算结果,在多个历史案件的案件数据中得到最相似的历史案件的案件数据;生成单元503依据最相似的历史案件的案件数据,生成当前当事人的用户画像,可以保证在当前当事人的案件处理过程中,当前当事人的用户画像提供与案件相关性高的案件数据作为参考,提高案件处理进度。
本实施例中公开的各个单元的具体工作过程,可参见对应图1的方法实施例的内容,此处不再赘述。
可选地,本申请的另一实施例中,确定单元501执行确定当前当事人的个人信息、所属案件的案件数据时,包括:
第一采集单元,用于采集当前当事人的基础数据和社会属性数据;其中,基础数据是人口统计特征数据;社会属性信息是当前当事人的工作信息。
第一分组单元,用于以当前当事人的基础数据和社会属性信息作为当前当事人的个人信息。
可选地,本申请的另一实施例中,确定单元501执行多个历史案件的案件数据时,包括:
第二采集单元,用于采集多个历史案件数据。
本实施例中公开的各个单元的具体工作过程,可参见对应方法实施例的内容,此处不再赘述。
可选地,本申请的另一实施例中,计算单元502,包括:
第二分组单元,用于对当前当事人的个人信息和所属案件的案件数据进行分组,得到当前当事人的静态属性向量和动态属性向量。
其中,静态属性向量包括当前当事人的个人信息,动态属性向量包括当前当事人的所属案件的案件数据。
第三分组单元,用于对多个历史案件的案件数据进行分组,得到每一个历史案件所属的历史当事人的静态属性向量和动态属性向量。
第一计算单元,用于以当前当事人的静态属性向量和动态属性向量分别与每一个历史当事人的静态属性向量和动态属性向量进行相似度计算,得到当前当事人和每一个历史当事人的相似度数据。
第二计算单元,用于依据当前当事人和每一个所述历史当事人的相似度数据,得到所述最相似案件的案件数据。
可选地,本申请的另一实施例中,用户画像生成单元503,包括:
提取单元,用于提取最相似案件的案件数据的共性数据。
用户画像生成单元,用于根据共性数据生成当前当事人的用户画像。
本实施例中公开的各个单元的具体工作过程,可参见对应图3的方法实施例的内容,此处不再赘述。
所述数据传输装置包括处理器和存储器,上述确定单元、计算单元和生成单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现图形数据由移动终端的内部环境向浏览器环境的传输。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述司法数据的处理方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述司法数据的处理方法。
本发明实施例提供了一种设备,本文中的设备可以是服务器、PC、PAD、手机等。设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
确定出当前当事人的个人信息、所属案件的案件数据以及多个历史案件的案件数据;其中,当前当事人是待处理案件中的当事人。
以当前当事人的个人信息和所属案件的案件数据,分别与每一个历史案件的案件数据进行相似度计算,得到多个历史案件的案件数据中,与当前当事人的个人信息和所属案件的案件数据最相似案件的案件数据。
利用最相似案件的案件数据,生成当前当事人的用户画像。
可选地,所述确定出当前当事人的个人信息、所属案件的案件数据,包括:
采集当前当事人的基础数据、社会属性信息以及所属案件的案件信息;其中,基础数据是所述当前当事人的人口统计特征数据;社会属性信息是当前当事人的工作信息;
以当前当事人的基础数据和社会属性信息作为当前当事人的个人信息。
可选地,所述以当前当事人的个人信息和所属案件的案件数据分别与每一个历史案件的案件数据进行相似度计算,包括:
对当前当事人的个人信息和所属案件的案件数据进行分组,得到当前当事人的静态属性向量和动态属性向量。
其中,静态属性向量包括当前当事人的个人信息,动态属性向量包括当前当事人的所属案件的案件数据。
对多个历史案件的案件数据进行分组,得到每一个历史案件所属的历史当事人的静态属性向量和动态属性向量。
以当前当事人的静态属性向量和动态属性向量分别与每一个历史当事人的静态属性向量和动态属性向量进行相似度计算,得到当前当事人和每一个历史当事人的相似度数据。
依据当前当事人和每一个历史当事人的相似度数据,得到最相似案件的案件数据。
可选地,所述利用所述最相似案件的案件数据,生成所述当前当事人的用户画像,包括:
提取最相似案件的案件数据的共性数据;
根据共性数据生成当前当事人的用户画像。
本发明还提供了一种计算机程序产品,当在司法数据处理装置上执行时,适于执行初始化有如下方法步骤的程序:
确定出当前当事人的个人信息、所属案件的案件数据以及多个历史案件的案件数据;其中,当前当事人是待处理案件中的当事人。
以当前当事人的个人信息和所属案件的案件数据,分别与每一个历史案件的案件数据进行相似度计算,得到多个历史案件的案件数据中,与当前当事人的个人信息和所属案件的案件数据最相似案件的案件数据。
利用最相似案件的案件数据,生成当前当事人的用户画像。
可选地,所述确定出当前当事人的个人信息、所属案件的案件数据,包括:
采集当前当事人的基础数据、社会属性信息以及所属案件的案件信息;其中,基础数据是所述当前当事人的人口统计特征数据;社会属性信息是当前当事人的工作信息;
以当前当事人的基础数据和社会属性信息作为当前当事人的个人信息。
可选地,所述以当前当事人的个人信息和所属案件的案件数据分别与每一个历史案件的案件数据进行相似度计算,包括:
对当前当事人的个人信息和所属案件的案件数据进行分组,得到当前当事人的静态属性向量和动态属性向量。
其中,静态属性向量包括当前当事人的个人信息,动态属性向量包括当前当事人的所属案件的案件数据。
对多个历史案件的案件数据进行分组,得到每一个历史案件所属的历史当事人的静态属性向量和动态属性向量。
以当前当事人的静态属性向量和动态属性向量分别与每一个历史当事人的静态属性向量和动态属性向量进行相似度计算,得到当前当事人和每一个历史当事人的相似度数据。
依据当前当事人和每一个历史当事人的相似度数据,得到最相似案件的案件数据。
可选地,所述利用最相似案件的案件数据,生成当前当事人的用户画像,包括:
提取最相似案件的案件数据的共性数据;
根据共性数据生成当前当事人的用户画像。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包
括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种司法数据的处理方法,其特征在于,包括:
确定出当前当事人的个人信息、所属案件的案件数据以及多个历史案件的案件数据;其中,所述当前当事人是待处理案件中的当事人;
以所述当前当事人的个人信息和所属案件的案件数据,分别与每一个所述历史案件的案件数据进行相似度计算,得到所述多个历史案件的案件数据中,与所述当前当事人的个人信息和所属案件的案件数据最相似案件的案件数据;
利用所述最相似案件的案件数据,生成所述当前当事人的用户画像。
2.根据权利要求1所述的司法数据的处理方法,其特征在于,所述确定出当前当事人的个人信息、所属案件的案件数据,包括:
采集所述当前当事人的基础数据、社会属性信息以及所属案件的案件信息;其中,所述基础数据是所述当前当事人的人口统计特征数据;所述社会属性信息是当前当事人的工作信息;
以所述当前当事人的基础数据和社会属性信息作为所述当前当事人的个人信息。
3.根据权利要求1所述的司法数据的处理方法,其特征在于,所述以所述当前当事人的个人信息和所属案件的案件数据,分别与每一个所述历史案件的案件数据进行相似度计算,包括:
对所述当前当事人的个人信息和所属案件的案件数据进行分组,得到所述当前当事人的静态属性向量和动态属性向量;其中,所述静态属性向量包括所述当前当事人的个人信息,所述动态属性向量包括所述当前当事人的所属案件的案件数据;
对所述多个历史案件的案件数据进行分组,得到每一个历史案件所属的历史当事人的静态属性向量和动态属性向量;
以所述当前当事人的静态属性向量和动态属性向量分别与每一个所述历史当事人的静态属性向量和动态属性向量进行相似度计算,得到所述当前当事人和每一个所述历史当事人的相似度数据;
依据所述当前当事人和每一个所述历史当事人的相似度数据,得到所述最相似案件的案件数据。
4.根据权利要求1所述的司法数据的处理方法,其特征在于,所述利用所述最相似案件的案件数据,生成所述当前当事人的用户画像,包括:
提取所述最相似案件的案件数据的共性数据;
根据所述共性数据生成所述当前当事人的用户画像。
5.一种司法数据处理装置,其特征在于,包括:
确定单元,用于确定出当前当事人的个人信息、所属案件的案件数据以及多个历史案件的案件数据;其中,所述当前当事人是待处理案件中的当事人;
计算单元,用于以所述当前当事人的个人信息和所属案件的案件数据,分别与每一个所述历史案件的案件数据进行相似度计算,得到所述多个历史案件的案件数据中,与所述当前当事人的个人信息和所属案件的案件数据最相似案件的案件数据;
生成单元,用于利用所述最相似案件的案件数据,生成所述当前当事人的用户画像。
6.根据权利要求5所述的装置,其特征在于,所述确定单元执行确定当前当事人的个人信息、所属案件的案件数据时,包括:
第一采集单元,用于采集所述当前当事人的基础数据、社会属性信息以及所属案件的案件信息;其中,所述基础数据是所述当前当事人的人口统计特征数据;所述社会属性信息是当前当事人的工作信息;
第一分组单元,用于以所述当前当事人的基础数据和社会属性信息作为所述当前当事人的个人信息。
7.根据权利要求5所述的装置,其特征在于,所述计算单元,包括:
第二分组单元,用于对所述当前当事人的个人信息和所属案件的案件数据进行分组,得到所述当前当事人的静态属性向量和动态属性向量;其中,所述静态属性向量包括所述当前当事人的个人信息,所述动态属性向量包括所述当前当事人的所属案件的案件数据;
第三分组单元,用于对所述多个历史案件的案件数据进行分组,得到每一个历史案件所属的历史当事人的静态属性向量和动态属性向量;
第一计算单元,用于以所述当前当事人的静态属性向量和动态属性向量分别与每一个所述历史当事人的静态属性向量和动态属性向量进行相似度计算,得到所述当前当事人和每一个所述历史当事人的相似度数据;
第二计算单元,用于依据所述当前当事人和每一个所述历史当事人的相似度数据,得到所述最相似案件的案件数据。
8.根据权利要求5所述的装置,其特征在于,所述生成单元,包括:
提取单元,用于提取所述最相似案件的案件数据的共性数据;
用户画像生成单元,用于根据所述共性数据生成所述当前当事人的用户画像。
9.一种存储介质,其特征在于,用于存储程序,所述程序被执行时,用于实现如权利要求1-4任意一项所述的司法数据处理方法。
10.一种处理器,其特征在于,用于运行程序,其中,所述程序被运行时用于执行:如权利要求1-4任意一项所述的司法数据处理方法。
CN201811130999.6A 2018-09-27 2018-09-27 司法数据处理的方法、装置、存储介质及处理器 Pending CN110968662A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811130999.6A CN110968662A (zh) 2018-09-27 2018-09-27 司法数据处理的方法、装置、存储介质及处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811130999.6A CN110968662A (zh) 2018-09-27 2018-09-27 司法数据处理的方法、装置、存储介质及处理器

Publications (1)

Publication Number Publication Date
CN110968662A true CN110968662A (zh) 2020-04-07

Family

ID=70027001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811130999.6A Pending CN110968662A (zh) 2018-09-27 2018-09-27 司法数据处理的方法、装置、存储介质及处理器

Country Status (1)

Country Link
CN (1) CN110968662A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140089000A1 (en) * 2011-06-30 2014-03-27 Panasonic Corporation Similar case searching apparatus, relevance database generating apparatus, similar case searching method, and relevance database generating method
JP2014178838A (ja) * 2013-03-14 2014-09-25 Nec Fielding Ltd 管理装置、管理システム、管理方法及びプログラム
CN106528708A (zh) * 2016-10-26 2017-03-22 李露青 信息推送方法和装置
CN106991092A (zh) * 2016-01-20 2017-07-28 阿里巴巴集团控股有限公司 基于大数据挖掘相似裁判文书的方法和设备
CN107784024A (zh) * 2016-08-31 2018-03-09 北京国双科技有限公司 构建当事人画像的方法及装置
CN108009299A (zh) * 2017-12-28 2018-05-08 北京市律典通科技有限公司 法律审判业务处理方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140089000A1 (en) * 2011-06-30 2014-03-27 Panasonic Corporation Similar case searching apparatus, relevance database generating apparatus, similar case searching method, and relevance database generating method
JP2014178838A (ja) * 2013-03-14 2014-09-25 Nec Fielding Ltd 管理装置、管理システム、管理方法及びプログラム
CN106991092A (zh) * 2016-01-20 2017-07-28 阿里巴巴集团控股有限公司 基于大数据挖掘相似裁判文书的方法和设备
CN107784024A (zh) * 2016-08-31 2018-03-09 北京国双科技有限公司 构建当事人画像的方法及装置
CN106528708A (zh) * 2016-10-26 2017-03-22 李露青 信息推送方法和装置
CN108009299A (zh) * 2017-12-28 2018-05-08 北京市律典通科技有限公司 法律审判业务处理方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JIE LI SUN 等: "Study on similar case determination of personalized recommendation system", 《SCIENCE.NET》 *
吕靖等, 《大连:大连海事大学出版社》 *
李明哲: "基于人物画像的案件辅助审理方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Similar Documents

Publication Publication Date Title
EP3780541B1 (en) Identity information identification method and device
CN106033416B (zh) 一种字符串处理方法及装置
US9116879B2 (en) Dynamic rule reordering for message classification
CN112650482A (zh) 一种逻辑组件的推荐方法及相关装置
KR102227593B1 (ko) 학습-기반 그룹 태깅을 위한 시스템 및 방법
CN104573434A (zh) 帐户保护方法、装置及***
CN105117489B (zh) 一种数据库管理方法、装置及电子设备
CN110990541A (zh) 一种实现问答的方法及装置
CN111224923A (zh) 一种仿冒网站的检测方法、装置及***
CN105653548A (zh) 一种电子文档页面类型识别方法和***
CN112837202B (zh) 基于隐私保护的水印图像的生成、攻击溯源方法及装置
US9785724B2 (en) Secondary queue for index process
CN109582834B (zh) 数据风险预测方法及装置
CN111177093A (zh) 一种科技资源的共享方法及设备、介质
CN110674383A (zh) 舆情查询方法、装置及设备
CN110968662A (zh) 司法数据处理的方法、装置、存储介质及处理器
Yu et al. Obfuscating the dataset: Impacts and applications
US10482279B2 (en) Pattern-less private data detection on data sets
CN115378806A (zh) 流量分配方法、装置、计算机设备及存储介质
CN114021112A (zh) 密码算法能量分析方法及装置、存储介质及电子设备
CN110019771B (zh) 文本处理的方法及装置
CN110955812A (zh) 一种敏感案件识别方法及装置
US10466965B2 (en) Identification of users across multiple platforms
CN110019198B (zh) 数据查询方法和装置
CN113051484A (zh) 确定热点社交类信息的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200407