CN113901034A - 一种自动识别行政非诉执行案源的方法 - Google Patents

一种自动识别行政非诉执行案源的方法 Download PDF

Info

Publication number
CN113901034A
CN113901034A CN202111386236.XA CN202111386236A CN113901034A CN 113901034 A CN113901034 A CN 113901034A CN 202111386236 A CN202111386236 A CN 202111386236A CN 113901034 A CN113901034 A CN 113901034A
Authority
CN
China
Prior art keywords
data
administrative
case
complaint
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111386236.XA
Other languages
English (en)
Inventor
崔放
姜合勇
李绍俊
庞景秋
齐井春
陈兴钰
李忆平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changchun Jiacheng Information Technology Co ltd
Original Assignee
Changchun Jiacheng Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changchun Jiacheng Information Technology Co ltd filed Critical Changchun Jiacheng Information Technology Co ltd
Priority to CN202111386236.XA priority Critical patent/CN113901034A/zh
Publication of CN113901034A publication Critical patent/CN113901034A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • Library & Information Science (AREA)
  • Technology Law (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种自动识别行政非诉执行案源的方法,包括以下步骤:步骤一、规则编制;步骤二、自动研判;步骤三、动作处理;步骤四、前端应用。其包括裁判文书、行政处罚决定书在内的行政检察案源数据经过行政非诉执行自动化引擎研判后,以标签化方式标记预警案源,再经过模型处理、案源推送等环节,将行政非诉执行预警案源数据、法律依据、监督关键要点、脑图、办案指引等数据以可视化的方式呈现给办案检察官。本方法可应用于行政检察监督领域,辅助检察官办案决策,提高办案效率,提升行政检察案源发现能力,在节约司法资源、维护正常司法秩序的同时,提升了司法权威和司法公信力。

Description

一种自动识别行政非诉执行案源的方法
技术领域
本发明涉及一种自动识别的方法,尤其涉及一种自动识别行政非诉执行案源的方法。
背景技术
行政非诉执行,是指公民、法人或其他组织在法定的期限内既不提起行政复议或者行政诉讼,又不履行已经生效的具体行政行为所确定的义务,人民法院根据行政机关或具体行政行为确定的权利人的执行申请,采取强制执行措施,使行政机关的具体行政行为得以实现的制度。行政非诉执行监督,是指人民检察院依据相关法律规定,对行政非诉执行活动的法律监督。
随着我国法治建设的不断发展,行政非诉执行监督机制的不健全造成监督不规范、不统一,程序性监督和选择性监督问题凸显。行政检察涉及的法律法规繁多,专业性强,对检察官自身的专业要求也非常高,以往全部是由人工来从海量数据中发现案源,花费了检察官大量的时间和精力,且收效甚微。
发明内容
为了解决上述技术所存在的不足之处,本发明提供了一种自动识别行政非诉执行案源的方法,将大数据处理技术应用到行政非诉执行业务中,通过交互式数据开发工具实现法律逻辑及算法数据处理,自动识别行政非诉执行预警案源,通过汇聚平台数据管道将预警案源数据推送到行政非诉执行大数据应用平台,高亮定位违法情形监督关键要点,以脑图的方式呈现法律依据、办案指引等,以可视化方式呈现预警案源信息,辅助检察官快速分析案情,判别成案,提高检察官办案效率。
为了解决以上技术问题,本发明采用的技术方案是:一种自动识别行政非诉执行案源的方法,包括以下步骤:
步骤一、规则编制;
步骤二、自动研判;
步骤三、动作处理;
步骤四、前端应用。
优选的,步骤一:将裁判文书和行政处罚决定书数据依据行政非诉执行业务特征进行元数据抽取处理和文书数据分类,针对行政非诉执行违法监督类型进行专项数据建模,将抽取的结构化要素及研判逻辑进行编制,并存储于服务器中。
优选的,步骤一的具体操作步骤如下:
步骤L001、元数据处理;
步骤L002、文书数据分类;
步骤L003、确定专项违法情形;
步骤L004、抽取结构化要素;
步骤L005、设计研判逻辑;
步骤L006、专项数据处理建模;
步骤L007、通过工具编制研判规则。
优选的,步骤一中,针对行政非诉执行的业务特征将裁判文书数据进行元数据抽取,并将行政非诉执行裁判文书数据分类为:行政裁定书和执行裁定书;行政处罚决定书按照执法主体、案件类型、领域进行元数据抽取,将分类处理后的数据存储于行政检察数据集中,形成行政非诉执行监督专项方向。
优选的,步骤二:将编制好的研判规则读取解析,经过行政非诉执行自动化研判引擎将符合逻辑的专项案源数据以标签化方式作预警标识,存储于数据库中。
优选的,步骤二的具体操作步骤如下:
步骤S001、配制解释器;
步骤S002、重新启动解释器;
步骤S003、运行专项Note;
步骤S004、连接数据库;
步骤S005、读取符合条件的数据;
步骤S006、识别结构化要素;
步骤S007、需要调用字典时,调用字典接口;不需要调用字典时,直接进入步骤S009;
步骤S008、返回字典项;
步骤S009、研判,对不符合研判逻辑的案源数据作跳过处理,并重新进入步骤S006环节处理下一条数据;
步骤S010、将符合研判逻辑中研判规则的案件进行预警标签化标识。
优选的,步骤三:在行政非诉执行应用平台的后端建立对应的专项索引模型,经数据管理平台汇聚子***配置数据管道及导入和导出数据项,将预警案源数据通过管道推送至前端应用数据库及Elasticsearch分布式搜索引擎中存储。
优选的,步骤三的具体操作步骤如下:
步骤A001、在应用后台构建索引数据模型;
步骤A002、创建索引;
步骤A003、构建脑图数据;
步骤A004、配制数据管道;
步骤A005、配制发送信息;
步骤A006、配制接收信息;
步骤A007、推送数据;
步骤A008、应用接收数据;
步骤A009、存储预警案源。
优选的,步骤四:将推送至行政非诉执行应用平台的预警案源信息案件信息、违法情形、监督关键要点、脑图数据,由前端vue图层技术以可视化方式进行呈现。
优选的,步骤四的具体操作步骤如下:
步骤F001、读取专项分类数据;
步骤F002、调用预警案源数据;
步骤F003、组装可视化脑图数据;
步骤F004、组装可视化高亮数据;
步骤F005、组装监督关键要点;
步骤F006、推送到vue前端呈现。
本发明具有以下有益效果:
(1)将行政非诉执行监督方向,法律依据、典型案例及检察官办案经验,通过法学研究进行梳理,依据模型方法论整理出计算机识别的研判规则。
(2)引入语义分析技术、大数据清洗、转换、加载等前沿技术与行政检察业务进行了深度融合,将行政非诉执行案源发现由人工转化为计算机识别,极大提高了办案效率。
(3)解决了非诉执行的案源发现的技术问题,提升检察监督能力,在节约司法资源,维护正常司法秩序的同时,提升司法权威和司法公信力,对促进行政机关依法行政、人民法院司法公证具有十分积极的作用。
附图说明
图1为本发明的整体架构图。
图2为本发明步骤一规则编制的工作流程图。
图3为本发明步骤二自动研判的工作流程图。
图4为本发明步骤三动作处理的工作流程图。
图5为本发明步骤四前端应用的工作流程图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1所示的一种自动识别行政非诉执行案源的方法,包含规则编制、自动研判、动作处理和前端应用四个步骤。依据法律法规、典型案例和检察官办案经验,通过对海量数据的分析,抽取了行政非诉执行违法情形、监督关键要点和研判规则,将研判规则编制后,通过自动化研判引擎和动作处理,在应用前端以可视化高亮定位及脑图等方式呈现,经过四个步骤处理后,形成了自动识别行政非诉执行案源的方法,具体包括以下步骤:
步骤一:将裁判文书和行政处罚决定书数据依据行政非诉执行业务特征进行元数据抽取处理和文书数据分类,针对行政非诉执行违法监督类型进行专项数据建模,将抽取的结构化要素及研判逻辑进行编制,并存储于服务器中;
针对行政非诉执行的业务特征将裁判文书数据进行元数据抽取,并将行政非诉执行裁判文书数据分类为:行政裁定书和执行裁定书;行政处罚决定书按照执法主体、案件类型、领域进行元数据抽取,将分类处理后的数据存储于行政检察数据集中,形成行政非诉执行监督专项方向。
具体操作步骤如下:
步骤L001、元数据处理;
步骤L002、文书数据分类;
步骤L003、确定专项违法情形;
步骤L004、抽取结构化要素;
步骤L005、设计研判逻辑;
步骤L006、专项数据处理建模;
步骤L007、通过工具编制研判规则。
步骤二:将编制好的研判规则读取解析,经过行政非诉执行自动化研判引擎将符合逻辑的专项案源数据以标签化方式作预警标识,存储于数据库中;
将提取的案件结构化要素送入行政非诉执行自动化研判引擎中,自动化研判引擎针对不同专项,部分结构化要素将通过赋能平台获取特征字典项,送回研判引擎再继续研判,自动化引擎研判后,将符合研判规则的预警案源数据进行标签化标识。
具体操作步骤如下:
步骤S001、配制解释器;
步骤S002、重新启动解释器;
步骤S003、运行专项Note;
步骤S004、连接数据库;
步骤S005、读取符合条件的数据;
步骤S006、识别结构化要素;
步骤S007、需要调用字典时,调用字典接口;不需要调用字典时,直接进入步骤S009;
步骤S008、返回字典项;
步骤S009、研判,对不符合研判逻辑的案源数据作跳过处理,并重新进入步骤S006环节处理下一条数据;
步骤S010、将符合研判逻辑中研判规则的案件进行预警标签化标识。
步骤三:在行政非诉执行应用平台的后端建立对应的专项索引模型,经数据管理平台汇聚子***配置数据管道及导入和导出数据项,将预警案源数据通过管道推送至前端应用数据库及Elasticsearch分布式搜索引擎中存储;
在行政非诉执行的管理平台针对专项,创建索引数据模型,在数据管理平台中的汇聚***中建立数据管道,实现多源异构数据的汇聚与流转。将标签化好的预警案源数据通过汇聚平台管道推送至已经建立好对应索引数据模型的行政非诉执行应用平台服务端存储。
具体操作步骤如下:
步骤A001、在应用后台构建索引数据模型;
步骤A002、创建索引;
步骤A003、构建脑图数据;
步骤A004、配制数据管道;
步骤A005、配制发送信息;
步骤A006、配制接收信息;
步骤A007、推送数据;
步骤A008、应用接收数据;
步骤A009、存储预警案源。
步骤四:将推送至行政非诉执行应用平台的预警案源信息案件信息、违法情形、监督关键要点、脑图数据,由前端vue图层技术以可视化方式进行呈现;
行政非诉执行应用平台将接收到的预警案源数据进行整理,以高亮定位显示行政非诉执行违法情形监督关键要点,以脑图的方式显示专项数据模型、法律法规、办案指引数据,并通过vue前端技术渲染可视化方式呈现。
具体操作步骤如下:
步骤F001、读取专项分类数据;
步骤F002、调用预警案源数据;
步骤F003、组装可视化脑图数据;
步骤F004、组装可视化高亮数据;
步骤F005、组装监督关键要点;
步骤F006、推送到vue前端呈现。
下面结合实施例对本发明作进一步详细的说明。
一种自动识别非诉执行案源的方法,具体包括:将行政非诉执行检察监督所需要的法律法规、典型案例和检察官办案经验进行深度分析,结合大量的行政裁判文书及行政处罚决定书等数据,形成了多案件类型违法监督预警专项模型,并形成监督关键要点抽取规则及研判逻辑,通过Zeppelin(Apache开源框架)等交互式数据开发工具,将所监督关键要点及研判逻辑编制实现,然后由行政非诉执行自动化研判引擎负责解释运行,经过自动化研判引擎研判后,将海量数据中符合研判逻辑的案源标签化处理。
其具体实施步骤包括:规则编制、自动研判、动作处理、前端应用。
步骤一、规则编制
规则编制是本发明自动识别执行案源行政非诉的关键前提工作,为后续的自动研判奠定基础,如图2所示:
步骤L001、元数据处理;元数据处理是将多数据源,多类型异构数据进行统一数据定义的一种标准规范的处理方式,是保证数据质量的关键。将裁判文书、行政处罚决定书等数据进行元数据抽取处理,形成多个通用数据集,元数据项包括:案号、案件名称、申请执行人、审理法院、裁判日期、执法机关、处罚日期、违法事实等百余项。
步骤L002、文书数据分类;裁判文书数据、行政处罚决定书数据经过元数据处理后,将民事、行政、刑事以及执行等案件按行政区划混放在多个数据集中,根据行政非诉执行案件特征,根据元数据中的案号、案件名称及申请人执行人类型等特征,剥离出民事、刑事和行政诉讼的案件,只保留行政非诉执行的行政裁定书和执行裁定文书,完成文书数据分类。
步骤L003、确定专项违法情形;依据法律法规、典型案例和检察官办案经验,抽取了行政非诉执行监督的违法点情形,形成专项监督方向,可监督法院或者监督行政机关;明确属于行政非诉执行业务环节中审查裁定环节还是执行实施环节等,并形成监督的法律依据和办案指引等。
步骤L004、抽取结构化要素;检察监督必须依据法律法规,依据梳理的法律依据,通过研读大量文书数据,设计结构化要素提取规则,设计监督关键要点。提取结构化要素通常为正则表达式,由关键词结合正则的符号组成,可结合限定符、元字符:*,+,?,{n},{n,},{n,m},^[^0-9][0-9]$,x|y,x&y等,如:处罚日期提取规则为:从行政处罚决定书中取“于&(\d{2,4}年(\d{1,2}月(\d{1,2}日){0,1}){0,1})&(作出|做出|下达)&(处罚决定|处理决定|行政征收补偿的决定)”。
步骤L005、设计研判逻辑;设计好结构化要素及监督关键要点时,设计研判逻辑,即通过法律语言描述违法情形的研判规则。如:法院审理行政非诉执行案件超期的违法情形,依据法律逻辑结合结构化要素形成的研判逻辑是:在裁判文书分类好的行政裁定书data.judgmentType=1(表示Mongodb数据库中的数据集字段类型,1表示行政裁定书,2表示执行裁定书)中筛查【裁判日期】-【立案日期】>30日的案件进行预警标识。
步骤L006、专项数据处理建模;针对每一个行政非诉执行的违法监督专项,需要依据结构化要素和监督关键要点,在行政非诉执行的数据集中完成建模,配置好专项对应的字段属性名称、数据类型、模式(图文、行政区划、时间戳等)、是否是数组、是否引用赋能字典等。
步骤L007、通过工具编制研判规则。依据设计好的结构化提取规则,监督关键要点设定可视化要求,研判逻辑通过Zeppelin等交互式数据开发工具编制,本方法的研判逻辑采用Python语言设计,将编制好的代码存储在Zeppelin Server(Zeppelin是一个高性能,高可用的分布式Key-Value存储平台)中Note(Note是Zeppelin的一条记录,存储着Python程序代码)中,等待行政非诉执行自动化研判引擎加载调用,实现自动研判。在编制好一个专项监督研判逻辑后,可重新回到步骤L003环节,进行下一个专项的编制。
步骤二、自动研判
自动识别行政非诉执行案源的方法需要通过自动研判完成对符合研判逻辑的预警案源数据的识别,自动研判前需完成数据分类并在Zeppelin中编制好研判规则,如图3所示:
步骤S001、配制解释器;在Zeppelin管理端配置Python解释器Interpreter(解释器)的版本和输出数据尺寸等,如:
zeppelin.python=/usr/bin/python3.5
zeppelin.interpreter.output.limit=10240000
zeppelin.ipython.grpc.message_size=33554432
步骤S002、重新启动解释器;配置好解释器相关参数后,需点击“restart”(重新启动)以使配置生效。
步骤S003、运行专项Note;针对步骤L007编制好的并存在Zeppelin Sever中的Note中的违法情形专项的研判规则,启动自动化研判引擎。
步骤S004、连接数据库;由于要对大量的数据进行处理,则首先要连接数据库,本发明中采用的是基于分布式文件存储、可扩展、高性能的MongoDB数据库,由Phtyon通过MongoClient API(MongoDB数据库的开放接口)连接行政非诉执行数据集,为后续环节中的数据查询、数据更新作好准备。
步骤S005、读取符合条件的数据;
依据研判规则,通过数据库链接,检索符合条件的数据集,如:只针对某一行政区划内的行政裁定书进行研判,则可设定数据检索范围为:param={"data.cityCode":330702,"data.judgmentTyp":"1"}(其中,cityCode表示行政区划代码,judgmentType表示数据是行政裁定书),通过find(find是MongoDB数据的查询函数)获取目标数据集合,如:find(param,no_cursor_timeout=True)(此表达式为MongoDB的检索特定参数的方法,no_cursor_timeout=True表示使数据库的游标不超时)。
步骤S006、识别结构化要素;在获取符合初步筛查条件的数据集后,需要对数据集中每一条记录进行研判分析。根据Note中的结构化要素规则,从数据记录的正文中解析出结构化要素具体的内容要更新至专项的数据模型所对应的数据字段中,即:保存数据加工过程产生的数据项。
步骤S007、需要调用字典时,调用字典接口;不需要调用字典时,直接进入步骤S009;对于多个违法监督类型共用的数据特征,可以调用字典API接口获取,调用字典API一是节省开发效率,二是也会使研判规则代码更易于维护。字典调用场景如:通过案件的地点名称,调用字典API可以获得具体的行政区划代码;通过当事人信息,调用字典API可以获知是属于哪类行政执法主体,引用字典API的代码如下:
字典地址:http://xx.xx.com/muscle/api/v2/dict/getItem
参数类型:dictionary_key=xx&key=yy
通过requests.get或request.post(由Python发起的get或post请求,并通过返回的Response对象,获得方法返回值)获取返回的字典项。
步骤S008、返回字典项;根据研判规则将字典API返回的字典项值送入研判规则继续运行。
步骤S009、研判,对不符合研判逻辑的案源数据作跳过处理,并重新进入步骤S006环节处理下一条数据;将提取的结构化要素,字典特征数据等传入研判逻辑,对不符合研判逻辑的案源数据作跳过处理,重新进入步骤S006环节处理下一条数据。
步骤S010、将符合研判逻辑中研判规则的案件进行预警标签化标识。将符合研判逻辑中研判规则的案件进行预警标签化标识,更新数据库模型对应字段后,等待动作处理环节向行政非诉执行的前端应用推送。
步骤三、动作处理
动作处理实现了将自动化研判作预警标识的案源数据向行政非诉执行前端应用进行推送存储,行政非诉执行应用平台的数据存储为数据库结合Elasticsearch(也称ES),它是一个分布式具有多用户能力的全文搜索引擎,预警案源数据需要以索引结构的方式存储和访问,该引擎使海量数据访问更加快捷,如图4所示:
步骤A001、在应用后台构建索引数据模型;行政非诉执行应用平台需要在其后台将违法行为监督的专项对应构建索引数据模型,索引是一种单独的、物理的对数据库表中一列或多列的值进行排序的一种存储结构。按照步骤L006中的模型建立索引数据模型,索引数据模型包括:字段名称、字段类型、数组、聚合查询、字典及是否使用控件等。
步骤A002、创建索引;配置好索引数据模型后,则要创建正式的索引,形成正式的ES索引表,为保证数据安全,已创建索引表结构不允许再被修改。创建索引,即具备了存储预警案源数据的空间。
步骤A003、构建脑图数据;脑图是行政非诉执行预警案源重要的可视化组件之一,脑图数据需要针对专项模型单独配置,脑图所呈现的数据包括:专项介绍、法律依据、监督关键要点、办案指引等,脑图的底层表现形式为json格式,与预警案源的关联条件为模型编号,通过模型编号,案源数据可自动加载脑图数据,在前端应用页面经渲染后以可视化的方式呈现给检察官。
步骤A004、配制数据管道;在数据管理平台汇聚子***需要配置单独的数据映射关系,预警案源数据将通过管道向前端应用推送。管道配置是针对预警案源的数据模型及前端应用的索引数据模型进行数据关系映射配置,如:数据模型中的案号caseNo与ES模型中的data.caseNo(裁判文书案件的案号)进行映射,类型为字符串,非数组。
步骤A005、配制发送信息;配置源信息,管道可配置与预警案源的数据库直接连接,也可用过接口连接获取源数据。管道配置可将异构、不同来源数据以通用的元数据形式向目标服务器推送。管道的源支持MongDB直连、Excel文件上传,Ftp(文件传输协议)等。确定连接方式后再进行具体的项目配置,如:先选择MongDB直连,则还需要配置:主机、端口、用户名、密码、数据库、集合等。
步骤A006、配制接收信息;
配置接收方信息,接收方支持restful,ftp,kafka(三种接收方式,restful一种网络应用程序的设计风格和开发方式,ftp是用于在网络上进行文件传输的一套标准协议,kafka是一种高吞吐量的分布式发布订阅消息***)等,本方法主要采用restful,配置好http(超文本传输协议)的接收地址,即:行政非诉执行应用后端接收url(网络地址),格式如:http://ip:port/smartcase/api/data/importDataBatch。
步骤A007、推送数据;通过MongDB的查询语句将专项预警案源以json(数据交换格式)的格式批量打包导出为zip格式的压缩文件包,在管道中选择该文件上传至应用服务器的Redis(远程字典服务)中。
步骤A008、应用接收数据;应用后台负责接收数据的控制类为ApiDataController(数据控制器)中的,接收方法为:importDataBatch,该方法调用apiDataService.importDataToRedis实现了从zip压缩文件中解析json数据,之后存储到Redis缓存容器中。
步骤A009、存储预警案源。
行政非诉执行应用后端通过ApiDataTask和ApiDataTaskThreadPool自动任务线程轮询Redis,当发现有待入库的预警案源数据,启动doImportData方法,调用redisUtils.rightPop("api:data:import_data")从Redis中缓存窗口中获得数据,按照设定的管道模型映射关系,将预警案源存储于ES的索引中,完成了数据接收工作,做好了前端应用的准备。
步骤四、前端应用
行政非诉执行的前端应用是将后端整理好的预警案源的违法情形、法律法规、监督关键要点、高亮组件、脑图等组件数据以可视化的方式呈现给检察官的重要过程,如图5所示:
步骤F001、读取专项分类数据;行政非诉执行按照业务划分为监督法院、监督行政机关以及重点领域、辅助办案模块,通过调用后台menuList方法,获取专项进行分类,形成违法监督类别json格式数据,在前端应用首页进行呈现。
步骤F002、调用预警案源数据;查看某一个分类的预警案源数据时,针对专项分类标识所对应的索引标识,调用getIndexInfo方法获取预警案源数据列表。
步骤F003、组装可视化脑图数据;封装脑图数据,将脑图数据封装为json,包含的数据项为:法律法规、脑图的底层代码片断,办案指引、监督关键要点等数据,辅助脑图生成。
步骤F004、组装可视化高亮数据;封装可视化高亮数据,为快速定位监督关键要点,将关键要点所对应在正文中的字符串进行对象封装,并将高亮显示的属性设定为{"highlight":"true"},对应高亮索引要素要与关键结构化要素成对出现,如:裁判日期的模型字段为:judgementDate,其对就的高亮裁判日期字段为:judgementDate_highlight。
步骤F005、组装监督关键要点;
组装监督关键要点是依据违法监督方,将处理好的结构化要素封装为{"name":"keys","type":"keyinfo","name":"data.courtLevel"}格式,用来在页面中呈示案件核心的关键信息。
步骤F006、推送到vue前端呈现。利用vue前端技术渲染后端传来的封装好的组件数据,以高亮可视化的方式呈现,会在预警案源正文对应的文字上动态创建橙色半透明背景,用高亮定位<highlight></highlight>标记来标识,设定文字背景属性为"background"="#ff9125";脑图可视化,需在页面配置中的脑图组件类型设定为:"type"="kityminder",kmdata的值必须以data.为前缀,内容为脑图底层的json格式数据。cover的值必须以data.为前缀,内容为页面展示脑图封面图片,格式可以是png或jpg。可视化技术可以辅助检察官快速定位监督关键要点,快速了解案情,提升案件分析效率。
本发明可应用于行政检察监督领域,辅助检察官办案决策,提高办案效率,提升行政检察案源发现能力,提升检察机关检察监督能力,在节约司法资源、维护正常司法秩序的同时,提升司法权威和司法公信力,对促进行政机关依法行政、人民法院司法公证起到十分积极的作用。
行政检察在完善制度机制的同时,更需要借助强科技助力,积极把以大数据等为代表的现代科技与行政检察工作深度融合。本申请通过对裁判文书、行政处罚决定书等数据中的文字进行语言分析,提取研判规则关键属性和特征,再通过技术工具实现研判逻辑,以甄别行政非诉执行案件中的违法情形监督关键要点。
上述实施方式并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的技术方案范围内所做出的变化、改型、添加或替换,也均属于本发明的保护范围。

Claims (10)

1.一种自动识别行政非诉执行案源的方法,其特征在于:包括以下步骤:
步骤一、规则编制;
步骤二、自动研判;
步骤三、动作处理;
步骤四、前端应用。
2.根据权利要求1所述的自动识别行政非诉执行案源的方法,其特征在于:所述步骤一:将裁判文书和行政处罚决定书数据依据行政非诉执行业务特征进行元数据抽取处理和文书数据分类,针对行政非诉执行违法监督类型进行专项数据建模,将抽取的结构化要素及研判逻辑进行编制,并存储于服务器中。
3.根据权利要求2所述的自动识别行政非诉执行案源的方法,其特征在于:所述步骤一的具体操作步骤如下:
步骤L001、元数据处理;
步骤L002、文书数据分类;
步骤L003、确定专项违法情形;
步骤L004、抽取结构化要素;
步骤L005、设计研判逻辑;
步骤L006、专项数据处理建模;
步骤L007、通过工具编制研判规则。
4.根据权利要求3所述的自动识别行政非诉执行案源的方法,其特征在于:所述步骤一中,针对行政非诉执行的业务特征将裁判文书数据进行元数据抽取,并将行政非诉执行裁判文书数据分类为:行政裁定书和执行裁定书;行政处罚决定书按照执法主体、案件类型、领域进行元数据抽取,将分类处理后的数据存储于行政检察数据集中,形成行政非诉执行监督专项方向。
5.根据权利要求1所述的自动识别行政非诉执行案源的方法,其特征在于:所述步骤二:将编制好的研判规则读取解析,经过行政非诉执行自动化研判引擎将符合逻辑的专项案源数据以标签化方式作预警标识,存储于数据库中。
6.根据权利要求5所述的自动识别行政非诉执行案源的方法,其特征在于:所述步骤二的具体操作步骤如下:
步骤S001、配制解释器;
步骤S002、重新启动解释器;
步骤S003、运行专项Note;
步骤S004、连接数据库;
步骤S005、读取符合条件的数据;
步骤S006、识别结构化要素;
步骤S007、需要调用字典时,调用字典接口;不需要调用字典时,直接进入步骤S009;
步骤S008、返回字典项;
步骤S009、研判,对不符合研判逻辑的案源数据作跳过处理,并重新进入步骤S006环节处理下一条数据;
步骤S010、将符合研判逻辑中研判规则的案件进行预警标签化标识。
7.根据权利要求1所述的自动识别行政非诉执行案源的方法,其特征在于:所述步骤三:在行政非诉执行应用平台的后端建立对应的专项索引模型,经数据管理平台汇聚子***配置数据管道及导入和导出数据项,将预警案源数据通过管道推送至前端应用数据库及Elasticsearch分布式搜索引擎中存储。
8.根据权利要求7所述的自动识别行政非诉执行案源的方法,其特征在于:所述步骤三的具体操作步骤如下:
步骤A001、在应用后台构建索引数据模型;
步骤A002、创建索引;
步骤A003、构建脑图数据;
步骤A004、配制数据管道;
步骤A005、配制发送信息;
步骤A006、配制接收信息;
步骤A007、推送数据;
步骤A008、应用接收数据;
步骤A009、存储预警案源。
9.根据权利要求1所述的自动识别行政非诉执行案源的方法,其特征在于:所述步骤四:将推送至行政非诉执行应用平台的预警案源信息案件信息、违法情形、监督关键要点、脑图数据,由前端vue图层技术以可视化方式进行呈现。
10.根据权利要求9所述的自动识别行政非诉执行案源的方法,其特征在于:所述步骤四的具体操作步骤如下:
步骤F001、读取专项分类数据;
步骤F002、调用预警案源数据;
步骤F003、组装可视化脑图数据;
步骤F004、组装可视化高亮数据;
步骤F005、组装监督关键要点;
步骤F006、推送到vue前端呈现。
CN202111386236.XA 2021-11-22 2021-11-22 一种自动识别行政非诉执行案源的方法 Pending CN113901034A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111386236.XA CN113901034A (zh) 2021-11-22 2021-11-22 一种自动识别行政非诉执行案源的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111386236.XA CN113901034A (zh) 2021-11-22 2021-11-22 一种自动识别行政非诉执行案源的方法

Publications (1)

Publication Number Publication Date
CN113901034A true CN113901034A (zh) 2022-01-07

Family

ID=79194976

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111386236.XA Pending CN113901034A (zh) 2021-11-22 2021-11-22 一种自动识别行政非诉执行案源的方法

Country Status (1)

Country Link
CN (1) CN113901034A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115511668A (zh) * 2022-10-12 2022-12-23 金华智扬信息技术有限公司 一种基于人工智能的案件监督方法、装置、设备和介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115511668A (zh) * 2022-10-12 2022-12-23 金华智扬信息技术有限公司 一种基于人工智能的案件监督方法、装置、设备和介质
CN115511668B (zh) * 2022-10-12 2023-09-08 金华智扬信息技术有限公司 一种基于人工智能的案件监督方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
US20210407033A1 (en) Patent mapping
CN102073726B (zh) 搜索引擎***的结构化数据的引入方法和装置
CN112597373B (zh) 一种基于分布式爬虫引擎的数据采集方法
US20090119240A1 (en) Network of Networks of Associative Memory Networks for Knowledge Management
EP2201450A2 (en) A system, method and graphical user interface for workflow generation, deployment and/or execution
CN112860727B (zh) 基于大数据查询引擎的数据查询方法、装置、设备及介质
CN112131295A (zh) 基于Elasticsearch的数据处理方法及设备
CN111125068A (zh) 一种元数据治理方法和***
CN108074033A (zh) 指标数据的处理方法、***、电子设备和存储介质
CN112163017B (zh) 一种知识挖掘***及方法
US20040083422A1 (en) System and method for automatically generating patent analysis reports
US11860914B1 (en) Natural language database generation and query system
CN113297251A (zh) 多源数据检索方法、装置、设备及存储介质
CN115438142B (zh) 一种对话式交互数据分析报告***
CN113901034A (zh) 一种自动识别行政非诉执行案源的方法
CN102902705B (zh) 定位数据中的歧义
KR20140026796A (ko) 맞춤형 특허분석 서비스 시스템 및 그 방법
CN116303641B (zh) 一种支持多数据源可视化配置的实验室报告管理方法
McNeill et al. Communication in emergency management through data integration and trust: an introduction to the CEM-DIT system
CN116975116A (zh) 一种大数据分析***的数据条件筛选方法
CN115422427A (zh) 就业技能需求分析***
US20120246152A1 (en) Jury research system
CN114201543A (zh) 一种药学数据集成方法及***
CN112380264A (zh) 一种基于个人全生命周期的政策解析和匹配的方法及装置
CN113987146B (zh) 一种电力内网专用的智能问答***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination