CN110675289B - 一种随案刑事一审电子卷宗目录编著方法 - Google Patents

一种随案刑事一审电子卷宗目录编著方法 Download PDF

Info

Publication number
CN110675289B
CN110675289B CN201910936642.5A CN201910936642A CN110675289B CN 110675289 B CN110675289 B CN 110675289B CN 201910936642 A CN201910936642 A CN 201910936642A CN 110675289 B CN110675289 B CN 110675289B
Authority
CN
China
Prior art keywords
file
criminal
catalog
volume
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910936642.5A
Other languages
English (en)
Other versions
CN110675289A (zh
Inventor
何坤
董晶
周鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN201910936642.5A priority Critical patent/CN110675289B/zh
Publication of CN110675289A publication Critical patent/CN110675289A/zh
Application granted granted Critical
Publication of CN110675289B publication Critical patent/CN110675289B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/113Details of archiving
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Technology Law (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于电子卷宗目录编著技术领域,公开了一种随案刑事一审电子卷宗目录编著方法,所述随案刑事一审电子卷宗目录编著方法包括以下步骤:分析刑事一审卷宗,提取卷宗的特征,构建刑事卷宗特征库;对随案刑事案件的卷宗文件分类识别,根据特征提取文件信息,构建随案刑事卷宗管理库;结合管理库编制阅读卷宗和存档卷宗目录。本发明有助于从目录中了解具体卷宗文件来源和大致案情,同时将各部门的卷宗文件进行整合著录。弥补了传统公安(侦查卷)、检察院(检查卷)、法院(诉讼卷)和行政司法机关(执行卷)各自独立编著的不足。该发明有利于新型材料的著录,便于著录技术的扩展。

Description

一种随案刑事一审电子卷宗目录编著方法
技术领域
本发明属于电子卷宗目录编著技术领域,尤其涉及一种随案刑事一审电子卷宗目录编著方法。
背景技术
目前,最接近的现有技术:随着司法信息化建设的深入,当前各级司法部门(法院、检察院、司法行政机关)存储的刑事案件卷宗每年以千万级的数量递增。为了便于刑事案件办理和节约卷宗管理成本,各级司法部门初步建设了电子化刑事案件卷宗和各自的网上办案业务***:高中级法院各自独立开发本单位内的业务***,如“审判管理***”、“电子卷宗***”和“执行***”;人民法院构建了电子卷宗目录规范的行业标准;全国法院和人民法庭构建了专网,实现“一张网”办公办案,实现全程留痕和监督;全国检察机关搭建了统一业务应用***,融办案、管理、监督、统计等功能于一体,实现了全国四级检察机关办案信息网上录入、办案流程网上管理、办案活动网上监督和数据生成。司法行政机关是多个职能机构的总称:它包括司法行政、公证、法律援助、基层法律服务、人民调解、司法鉴定、社区矫正及帮教安置、监狱、看守所、解毒场所等。一些职能机构已建立本单位的业务***:如“司法行政工作信息管理信息***”、“公证行政管理和行业管理***”、“司法评估拍卖管理***”、“司法社区矫正管理***”和“监狱管理信息***”等等。虽然电子卷宗处理研究已在国内广泛开展,各级司法部门基本上建立了各自的电子卷宗管理***。但各级司法部门间刑事案件卷宗数据流传、共享、交换尚未完全实现。
由于我国在电子卷宗起步较晚,当前刑事案件卷宗目录仅根据各部门内办理流程进行人工编著,尚未实现根据从卷宗中自动提取文档号、基于内容的分类编目和挂接。刑事一审卷宗目录在内容上主要存在下列不足:1)目录过于简单。传统卷宗目录主要由两级构成,一级为部门内部的类名,二级为卷宗文件名称。传统卷宗目录没有包含卷宗文件的关键信息,如在侦查卷目录中,强制文书类(一级目录)的“拘留证”(二级目录)和证据类(一级目录)的“视听资料记录”(二级目录)。“拘留证”(二级目录)没有写明对谁何时进行拘留证等信息;“视听资料记录”(二级目录)没有注释关于什么的视听资料。刑事案件随案情不同卷宗文件数量不同,多则上百册,证据文件纷乱错杂。阅卷人难以从这样目录中大致了解案件的基本情况和证据构成,未充分发挥起到目录应有的作用。2)各级司法部门间缺乏统一的刑事案件卷宗著录规范,当前公检法各自有一套刑事案件卷宗著录规范,这可能导致一份卷宗在不同部门的卷宗目录中名称不一致,如证据类文件。刑事一审卷宗从使用角度上可以分为阅读卷宗和存档卷宗,阅读卷宗是指在各部门间流传的可阅读卷宗文件,它由部分刑事一审卷宗文件构成,这类卷宗因不同部门或个人的权限不同而不同,其目录也因人而异。存档卷宗是指刑事案件办理过程中形成的所有一审卷宗文件集合,它主要由公安、各级司法部门和诉讼参与人形成的文书和证据构成。存档卷宗目录应该包括公安、检察院、法院、司法行政机关和诉讼参与人可阅读卷宗名称、已提交的不采信卷宗文件名称和密级文件名称。
目前阅读卷宗目录的不足主要表现为:1)著录的自动化程度不高,还未实现依据阅卷人的权限对已有刑事一审卷宗进行自动文件筛选和目录编制。当前刑事一审卷宗在部门间流转及相应的目录需要专业人员进行人工筛选和编写。如诉讼参与人(律师)想阅读移送到检察院的侦查卷宗时,一般先与办案人员或案件管中心取得联系约定时间或申请阅读的卷宗文件,办案人员或案件管中心根据其阅读权限和申请进行人工筛选卷宗文件,并编制相应目录。2)著录不具有及时性,传统目录编制一般按案件办理节点或者事先约定时间进行编制。3)著录的整合性差,如诉讼参与人(律师)想同时阅读相关检察院和法院卷宗,他必须向检察院和法院提出申请和不同的预约时间。4)当前目录过于简单,不便于阅卷人从目录中简略的了解案情。存档目录存在的不足表现为:1)由于各部门独立编写,整合性差;2)传统刑事一审存档卷宗是由法院提供,其目录包含了公检法及部分司法行政机关的法律文书和证据材料。未包括所有司法行政机关(如监狱、看守所和解毒场所)的卷宗内容。
针对当前随案刑事一审电子卷宗著录智能化程度不高、整合性差等问题,迫切需要一项覆盖公安、法院、检察院、司法行政机关和诉讼参与人的自动卷宗存档和阅读目录编著技术,充分发挥卷宗目录在不同用途中的作用,推进司法的高效化和阳光化。旨在解决分布式存储的海量刑事一审卷宗的数据知识化问题。
综上所述,现有技术存在的问题是:目前的随案刑事一审电子卷宗著录智能化程度不高、整合性差。
解决上述技术问题的难度:
(1)构建卷宗特征库:刑事案件的文书卷宗随案情不同有多有少,多则上百册,同时证据文件纷乱错杂,不同文书和证据描述案情的内容不同。为了从文书和证据中提取关键信息,本发明分析不同刑事案件相同文件样本的共性和差异性,构成卷宗特征库。卷宗文件特征的准确性取决于文件样本的数量,同时也决定了卷宗简要说明和著录的准确性。
(2)构建随案卷宗管理库:随案刑事卷宗文件数量较多且形式多样,他们主要表现为文本、图像、视听媒体、复印件和表格等形式,不同形式的文件其信息表现方式不同。为了提出随案卷宗文件信息构建卷宗管理库,本发明综合了文字识别技术、图像处理技术和模糊识别。
解决上述技术问题的意义:
(1)构建刑事案件卷宗特征库的主要目的:
1)使得编制目录满足公检法监的阅卷习惯以及相应的著录规范;
2)为随案卷宗文件的简要说明提供指导信息;
3)为随案卷宗文件分类提供必要的特征信息。
(2)构建随案卷宗管理库的主要目的:
1)为生成阅卷目录和存档目录提供必要的数据支撑;
2)为在阅卷目录中增加文件的摘要提供数据支撑。
3)方便编排卷宗著录顺序。
发明内容
针对现有技术存在的问题,本发明提供了一种随案刑事一审电子卷宗目录编著方法。
本发明是这样实现的,一种随案刑事一审电子卷宗目录编著方法,所述随案刑事一审电子卷宗目录编著方法包括以下步骤:
第一步,分析刑事一审卷宗,提取卷宗的特征,构建刑事卷宗特征库;
第二步,对随案刑事案件的卷宗文件分类识别,根据特征提取文件信息,构建随案刑事卷宗管理库;
第三步,结合管理库编制阅读卷宗和存档卷宗目录。
进一步,所述第一步构建刑事卷宗特征库:包括卷宗制作机关、文件名称、文件属性、文件类型、文件类别、目录代码和关键信息;
文件类别是对文书类文件的具体分类;
目录代码是卷宗文件目录编号,根据公检法监的卷宗目录顺序规范;
关键信息记录卷宗文件的概要信息,根据法律工作者对卷宗文件阅读要点,构建该类文件的关键信息。
进一步,所述第二步的构建随案刑事卷宗管理库包括:
(1)卷宗文件结构:刑事案件卷宗的文书包括公检法监撰写的文书、自诉人和被告人的文本材料;文书的模板包含首部、正文和尾部;首部写明制作机关、文件名称、正副卷以及其他;正文部分写明理由及触犯的条款;尾部写明承办单位、承办人和日期;
(2)卷宗文件信息提取:借助文本、图像、视听媒体、复印件和表格形式表达;
(3)刑事案件卷宗文件管理库:
运用MYSQL8.1建立卷宗管理库,管理库主要包括卷宗制作机关、文件名称、文件属性、文件类别、权限、文件ID号、文件类型和简要说明;
制作机关,根据发布部门填写;
文件名称,利用文字识别技术从卷宗文件中提取并填写;
文件属性,利用文字识别技术从卷宗文件中提取并填写;
文件类别,根据文件名称从卷宗特征库中查询并填写;
权限,记录卷宗文件的阅读权限,由卷宗文件发布者依据案情填写;
文件ID号,既表示卷宗文件在目录中顺序,又表示卷宗文件在卷宗仓库的编号;
文件类型,根据文件名称从卷宗特征库中查询并填写;
简要说明,记录卷宗文件的概要,根据文件名称从卷宗特征库中查询该文件的关键信息,利用关键信息从文件中检索相关内容,最后填写对应项。
进一步,所述正式文书的首部分为四类:第一类只有文书名称;第二类包含制作机关、文件名称和发文字号;第三类由制作机关、文件名称、发文字号及其他构成;第四类是在第三类的基础上增加正副卷;
图像和视听资料主要由两部分组成:说明体和相关媒体资料,说明体写明媒体的来源、时间、地点、采集人员和相关内容说明;复印件是指相关单位颁发的有效证件;表格由表名和表格各项内容构成;表名均以独立行在首页中出现。
进一步,所述卷宗文件信息提取还包括:
1)文书名称及信息提取:
解析PDF文本结构;其次利用文字识别技术提取首页的各行文本;最后对各行文本与特征库中的文件名称项进行模糊匹配,识别文书名称;
文书其他信息提取:根据文书名称,首先结合特征库中该文件的关键信息检索相应的内容,构成该文件的简要说明;其次根据特征库中该文件的目录代码生成该文件ID号;最后分析文件属性和类别;
2)图像和视听媒体的信息提取:
图像和视听资料的说明部分表现为PDF格式,首先解析说明部分PDF文本结构;其次利用文字识别技术结合卷宗特征库中的时间、地点、采集人员内容,同时根据特征库中的关键信息从说明部分检索相关内容,构成图像和视听媒体的简要说明;最后根据特征库中目录代码生成该文件ID号;
3)复印件的信息提取:
首先运用边缘检测算法检测出证件边缘,对边缘进行Hough变化检测出证件边界上下左右的平行线,根据上下平行线和左右平行线的斜率分析证件采集时的角度,依据该角度对证件进行旋转处理;其次对旋转后的复印件运用OCR技术提取证件类型、证件持有人姓名、签发时间信息;最后根据特征库中目录代码生成该文件ID号;
4)表格的信息提取:
首先解析PDF文本结构;其次提取首页的各行文本,对各行文本与特征库中的文件名称项进行模糊匹配,识别表名;最后根据表名结合其特征提取其关键信息,构成其简要说明,同时生成ID号。
进一步,所述第三步结合管理库编制阅读卷宗和存档卷宗目录具体包括:
(1)目录框架:
将刑事案件卷宗目录框架设计为:公安材料、检察院材料、法院材料、执行材料、自诉人材料、被告人材料、第三方机构材料、音视频材料、其他诉讼相关材料和其他为一级目录;法律文书、证据为二级目录;文件类别为三级目录;具体的卷宗文件为四级目录,根据卷宗文件管理库的相关项编制目录;
(2)卷宗目录编著:
案件卷宗从使用角度上分为存档卷宗和阅读卷宗,相应生成存档卷宗目录和阅读卷宗目录;目录顺序由卷宗管理库中的文件ID号决定。
进一步,所述一级目录指明卷宗文件的来源,制作机关,根据卷宗文件管理库的制作机关项生成;
二级目录指明卷宗文件类型,法律文书和证据;根据卷宗文件管理库的文件类型项生成;
三级目录指明卷宗文件类别,根据卷宗文件管理库的类别项生成;
四级目录由具体卷宗文件的名称和摘要构成,文件名称根据卷宗管理库中文件名称生成。
进一步,所述卷宗目录编著包括:
1)存档目录编著:
存档卷宗是指刑事案件办理过程中形成的所有卷宗集合,其目录不受任何约束地概括案件的所有卷宗文件;用于存档处理,该目录中不包含四级目录的摘要部分,由一级目录、二级目录、三级目录和四级目录的文件名称等项构成;
2)阅读卷宗目录编著:
阅读卷宗是相关人员或部门依据权限的可阅读卷宗,其目录只能包括阅读权限内的卷宗文件;目录中主要由一级目录、二级目录、三级目录和满足阅读权限的四级目录构成。
进一步,所述随案刑事一审电子卷宗目录编著方法还包括卷宗文件挂接,根据卷宗管理库中的文件ID号检索相应的卷宗文件并展出来。
综上所述,本发明的优点及积极效果为:随着互联网对社会的影响越来越大,现有的电子卷宗著录需要作出改变。刑事案件一审处理部门主要由法院、检察院、法院、司法行政机关和诉讼参与人(律师)。刑事一审电子卷宗是各个部门在办理过程中形成的所有法律文书和证据的总称,每份法律文书或证据称为卷宗文件。卷宗数量随案情不同有多有少,少则两册,多则上百册,证据文件纷乱错杂。刑事一审电子卷宗从使用角度上可以分为阅读卷宗和存档卷宗,存档卷宗是指刑事案件办理过程中形成的所有卷宗集合,其目录的主要作用概括刑事一审的所有卷宗文件;阅读卷宗是相关人员或部门依据权限的可阅读卷宗,其目录主要帮助阅读人了解权限内的案情,阅卷人从阅卷目录中的摘要中可以看出大致案情和证据构成。
本发明结合公安、检察院、法院、行政司法机关和诉讼参与人提供的卷宗文件及相应的著录规范,对刑事案件的卷宗分为公安材料、检察院材料、法院材料、执行材料、自诉人材料、被告人材料、第三方机构材料(仲裁公证)、音视频材料、其他诉讼相关材料和其他,并将他们作为一级目录。有助于从目录中了解具体卷宗文件的制作机关或来源,同时将各部门的卷宗文件进行整合著录。弥补了传统公安(侦查卷)、检察院(检查卷)、法院(诉讼卷)和行政司法机关(执行卷)各自独立编著的不足。其他有利于新型材料的著录,便于著录技术的扩展。
本发明对刑事案件进行整合著录,有助于阅卷人查阅不同部门的卷宗文件。减少了阅卷人到各个部门申请阅卷的时间和成本。
本发明构建了随案卷宗管理库,根据随案卷宗管理库可随时自动生成不同用途的卷宗目录,不需要人工干预,弥补了传统著录技术的缺陷,节约了卷宗目录生成的人力和成本。
本发明在传统目录上增加了卷宗文件摘要,便于阅卷人从目录中快速地了解案件的基本情况和证据构成,提高阅卷质量和效率。
本发明结合公检法监的传统卷宗目录以及相应的规范建立刑事案件一审卷宗特征库。为构建其他类型案件的卷宗特征库奠定了一定的基础。
本发明促进了随案电子卷宗同步的深度应用,减轻了法律工作者的负担。支持刑事案件的侦查、监督、庭审和执行流程,提升办案质量和效率。实现无纸化办案,在各个环节根据需要及时展示卷宗文件的全文;支持各部门的领导及管理者同步查阅卷宗文件。本发明充分发挥了刑事一审卷宗目录的作用,弥补了传统目录存在的不足。
附图说明
图1是本发明实施例提供的随案刑事一审电子卷宗目录编著方法流程图。
图2是本发明实施例提供的随案刑事一审电子卷宗目录编著方法实现流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种随案刑事一审电子卷宗目录编著方法,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的随案刑事一审电子卷宗目录编著方法包括以下步骤:
S101:分析刑事一审卷宗,提取卷宗的特征,构建刑事卷宗特征库;
S102:对随案刑事案件的卷宗文件分类识别,根据特征提取文件信息,构建随案刑事卷宗管理库;
S103:结合管理库编制阅读卷宗和存档卷宗目录。
下面结合附图对本发明的技术方案作进一步的描述。
如图2所示,本发明实施例提供的随案刑事一审电子卷宗目录编著方法具体包括以下步骤:
第一步,构建刑事卷宗特征库:
刑事案件随案情不同其卷宗文件数量不同,但他们具有如下的共性:i)文件制作机关主要由公安、检察院、法院、执行材料自诉人、被告人、第三方机构和监狱;ii)文件类型分为文书类和证据类;iii)其相同卷宗文件命名是统一的,如所有刑事案件的逮捕证均命名为“逮捕证”;iv)卷宗文件分为正副卷;v)卷宗文件在不同部门的卷宗目录中位置必须满足相关规范。综合上述刑事一审案件电子卷宗文件共性和目录编著的相关规范,本发明建立卷宗特征库。该特征库主要包括卷宗制作机关、文件名称、文件属性(正副卷)、文件类型(文书类、证据类)、文件类别、目录代码和关键信息等内容。
文件类别是不同部门为了便于阅卷对文书类文件的具体分类,如公安机关的法律文书又分为3类:立案管辖文书,侦查文书和强制类文书等等。
目录代码为卷宗文件目录编号。该项根据公检法监的卷宗目录顺序规范,设计为数字序列AABBB,AA表示文件来源(公安材料、检察院材料、法院材料、自诉人材料、被告人材料、第三方机构材料(仲裁公证)、音视频材料和其他诉讼相关材料);BBB表示不同卷宗文件在目录中的序号。
关键信息记录卷宗文件的概要信息,不同卷宗文件内容不相同,相同文件虽命名相同但内容不同。根据法律工作者对卷宗文件阅读要点,构建该类文件的关键信息。如拘留证中的被拘留人、执行人及日期等项为拘留证的关键信息。
第二步,构建随案刑事卷宗管理库:
刑事一审卷宗是各级司法部门形成文件的集合,其大致可以分为公安材料、检察院材料、法院材料、执行材料自诉人材料、被告人材料、第三方机构材料(仲裁公证)、音视频材料和其他诉讼相关材料(诉讼参与人的身份证明以及委托手续)和其他。这些材料呈现的形式主要包括PDF格式的文本、图像、视听媒体、复印件和表格(审判信息表或者罪犯入监登记表)。
(1)卷宗文件结构:
随案刑事卷宗文件数量较多且形式多样,但同形式的文件具有相似的书写格式。
刑事案件卷宗的文书主要包括公检法监撰写的正式文书、自诉人和被告人的文本材料。公检法监撰写的文书(法律文书、笔录、仲裁公证文书、和委托书)一般具有统一的模板,其模板包含了首部、正文和尾部。首部写明制作机关、文件名称、正副卷以及其他。正文部分写明理由及触犯的《刑法》条款)。尾部写明承办单位、承办人和日期。文书的首部大致可以分为四类:第一类只有文书名称,如呈请调取证据报告书和委托申请书。第二类包含制作机关、文件名称和发文字号,其中发文字号具有统一的格式:如:×公刑拘字〈×××〉第××号,×检立(×××)号,×法刑终字第××号。第三类由制作机关、文件名称、发文字号及其他等构成。如第一审刑事判决书的首部包括:制作机关、文件名称(×××人民法院刑事判决书)、案号和其他(公诉机关项、被告人项、辩护人项和案件的由来、审判组织、审判方式和审判经过)。第四类是在第三类的基础上增加了正副卷。自诉人和被告人的文本文件一般由文书名称和正文构成。在刑事案件文书类卷宗中,文件名称在文书中具***置没有统一规范,但他均以独立行在首页中出现。
图像和视听资料一般包括说明体和相关媒体资料,其中说明体写明了该媒体的来源、时间、地点、采集人员和相关内容说明。复印件一般为相关单位颁发的有效证件,如身份证、结婚证、驾驶证。表格主要有表名和表格各项内容构成。表名均以独立行在首页中出现。
(2)卷宗文件信息提取:
卷宗文件的内容一般借助文本、图像、视听媒体、复印件和表格等形式表达出来,不同形式的卷宗文件信息的呈现方式不同。为了提取卷宗文件信息,本发明主要内容为:
1)文书名称及信息提取:
在刑事一审卷宗中,文本表现为PDF格式。为了提取文本形式的卷宗文件信息,本发明首先解析PDF文本结构;其次利用文字识别技术提取首页的各行文本;最后对各行文本与特征库中的文件名称项进行模糊匹配,识别文书名称。
文书其他信息提取:根据文书名称,首先结合特征库中该文件的关键信息检索相应的内容,构成该文件的简要说明;其次根据特征库中该文件的目录代码生成该文件ID号;最后分析文件属性和类别。
2)图像和视听媒体的信息提取:
图像和视听资料的说明部分表现为PDF格式,本发明首先解析说明部分PDF文本结构;其次利用文字识别技术结合卷宗特征库中的时间、地点、采集人员等内容,同时根据特征库中的关键信息从说明部分检索相关内容,构成图像和视听媒体的简要说明;最后根据特征库中目录代码生成该文件ID号。
3)复印件的信息提取:
复印件在卷宗中表现为图像形式,它是借助复印机采集得到的。为了弥补证件摆放位置及角度对复印件信息提取的影响。本发明首先运用边缘检测算法检测出证件边缘,对边缘进行Hough变化检测出证件边界上下左右的平行线,根据上下平行线和左右平行线的斜率分析证件采集时的角度,依据该角度对证件进行旋转处理;其次对旋转后的复印件运用OCR技术提取证件类型、证件持有人姓名、签发时间等信息;最后根据特征库中目录代码生成该文件ID号。
4)表格的信息提取:
表格主要由表名、制表时间和各项内容构成,表现为PDF的文本格式。为了提取表格信息,首先解析PDF文本结构;其次提取首页的各行文本,对各行文本与特征库中的文件名称项进行模糊匹配,识别表名;最后根据表名结合其特征提取其关键信息,构成其简要说明,同时生成ID号。
(3)刑事案件卷宗文件管理库:
刑事案件卷宗文件主要用于阅读和存档,为了方便管理和及时生成不同用途的卷宗目录,本发明运用MYSQL8.1建立卷宗管理库。该管理库主要包括卷宗制作机关、文件名称、文件属性、文件类别、权限、文件ID号、文件类型和简要说明。
制作机关,根据发布部门填写。
文件名称,利用文字识别技术从卷宗文件中提取并填写。
文件属性,利用文字识别技术从卷宗文件中提取并填写。如不存在,均填写正卷。
文件类别,根据文件名称从卷宗特征库中查询并填写。
权限,记录卷宗文件的阅读权限,由卷宗文件发布者依据案情填写。
文件ID号,既表示卷宗文件在目录中顺序,又表示卷宗文件在卷宗仓库的编号,如数字序列AABBBCCC,AABBB根据文件名在卷宗特征库中查询;CCC表示同一文件下的子文件序号(如刑事案件中不同人的拘留证),以时间顺序自动生成。
文件类型,根据文件名称从卷宗特征库中查询并填写。
简要说明,记录卷宗文件的概要。根据文件名称从卷宗特征库中查询该文件的关键信息,利用关键信息从文件中检索相关内容,最后填写对应项。
第三步,随案刑事卷宗著录技术:
为了提高公安、各级司法部门和诉讼参与人随时从海量的卷宗中快速地了解刑事案件的基本情况和证据构成。本发明结合公安、检察院、法院和诉讼参与人提供的卷宗文件及相应的著录规范,将刑事案件的卷宗分为公安材料、检察院材料、法院材料、执行材料、自诉人材料、被告人材料、第三方机构材料(仲裁公证)、音视频材料、其他诉讼相关材料和其他。公安材料,由公安机关在侦查过程中形成并制作一般由公安机关办案时使用的法律文书和侦查过程形成的证据构成。检察院材料由检察院制作,分为正卷(检察院的法律文书和外部手续)和副卷(检察院形成的报告和内部手续)。法院材料是法院在审理过程中形成的法律文书和证据。执行材料包括司法行政机关依据法院文书执行过程中形成的法律文书和证据。自诉人材料、被告人材料是自诉人或被告人提交的文书和证据性材料。
(1)目录框架:
为了在目录中体现刑事案件办理节点和随案形成的卷宗文件来源,本发明将刑事案件卷宗目录框架设计为:公安材料、检察院材料、法院材料、执行材料、自诉人材料、被告人材料、第三方机构材料(仲裁公证)、音视频材料、其他诉讼相关材料和其他为一级目录;法律文书、证据为二级目录;文件类别为三级目录;具体的卷宗文件为四级目录。根据卷宗文件管理库的相关项编制目录。
一级目录主要指明卷宗文件的来源,即制作机关,根据卷宗文件管理库的制作机关项生成。
二级目录主要指明卷宗文件类型,即法律文书和证据。根据卷宗文件管理库的文件类型项生成。
三级目录主要指明卷宗文件类别,根据卷宗文件管理库的类别项生成。
四级目录主要由具体卷宗文件的名称和摘要构成。文件名称根据卷宗管理库中文件名称生成。摘要是为了便于阅卷人从目录中快速地了解案件的基本情况和证据构成。摘要因卷宗文件信息而异,如有效证件的文件简要说明仅仅包括姓名和***日期,有些文件简要说明较多,如现场勘查笔录(发现或者报案的时间,现场保护人姓名、单位;现场保护人到达时间;勘查时间;勘查地点;现场勘查的指挥人员和勘查人员姓名、职务和单位;见证人的姓名、单位和住址;现场条件)。本发明文件的简要说明以摘要形式给出。该内容仅仅根据卷宗管理库简要说明项编写。
(2)卷宗目录编著:
案件卷宗从使用角度上可以分为存档卷宗和阅读卷宗,相应生成存档卷宗目录和阅读卷宗目录。目录顺序由卷宗管理库中的文件ID号来决定。具体序号为:以AA增序。在AA相同的情况下,以BBB增序。在AABBB相同的情况下,以CCC增序。
1)存档目录编著:
存档卷宗是指刑事案件办理过程中形成的所有卷宗集合,其目录不受任何约束地概括案件的所有卷宗文件。其目的主要用于存档处理,该目录中不包含三级目录简要说明说明部分,主要由一级目录、二级目录、三级目录和四级目录的文件名等项构成。
2)阅读卷宗目录编著:
阅读卷宗是相关人员或部门依据权限的可阅读卷宗,其目录只能包括阅读权限内的卷宗文件。其目的主要是有助于阅卷人从阅卷目录中可以看出大致案情和证据构成,该目录中主要由一级目录、二级目录、三级目录和满足阅读权限的四级目录(文件名和摘要)构成。
第四步,卷宗文件挂接:
阅卷人根据目录大致了解案件的基本情况和证据构成后,一般抱着质疑的态度分析案卷和针对性审阅卷宗文件,此时需要阅读卷宗文件的全文。对此,本发明根据卷宗管理库中的文件ID号检索相应的卷宗文件并显示出来。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种随案刑事一审电子卷宗目录编著方法,其特征在于,所述随案刑事一审电子卷宗目录编著方法包括以下步骤:
第一步,分析刑事一审卷宗,提取卷宗的特征,构建刑事卷宗特征库;
第二步,对随案刑事案件的卷宗文件分类识别,根据特征提取文件信息,构建随案刑事卷宗管理库;
第三步,结合管理库编制阅读卷宗和存档卷宗目录;
所述第一步构建刑事卷宗特征库:包括卷宗制作机关、文件名称、文件属性、文件类型、文件类别、目录代码和关键信息;
文件属性是指卷宗文件的属性,即正副卷;
文件类型是卷宗文件为文书还是证据;
文件类别是对文件类文件的具体分类;
目录代码是卷宗文件目录编号,根据公检法监的卷宗目录顺序规范;
关键信息记录卷宗文件的概要信息,根据法律工作者对卷宗文件阅读要点,构建该类文件的关键信息;
所述第二步的构建随案刑事卷宗管理库包括:
(1)卷宗文件结构:刑事案件卷宗的文书包括公检法监撰写的文书、自诉人和被告人的文本材料;文书的模板包含首部、正文和尾部;首部写明制作机关、文件名称、正副卷以及其他;正文部分写明理由及触犯的条款;尾部写明承办单位、承办人和日期;
(2)卷宗文件信息提取:借助文本、图像、视听媒体、复印件和表格形式表达,运用文本、表格、图像和流媒体处理技术提取信息;
(3)随案刑事案件卷宗文件管理库:
运用MYSQL8.1建立卷宗管理库,管理库主要包括卷宗制作机关、文件名称、文件属性、文件类别、权限、文件ID号、文件类型和简要说明;
制作机关,根据发布部门填写;
文件名称,利用文字识别技术从卷宗文件中提取并填写;
文件属性,利用文字识别技术从卷宗文件中提取并填写;
文件类别,根据文件名称从卷宗特征库中查询并填写;
权限,记录卷宗文件的阅读权限,由卷宗文件发布者依据案情填写;
文件ID号,既表示卷宗文件在目录中顺序,又表示卷宗文件在卷宗仓库的编号;
文件类型,根据文件名称从卷宗特征库中查询并填写;
简要说明,记录卷宗文件的概要,根据文件名称从卷宗特征库中查询该文件的关键信息,利用关键信息从文件中检索相关内容,最后填写对应项。
2.如权利要求1所述的随案刑事一审电子卷宗目录编著方法,其特征在于,正式文书的首部分为四类:第一类只有文书名称;第二类包含制作机关、文件名称和发文字号;第三类由制作机关、文件名称、发文字号及其他构成;第四类是在第三类的基础上增加正副卷;
图像和视听资料由两部分组成:说明体和相关媒体资料,说明体写明媒体的来源、时间、地点、采集人员和相关内容说明;复印件是指相关单位颁发的有效证件;表格由表名和表格各项内容构成;表名均以独立行在首页中出现。
3.如权利要求1所述的随案刑事一审电子卷宗目录编著方法,其特征在于,所述卷宗文件信息提取还包括:
1)文书名称及信息提取:
解析PDF文本结构;其次利用文字识别技术提取首页的各行文本;最后对各行文本与特征库中的文件名称项进行模糊匹配,识别文书名称;
文书其他信息提取:根据文书名称,首先结合特征库中该文件的关键信息检索相应的内容,构成该文件的简要说明;其次根据特征库中该文件的目录代码生成该文件ID号;最后分析文件属性和类别;
2)图像和视听媒体的信息提取:
图像和视听资料的说明部分表现为PDF格式,首先解析说明部分PDF文本结构;其次利用文字识别技术结合卷宗特征库中的时间、地点、采集人员内容,同时根据特征库中的关键信息从说明部分检索相关内容,构成图像和视听媒体的简要说明;最后根据特征库中目录代码生成该文件ID号;
3)复印件的信息提取:
首先运用边缘检测算法检测出证件边缘,对边缘进行Hough变化检测出证件边界上下左右的平行线,根据上下平行线和左右平行线的斜率分析证件采集时的角度,依据该角度对证件进行旋转处理;其次对旋转后的复印件运用OCR技术提取证件类型、证件持有人姓名、签发时间信息;最后根据特征库中目录代码生成该文件ID号;
4)表格的信息提取:
首先解析PDF文本结构;其次提取首页的各行文本,对各行文本与特征库中的文件名称项进行模糊匹配,识别表名;最后根据表名结合其特征提取其关键信息,构成其简要说明,同时生成ID号。
4.如权利要求1所述的随案刑事一审电子卷宗目录编著方法,其特征在于,所述第三步结合管理库编制阅读卷宗和存档卷宗目录具体包括:
(1)目录框架:
将刑事案件卷宗目录框架设计为:公安材料、检察院材料、法院材料、执行材料、自诉人材料、被告人材料、第三方机构材料、音视频材料、其他诉讼相关材料和其他为一级目录;法律文书、证据为二级目录;文件类别为三级目录;具体的卷宗文件为四级目录,根据卷宗文件管理库的相关项编制目录;
(2)卷宗目录编著:
案件卷宗从使用角度上分为存档卷宗和阅读卷宗,相应生成存档卷宗目录和阅读卷宗目录;目录顺序由卷宗管理库中的文件ID号决定。
5.如权利要求4所述的随案刑事一审电子卷宗目录编著方法,其特征在于,所述一级目录指明卷宗文件的来源,制作机关,根据卷宗文件管理库的制作机关项生成;
二级目录指明卷宗文件类型,法律文书和证据;根据卷宗文件管理库的文件类型项生成;
三级目录指明卷宗文件类别,根据卷宗文件管理库的类别项生成;
四级目录由具体卷宗文件的名称和摘要构成,文件名称根据卷宗管理库中文件名称生成。
6.如权利要求4所述的随案刑事一审电子卷宗目录编著方法,其特征在于,所述卷宗目录编著包括:
1)存档目录编著:
存档卷宗是指刑事案件办理过程中形成的所有卷宗集合,其目录不受任何约束地概括案件的所有卷宗文件;用于存档处理,该目录中不包含四级目录的摘要部分,由一级目录、二级目录、三级目录和四级目录的文件名称构成;
2)阅读卷宗目录编著:
阅读卷宗是相关人员或部门依据权限的可阅读卷宗,其目录只能包括阅读权限内的卷宗文件;目录中主要由一级目录、二级目录、三级目录和满足阅读权限的四级目录构成。
7.如权利要求4所述的随案刑事一审电子卷宗目录编著方法,其特征在于,所述随案刑事一审电子卷宗目录编著方法还包括卷宗文件挂接,根据卷宗管理库中的文件ID号检索相应的卷宗文件并显示。
CN201910936642.5A 2019-09-29 2019-09-29 一种随案刑事一审电子卷宗目录编著方法 Active CN110675289B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910936642.5A CN110675289B (zh) 2019-09-29 2019-09-29 一种随案刑事一审电子卷宗目录编著方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910936642.5A CN110675289B (zh) 2019-09-29 2019-09-29 一种随案刑事一审电子卷宗目录编著方法

Publications (2)

Publication Number Publication Date
CN110675289A CN110675289A (zh) 2020-01-10
CN110675289B true CN110675289B (zh) 2023-05-05

Family

ID=69080176

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910936642.5A Active CN110675289B (zh) 2019-09-29 2019-09-29 一种随案刑事一审电子卷宗目录编著方法

Country Status (1)

Country Link
CN (1) CN110675289B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612893A (zh) * 2020-12-29 2021-04-06 广西安怡臣信息技术有限公司 一种电子卷宗随案生成***
CN113157642A (zh) * 2021-03-19 2021-07-23 浪潮云信息技术股份公司 一种实现电子材料数字化流程自动化的方法
CN113222417A (zh) * 2021-05-17 2021-08-06 广西安怡臣信息技术有限公司 一种电子卷宗数据工厂全流程智能应用管理***
CN113222788A (zh) * 2021-05-17 2021-08-06 广西安怡臣信息技术有限公司 一种智能阅卷方法
CN113254396B (zh) * 2021-06-23 2021-09-24 昌和云科技有限公司 一种多部门的案件协同管理***
CN113609856A (zh) * 2021-07-21 2021-11-05 浙江建达科技股份有限公司 一种基于人工智能的电子卷宗阅读***及其阅卷工具
CN115391577B (zh) * 2022-09-29 2023-06-23 浙江星汉信息技术股份有限公司 一种基于机器学习算法的电子档案管理方法与***

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2738368A1 (fr) * 1995-09-01 1997-03-07 Finance Christian Procede et systeme de conception et de production de catalogues electroniques personnalises
CN101853311A (zh) * 2010-06-18 2010-10-06 上海百事通信息技术有限公司 一种法律服务方法及***
CN102955822A (zh) * 2011-08-31 2013-03-06 河南新创元信息网络有限公司 类分式文书档案管理***及管理方法
CN104636835A (zh) * 2013-11-06 2015-05-20 北京航天长峰科技工业集团有限公司 一种跨部门的案件协同处理***
CN105159968A (zh) * 2015-08-25 2015-12-16 浪潮(北京)电子信息产业有限公司 一种文件***的目录管理方法及客户端
CN107085584A (zh) * 2016-11-09 2017-08-22 中国长城科技集团股份有限公司 一种基于内容的云文档管理方法、***及服务端
CN109977073A (zh) * 2019-03-11 2019-07-05 厦门纵横集团科技股份有限公司 一种法院电子卷宗自动化归档***及其方法
CN110135715A (zh) * 2019-05-06 2019-08-16 江苏新视云科技股份有限公司 一种智能法庭管理方法
CN110209632A (zh) * 2019-05-27 2019-09-06 武汉市润普网络科技有限公司 一种电子卷宗随案生产、转档***

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2738368A1 (fr) * 1995-09-01 1997-03-07 Finance Christian Procede et systeme de conception et de production de catalogues electroniques personnalises
CN101853311A (zh) * 2010-06-18 2010-10-06 上海百事通信息技术有限公司 一种法律服务方法及***
CN102955822A (zh) * 2011-08-31 2013-03-06 河南新创元信息网络有限公司 类分式文书档案管理***及管理方法
CN104636835A (zh) * 2013-11-06 2015-05-20 北京航天长峰科技工业集团有限公司 一种跨部门的案件协同处理***
CN105159968A (zh) * 2015-08-25 2015-12-16 浪潮(北京)电子信息产业有限公司 一种文件***的目录管理方法及客户端
CN107085584A (zh) * 2016-11-09 2017-08-22 中国长城科技集团股份有限公司 一种基于内容的云文档管理方法、***及服务端
CN109977073A (zh) * 2019-03-11 2019-07-05 厦门纵横集团科技股份有限公司 一种法院电子卷宗自动化归档***及其方法
CN110135715A (zh) * 2019-05-06 2019-08-16 江苏新视云科技股份有限公司 一种智能法庭管理方法
CN110209632A (zh) * 2019-05-27 2019-09-06 武汉市润普网络科技有限公司 一种电子卷宗随案生产、转档***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
论归档文件整理工作的简化;沈蕾等;《档案学通讯》;20160630(第6期);第39-42页 *

Also Published As

Publication number Publication date
CN110675289A (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
CN110675289B (zh) 一种随案刑事一审电子卷宗目录编著方法
US8935265B2 (en) Document journaling
Pearce-Moses et al. A glossary of archival and records terminology
US10089287B2 (en) Redaction with classification and archiving for format independence
CN109144968B (zh) 一种数据分布管理***
US7505968B2 (en) Evaluating the relevance of documents and systems and methods therefor
CN109388648B (zh) 一种在电子笔录中提取人员信息及关系人的方法
Gaikwad et al. Text-Based Sources
CN112597763A (zh) 司法文书信息提取和关联展示方法、装置及存储介质
Forstrom Managing electronic records in manuscript collections: A case study from the Beinecke Rare Book and Manuscript Library
US20050034072A1 (en) Method and system for documenting and processing intellectual assets
Bhardwaj et al. Metadata framework for online legal information system in Indian environment
Mastley Representation of Black History in Archives: A Collection-Centered Quantitative Analysis of the Billups-Garth Archive
Lambert et al. Grey Literature, institutional repositories, and the organisational context
Emery Document and records management: Understanding the differences and embracing integration
Abdumalik Information support for forensic expert activities of forensic institutions: current problems of theory and practice
Bunawan et al. A Primary School Case Study on Difficulties of Using the Digital Document as Evidence
Sanders Archivists and records managers: another marriage in trouble?
Fitzgerald 10 Computer-based qualitative data methods
Mardiati et al. The Potential Use of Artificial Intelligence Technology in the Process of Collecting Metadata in Photo Archive Description Activities
Zahura et al. Designing an electronic storage system to enhance the retrieval of records at Kasangati Magistrate Court
Nelson The impact of computers on the legal profession
Kumar et al. Managing Newspaper Clippings in Print Media Libraries: A Study
Haried US Attorneys' Options for Managing Case Investigative Information in Small, Medium, and Large Cases
Demydova et al. DIGITAL EVIDENCE IN CRIMINAL JUSTICE: CHALLENGES OF UTILIZATION

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant