CN111859969B - 数据分析方法及装置、电子设备、存储介质 - Google Patents
数据分析方法及装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN111859969B CN111859969B CN202010697225.2A CN202010697225A CN111859969B CN 111859969 B CN111859969 B CN 111859969B CN 202010697225 A CN202010697225 A CN 202010697225A CN 111859969 B CN111859969 B CN 111859969B
- Authority
- CN
- China
- Prior art keywords
- data analysis
- data
- analysis
- case
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 327
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000004458 analytical method Methods 0.000 claims abstract description 144
- 238000012545 processing Methods 0.000 claims abstract description 29
- 230000008569 process Effects 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 5
- 238000013135 deep learning Methods 0.000 claims description 5
- 230000001502 supplementing effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 2
- 238000007689 inspection Methods 0.000 description 60
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 230000004927 fusion Effects 0.000 description 8
- 238000011161 development Methods 0.000 description 7
- 230000018109 developmental process Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000013499 data model Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000012098 association analyses Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Technology Law (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种数据分析方法及装置、电子设备、存储介质,涉及数据处理技术领域。该数据分析方法包括:响应于对待处理案件的分析指令,获取预先构建的数据分析知识图谱;基于所述数据分析知识图谱,根据所述分析指令确定所述待处理案件对应的数据分析微服务;通过所述数据分析微服务获取所述待处理案件对应的关联数据;根据所述数据分析知识图谱将所述关联数据进行连接处理以生成所述分析指令对应的分析结果,并返回所述分析结果。本公开实施例的技术方案可以实现对海量民事、行政、刑事案件信息和判决文书等业务数据的高效率、高准确度的处理,实现多种类型数据之间的分析协同以及自动关联,提升工作人员的工作效率。
Description
技术领域
本公开涉及数据处理技术领域,具体而言,涉及一种数据分析方法、数据分析装置、电子设备以及计算机可读存储介质。
背景技术
随着互联网技术的飞速发展,人们所要处理的信息数据的数量以及类型越来越多,因此如何快速、准确地对海量数据进行分析处理成为人们关注的重点。
检察机关对于民事检察、行政检察等法律监督业务,采用对已经审结生效的审判办案信息和裁判文书进行数据全面综合分析,从而行使对民事、行政案件审判工作的法律监督职责。
目前,相关数据分析的技术方案中,要么针对特定业务构建专门的业务辅助分析办案***和专用的业务数据模型,要么提供通用的案件信息分析技术,由检察官人力进行综合分析。但是,第一种方案中,对特定检察业务构建专用辅助办案软件***,业务逻辑固化,适用范围较窄,且不能将不同类型的数据打通,增大分析检索的难度;第二种方案中,检察官检索分析的数据量较多且结构复杂,导致工作效率较低,数据分析的结果不准确。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开实施例的目的在于提供一种数据分析方法、数据分析装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服相关技术方案中案件数据分析难度大、效率低以及准确度低的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的第一方面,提供了一种数据分析方法,包括:响应于对待处理案件的分析指令,获取预先构建的数据分析知识图谱;基于所述数据分析知识图谱,根据所述分析指令确定所述待处理案件对应的数据分析微服务;通过所述数据分析微服务获取所述待处理案件对应的关联数据;根据所述数据分析知识图谱将所述关联数据进行连接处理以生成所述分析指令对应的分析结果,并返回所述分析结果。
在本公开的一些示例实施例中,基于前述方案,在根据所述分析指令确定所述待处理案件对应的数据分析微服务之前,所述方法还包括:确定案件业务类型;根据不同的所述案件业务类型,构建不同的所述案件业务类型对应的数据分析微服务。
在本公开的一些示例实施例中,基于前述方案,在获取预先构建的数据分析知识图谱之前,所述方法还包括:根据专业用语词典构建初始知识图谱;获取不同案件业务类型的所述数据分析微服务对应的命令参数以及所述分析命令对应的结果参数;将所述初始知识图谱与所述分析命令参数以及所述结果参数进行映射,构建所述数据分析知识图谱。
在本公开的一些示例实施例中,基于前述方案,所述基于所述数据分析知识图谱,根据所述分析指令确定所述待处理案件对应的数据分析微服务,包括:解析所述分析指令对应的命令参数;基于所述数据分析知识图谱,根据所述命令参数从所述数据分析知识图谱进行检索分析处理,以确定所述待处理案件对应的数据分析微服务。
在本公开的一些示例实施例中,基于前述方案,通过所述数据分析微服务获取所述待处理案件对应的关联数据,包括:基于预设的数据分析工具,通过所述数据分析微服务从大数据平台中获取与所述待处理案件对应的关联数据;其中,所述数据分析工具包括模板匹配工具、实体识别工具、电子文档识别工具以及基于深度学习的关键事件识别工具中的一种或者多种。
在本公开的一些示例实施例中,基于前述方案,所述基于预设的数据分析工具,通过所述数据分析微服务从大数据平台中获取与所述待处理案件对应的关联数据,包括:基于预设的数据分析工具,通过所述数据分析微服务从大数据平台中获取对应所述案件业务类型的结构化数据;根据所述分析指令从所述结构化数据中获取与所述待处理案件相关的关联数据。
在本公开的一些示例实施例中,基于前述方案,所述方法还包括:通过所述数据分析微服务从所述大数据平台中持续获取实际数据;根据所述实际数据补充并更新所述数据分析知识图谱。
根据本公开实施例的第二方面,提供了一种数据分析装置,包括:知识图谱获取模块,用于响应于对待处理案件的分析指令,获取预先构建的数据分析知识图谱;微服务确定模块,用于基于所述数据分析知识图谱,根据所述分析指令确定所述待处理案件对应的数据分析微服务;关联数据获取模块,用于通过所述数据分析微服务获取所述待处理案件对应的关联数据;分析结果返回模块,用于根据所述数据分析知识图谱将所述关联数据进行连接处理以生成所述分析指令对应的分析结果,并返回所述分析结果。
在本公开的一种示例性实施例中,基于前述方案,所述数据分析装置还包括数据分析微服务构建单元,所述数据分析微服务构建单元被配置为:确定案件业务类型;根据不同的所述案件业务类型,构建不同的所述案件业务类型对应的数据分析微服务。
在本公开的一种示例性实施例中,基于前述方案,所述数据分析装置还包括数据分析知识图谱构建单元,所述数据分析知识图谱构建单元被配置为:根据专业用语词典构建初始知识图谱;获取不同案件业务类型的所述数据分析微服务对应的命令参数以及所述分析命令对应的结果参数;将所述初始知识图谱与所述分析命令参数以及所述结果参数进行映射,构建所述数据分析知识图谱。
在本公开的一种示例性实施例中,基于前述方案,所述微服务确定模块还被配置为:解析所述分析指令对应的命令参数;基于所述数据分析知识图谱,根据所述命令参数从所述数据分析知识图谱进行检索分析处理,以确定所述待处理案件对应的数据分析微服务。
在本公开的一种示例性实施例中,基于前述方案,所述关联数据获取模块还被配置为:基于预设的数据分析工具,通过所述数据分析微服务从大数据平台中获取与所述待处理案件对应的关联数据;其中,所述数据分析工具包括模板匹配工具、实体识别工具、电子文档识别工具以及基于深度学习的关键事件识别工具中的一种或者多种。
在本公开的一种示例性实施例中,基于前述方案,所述关联数据获取模块还被配置为:基于预设的数据分析工具,通过所述数据分析微服务从大数据平台中获取对应所述案件业务类型的结构化数据;根据所述分析指令从所述结构化数据中获取与所述待处理案件相关的关联数据。
在本公开的一种示例性实施例中,基于前述方案,所述数据分析装置还包括数据分析知识图谱更新单元,所述数据分析知识图谱更新单元被配置为:通过所述数据分析微服务从所述大数据平台中持续获取实际数据;根据所述实际数据补充并更新所述数据分析知识图谱。
根据本公开实施例的第三方面,提供了一种电子设备,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现上述任意一项所述的数据分析方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据上述任意一项所述的数据分析方法。
本公开实施例提供的技术方案可以包括以下有益效果:
本公开的示例实施例中的数据分析方法,获取预先构建的数据分析知识图谱,根据分析指令从数据分析知识图谱确定待处理案件对应的数据分析微服务,通过数据分析微服务获取待处理案件对应的关联数据,然后根据数据分析知识图谱将关联数据进行连接处理以生成分析指令对应的分析结果,并返回分析结果。一方面,根据不同类型的数据分析微服务获取待处理案件对应的关联数据,能够实现快速定位待分析数据,并针对性获取带分析数据,不仅降低数据分析的难度,提高数据获取的效率,而且可以提升数据的准确率;另一方面,根据分析指令从数据分析知识图谱确定待处理案件对应的数据分析微服务,通过数据分析知识图谱融合管理不同的数据分析微服务,实现不同类型数据之间的融合,进一步提升数据分析的效率;再一方面,根据数据分析知识图谱将关联数据进行连接处理,不仅便于用户对分析结果进行整理,提升用户对分析结果的分析效率,而且通过分析结果补充更新数据分析知识图谱,保证数据分析知识图谱的时效性以及完整性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出了根据本公开的一些实施例的数据分析方法的流程示意图;
图2示意性示出了根据本公开的一些实施例的构建数据分析知识图谱的流程示意图;
图3示意性示出了根据本公开的一些实施例的数据分析知识图谱的本体示意图;
图4示意性示出了根据本公开的一些实施例的数据分析方法对应的应用***的框架示意图;
图5示意性示出了根据本公开的一些实施例的数据分析装置的示意图;
图6示意性示出了根据本公开的一些实施例的电子设备的计算机***的结构示意图;
图7示意性示出了根据本公开的一些实施例的计算机可读存储介质的示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
此外,附图仅为示意性图解,并非一定是按比例绘制。附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
目前,检察机关对于民事检察、行政检察等法律监督业务,采用对已经审结生效的审判办案信息和裁判文书进行数据全面综合分析,从而行使对民事、行政案件审判工作的法律监督职责。其中从民事案件中发现虚假诉讼案件线索,判断虚假诉讼违法犯罪行为,是民事法律监督的重点工作之一,也是民事检察与刑事检察、法院立案审判等工作进行协同的重要内容。因此,存在对海量的民事、行政、刑事案件信息和文书等业务数据分别进行专业分析的技术需求,并且有数据分析结果准确和高性能的需求。
由于类似虚假诉讼监督这样的检察业务需要收集和综合分析的案件信息和文书类型多,包括刑事案件和民事案件(不同案由采用不同分析方法);不同案由的案件数据分析方法不同,在分析结果进行集成和关联的时候,存在数据的语义一致性的问题。因此需要有一种在不同检察监督业务、不同检察机关、检察机关与法院之间进行案件业务数据分析的过程协同、结果自动关联的需求。
申请人发现,在解决上述存在的问题时,一种技术方案中,提供通用的案件信息分析技术,由检察官进行综合分析,判断民事审判案件是否存在司法问题,例如虚假诉讼等。但是,该方案中检察官根据现有的通用案件信息分析***,对办案信息和裁判文书进行检索分析,具有包括但不限于如下维度:案由、诉讼当事人姓名和身份证等信息、诉讼代理人信息、诉讼当事人的关系、被告企业经营状况信息、不同案件诉讼时间之间的关系、案件中是否存在诉辩特殊情况、诉讼当事人在刑事案件中的情况、等等。需要检察官检索分析的数据量大且复杂,带来工作效率低,数据分析不准确。
另一种技术方案中,针对类似虚假诉讼检察监督这样的业务构建专门的业务辅助分析办案***和专用的业务数据模型。但是,该方案中,一方面,办案数据获取和分析结果的定义(维度描述及信息语义)没有统一标准,导致不能用机器自动地将不同检察业务的数据、不同检察机关数据、检察院与法院之间数据进行直观的综合集成分析;另一方面,对特定检察业务构建专用辅助办案软件***,业务逻辑固化,不能快速适应办案业务发展和不同类型业务的需求。存在重复开发,辅助办案工具中的数据分析技术不能为更多类型办案业务所使用。
基于上述提到的一个或者多个问题,在本示例实施例中,首先提供了一种数据分析方法,该数据分析方法可以应用于终端设备,也可以应用于服务器,本示例实施例不以此为限,下面以终端设备执行该方法为例进行说明。图1示意性示出了根据本公开的一些实施例的数据分析方法的流程示意图。参考图1所示,该数据分析方法可以包括以下步骤:
步骤S110,响应于对待处理案件的分析指令,获取预先构建的数据分析知识图谱;
步骤S120,基于所述数据分析知识图谱,根据所述分析指令确定所述待处理案件对应的数据分析微服务;
步骤S130,通过所述数据分析微服务获取所述待处理案件对应的关联数据;
步骤S140,根据所述数据分析知识图谱将所述关联数据进行连接处理以生成所述分析指令对应的分析结果,并返回所述分析结果。
根据本示例实施例中的数据分析方法,一方面,根据不同类型的数据分析微服务获取待处理案件对应的关联数据,能够实现快速定位待分析数据,并针对性获取带分析数据,不仅提高数据获取的效率,而且可以提升数据的准确率;另一方面,根据分析指令从数据分析知识图谱确定待处理案件对应的数据分析微服务,通过数据分析知识图谱融合管理不同的数据分析微服务,实现不同类型数据之间的融合,进一步提升数据分析的效率;再一方面,根据数据分析知识图谱将关联数据进行连接处理,不仅便于用户对分析结果进行整理,提升用户对分析结果的分析效率,而且通过分析结果补充更新数据分析知识图谱,保证数据分析知识图谱的时效性以及完整性。
下面,将对本示例实施例中的数据分析方法进行进一步的说明。
在步骤S110中,响应于对待处理案件的分析指令,获取预先构建的数据分析知识图谱。
在本公开的一个示例实施例中,待处理案件可以是指需要进行数据分析的案件,分析指令可以是指用户通过前端(HTML5或应用程序)或者其他微服务通过数据接口发出的、包含待处理案件对应关键词或者命令参数的指令。
其中,数据分析知识图谱可以是指包含案件实体、实体属性、实体关系等数据的知识图谱,例如,数据分析知识图谱的本体可以包括如下实体类:检察机关、审判法院、当事人、代理人、证人、立案时间、判决生效时间、案由、罪名、争议焦点、判决结果、证据等案件信息实体和社会实体;数据分析知识图谱的本体的实体属性可以包括:姓名、身份证号、法人名称、企业名称、营业执照号等文本属性、数值属性;数据分析知识图谱的本体的实体关系可以包括:当事人关系、当事人与代理人关系、当事人与证人关系、刑事附带民事案件关系、夫妻、父母子女、同一企业股东等各种案件关系和实体的社会关系。本示例实施例中可以通过数据分析知识图谱来描述不同检察办案业务所需的数据分析微服务。
进一步的,可以通过数据分析知识图谱的本体与待处理案件所需的数据分析微服务的服务接口(命令和参数)进行映射,用数据分析知识图谱来描述检察办案业务所需的数据分析微服务的过程与结果。
具体的,在获取预先构建的数据分析知识图谱之前,可以通过图2中的步骤构建数据分析知识图谱,参考图2所示:
步骤S210,根据专业用语词典构建初始知识图谱;
步骤S220,获取不同案件业务类型的所述数据分析微服务对应的命令参数以及所述分析命令对应的结果参数;
步骤S230,将所述初始知识图谱与所述分析命令参数以及所述结果参数进行映射,构建所述数据分析知识图谱。
其中,专业用语词典可以是指预先构建的包含司法领域统一的名称及术语等数据的词典,通过该专业用语词典可以提取并统一结构化(半结构化)信息或者裁判文书中的关键信息或者口语化信息。由于检察办案数据分析的功能描述、案件中实体的描述、案件要素信息的描述都采用司法领域统一的名称及术语,并依据司法案件中信息本来的关系和属性来构建数据分析知识图谱的关系和属性,从而保证不同检察办案业务对应的数据分析微服务的功能和结果的语义一致性和相关性。
初始知识图谱可以是指根据大数据平台数据中的数据、数据分析微服务以及专业用语词典初步建立的知识图谱,命令参数以及结果参数可以是指不同案件业务类型的数据分析微服务对应的服务接口,将数据分析微服务的命令参数以及结果参数等服务接口与初始知识图谱中的本体进行映射得到数据分析知识图谱,以实现用数据分析知识图谱来描述数据分析微服务的过程与结果,并且检察办案的数据分析知识图谱的实体、属性和关系等实际数据通过检察办案业务所需的数据分析微服务持续获取,从而实现用检察办案数据分析知识图谱对检察办案数据分析的总体集成。
在本公开的一个示例实施例中,可以解析分析指令对应的命令参数,基于所述数据分析知识图谱,根据命令参数从数据分析知识图谱进行检索分析处理,以确定待处理案件对应的数据分析微服务。检索分析处理可以是指根据命令参数从数据分析知识图谱中检索并确定需要调用的数据分析微服务的处理过程,通过分析指令中的命令参数,实现了对待处理案件对应案件业务类型的数据分析微服务的智能调用,提升数据检索的效率。
将数据分析微服务用检察办案对应的数据分析知识图谱进行描述,不仅解决了对不同办案业务数据分析微服务的功能、输入数据、分析结果描述的标准化和语义化;而且解决了同一个办案数据分析微服务的分析结果之间的关系描述,以及不同办案数据分析微服务的分析结果之间的关系描述。这样就实现了根据不同办案对多个办案业务数据分析综合集成的技术需求,且由于这些办案数据分析微服务的功能和分析结果用检察机关司法办案知识图谱来描述,同时也实现了分析功能的协同以及分析结果的语义一致性和关联性的效果。
在步骤S120中,基于所述数据分析知识图谱,根据所述分析指令确定所述待处理案件对应的数据分析微服务。
在本公开的一个示例实施例中,微服务可以是指一种软件架构,微服务的设计目标是为了肢解业务,使得服务能够独立运行,例如可以通过微服务可以将一个大型的单个应用程序和服务拆分为数十个的支持微服务,一个微服务的策略可以让工作变得更为简便,它可扩展单个组件而不是整个的应用程序堆栈,从而满足服务等级协议。数据分析微服务可以是指对不同的检察机关司法办案业务数据进行专业分析的微服务,基于预先构建的数据分析知识图谱,可以通过待处理案件对应的分析命令中的命令参数快速检索到需要调用的数据分析微服务。
具体的,每个数据分析微服务都是一个可以独立对结构化案件信息和司法文书进行数据分析的微服务,通过对其他微服务和前端(HTML5或移动APP)提供数据分析的接口,对存在检察大数据平台中的各种数据进行信息提取、检索、统计分析和关联分析。每个数据分析微服务都可以作为一个独立的子***通过前端界面的输入项和选择项进行检索分析,也可以通过微服务编程接口输入数据和信息进行检索分析。
具体的,在根据分析指令确定待处理案件对应的数据分析微服务之前,可以通过以下步骤预先构建数据分析微服务:
确定案件业务类型;
根据不同的案件业务类型,构建不同的案件业务类型对应的数据分析微服务。
其中,数据分析微服务可以是以案件业务类型为中心来构建的,例如可以构建刑事案件数据分析对应的数据分析微服务,对不同案由的民事案件的数据分析细分为不同的数据分析微服务,也可以构建行政案件数据分析对应的数据分析微服务,还可以构建立案业务数据分析对应的数据分析微服务,构建控申业务数据分析对应的数据分析微服务,本示例实施例对此不做特殊限定。通过这样构建数据分析微服务,不仅可以降低数据分析的复杂度,而且将数据分析微服务运行在轻量云(可以是指数据分析微服务的运行环境)上实现分布式计算,可以根据不同业务类型的数据量来启动不同数量的数据分析微服务,提升***性能。
不同的案件业务类型对应的数据分析微服务的区别在于针对不同案件业务类型进行了不同的文本解析、信息检索、数据汇总、统计分析、关联分析,得到不同的结果信息和数据。
举例而言,以刑事罪名(及同义词)为关键词对刑事案件信息和卷宗文书进行分析,对应的数据分析微服务汇聚该刑事罪名的关联数据,可以包括案件信息、刑事文书、附带民事案件文书等,并提取其中当事人信息(如可以是姓名、身份证号、法人名称)、审判法院等结构化信息,以当事人或法院为第一维度对全部数据进行汇聚,进行结构化(或半结构化,例如Json文档数据)集中存储;以指定民事案由对民事裁判文书进行检索,对应数据分析微服务汇聚案由为检索词的民事裁判文书,并提取文书中的当事人信息(姓名、身份证号、企业名称、营业执照号等)、证人信息、审判法院等结构化信息,并以当事人信息或法院为第一维度对全部数据汇聚,进行结构化(或半结构化,例如Json文档数据)集中存储;对民事案件争议焦点进行检索,对应的数据分析微服务汇聚相同争议焦点的民事案件裁判文书,对案件处理时间长短进行检索,对应的数据分析微服务汇集类似处理时间长短特征的文书,对民事案件当事人相同特征进检索,例如资不抵债的企业,对应的数据分析微服务汇聚类似特征的文书,对民事案件当事人特殊关系进行检索,例如夫妻、父母子女、同一企业股东等关系,对应的数据分析微服务并提取文书中的当事人信息(姓名、身份证号、企业名称、营业执照号等)、证人信息、审判法院、争议焦点、当事人关系等结构化信息,并以当事人信息或法院为第一维度对全部数据汇聚,进行结构化(或半结构化,例如Json文档数据)集中存储。
具体的,每个办案业务数据分析微服务的功能(命令),可以包括但不限于:进行数据分析的指令,获取分析结果信息和数据的指令,获得当前数据分析进度的指令等,通过微服务接口(REST ful等)对外提供服务。
在步骤S130中,通过所述数据分析微服务获取所述待处理案件对应的关联数据。
在本公开的一个示例实施例中,关联数据可以是指数据分析微服务从大数据平台中获取的与待处理案件的分析指令对应的数据,例如,待处理案件可以是刑事案件,分析指令可以是刑事罪名(或者同义词),则关联数据可以是案件信息、当事人信息、刑事文书、附带民事案件文书等与刑事罪名相关的所有数据。
进一步的,可以基于预设的数据分析工具,通过数据分析微服务从大数据平台中获取与待处理案件对应的关联数据。其中,数据分析工具可以是指预先设置的用于从大数据平台中获取数据的工具,例如数据分析工具可以包括模板匹配工具、实体识别工具、电子文档识别工具以及基于深度学习的关键事件识别模型等基于大数据、自然语言处理及其它人工智能技术的工具,本示例实施例对此不做特殊限定。
具体的,可以基于预设的数据分析工具,通过数据分析微服务从大数据平台中获取对应案件业务类型的结构化数据;根据分析指令从结构化数据中获取与待处理案件相关的关联数据。结构化数据可以是指数据分析微服务将对应案件业务类型的以关键信息为第一维度对全部数据汇聚,进行结构化(或半结构化)集中存储的数据,例如结构化数据可以是Json文档数据,也可以是OEM(Object exchange Model,半结构化数据模型)数据,本示例实施例对此不做特殊限定。
在步骤S140中,根据所述数据分析知识图谱将所述关联数据进行连接处理以生成所述分析指令对应的分析结果,并返回所述分析结果。
在本公开的一个示例实施例中,分析结果可以是指将数据分析微服务获取的关联数据通过数据分析知识图谱连接起来形成的展示数据,例如,分析结果可以是通过关联数据构成的知识图谱,也可以是通过关联数据构成的三元组数据或者表格数据,本示例实施例对此不足特殊限定。
可选的,可以通过数据分析微服务从大数据平台中持续获取实际数据;根据实际数据补充并更新数据分析知识图谱。实际数据可以是指大数据平台中实时更新的、不同案件业务类型对应的真实案件的相关数据,可以通过数据分析微服务从大数据平台中持续获取实际数据,并根据获得的实际数据补充并更新数据分析知识图谱。数据分析知识图谱的实体、属性和关系等实际数据通过检察办案业务所需的数据分析微服务持续获取,从而实现用检察办案数据分析知识图谱对检察办案数据分析的总体集成。
基于前面所述的数据分析知识图谱,一方面,不但可以实现对不同检察办案业务数据分析微服务结果的融合,也可以有效实现各种检察办案业务数据分析微服务的复用。还可以根据不同检察办案对数据分析结果的不同需求和业务逻辑的变化,可以对已有的检察办案业务数据分析微服务的调用进行不同的组合以及重新组合,从而实现对已经开发并成功应用的检察办案业务数据分析微服务的复用,达到提升不同检察办案的数据分析软件开发的效率,减少研发时间和成本,还能达到对检察办案数据分析能力的不断积累和增强。另一方面,可以实现交互式智能数据分析对数据汇聚结果进行综合分析,根据检查办案对信息和数据的关联分析,自动形成对某些微服务内容的调用需求,由智能案件特征知识体系分析***对通用维度分析微服务进行协同使用,并对分析结果进行数据汇聚。
图3示意性示出了根据本公开的一些实施例的数据分析知识图谱的本体示意图。
参考图3所示,数据分析知识图谱301的实体类可以包括案件信息客观实体类(例如可以是审判实体、当事人实体、相关人实体等),案件要素实体类(例如可以是定罪要素、减轻情节、犯罪意图、犯罪行为、从重量刑情节、特殊犯罪情形、合同争议、财产争议、公司决议纠纷等),数据分析实体类(例如可以是刑事案件分析、当事人分析、案件要素分析等)三大类。案件信息客观实体类与案件要素实体类,与司法机关的术语、标准、习惯相一致,而数据分析实体类和实体的命名与检察办案数据分析的功能命名(由数据分析微服务的服务接口命名决定)相对应(用知识图谱的特定实体关系的标签字符串匹配管理)。
图4示意性示出了根据本公开的一些实施例的数据分析方法对应的应用***的框架示意图。
参考图4所示,数据分析***的基本架构可以包括数据库层401、微服务层402、检察办案数据分析应用层403。其中,数据库层401可以包括***所需的各类数据库,例如可以包括图数据库、关系型数据库、文档数据库等;微服务层402可以由微服务运行环境(如DockerKubernetes等技术构建的微服务资源池),以及对应不同案件业务类型的各个微服务构成,这些微服务是以不同办案业务的需求设计开发的,每种微服务通过服务接口参数实现其数据分析功能;检察办案数据分析应用层403可以包括检察办案数据分析知识图谱应用***和其他检察办案应用***,其他检察办案应用***可以通过前端(HTML5或移动应用程序)直接调用所需的数据分析微服务(可以是一个或者多个),以满足检察办案业务需求,检察办案数据分析知识图谱应用***可以包括对检察办案数据知识图谱进行检索分析的子***、知识图谱、知识图谱驱动微服务的引擎等部分,该***可以通过检索、推理、汇集知识图谱中的案件信息,实现对微服务的操作,从而获得对案件信息和裁判文书的解析、统计,并由知识图谱汇聚案件信息和案件要素,为检察官办案提供全方面的信息和数据。
总的来说,通过本示例实施例中的数据分析方法,可以通过将检察机关司法办案数据分析工作,按照案件业务需要来构建对应案件业务类型的数据分析微服务,并用数据分析知识图谱来描述数据分析微服务,在检察官办案的应用中,通过集成各个办案业务数据分析微服务的知识图谱,达到协同办案的目的;每个数据分析微服务的知识图谱用司法概念、术语和数据中的关键信息(案件要素信息)来构建,可以保证数据分析指令和业务数据信息的融合性。该数据分析方法不但具有业务数据和业务分析结果智能融合和关联的效果,而且还可以实现各个检察业务数据专业分析功能和服务的有效复用,提升检察业务数据分析的价值和效能。
一方面,构建面向不同检察办案业务所需的数据分析微服务,使用大数据、自然语言处理及其它人工智能技术从结构化案件信息和裁判文书中获取具体办案业务所需的信息。可以解决办案中所需信息提取和分析的复杂性问题和准确性问题;通过微服务在轻量云中的弹性扩展能力解决大量数据分析的性能问题。
另一方面,对不同检察办案业务所需的数据分析微服务用检察办案数据分析知识图谱来描述。由于检察办案数据分析的功能描述、案件中实体的描述、案件要素信息的描述都采用司法领域统一的名称及术语,并依据司法案件中信息本来的关系和属性来构建知识图谱的关系和属性,从而达到不同检察办案业务数据分析微服务的功能和结果的语义一致性和相关性。
再一方面,基于前面所述的数据分析知识图谱,既能实现对不同案件业务类型的数据分析微服务结果的融合,也可以实现各种数据分析微服务的复用。根据不同检察办案对数据分析结果的不同需求和业务逻辑的变化,可以对已有的数据分析微服务的调用进行不同的组合以及重新组合,从而实现对已经开发并成功应用的数据分析微服务的复用,达到提升不同检察办案的数据分析软件开发的效率,减少研发时间和成本;还能达到对检察办案数据分析能力的不断积累和增强。
需要说明的是,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
此外,在本示例实施例中,还提供了一种数据分析装置。参照图5所示,该数据分析装置500包括:知识图谱获取模块510、微服务确定模块520、关联数据获取模块530以及分析结果返回模块540。其中:知识图谱获取模块510用于响应于对待处理案件的分析指令,获取预先构建的数据分析知识图谱;微服务确定模块520用于基于所述数据分析知识图谱,根据所述分析指令确定所述待处理案件对应的数据分析微服务;关联数据获取模块530用于通过所述数据分析微服务获取所述待处理案件对应的关联数据;分析结果返回模块540用于根据所述数据分析知识图谱将所述关联数据进行连接处理以生成所述分析指令对应的分析结果,并返回所述分析结果。
在本公开的一种示例性实施例中,基于前述方案,所述数据分析装置500还包括数据分析微服务构建单元,所述数据分析微服务构建单元被配置为:确定案件业务类型;根据不同的所述案件业务类型,构建不同的所述案件业务类型对应的数据分析微服务。
在本公开的一种示例性实施例中,基于前述方案,所述数据分析装置500还包括数据分析知识图谱构建单元,所述数据分析知识图谱构建单元被配置为:根据专业用语词典构建初始知识图谱;获取不同案件业务类型的所述数据分析微服务对应的命令参数以及所述分析命令对应的结果参数;将所述初始知识图谱与所述分析命令参数以及所述结果参数进行映射,构建所述数据分析知识图谱。
在本公开的一种示例性实施例中,基于前述方案,所述微服务确定模块520还被配置为:解析所述分析指令对应的命令参数;基于所述数据分析知识图谱,根据所述命令参数从所述数据分析知识图谱进行检索分析处理,以确定所述待处理案件对应的数据分析微服务。
在本公开的一种示例性实施例中,基于前述方案,所述关联数据获取模块530还被配置为:基于预设的数据分析工具,通过所述数据分析微服务从大数据平台中获取与所述待处理案件对应的关联数据;其中,所述数据分析工具包括模板匹配工具、实体识别工具、电子文档识别工具以及基于深度学习的关键事件识别工具中的一种或者多种。
在本公开的一种示例性实施例中,基于前述方案,所述关联数据获取模块530还被配置为:基于预设的数据分析工具,通过所述数据分析微服务从大数据平台中获取对应所述案件业务类型的结构化数据;根据所述分析指令从所述结构化数据中获取与所述待处理案件相关的关联数据。
在本公开的一种示例性实施例中,基于前述方案,所述数据分析装置500还包括数据分析知识图谱更新单元,所述数据分析知识图谱更新单元被配置为:通过所述数据分析微服务从所述大数据平台中持续获取实际数据;根据所述实际数据补充并更新所述数据分析知识图谱。
上述中数据分析装置各模块的具体细节已经在对应的数据分析方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了数据分析装置的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,在本公开的示例性实施例中,还提供了一种能够实现上述数据分析方法的电子设备。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为***、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施例、完全的软件实施例(包括固件、微代码等),或硬件和软件方面结合的实施例,这里可以统称为“电路”、“模块”或“***”。
下面参照图6来描述根据本公开的这种实施例的电子设备600。图6所示的电子设备600仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:上述至少一个处理单元610、上述至少一个存储单元620、连接不同***组件(包括存储单元620和处理单元610)的总线630、显示单元640。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元610执行,使得所述处理单元610执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。例如,所述处理单元610可以执行如图1中所示的步骤S110,响应于对待处理案件的分析指令,获取预先构建的数据分析知识图谱;步骤S120,基于所述数据分析知识图谱,根据所述分析指令确定所述待处理案件对应的数据分析微服务;步骤S130,通过所述数据分析微服务获取所述待处理案件对应的关联数据;步骤S140,根据所述数据分析知识图谱将所述关联数据进行连接处理以生成所述分析指令对应的分析结果,并返回所述分析结果。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)621和/或高速缓存存储单元622,还可以进一步包括只读存储单元(ROM)623。
存储单元620还可以包括具有一组(至少一个)程序模块625的程序/实用工具624,这样的程序模块625包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备670(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器660通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。
参考图7所示,描述了根据本公开的实施例的用于实现上述数据分析方法的程序产品700,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施例的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施例。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (8)
1.一种数据分析方法,其特征在于,包括:
响应于对待处理案件的分析指令,获取预先构建的数据分析知识图谱;
解析所述分析指令对应的命令参数,基于所述数据分析知识图谱,根据所述命令参数从所述数据分析知识图谱进行检索分析处理,以确定所述待处理案件对应的数据分析微服务;
通过所述数据分析微服务获取所述待处理案件对应的关联数据;
根据所述数据分析知识图谱将所述关联数据进行连接处理以生成所述分析指令对应的分析结果,并返回所述分析结果;
其中,预先构建所述数据分析知识图谱的过程包括:
根据专业用语词典构建初始知识图谱;
获取不同案件业务类型的所述数据分析微服务对应的命令参数以及分析命令对应的结果参数;
将所述初始知识图谱与分析命令参数以及所述结果参数进行映射,构建所述数据分析知识图谱。
2.根据权利要求1所述的数据分析方法,其特征在于,在根据所述分析指令确定所述待处理案件对应的数据分析微服务之前,所述方法还包括:
确定案件业务类型;
根据不同的所述案件业务类型,构建不同的所述案件业务类型对应的数据分析微服务。
3.根据权利要求1所述的数据分析方法,其特征在于,通过所述数据分析微服务获取所述待处理案件对应的关联数据,包括:
基于预设的数据分析工具,通过所述数据分析微服务从大数据平台中获取与所述待处理案件对应的关联数据;
其中,所述数据分析工具包括模板匹配工具、实体识别工具、电子文档识别工具以及基于深度学习的关键事件识别工具中的一种或者多种。
4.根据权利要求3所述的数据分析方法,其特征在于,所述基于预设的数据分析工具,通过所述数据分析微服务从大数据平台中获取与所述待处理案件对应的关联数据,包括:
基于预设的数据分析工具,通过所述数据分析微服务从大数据平台中获取对应案件业务类型的结构化数据;
根据所述分析指令从所述结构化数据中获取与所述待处理案件相关的关联数据。
5.根据权利要求3所述的数据分析方法,其特征在于,所述方法还包括:
通过所述数据分析微服务从所述大数据平台中持续获取实际数据;
根据所述实际数据补充并更新所述数据分析知识图谱。
6.一种数据分析装置,其特征在于,包括:
知识图谱获取模块,用于响应于对待处理案件的分析指令,获取预先构建的数据分析知识图谱;
微服务确定模块,用于解析所述分析指令对应的命令参数,基于所述数据分析知识图谱,根据所述命令参数从所述数据分析知识图谱进行检索分析处理,以确定所述待处理案件对应的数据分析微服务;
关联数据获取模块,用于通过所述数据分析微服务获取所述待处理案件对应的关联数据;
分析结果返回模块,用于根据所述数据分析知识图谱将所述关联数据进行连接处理以生成所述分析指令对应的分析结果,并返回所述分析结果;
数据分析知识图谱构建单元,用于根据专业用语词典构建初始知识图谱;获取不同案件业务类型的所述数据分析微服务对应的命令参数以及分析命令对应的结果参数;将所述初始知识图谱与分析命令参数以及所述结果参数进行映射,构建所述数据分析知识图谱。
7.一种电子设备,包括:
处理器;以及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至5中任一项所述的数据分析方法。
8.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的数据分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010697225.2A CN111859969B (zh) | 2020-07-20 | 2020-07-20 | 数据分析方法及装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010697225.2A CN111859969B (zh) | 2020-07-20 | 2020-07-20 | 数据分析方法及装置、电子设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111859969A CN111859969A (zh) | 2020-10-30 |
CN111859969B true CN111859969B (zh) | 2024-05-03 |
Family
ID=73000973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010697225.2A Active CN111859969B (zh) | 2020-07-20 | 2020-07-20 | 数据分析方法及装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111859969B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113421108A (zh) * | 2021-05-11 | 2021-09-21 | 北京沃东天骏信息技术有限公司 | 一种数据关系的确定方法、装置、设备及存储介质 |
CN113342808B (zh) * | 2021-05-26 | 2022-11-08 | 电子科技大学 | 一种基于机电设备的知识图谱推理引擎架构*** |
CN113467755B (zh) * | 2021-07-12 | 2022-07-26 | 卡斯柯信号有限公司 | 需求符合性分析方法、***、电子设备及存储介质 |
CN114971140B (zh) * | 2022-03-03 | 2023-01-13 | 北京计算机技术及应用研究所 | 一种面向数据交换的业务数据质量评估方法 |
CN114819764B (zh) * | 2022-06-27 | 2022-11-01 | 岩火科技(杭州)有限公司 | 一种基于脱敏数据的虚假诉讼行为风险预测方法 |
Citations (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014037914A2 (en) * | 2012-09-07 | 2014-03-13 | University Of The Western Cape | Method and system for organizing and retrieving data in a semantic database structure |
CN108009299A (zh) * | 2017-12-28 | 2018-05-08 | 北京市律典通科技有限公司 | 法律审判业务处理方法和装置 |
CN108829858A (zh) * | 2018-06-22 | 2018-11-16 | 北京京东金融科技控股有限公司 | 数据查询方法、装置及计算机可读存储介质 |
CN109284394A (zh) * | 2018-09-12 | 2019-01-29 | 青岛大学 | 一种从多源数据集成视角构建企业知识图谱的方法 |
CN109446344A (zh) * | 2018-11-14 | 2019-03-08 | 同方知网(北京)技术有限公司 | 一种基于大数据的智能分析报告自动生成*** |
CN110019825A (zh) * | 2017-07-25 | 2019-07-16 | 华为技术有限公司 | 一种分析数据语义的方法及装置 |
CN110083706A (zh) * | 2019-03-22 | 2019-08-02 | 西安电子科技大学 | 一种面向物联网微服务框架及其服务组合方法 |
CN110569369A (zh) * | 2019-09-16 | 2019-12-13 | 神州数码融信软件有限公司 | 银行金融***知识图谱的生成方法及装置、应用方法及装置 |
CN110597999A (zh) * | 2019-08-01 | 2019-12-20 | 湖北工业大学 | 一种依存句法分析关系抽取模型的司法案件知识图谱构建方法 |
CN110609906A (zh) * | 2019-09-16 | 2019-12-24 | 金色熊猫有限公司 | 知识图谱构建方法及装置、存储介质及电子终端 |
CN110795528A (zh) * | 2019-09-05 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 一种数据查询方法、装置、电子设备及存储介质 |
CN110825879A (zh) * | 2019-09-18 | 2020-02-21 | 平安科技(深圳)有限公司 | 判案结果确定方法、装置、设备及计算机可读存储介质 |
CN110875920A (zh) * | 2018-12-24 | 2020-03-10 | 哈尔滨安天科技集团股份有限公司 | 一种网络威胁分析方法、装置、电子设备及存储介质 |
CN110888943A (zh) * | 2019-11-08 | 2020-03-17 | 太极计算机股份有限公司 | 基于微模板的法院裁判文书辅助生成的方法和*** |
CN110929039A (zh) * | 2019-10-18 | 2020-03-27 | 平安科技(深圳)有限公司 | 数据处理方法、装置、设备及存储介质 |
CN110942200A (zh) * | 2019-11-28 | 2020-03-31 | 好买气电子商务有限公司 | 一种基于物联区块链技术的lng能源管理的方法 |
CN111125300A (zh) * | 2020-01-19 | 2020-05-08 | 湖南工业大学 | 一种基于知识图谱信息数据智能分析*** |
CN111221978A (zh) * | 2019-12-31 | 2020-06-02 | 北京明略软件***有限公司 | 一种构建知识图谱的方法、装置、计算机存储介质及终端 |
CN111241241A (zh) * | 2020-01-08 | 2020-06-05 | 平安科技(深圳)有限公司 | 基于知识图谱的案件检索方法、装置、设备及存储介质 |
CN111291161A (zh) * | 2020-02-20 | 2020-06-16 | 平安科技(深圳)有限公司 | 法律案件知识图谱查询方法、装置、设备及存储介质 |
WO2020118531A1 (zh) * | 2018-12-11 | 2020-06-18 | 西门子股份公司 | 提供云服务的方法、装置、电子设备、计算机介质以及产品 |
CN111368089A (zh) * | 2018-12-25 | 2020-07-03 | ***通信集团浙江有限公司 | 一种基于知识图谱的业务处理方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10755344B2 (en) * | 2015-09-30 | 2020-08-25 | Bank Of America Corporation | System framework processor for channel contacts |
US10542015B2 (en) * | 2016-08-15 | 2020-01-21 | International Business Machines Corporation | Cognitive offense analysis using contextual data and knowledge graphs |
US20180157928A1 (en) * | 2016-12-07 | 2018-06-07 | General Electric Company | Image analytics platform for medical data using expert knowledge models |
EP3561689A1 (en) * | 2018-04-23 | 2019-10-30 | QlikTech International AB | Knowledge graph data structures and uses thereof |
-
2020
- 2020-07-20 CN CN202010697225.2A patent/CN111859969B/zh active Active
Patent Citations (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014037914A2 (en) * | 2012-09-07 | 2014-03-13 | University Of The Western Cape | Method and system for organizing and retrieving data in a semantic database structure |
CN110019825A (zh) * | 2017-07-25 | 2019-07-16 | 华为技术有限公司 | 一种分析数据语义的方法及装置 |
CN108009299A (zh) * | 2017-12-28 | 2018-05-08 | 北京市律典通科技有限公司 | 法律审判业务处理方法和装置 |
CN108829858A (zh) * | 2018-06-22 | 2018-11-16 | 北京京东金融科技控股有限公司 | 数据查询方法、装置及计算机可读存储介质 |
CN109284394A (zh) * | 2018-09-12 | 2019-01-29 | 青岛大学 | 一种从多源数据集成视角构建企业知识图谱的方法 |
CN109446344A (zh) * | 2018-11-14 | 2019-03-08 | 同方知网(北京)技术有限公司 | 一种基于大数据的智能分析报告自动生成*** |
WO2020118531A1 (zh) * | 2018-12-11 | 2020-06-18 | 西门子股份公司 | 提供云服务的方法、装置、电子设备、计算机介质以及产品 |
CN110875920A (zh) * | 2018-12-24 | 2020-03-10 | 哈尔滨安天科技集团股份有限公司 | 一种网络威胁分析方法、装置、电子设备及存储介质 |
CN111368089A (zh) * | 2018-12-25 | 2020-07-03 | ***通信集团浙江有限公司 | 一种基于知识图谱的业务处理方法及装置 |
CN110083706A (zh) * | 2019-03-22 | 2019-08-02 | 西安电子科技大学 | 一种面向物联网微服务框架及其服务组合方法 |
CN110597999A (zh) * | 2019-08-01 | 2019-12-20 | 湖北工业大学 | 一种依存句法分析关系抽取模型的司法案件知识图谱构建方法 |
CN110795528A (zh) * | 2019-09-05 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 一种数据查询方法、装置、电子设备及存储介质 |
CN110609906A (zh) * | 2019-09-16 | 2019-12-24 | 金色熊猫有限公司 | 知识图谱构建方法及装置、存储介质及电子终端 |
CN110569369A (zh) * | 2019-09-16 | 2019-12-13 | 神州数码融信软件有限公司 | 银行金融***知识图谱的生成方法及装置、应用方法及装置 |
CN110825879A (zh) * | 2019-09-18 | 2020-02-21 | 平安科技(深圳)有限公司 | 判案结果确定方法、装置、设备及计算机可读存储介质 |
CN110929039A (zh) * | 2019-10-18 | 2020-03-27 | 平安科技(深圳)有限公司 | 数据处理方法、装置、设备及存储介质 |
CN110888943A (zh) * | 2019-11-08 | 2020-03-17 | 太极计算机股份有限公司 | 基于微模板的法院裁判文书辅助生成的方法和*** |
CN110942200A (zh) * | 2019-11-28 | 2020-03-31 | 好买气电子商务有限公司 | 一种基于物联区块链技术的lng能源管理的方法 |
CN111221978A (zh) * | 2019-12-31 | 2020-06-02 | 北京明略软件***有限公司 | 一种构建知识图谱的方法、装置、计算机存储介质及终端 |
CN111241241A (zh) * | 2020-01-08 | 2020-06-05 | 平安科技(深圳)有限公司 | 基于知识图谱的案件检索方法、装置、设备及存储介质 |
CN111125300A (zh) * | 2020-01-19 | 2020-05-08 | 湖南工业大学 | 一种基于知识图谱信息数据智能分析*** |
CN111291161A (zh) * | 2020-02-20 | 2020-06-16 | 平安科技(深圳)有限公司 | 法律案件知识图谱查询方法、装置、设备及存储介质 |
Non-Patent Citations (5)
Title |
---|
以案件为中心的检务服务协同中共***构建技术研究与实现;柴一栋;赵鹏;;国外电子测量技术(第04期);全文 * |
关联大数据管理技术:挑战、对策与实践;沈志宏;姚畅;侯艳飞;吴林寰;李跃鹏;;数据分析与知识发现(第01期);全文 * |
基于领域知识的气象智能服务软件微开发技术及应用;刘魁;舒红平;何文春;罗飞;曹亮;;气象科技进展(第01期);全文 * |
大规模企业级知识图谱实践综述;王昊奋;丁军;胡芳槐;王鑫;;计算机工程(第07期);全文 * |
智能化煤矿大数据平台架构及数据处理关键技术研究;杜毅博;赵国瑞;巩师鑫;;煤炭科学技术(第07期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111859969A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111859969B (zh) | 数据分析方法及装置、电子设备、存储介质 | |
US20190034543A1 (en) | Analyzing Concepts Over Time | |
CN108491378B (zh) | 电力信息运维智能应答*** | |
RU2704531C1 (ru) | Способ и устройство для анализа семантической информации | |
CN111177532A (zh) | 一种垂直搜索方法、装置、计算机***及可读存储介质 | |
CN105550206B (zh) | 结构化查询语句的版本控制方法及装置 | |
CN112860727B (zh) | 基于大数据查询引擎的数据查询方法、装置、设备及介质 | |
CN113887941B (zh) | 业务流程生成方法、装置、电子设备及介质 | |
CN116257610B (zh) | 基于行业知识图谱的智能问答方法、装置、设备及介质 | |
CN111143394A (zh) | 知识数据处理方法、装置、介质及电子设备 | |
CN113610626A (zh) | 银行信贷风险识别知识图谱构建方法、装置、计算机设备及计算机可读存储介质 | |
CN114064923A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN113190663A (zh) | 应用于水利场景的智能交互方法、装置、存储介质及计算机设备 | |
CN113609100A (zh) | 数据存储方法、数据查询方法、装置及电子设备 | |
CN111126073B (zh) | 语义检索方法和装置 | |
CN112732969A (zh) | 图像语义分析方法、装置、存储介质及电子设备 | |
CN116467291A (zh) | 一种知识图谱存储与搜索方法及*** | |
CN106055702B (zh) | 一种面向互联网的数据服务统一描述方法 | |
CN109146306A (zh) | 一种企业管理*** | |
CN115222058A (zh) | 调控***运行状态分析模型构建方法及装置、介质及设备 | |
Kakkonen et al. | Developing and applying a company, product and business event ontology for text mining | |
KR20190052980A (ko) | 인재 정보 처리 방법 및 장치 | |
CN114676694A (zh) | 业务模型的生成方法、装置、设备、介质和程序产品 | |
CN113095078A (zh) | 关联资产确定方法、装置和电子设备 | |
CN112527880B (zh) | 大数据集群元数据信息的采集方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |