CN115080630A - 基于图数据库的法律案源关系搜索方法 - Google Patents

基于图数据库的法律案源关系搜索方法 Download PDF

Info

Publication number
CN115080630A
CN115080630A CN202210847347.4A CN202210847347A CN115080630A CN 115080630 A CN115080630 A CN 115080630A CN 202210847347 A CN202210847347 A CN 202210847347A CN 115080630 A CN115080630 A CN 115080630A
Authority
CN
China
Prior art keywords
case source
source
case
query
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210847347.4A
Other languages
English (en)
Inventor
鲁圳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Youah Network Technology Co ltd
Original Assignee
Chengdu Youah Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Youah Network Technology Co ltd filed Critical Chengdu Youah Network Technology Co ltd
Priority to CN202210847347.4A priority Critical patent/CN115080630A/zh
Publication of CN115080630A publication Critical patent/CN115080630A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于图数据库的法律案源关系搜索方法,它涉及一种法律案源关系搜索方法。包括以下步骤:1、使用图数据库存储案源数据;2、使用图数据库存储案源‑律师、案源‑当事人、案源‑法律法规关系;3、使用gremlin语言实现查询与统计分析。本发明实现方式更为简单,无需借助后端技术,通过图数据库hugegraph的http接口即可实现相关查询与分析统计。降低了技术架构的复杂度与实现成本。同时,hugegraph的底层存储引擎可选择多种已有开源数据库,没有和具体的某一种数据库耦合,在部署方面,只需要部署hugegraph服务端一个组件,加上已有的mysql或者hbase等数据库作为存储层即可完成。Greemlin查询语言专门针对关系型查询进行优化,可提供更为高效的查询与分析。

Description

基于图数据库的法律案源关系搜索方法
技术领域
本发明涉及的是一种法律案源关系搜索方法,具体涉及一种基于图数据库的法律案源关系搜索方法。
背景技术
随着软件技术的发展与政务数据获取难度的降低,越来越多的软件服务商开始专注于法律相关方面资料的搜索与分析。以法律文书为例,在当前的法律文书网上已公开的文书数量达到1多亿条,面对如此庞大数量的案源数据,市面上除了使用搜索引擎针对性的提供搜索之外,并没有对案源本身、案源涉及到的当事人、代理律师等关系进行有效的分析及利用。现有技术一般采用elasticsearch作为存储查询引擎,通过关键字搜索的方式高效实现案源数据的搜索与查询。以统计律师关联的案源为例,一般指定律师作为搜索查询条件,elasticsearch 搜索引擎返回该律师条件下的关联案源,结合后端技术(如java、python等)实现相关的统计与分析。
因此,有必要对按案源之间的关系、案源涉及到的当事人、代理律师、引用法律法规等关系进行更为合理的存储与利用。
综上所述,本发明设计了一种基于图数据库的法律案源关系搜索方法。
发明内容
针对现有技术上存在的不足,本发明目的是在于提供一种基于图数据库的法律案源关系搜索方法,通过采用图数据库的方式存储数据,通过专用的图查询语言,实现案源之间关系、案源与当事人关系、案源与律师关系的快速查询与分析。
为了实现上述目的,本发明是通过如下的技术方案来实现:基于图数据库的法律案源关系搜索方法,包括以下步骤:
1、使用图数据库存储案源数据;
2、使用图数据库存储案源-律师、案源-当事人、案源-法律法规关系;
3、使用gremlin语言实现查询与统计分析。
所述的步骤1和步骤2的存储部分包括:
1.1、提取已有案源文书数据中的id、基本信息(案号、案由、审理法院等)、律师信息、当事人信息、引用法律法规;
1.2、分别将案源、律师、当事人、法律法规作为hugegraph数据库中的顶点进行存储;
1.3、将案源-律师关系、案源-当事人关系、案源-法律法规关系作为hugegraph的边进行存储。
所述的步骤2采用图数据库hugegraph存储案源、当事人、律师、法律法规等信息。
所述的步骤3的查询部分包括:
3.1、以案源作为查询起点,通过图查询语言gremlin快速查询出当前案源所关联的律师、当事人、法律法规等信息;
3.2、接着以查询出的律师、当事人、法律法规等节点作为起点,查询出关联的案源;
3.3、至此,案源与案源的关系路径被查询出来,反复重复步骤3.1、步骤3.2两步,可以更深层次的查询出与起始案源相关联的案源;
3.4、同理,上述的查询起点可以更换为当事人、律师、法律法规。
所述的步骤3的分析统计基于步骤1和步骤2的存储方式,以律师作为查询入口,可快速查询出律师关联的案源信息,较为方便的构建出该律师的画像数据。
本发明具有以下有益效果:
1、与传统的搜索引擎(elasticsearch)结合后端技术(java、python)相比,本发明的实现方式更为简单,无需借助后端技术,通过图数据库hugegraph 的http接口即可实现相关查询与分析统计。无疑降低了技术架构的复杂度与实现成本。
2、同时,hugegraph的底层存储引擎可选择多种已有开源数据库,没有和具体的某一种数据库耦合,在部署方面,只需要部署hugegraph服务端一个组件, 加上已有的mysql或者hbase等数据库作为存储层即可完成。
3、Greemlin查询语言专门针对关系型查询进行优化,相比传统的方式,同样资源情况下,可提供更为高效的查询与分析。
4、天然的分布式存储,以存储层采用hbase为例,当现有资源不足以存储下数据时,只需要对应扩展hbase 的节点,无需单独运维升级成本。
附图说明
下面结合附图和具体实施方式来详细说明本发明;
图1为本发明的方法流程图。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
参照图1,本具体实施方式采用以下技术方案:基于图数据库的法律案源关系搜索方法,包括:
一、存储部分:
1.提取已有案源文书数据中的id、基本信息(案号、案由、审理法院等)、律师信息、当事人信息、引用法律法规;
2.分别将案源、律师、当事人、法律法规作为hugegraph数据库中的顶点进行存储;
3.将 案源-律师关系、案源-当事人关系、案源-法律法规关系作为hugegraph的边进行存储。
二、查询部分:
1.以案源作为查询起点,通过图查询语言gremlin快速查询出当前案源所关联的律师、当事人、法律法规等信息。
2.接着以查询出的律师、当事人、法律法规等节点作为起点,查询出关联的案源。
3.至此,案源与案源的关系路径被查询出来,反复重复1、2两步,可以更深层次的查询出与起始案源相关联的案源;
4.同理,上述的查询起点可以更换为当事人、律师、法律法规。
三、分析统计:
基于上述存储方式,以律师作为查询入口,可快速查询出律师关联的案源信息,较为方便的构建出该律师的画像数据。
本具体实施方式提供了一种新的数据存储方式和查询方式。包括:采用图数据库hugegraph存储案源、当事人、律师、法律法规等信息;采用图查询语言 gremlin实现相关的查询。本具体实施方式的实现方式更为简单,无需借助后端技术,通过图数据库hugegraph的http接口即可实现相关查询与分析统计。无疑降低了技术架构的复杂度与实现成本。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (5)

1.基于图数据库的法律案源关系搜索方法,其特征在于,包括以下步骤:
(1)、使用图数据库存储案源数据;
(2)、使用图数据库存储案源-律师、案源-当事人、案源-法律法规关系;
(3)、使用gremlin语言实现查询与统计分析。
2.根据权利要求1所述的基于图数据库的法律案源关系搜索方法,其特征在于,所述的步骤(1)和步骤(2)的存储部分包括:
(1.1)、提取已有案源文书数据中的id、基本信息、律师信息、当事人信息、引用法律法规;
(1.2)、分别将案源、律师、当事人、法律法规作为hugegraph数据库中的顶点进行存储;
(1.3)、将案源-律师关系、案源-当事人关系、案源-法律法规关系作为hugegraph的边进行存储。
3.根据权利要求1所述的基于图数据库的法律案源关系搜索方法,其特征在于,所述的步骤(2)采用图数据库hugegraph存储案源、当事人、律师、法律法规信息。
4.根据权利要求1所述的基于图数据库的法律案源关系搜索方法,其特征在于,所述的步骤(3)的查询部分包括:
(3.1)、以案源作为查询起点,通过图查询语言gremlin快速查询出当前案源所关联的律师、当事人、法律法规信息;
(3.2)、接着以查询出的律师、当事人、法律法规的节点作为起点,查询出关联的案源;
(3.3)、至此,案源与案源的关系路径被查询出来,反复重复步骤(3.1)、步骤(3.2)这两步,可以更深层次的查询出与起始案源相关联的案源;
(3.4)、同理,上述的查询起点可以更换为当事人、律师、法律法规。
5.根据权利要求1所述的基于图数据库的法律案源关系搜索方法,其特征在于,所述的步骤(3)的分析统计基于步骤(1)和步骤(2)的存储方式,以律师作为查询入口,可快速查询出律师关联的案源信息,较为方便的构建出该律师的画像数据。
CN202210847347.4A 2022-07-19 2022-07-19 基于图数据库的法律案源关系搜索方法 Pending CN115080630A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210847347.4A CN115080630A (zh) 2022-07-19 2022-07-19 基于图数据库的法律案源关系搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210847347.4A CN115080630A (zh) 2022-07-19 2022-07-19 基于图数据库的法律案源关系搜索方法

Publications (1)

Publication Number Publication Date
CN115080630A true CN115080630A (zh) 2022-09-20

Family

ID=83259993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210847347.4A Pending CN115080630A (zh) 2022-07-19 2022-07-19 基于图数据库的法律案源关系搜索方法

Country Status (1)

Country Link
CN (1) CN115080630A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271458A (zh) * 2018-09-14 2019-01-25 南威软件股份有限公司 一种基于图数据库的关系网查询方法及***
CN113011185A (zh) * 2020-07-17 2021-06-22 上海浦东华宇信息技术有限公司 法律领域文本分析识别方法、***、存储介质及终端

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271458A (zh) * 2018-09-14 2019-01-25 南威软件股份有限公司 一种基于图数据库的关系网查询方法及***
CN113011185A (zh) * 2020-07-17 2021-06-22 上海浦东华宇信息技术有限公司 法律领域文本分析识别方法、***、存储介质及终端

Similar Documents

Publication Publication Date Title
US7730060B2 (en) Efficient evaluation of object finder queries
CN1845104B (zh) 信息智能检索加工的***和方法
CA2805878C (en) Methods for semantics-based citation-pairing information
US8914316B2 (en) Information similarity and related statistical techniques for use in distributed computing environments
JP6355840B2 (ja) ストップワード識別方法および装置
CN111611225A (zh) 数据存储管理方法、查询方法、装置、电子设备及介质
CN111680043B (zh) 一种针对海量数据进行快速检索方法
CN111506621A (zh) 一种数据统计方法及装置
US10496648B2 (en) Systems and methods for searching multiple related tables
CN109542930A (zh) 一种基于ElasticSearch的数据高效检索方法
CN111177303A (zh) 基于phoenix的Hbase二级全文索引方法及***
CN105912696A (zh) 一种基于对数归并的dns索引创建方法及查询方法
CN106484684B (zh) 一种对数据库中的数据进行术语匹配的方法
CN102214216B (zh) 一种层次关系数据上关键字检索结果的聚合摘要方法
Cappellari et al. A path-oriented rdf index for keyword search query processing
CN102622361A (zh) 一种数据库查询方法
CN101261645B (zh) 一种获取多层信息的方法和装置
CN111611222B (zh) 一种基于分布式存储的数据动态处理方法
CN115080630A (zh) 基于图数据库的法律案源关系搜索方法
CN115994146A (zh) 一种混合式数据存储引擎***及数据存储方法、访问方法
CN116090413A (zh) 一种基于序列化的通用rdf数据压缩方法
CN112416626B (zh) 一种数据处理方法和装置
CN101610284B (zh) 基于调用数据的服务参数关系匹配方法及***
CN110867179A (zh) 基于语音识别、IKAnalyzer分词和hdfs的文件存储及检索方法和***
Schallehn et al. Supporting similarity operations based on approximate string matching on the web

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination