CN115080630A - 基于图数据库的法律案源关系搜索方法 - Google Patents
基于图数据库的法律案源关系搜索方法 Download PDFInfo
- Publication number
- CN115080630A CN115080630A CN202210847347.4A CN202210847347A CN115080630A CN 115080630 A CN115080630 A CN 115080630A CN 202210847347 A CN202210847347 A CN 202210847347A CN 115080630 A CN115080630 A CN 115080630A
- Authority
- CN
- China
- Prior art keywords
- case source
- source
- case
- query
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 102100038367 Gremlin-1 Human genes 0.000 claims abstract description 7
- 101001032872 Homo sapiens Gremlin-1 Proteins 0.000 claims abstract description 7
- 238000007619 statistical method Methods 0.000 claims abstract description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于图数据库的法律案源关系搜索方法,它涉及一种法律案源关系搜索方法。包括以下步骤:1、使用图数据库存储案源数据;2、使用图数据库存储案源‑律师、案源‑当事人、案源‑法律法规关系;3、使用gremlin语言实现查询与统计分析。本发明实现方式更为简单,无需借助后端技术,通过图数据库hugegraph的http接口即可实现相关查询与分析统计。降低了技术架构的复杂度与实现成本。同时,hugegraph的底层存储引擎可选择多种已有开源数据库,没有和具体的某一种数据库耦合,在部署方面,只需要部署hugegraph服务端一个组件,加上已有的mysql或者hbase等数据库作为存储层即可完成。Greemlin查询语言专门针对关系型查询进行优化,可提供更为高效的查询与分析。
Description
技术领域
本发明涉及的是一种法律案源关系搜索方法,具体涉及一种基于图数据库的法律案源关系搜索方法。
背景技术
随着软件技术的发展与政务数据获取难度的降低,越来越多的软件服务商开始专注于法律相关方面资料的搜索与分析。以法律文书为例,在当前的法律文书网上已公开的文书数量达到1多亿条,面对如此庞大数量的案源数据,市面上除了使用搜索引擎针对性的提供搜索之外,并没有对案源本身、案源涉及到的当事人、代理律师等关系进行有效的分析及利用。现有技术一般采用elasticsearch作为存储查询引擎,通过关键字搜索的方式高效实现案源数据的搜索与查询。以统计律师关联的案源为例,一般指定律师作为搜索查询条件,elasticsearch 搜索引擎返回该律师条件下的关联案源,结合后端技术(如java、python等)实现相关的统计与分析。
因此,有必要对按案源之间的关系、案源涉及到的当事人、代理律师、引用法律法规等关系进行更为合理的存储与利用。
综上所述,本发明设计了一种基于图数据库的法律案源关系搜索方法。
发明内容
针对现有技术上存在的不足,本发明目的是在于提供一种基于图数据库的法律案源关系搜索方法,通过采用图数据库的方式存储数据,通过专用的图查询语言,实现案源之间关系、案源与当事人关系、案源与律师关系的快速查询与分析。
为了实现上述目的,本发明是通过如下的技术方案来实现:基于图数据库的法律案源关系搜索方法,包括以下步骤:
1、使用图数据库存储案源数据;
2、使用图数据库存储案源-律师、案源-当事人、案源-法律法规关系;
3、使用gremlin语言实现查询与统计分析。
所述的步骤1和步骤2的存储部分包括:
1.1、提取已有案源文书数据中的id、基本信息(案号、案由、审理法院等)、律师信息、当事人信息、引用法律法规;
1.2、分别将案源、律师、当事人、法律法规作为hugegraph数据库中的顶点进行存储;
1.3、将案源-律师关系、案源-当事人关系、案源-法律法规关系作为hugegraph的边进行存储。
所述的步骤2采用图数据库hugegraph存储案源、当事人、律师、法律法规等信息。
所述的步骤3的查询部分包括:
3.1、以案源作为查询起点,通过图查询语言gremlin快速查询出当前案源所关联的律师、当事人、法律法规等信息;
3.2、接着以查询出的律师、当事人、法律法规等节点作为起点,查询出关联的案源;
3.3、至此,案源与案源的关系路径被查询出来,反复重复步骤3.1、步骤3.2两步,可以更深层次的查询出与起始案源相关联的案源;
3.4、同理,上述的查询起点可以更换为当事人、律师、法律法规。
所述的步骤3的分析统计基于步骤1和步骤2的存储方式,以律师作为查询入口,可快速查询出律师关联的案源信息,较为方便的构建出该律师的画像数据。
本发明具有以下有益效果:
1、与传统的搜索引擎(elasticsearch)结合后端技术(java、python)相比,本发明的实现方式更为简单,无需借助后端技术,通过图数据库hugegraph 的http接口即可实现相关查询与分析统计。无疑降低了技术架构的复杂度与实现成本。
2、同时,hugegraph的底层存储引擎可选择多种已有开源数据库,没有和具体的某一种数据库耦合,在部署方面,只需要部署hugegraph服务端一个组件, 加上已有的mysql或者hbase等数据库作为存储层即可完成。
3、Greemlin查询语言专门针对关系型查询进行优化,相比传统的方式,同样资源情况下,可提供更为高效的查询与分析。
4、天然的分布式存储,以存储层采用hbase为例,当现有资源不足以存储下数据时,只需要对应扩展hbase 的节点,无需单独运维升级成本。
附图说明
下面结合附图和具体实施方式来详细说明本发明;
图1为本发明的方法流程图。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
参照图1,本具体实施方式采用以下技术方案:基于图数据库的法律案源关系搜索方法,包括:
一、存储部分:
1.提取已有案源文书数据中的id、基本信息(案号、案由、审理法院等)、律师信息、当事人信息、引用法律法规;
2.分别将案源、律师、当事人、法律法规作为hugegraph数据库中的顶点进行存储;
3.将 案源-律师关系、案源-当事人关系、案源-法律法规关系作为hugegraph的边进行存储。
二、查询部分:
1.以案源作为查询起点,通过图查询语言gremlin快速查询出当前案源所关联的律师、当事人、法律法规等信息。
2.接着以查询出的律师、当事人、法律法规等节点作为起点,查询出关联的案源。
3.至此,案源与案源的关系路径被查询出来,反复重复1、2两步,可以更深层次的查询出与起始案源相关联的案源;
4.同理,上述的查询起点可以更换为当事人、律师、法律法规。
三、分析统计:
基于上述存储方式,以律师作为查询入口,可快速查询出律师关联的案源信息,较为方便的构建出该律师的画像数据。
本具体实施方式提供了一种新的数据存储方式和查询方式。包括:采用图数据库hugegraph存储案源、当事人、律师、法律法规等信息;采用图查询语言 gremlin实现相关的查询。本具体实施方式的实现方式更为简单,无需借助后端技术,通过图数据库hugegraph的http接口即可实现相关查询与分析统计。无疑降低了技术架构的复杂度与实现成本。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (5)
1.基于图数据库的法律案源关系搜索方法,其特征在于,包括以下步骤:
(1)、使用图数据库存储案源数据;
(2)、使用图数据库存储案源-律师、案源-当事人、案源-法律法规关系;
(3)、使用gremlin语言实现查询与统计分析。
2.根据权利要求1所述的基于图数据库的法律案源关系搜索方法,其特征在于,所述的步骤(1)和步骤(2)的存储部分包括:
(1.1)、提取已有案源文书数据中的id、基本信息、律师信息、当事人信息、引用法律法规;
(1.2)、分别将案源、律师、当事人、法律法规作为hugegraph数据库中的顶点进行存储;
(1.3)、将案源-律师关系、案源-当事人关系、案源-法律法规关系作为hugegraph的边进行存储。
3.根据权利要求1所述的基于图数据库的法律案源关系搜索方法,其特征在于,所述的步骤(2)采用图数据库hugegraph存储案源、当事人、律师、法律法规信息。
4.根据权利要求1所述的基于图数据库的法律案源关系搜索方法,其特征在于,所述的步骤(3)的查询部分包括:
(3.1)、以案源作为查询起点,通过图查询语言gremlin快速查询出当前案源所关联的律师、当事人、法律法规信息;
(3.2)、接着以查询出的律师、当事人、法律法规的节点作为起点,查询出关联的案源;
(3.3)、至此,案源与案源的关系路径被查询出来,反复重复步骤(3.1)、步骤(3.2)这两步,可以更深层次的查询出与起始案源相关联的案源;
(3.4)、同理,上述的查询起点可以更换为当事人、律师、法律法规。
5.根据权利要求1所述的基于图数据库的法律案源关系搜索方法,其特征在于,所述的步骤(3)的分析统计基于步骤(1)和步骤(2)的存储方式,以律师作为查询入口,可快速查询出律师关联的案源信息,较为方便的构建出该律师的画像数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210847347.4A CN115080630A (zh) | 2022-07-19 | 2022-07-19 | 基于图数据库的法律案源关系搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210847347.4A CN115080630A (zh) | 2022-07-19 | 2022-07-19 | 基于图数据库的法律案源关系搜索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115080630A true CN115080630A (zh) | 2022-09-20 |
Family
ID=83259993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210847347.4A Pending CN115080630A (zh) | 2022-07-19 | 2022-07-19 | 基于图数据库的法律案源关系搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115080630A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109271458A (zh) * | 2018-09-14 | 2019-01-25 | 南威软件股份有限公司 | 一种基于图数据库的关系网查询方法及*** |
CN113011185A (zh) * | 2020-07-17 | 2021-06-22 | 上海浦东华宇信息技术有限公司 | 法律领域文本分析识别方法、***、存储介质及终端 |
-
2022
- 2022-07-19 CN CN202210847347.4A patent/CN115080630A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109271458A (zh) * | 2018-09-14 | 2019-01-25 | 南威软件股份有限公司 | 一种基于图数据库的关系网查询方法及*** |
CN113011185A (zh) * | 2020-07-17 | 2021-06-22 | 上海浦东华宇信息技术有限公司 | 法律领域文本分析识别方法、***、存储介质及终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7730060B2 (en) | Efficient evaluation of object finder queries | |
CN1845104B (zh) | 信息智能检索加工的***和方法 | |
CA2805878C (en) | Methods for semantics-based citation-pairing information | |
US8914316B2 (en) | Information similarity and related statistical techniques for use in distributed computing environments | |
JP6355840B2 (ja) | ストップワード識別方法および装置 | |
CN111611225A (zh) | 数据存储管理方法、查询方法、装置、电子设备及介质 | |
CN111680043B (zh) | 一种针对海量数据进行快速检索方法 | |
CN111506621A (zh) | 一种数据统计方法及装置 | |
US10496648B2 (en) | Systems and methods for searching multiple related tables | |
CN109542930A (zh) | 一种基于ElasticSearch的数据高效检索方法 | |
CN111177303A (zh) | 基于phoenix的Hbase二级全文索引方法及*** | |
CN105912696A (zh) | 一种基于对数归并的dns索引创建方法及查询方法 | |
CN106484684B (zh) | 一种对数据库中的数据进行术语匹配的方法 | |
CN102214216B (zh) | 一种层次关系数据上关键字检索结果的聚合摘要方法 | |
Cappellari et al. | A path-oriented rdf index for keyword search query processing | |
CN102622361A (zh) | 一种数据库查询方法 | |
CN101261645B (zh) | 一种获取多层信息的方法和装置 | |
CN111611222B (zh) | 一种基于分布式存储的数据动态处理方法 | |
CN115080630A (zh) | 基于图数据库的法律案源关系搜索方法 | |
CN115994146A (zh) | 一种混合式数据存储引擎***及数据存储方法、访问方法 | |
CN116090413A (zh) | 一种基于序列化的通用rdf数据压缩方法 | |
CN112416626B (zh) | 一种数据处理方法和装置 | |
CN101610284B (zh) | 基于调用数据的服务参数关系匹配方法及*** | |
CN110867179A (zh) | 基于语音识别、IKAnalyzer分词和hdfs的文件存储及检索方法和*** | |
Schallehn et al. | Supporting similarity operations based on approximate string matching on the web |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |