CN107844497A - 一种数据库检索的方法和*** - Google Patents

一种数据库检索的方法和*** Download PDF

Info

Publication number
CN107844497A
CN107844497A CN201610834989.5A CN201610834989A CN107844497A CN 107844497 A CN107844497 A CN 107844497A CN 201610834989 A CN201610834989 A CN 201610834989A CN 107844497 A CN107844497 A CN 107844497A
Authority
CN
China
Prior art keywords
database
retrieval
index
keyword
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610834989.5A
Other languages
English (en)
Inventor
陈杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TVM Beijing Technology Co Ltd
Original Assignee
TVM Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TVM Beijing Technology Co Ltd filed Critical TVM Beijing Technology Co Ltd
Priority to CN201610834989.5A priority Critical patent/CN107844497A/zh
Publication of CN107844497A publication Critical patent/CN107844497A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据库检索的方法和***,该方法包括:S101、分析检索关键词;S102、判断关键词是否在索引中,若是,则转向S105;S103、对数据库进行检索,判断数据库中是否有所述关键词,若无则转向S105;S104、建立所述关键词的索引词条;S105、输出检索结果。本发明技术方案节约了整体技术方案的成本,提高了数据库信息检索的速度,简化了技术方案的复杂程度,提高了数据库检索的综合效率,适应了互联网技术和市场快速发展的需求。

Description

一种数据库检索的方法和***
技术领域
本发明涉及互联网技术领域,特别涉及一种数据库检索的方法和***。
背景技术
互联网发展迅速,已成为人们生活的重要组成部分和人类文明传播发展的重要载体,渗透到经济、政治、文化、社会生活各个方面,改变着人们的交往方式和思维方式。无论是在工业领域或者是在社会生活领域,互联网给人的改变是巨大的。
作为互联网数据记录的核心,数据库也渗透到社会的各个方面,得到广泛的发展和应用。数据库是按照一定的结构和规则组织起来的相关数据的集合,是从全局观点出发建立的,按一定的数据模型进行组织、描述和存储。其结构基于数据间的自然联系,从而可提供一切必要的存取路径,且数据不再针对某一应用,而是面向全组织,具有整体的结构化特征。
数据库用于数据的存储和处理,存储的是属于企业、事业部门、团体和个人的有关数据的集合,是一个单位或是一个应用领域的通用数据处理***。数据库中的数据是为众多用户所共享其信息而建立的,已经摆脱了具体程序的限制和制约。不同的用户可以按各自的用法使用数据库中的数据;多个用户可以同时共享数据库中的数据资源,即不同的用户可以同时存取数据库中的同一个数据。数据共享性不仅满足了各用户对信息内容的要求,同时也满足了各用户之间信息通信的要求。
数据库是重要的电子资源,是适应互联网发展的信息技术,具有以下特点:
1)、数据的结构化数据库中的数据并不是杂乱无章、毫不相干的,它们具有一定的组织结构,属于同一集合的数据具有相似的特征。
2)、数据具共享性。在一个单位的各个部门之间,存在着大量的重复信息。使用数据库的目的就是要统一管理这些信息,减少冗余度,使各个部门共同享有相同的数据。
3)、数据的独立性。数据的独立性是指数据记录和数据管理软件之间的独立。数据及其结构应具有独立性,而不应该去改变应用程序。
4)、数据的完整性。数据的完整性是指保证数据库中数据的正确性。可能造成数据不正确的原因很多,数据库管理***通过对数据性质进行检查而管理它们。
5)、数据的灵活性。数据库管理***不是把数据简单堆积,它在记录数据信息的基础上具有很多的管理功能,如输入、输出、查询、编辑修改等。
6)、数据的安全性。根据用户的职责,不同级别的人对数据库具有不同的权限,数据库管理***能够确保数据的安全性。
随着数据库技术的广泛应用,信息量增长与传播速度达到了前所未有的高度。信息发布的媒介类型的多样化使信息的冗余度越来越高,信息资源的生命期越来越短,给人门在信息的海洋中选择获取信息带来了比以前更大的难度。在信息社会中,检索技术对于数据的有效应用越来越重要,主要体现在:
1)、信息检索技术可以快速查找所需的信息。高效的信息检索技术能够节约时间和成本,准确、快速的获得所需的信息,提高工作效益,做到事半功倍,实现信息资源的有效利用。
2)、高效检索技术能够及时***地了解已有的数据的积累情况,掌握业务最新动态及发展趋势,适时做出正确的决策,使所开展的工作取得最快、最有效的进展。
3)、高效检索能及时把握最新的信息,促进新业务和应用的不断涌现。
4)、有助于科学决策。随着现代信息技术的高速发展,信息资源的电子化、多元化以及运行条件的网络化已经成为现实。无论是国家、部门还是企业都将更多地依赖于数据等信息的迅速交流、传播和利用。智能技术日益成为制定政策的手段。知识和信息日益成为科学、民主、合理决策之源泉。而信息检索则是获取信息的重要途径,是科学决策的必要前提。
现有的数据库检索技术方案,为了解决巨大用户量访问和特定时刻的峰值访问量,常用的解决方案包括:数据库SQL慢查询优化,如重构相关索引,对where子句进行优化等;数据库读写分离,如MySQL的Master/Slave结构;数据库分库分表,该方案可以减轻单个数据库服务器压力,但是也会带来***的复杂性。上述方案都会增加技术方案的成本或复杂度,造成了方案实施的难度,不利于该类技术方案的大规模推广和采用。
发明内容
本发明提供一种数据库检索的方法和***,采用多层检索模式实现高效的数据库检索,节约了整体技术方案的成本,提高了数据库信息检索的速度,简化了技术方案的复杂程度,提高了数据库检索的综合效率,适应了互联网技术和市场快速发展的需求。
本发明的技术方案提供了一种数据库检索的方法,包括以下步骤:
S101、分析检索关键词;
S102、判断关键词是否在索引中,若是,则转向S104;
S101、分析检索关键词;
S102、判断关键词是否在索引中,若是,则转向S105;
S103、对数据库进行检索,判断数据库中是否有所述关键词,若无则转向S105;
S104、建立所述关键词的索引词条;
S105、输出检索结果。
进一步的,所述索引存储于缓存中,所述索引的检索在内存中进行。
进一步的,所述索引的存储和检索支持集群服务器的集群内存模式。
进一步的,所述数据库定时进行更新。
进一步的,所述数据库完成更新后,则所述索引进行相应更新。
进一步的,所述数据库检索和索引检索的搜索条件遵循相同的格式。
进一步的,所述数据库检索和索引检索的搜索结果遵循相同的匹配原则和排序原则。
本发明的技术方案还提供了一种数据库检索的***,包括:管理单元,数据库单元,索引单元,其中,
管理单元用于管理所述索引单元和数据库单元的更新,管理对所述索引单元和数据库的检索操作;
数据库单元用于数据信息的存储,以及进行数据库信息的检索;
索引单元用于进行关键词的检索,并进行所述索引单元的更新。
进一步的,所述索引单元在内存中运行检索。
进一步的,所述数据库单元更新数据信息后,所述索引单元进行相应的更新。
本发明技术方案采用多层检索模式实现高效的数据库检索,节约了整体技术方案的成本,提高了数据库信息检索的速度,简化了技术方案的复杂程度,提高了数据库检索的综合效率,适应了互联网技术和市场快速发展的需求。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例一中数据库检索的方法流程图;
图2为本发明实施例一中数据库检索的***结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1为本发明实施例一中数据库检索的方法流程图。如图1所示,该流程包括以下步骤:
步骤S101、分析检索关键词。
步骤S102、判断关键词是否在索引中,若是,则转向S105。
检索关键词,若索引中有该关键词,则转向步骤S105;
若没有,则执行步骤S103。
索引存储于缓存中;
对索引的检索也在内存中进行;
索引的存储和检索支持集群服务器的集群内存模式。
步骤S103、对数据库进行检索,判断是否有关键词,若无则转向S105。
采用数据库对该关键词进行检索,并进行判断。
步骤S104、建立该关键词的索引词条;
若没有该关键词,则无检索结果。
数据库定时进行更新;
每次数据库检索都采用最新的数据库进行,保证检索结果最新。
数据库完成更新后,则索引进行相应更新。
数据库检索和索引检索的搜索条件遵循相同的格式。
数据库检索和索引检索的搜索结果遵循相同的匹配原则和排序原则。
步骤S105、输出检索结果。
为了实现上述方法流程,本实施例还提供了一种数据库检索的***,图2为本发明实施例一中数据库检索的***结构图。如图2所示,该***包括:管理单元201,数据库单元202,索引单元203,其中,
管理单元用于管理索引单元和数据库单元的更新,管理对索引单元和数据库单元的检索操作;
数据库单元用于数据信息的存储和更新,生成索引数据和进行数据库检索;
索引单元用于进行索引的更新,并进行关键词的检索。
索引单元在内存中运行检索。
数据库单元更新数据信息后,索引单元也进行相应的更新。
本发明技术方案多层检索模式实现高效的数据库检索,节约了整体技术方案的成本,提高了数据库信息检索的速度,简化了技术方案的复杂程度,提高了数据库检索的综合效率,适应了互联网技术和市场快速发展的需求。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种数据库检索的方法,其特征在于,包括以下步骤:
S101、分析检索关键词;
S102、判断关键词是否在索引中,若是,则转向S105;
S103、对数据库进行检索,判断数据库中是否有所述关键词,若无则转向S105;
S104、建立所述关键词的索引词条;
S105、输出检索结果。
2.根据权利要求1所述的方法,其特征在于,所述索引存储于缓存中,所述索引的检索在内存中进行。
3.根据权利要求1或2所述的方法,其特征在于,所述索引的存储和检索支持集群服务器的集群内存模式。
4.根据权利要求1所述的方法,其特征在于,所述数据库定时进行更新。
5.根据权利要求1或4所述的方法,其特征在于,所述数据库完成更新后,则所述索引进行相应更新。
6.根据权利要求1所述的方法,其特征在于,所述数据库检索和索引检索的搜索条件遵循相同的格式。
7.根据权利要求1所述的方法,其特征在于,所述数据库检索和索引检索的搜索结果遵循相同的匹配原则和排序原则。
8.一种数据库检索的***,其特征在于,包括管理单元,数据库单元,索引单元,其中,
管理单元用于管理所述索引单元和数据库单元的更新,管理对所述索引单元和数据库的检索操作;
数据库单元用于数据信息的存储,以及进行数据库信息的检索;
索引单元用于进行关键词的检索,并进行所述索引单元的更新。
9.根据权利要求8所述的***,其特征在于,所述索引单元在内存中运行检索。
10.根据权利要求8所述的***,其特征在于,所述数据库单元更新数据信息后,所述索引单元进行相应的更新。
CN201610834989.5A 2016-09-20 2016-09-20 一种数据库检索的方法和*** Pending CN107844497A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610834989.5A CN107844497A (zh) 2016-09-20 2016-09-20 一种数据库检索的方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610834989.5A CN107844497A (zh) 2016-09-20 2016-09-20 一种数据库检索的方法和***

Publications (1)

Publication Number Publication Date
CN107844497A true CN107844497A (zh) 2018-03-27

Family

ID=61656714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610834989.5A Pending CN107844497A (zh) 2016-09-20 2016-09-20 一种数据库检索的方法和***

Country Status (1)

Country Link
CN (1) CN107844497A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999034307A1 (en) * 1997-12-29 1999-07-08 Infodream Corporation Extraction server for unstructured documents
CN101789006A (zh) * 2010-01-29 2010-07-28 华东电网有限公司 基于智能搜索的电网企业信息集成***的快速检索方法
CN102023989A (zh) * 2009-09-23 2011-04-20 阿里巴巴集团控股有限公司 一种信息检索方法及其***
CN105354283A (zh) * 2015-10-30 2016-02-24 北京奇艺世纪科技有限公司 一种资源的搜索方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999034307A1 (en) * 1997-12-29 1999-07-08 Infodream Corporation Extraction server for unstructured documents
CN102023989A (zh) * 2009-09-23 2011-04-20 阿里巴巴集团控股有限公司 一种信息检索方法及其***
CN101789006A (zh) * 2010-01-29 2010-07-28 华东电网有限公司 基于智能搜索的电网企业信息集成***的快速检索方法
CN105354283A (zh) * 2015-10-30 2016-02-24 北京奇艺世纪科技有限公司 一种资源的搜索方法和装置

Similar Documents

Publication Publication Date Title
KR101617987B1 (ko) 데이터베이스 마이그레이션 소스를 위한 머신 학습
Bakshi Considerations for big data: Architecture and approach
Aksu et al. Distributed $ k $-Core View Materialization and Maintenance for Large Dynamic Graphs
Loos et al. In-memory databases in business information systems
CN103324765B (zh) 一种基于列存储的多核并行数据查询优化方法
Holzschuher et al. Querying a graph database–language selection and performance considerations
Hsieh et al. SQLMR: A scalable database management system for cloud computing
He et al. Parallel implementation of classification algorithms based on MapReduce
CN107608773A (zh) 任务并发处理方法、装置及计算设备
Wang et al. Scalable data cube analysis over big data
Zhang et al. Oceanrt: Real-time analytics over large temporal data
Mukherjee Synthesis of non-replicated dynamic fragment allocation algorithm in distributed database systems
CN107622059A (zh) 一种提高数据库搜索效率的方法和***
JP2012168781A (ja) 分散型データストアシステム及び分散型データストアシステムにおけるレコード管理方法
CN103365923A (zh) 用于评估数据库的分区方案的方法和装置
Huang et al. Performance evaluation of enabling logistic regression for big data with R
Ho et al. Data partition optimization for column-family NoSQL databases
Wu et al. Towards big data analytics across multiple clusters
US8832157B1 (en) System, method, and computer-readable medium that facilitates efficient processing of distinct counts on several columns in a parallel processing system
CN107844497A (zh) 一种数据库检索的方法和***
CN108153770A (zh) 一种搜索引擎加速的方法和***
Nagy et al. Improving transport management with big data analytics
Cores et al. High throughput BLAST algorithm using spark and cassandra
Schütt et al. MR‐search: massively parallel heuristic search
CN113177089A (zh) 一种分布式数据存储引擎调度方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180327