CN109657044A - 数据检索方法、数据排序方法、装置、终端以及存储介质 - Google Patents

数据检索方法、数据排序方法、装置、终端以及存储介质 Download PDF

Info

Publication number
CN109657044A
CN109657044A CN201811536639.6A CN201811536639A CN109657044A CN 109657044 A CN109657044 A CN 109657044A CN 201811536639 A CN201811536639 A CN 201811536639A CN 109657044 A CN109657044 A CN 109657044A
Authority
CN
China
Prior art keywords
data
retrieved
term
candidate word
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811536639.6A
Other languages
English (en)
Inventor
高安
陈而淦
刘永刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shangyi Heart Technology Co Ltd
Original Assignee
Beijing Shangyi Heart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shangyi Heart Technology Co Ltd filed Critical Beijing Shangyi Heart Technology Co Ltd
Priority to CN201811536639.6A priority Critical patent/CN109657044A/zh
Publication of CN109657044A publication Critical patent/CN109657044A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种数据检索方法、数据排序方法、装置、终端以及存储介质。其中,该数据检索方法包括:获取检索词;其中,检索词用于检索待检索数据,待检索数据具有属性信息,属性信息包括待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数和热度;将检索词与候选词列表中的候选词进行匹配;其中,候选词根据待检索数据的属性信息确定;根据匹配结果,按照预定条件,对待检索数据进行筛选,得到目标数据。通过本发明实施例,解决了如何提高数据检索准确性的技术问题,使得检索结果与用户的期望结果高度相关,用户可以快速地获得感兴趣的数据,进而提高了用户体验度,而且还实现了热搜的技术效果。

Description

数据检索方法、数据排序方法、装置、终端以及存储介质
技术领域
本发明涉及数据处理技术领域,特别是涉及一种数据检索方法、数据排序方法、装置、终端以及存储介质。
背景技术
随着社会的不断发展,产生了大量丰富的资料。当面对大量丰富的资料时,如果要获取感兴趣的数据,那么,数据检索就显得十分重要了。
现有技术通常根据数据代码进行数据检索。可是,这种检索方法所依赖的检索条件单一,检索结果中用户感兴趣的数据往往不能够排列在靠前的位置,从而造成了数据检索的准确性很差,使得用户不能快速地获取到感兴趣的数据。
因此,现有技术因为检索条件单一而存在数据检索准确性差的缺陷。
发明内容
本发明实施例的目的在于提供一种数据检索方法,以解决如何提高数据检索准确性的技术问题。此外,本发明实施例还提供一种数据排序方法、装置、终端以及存储介质。
为了实现上述目的,根据本发明的第一方面,提供了以下技术方案:
一种数据检索方法,其包括:
获取检索词;其中,所述检索词用于检索待检索数据,所述待检索数据具有属性信息,所述属性信息包括待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数和热度;
将所述检索词与候选词列表中的候选词进行匹配;其中,所述候选词根据所述待检索数据的所述属性信息确定;
根据匹配结果,按照预定条件,对所述待检索数据进行筛选,得到目标数据。
进一步地,在所述获取检索词的步骤之后,所述方法还包括:
对所述检索词进行正则化。
进一步地,将所述检索词与候选词列表中的候选词进行匹配的步骤,具体包括:
对所述检索词进行分割;
通过三叉搜索树来构建所述候选词列表;其中,所述三叉搜索树的节点存储的键值对基于所述待检索数据及其属性信息生成;
基于前缀匹配策略,将分割后的检索词与所述候选词列表中的所述候选词进行匹配。
为了实现上述目的,根据本发明的第二方面,还提供了以下技术方案:
一种数据排序方法,其包括:
获取待排序数据;其中,所述待排序数据根据本发明第一方面所述的数据检索方法获得;
按照预定策略,对所述待排序数据进行排列,得到目标数据;其中,所述预定策略包括以下中的一项或多项:数据代码完全匹配、去除前导零之后数据代码完全匹配、拼音首字母完全匹配、数据代码和数据名称前缀匹配、历史检索次数、数据权重。
为了实现上述目的,根据本发明的第三方面,还提供了以下技术方案:
一种数据检索装置,其包括:
第一获取模块,用于获取检索词;其中,所述检索词用于检索待检索数据,所述待检索数据具有属性信息,所述属性信息包括待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数和热度;
匹配模块,用于将所述检索词与候选词列表中的候选词进行匹配;其中,所述候选词根据所述待检索数据的所述属性信息确定;
筛选模块,用于根据匹配结果,按照预定条件,对所述待检索数据进行筛选,得到目标数据。
进一步地,所述装置还包括:
正则化模块,用于对所述检索词进行正则化。
进一步地,所述匹配模块具体用于:
对所述检索词进行分割;
通过三叉搜索树来构建所述候选词列表;其中,所述三叉搜索树的节点存储的键值对基于所述待检索数据及其属性信息生成;
基于前缀匹配策略,将分割后的检索词与所述候选词列表中的所述候选词进行匹配。
为了实现上述目的,根据本发明的第四方面,还提供了以下技术方案:
一种数据排序装置,其包括:
第二获取模块,用于获取待排序数据;其中,所述待排序数据根据本发明第三方面所述的数据检索装置获得;
排列模块,用于按照预定策略,对所述待排序数据进行排列,得到目标数据;其中,所述预定策略包括以下中的一项或多项:数据代码完全匹配、去除前导零之后数据代码完全匹配、拼音首字母完全匹配、数据代码和数据名称前缀匹配、历史检索次数、数据权重。
为了实现上述目的,根据本发明的第五方面,还提供了以下技术方案:
一种终端,其包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现本发明第一方面或第二方面所述的方法步骤。
为了实现上述目的,根据本发明的第六方面,还提供了以下技术方案:
一种计算机可读存储介质,其内存储有计算机程序,所述计算机程序被处理器执行时实现本发明第一方面或第二方面所述的方法步骤。
本发明实施例提供一种数据检索方法、数据排序方法、装置、终端以及存储介质。其中,该数据检索方法包括:获取检索词;其中,检索词用于检索待检索数据,待检索数据具有属性信息,属性信息包括待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数和热度;将检索词与候选词列表中的候选词进行匹配;其中,候选词根据待检索数据的属性信息确定;根据匹配结果,按照预定条件,对待检索数据进行筛选,得到目标数据。
本发明实施例结合了待检索数据的属性信息,即待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数、热度等,进行检索词的匹配,从而提高了数据检索的准确性,使得检索结果与用户的期望结果高度相关,用户可以快速地获得感兴趣的数据,而且,本发明实施例考虑了搜索次数以及热度,通过词频统计,从而实现了热搜的技术效果,进而提高了用户体验度。
为了能更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而得以体现。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例的数据检索方法的流程示意图;
图2为根据本发明实施例的数据排序方法的流程示意图;
图3为根据本发明实施例的数据检索装置的结构示意图;
图4为根据本发明实施例的数据排序装置的结构示意图。
具体实施方式
下面通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本发明,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
作为股票个股和添加为自选的入口,股票数据检索的准确性和相关性会严重影响用户的体验。现有的数据检索方法一般通过股票数据名称的匹配来进行数据检索,由此得到的结果并不能反映股票的被检所热度和对检索词的相关度,甚至会导致低关联度的结果排列在前面,高关联度的结果反而排在后面。
现有技术在进行数据检索时,一般通过数据代码的匹配来进行数据检索。举例来说,以股票数据为例(当然,也可以为期货等有价证券数据、消费统计数据、旅游分布数据、穿衣指数数据等),现有技术通常通过股票数据的代码来检索相关股票数据。例如,如果使用“51”作为检索词进行检索;那么,当通过股票数据代码进行检索的时候,会得到如下检索结果:银华日利(511880)、康美药业(600518)等。但是,实际上,用户感兴趣的是无忧英语(51Talk/COE)。也就是说,在检索结果中,用户不感兴趣的数据会排列在靠前的位置,而用户感兴趣的数据会排列在考后的位置,由此造成数据检索的准确性差的缺陷,从而使得用户不能快速地获取到感兴趣的数据,降低了用户体验度。
由此可见,现有技术因为只使用数据代码进行匹配,以对数据进行检索,从而存在无法数据检索准确性差的缺陷。
鉴于此,为了提高数据检索的准确性,本发明实施例还提供一种数据检索方法。如图1所示,该数据检索方法主要包括以下步骤S100至步骤S120。其中:
S100:获取检索词。其中,该检索词用于检索待检索数据;该待检索数据具有属性信息;该属性信息包括待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数、热度。
在本步骤中,用户可以通过终端输入检索词,以进行数据搜索。其中,终端包括但不限于智能手机、计算机、平板电脑、智能电视机、可穿戴设备等。
其中,待检索数据的属性信息包括但不限于待检索数据的代码、待检索数据的中文名称、待检索数据的英文名称、待检索数据的别名、待检索数据的拼音、待检索数据的搜索次数、待检索数据的热度等。现有技术没有认识到待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数、热度等可以影响到数据检索的结果;而本发明实施例考虑了待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数、热度等影响检索结果的因素,由此为数据检索准确性的提高提供了基础。
其中,待检索数据的热度例如可以根据诸如新闻报道次数、媒体公布次数、被分享的次数等来确定。
本发明实施例通过将待检索数据的搜索次数、待检索数据的热度应用于数据的检索,可以实现检索结果与用户期望结果的高相关性。
在本步骤之后,该数据检索方法还可以包括:
S101:对该检索词进行正则化。
在本步骤中,可以通过构建正则表达式来对该检索词进行逻辑过滤,并获取所需要的内容。其中,正则表达式可以利用预定的字符和/或字符串进行组合而得到。
举例而言,上述正则表达式可以表示将小写英文字母转换为大写英文字母,将繁体中文转化为简体中文,以及去除单词分割等。
S110:将检索词与候选词列表中的候选词进行匹配。其中,该候选词根据待检索数据的属性信息确定。
具体地,本步骤S110可以包括:步骤S111至步骤S113。其中:
S111:对待检索数据进行分割。
在本步骤中,例如,可以利用正向最大长度匹配的方法、逆向最大长度匹配的方法、最大概率分词方法、最大熵分词方法等,对待检索数据进行分割。
举例而言,若待检索数据为中文数据,则以一个汉字作为分割单位;若待检索数据为英文数据,则一个单词作为分割单位。
S112:通过三叉搜索树来构建候选词列表;其中,该三叉搜索树的节点存储的键值对基于待检索数据及其属性信息生成。
举例来说,三叉搜索树(也称前缀树)的每个节点所存储的值基于待检索数据生成;三叉搜索树的每个节点所存储的键(key)基于待检索数据的属性信息生成。
S113:基于前缀匹配策略,将分割后的检索词与候选词列表中的候选词进行匹配。
在本步骤中,由于采用前缀匹配策略进行匹配,所以,所有的右前缀也要添加进候选词列表。
举例来说,如果以BABA(阿里巴巴、ALiBaBa)为检索词,则会产生“BABA”、“ALIBABA”、“阿里巴巴”、“ALBB”这些前缀,同时,还会产生“里巴巴”、“巴巴”、“LBB”、“BB”等右前缀。为了提高数据检索的准确性,这些右前缀也添加进候选词列表。
S120:根据匹配结果,按照预定条件,对待检索数据进行筛选,得到目标数据。
其中,预定条件可以是用户设定的条件,例如,证券的市场数据、证券的种类数据、音乐打榜数据、图书销量数据等。
综上所述,与现有技术采用单一的数据匹配因素不同,本发明实施例结合了待检索数据的属性信息(其包括但不限于待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数、热度)进行检索词的匹配,从而提高了数据检索的准确性,使得检索结果与用户的期望结果高度相关,用户可以快速地获得感兴趣的数据,而且,本发明实施例考虑了搜索次数以及热度,通过词频统计,从而实现了热搜的技术效果,进而提高了用户体验度。
另外,本发明实施例还提供一种数据排序方法。如图2所示,该数据排序方法主要包括:
S200:获取待排序数据。
其中,本步骤的待排序数据可以通过前述数据检索方法实施例获得。
S210:按照预定策略,对待排序数据进行排列,得到目标数据。其中,该预定策略包括以下中的一项或多项:数据代码完全匹配、去除前导零之后数据代码完全匹配、拼音首字母完全匹配、数据代码和数据名称前缀匹配、历史检索次数、数据权重。
其中,数据权重可以根据该数据被公布、报道、关注等的次数或程度来确定。例如,如果该数据的新闻热度和用户关注度程度高;则可以赋予该数据高权重。
在实际应用中,可以通过预定顺序或随机地按照上述预定策略中的各项,对待排序数据进行排列,得到作为排序结果的目标数据。
为了便于理解本发明,下面以具体实施例对本实施例进行详细说明。
当用户搜索“GOOG”(其作为检索词)时,如果存在“GOOG”和“GOOGL”,则根据数据代码完全匹配的策略,“GOOG”的优先级高(即与检索词的关联度高),从而将“GOOG”排在“GOOGL”的前面。当用户搜索“5”时,如果存在以下数据:00005、000005、57000、57001,则根据去除前导零之后数据代码完全匹配的策略,00005、000005排在57000、57001的前面。当用户检索“PG”时,如果存在“PG”、“AAPL”、“PGC”,则根据数据代码完全匹配的策略以及拼音首字母完全匹配的策略,“PG”和“AAPL”排在“PGC”的前面。当用户搜索“51”时,如果存在“COE”(即51Talk)、510010,则根据数据代码和数据名称前缀匹配的策略,COE排在510010的前面。
如果待检索数据与检索词的匹配度相当时(即预定策略中的数据代码完全匹配、去除前导零之后数据代码完全匹配、拼音首字母完全匹配,以及数据代码和数据名称前缀匹配均不满足或均满足的情况),则根据历史检索次数多和数据权重大来确定哪个或些数据排在靠前的位置。
综上所述,本实施例通过预定策略来展示检索结果,可以将高相关性的检索结果排序在前,以便于用户优先看到最感兴趣的数据,由此提高了用户体验度。
在上文中,虽然按照上述的顺序描述了数据检索方法和数据排序方法实施例中的各个步骤,本领域技术人员应清楚,本发明实施例中的步骤并不必然按照上述顺序执行,其也可以倒序、并行、交叉等其他顺序执行,而且,在上述步骤的基础上,本领域技术人员也可以再加入其他步骤,这些明显变型或等同替换的方式也应包含在本发明的保护范围之内,在此不再赘述。
下面为本发明装置实施例,本发明装置实施例用于执行本发明方法实施例实现的步骤,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明方法实施例。在本发明各个装置实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
基于与上述数据检索方法实施例相同的技术构思,本发明实施例还提供一种数据检索装置。如图3所示,该数据检索装置主要包括:第一获取模块31、匹配模块32和筛选模块33。其中,第一获取模块31用于获取检索词;其中,所述检索词用于检索待检索数据,所述待检索数据具有属性信息,所述属性信息包括待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数和热度。匹配模块32用于将所述检索词与候选词列表中的候选词进行匹配;其中,所述候选词根据所述待检索数据的所述属性信息确定。筛选模块33用于根据匹配结果,按照预定条件,对所述待检索数据进行筛选,得到目标数据。
其中,待检索数据的热度例如可以根据诸如新闻报道次数、媒体公布次数、被分享的次数等来确定。由此,本发明实施例通过第一获取模块31将待检索数据的搜索次数、待检索数据的热度应用于数据的检索,可以实现检索结果与用户期望结果的高相关性。
其中,预定条件可以是用户设定的条件,例如,证券的市场数据、证券的种类数据、音乐打榜数据、图书销量数据等。
在一个优选的实施例中,该数据检索装置还可以包括正则化模块。其中,正则化模块用于对检索词进行正则化。
其中,正则化模块可以通过构建正则表达式来对该检索词进行逻辑过滤,并获取所需要的内容。其中,正则表达式可以利用预定的字符和/或字符串进行组合而得到。
在一个优选的实施例中,上述匹配模块32具体用于:对检索词进行分割;通过三叉搜索树来构建候选词列表;其中,三叉搜索树的节点存储的键值对基于待检索数据及其属性信息生成;基于前缀匹配策略,将分割后的检索词与候选词列表中的候选词进行匹配。
其中,匹配模块32可以利用正向最大长度匹配的方法、逆向最大长度匹配的方法、最大概率分词方法、最大熵分词方法等,对待检索数据进行分割。
有关数据检索装置实施例的详细说明可以参考前述方法实施例的有关说明,在此不再赘述。
综上所述,与现有技术采用单一的数据匹配因素不同,本发明实施例利用第一获取模块31、匹配模块32和筛选模块33,结合了待检索数据的属性信息(其包括但不限于待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数、热度)进行检索词的匹配,从而提高了数据检索的准确性,使得检索结果与用户的期望结果高度相关,用户可以快速地获得感兴趣的数据,而且,本发明实施例考虑了搜索次数以及热度,通过词频统计,从而实现了热搜的技术效果,进而提高了用户体验度。
此外,本发明实施例还提供一种数据排序装置。如图4所示,该数据排序装置主要包括:第二获取模块41和排列模块42。其中,第二获取模块41用于获取待排序数据;其中,待排序数据根据上述数据检索装置获得。排列模块42用于按照预定策略,对待排序数据进行排列,得到目标数据;其中,预定策略包括以下中的一项或多项:数据代码完全匹配、去除前导零之后数据代码完全匹配、拼音首字母完全匹配、数据代码和数据名称前缀匹配、历史检索次数、数据权重。
有关本实施例的具体实现过程、解决的问题以及取得的技术效果可以参考前述方法实施例中的相关描述,在此不再赘述。
本发明实施例利用第二获取模块41和排列模块42,通过预定策略来展示检索结果,可以将高相关性的检索结果排序在前,以便于用户优先看到最感兴趣的数据,由此提高了用户体验度。
基于与上述数据检索方法或数据排序方法相同的技术构思,本发明实施例还提供一种终端,其包括处理器和存储器;其中:存储器用于存放计算机程序。处理器用于执行存储器上所存放的程序时,实现数据检索方法实施例或数据排序方法实施例所述各个技术方案中任一的方法步骤。
其中,该处理器可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central Processing Unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器还可以包括AI(ArtificialIntelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
上述存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(non-volatile memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
在一些实施例中,终端还可选地包括有:***设备接口和至少一个***设备。处理器、存储器和***设备接口之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口相连。
有关本实施例的具体实现过程、解决的问题的具体细节可以参考前述方法实施例中的相关描述,在此不再赘述。
本发明实施例提供的终端在处理器执行存储器上所存放的程序时,结合了待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数、热度等待检索数据的属性信息,进行检索词的匹配从而提高了数据检索的准确性,使得检索结果与用户的期望结果高度相关,用户可以快速地获得感兴趣的数据,而且,本发明实施例考虑了搜索次数以及热度,通过词频统计,从而实现了热搜的技术效果,进而提高了用户体验度。
基于与上述数据检索方法或数据排序方法相同的技术构思,本发明实施例还提供一种计算机可读存储介质。该计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现数据检索方法实施例或数据排序方法实施例所述各个技术方案中任一的方法步骤。
上述计算机可读存储介质可以包括但不限于随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、只读存储器(ROM)、可编程只读存储器(PROM)、可擦写可编程只读存储器(EPROM)、电可擦写可编程只读存储器(EEPROM)、闪存(例如,NOR型闪存或NAND型闪存)、内容可寻址存储器(CAM)、聚合物存储器(例如,铁电聚合物存储器)、相变存储器、双向开关半导体存储器、硅-氧化物-氮化硅-氧化硅-硅(Silicon-Oxide-Nitride-Oxide-Silicon,SONOS)存储器、磁卡或者光卡,亦或是其他任意适当类型的计算机可读存储介质。
有关本实施例的具体实现过程、解决的问题具体细节可以参考前述方法实施例中的相关描述,在此不再赘述。
本发明实施例提供的计算机可读存储介质在被处理器执行时,结合了待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数、热度等待检索数据的属性信息,进行检索词的匹配从而提高了数据检索的准确性,使得检索结果与用户的期望结果高度相关,用户可以快速地获得感兴趣的数据,而且,本发明实施例考虑了搜索次数以及热度,通过词频统计,从而实现了热搜的技术效果,进而提高了用户体验度。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
还需要指出的是,在本公开的***和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
本说明书中的各个实施例均采用相关的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。可以不脱离由所附权利要求定义的教导的技术而进行对在此所述的技术的各种改变、替换和更改。此外,本公开的权利要求的范围不限于以上所述的处理、机器、制造、事件的组成、手段、方法和动作的具体方面。可以利用与在此所述的相应方面进行基本相同的功能或者实现基本相同的结果的当前存在的或者稍后要开发的处理、机器、制造、事件的组成、手段、方法或动作。因而,所附权利要求包括在其范围内的这样的处理、机器、制造、事件的组成、手段、方法或动作。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种数据检索方法,其特征在于,包括:
获取检索词;其中,所述检索词用于检索待检索数据,所述待检索数据具有属性信息,所述属性信息包括待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数和热度;
将所述检索词与候选词列表中的候选词进行匹配;其中,所述候选词根据所述待检索数据的所述属性信息确定;
根据匹配结果,按照预定条件,对所述待检索数据进行筛选,得到目标数据。
2.根据权利要求1所述的数据检索方法,其特征在于,在所述获取检索词的步骤之后,所述方法还包括:
对所述检索词进行正则化。
3.根据权利要求1所述的数据检索方法,其特征在于,将所述检索词与候选词列表中的候选词进行匹配的步骤,具体包括:
对所述检索词进行分割;
通过三叉搜索树来构建所述候选词列表;其中,所述三叉搜索树的节点存储的键值对基于所述待检索数据及其属性信息生成;
基于前缀匹配策略,将分割后的检索词与所述候选词列表中的所述候选词进行匹配。
4.一种数据排序方法,其特征在于,包括:
获取待排序数据;其中,所述待排序数据根据权利要求1-3中任一所述的数据检索方法获得;
按照预定策略,对所述待排序数据进行排列,得到目标数据;其中,所述预定策略包括以下中的一项或多项:数据代码完全匹配、去除前导零之后数据代码完全匹配、拼音首字母完全匹配、数据代码和数据名称前缀匹配、历史检索次数、数据权重。
5.一种数据检索装置,其特征在于,包括:
第一获取模块,用于获取检索词;其中,所述检索词用于检索待检索数据,所述待检索数据具有属性信息,所述属性信息包括待检索数据的代码、中文名称、英文名称、别名、拼音、搜索次数和热度;
匹配模块,用于将所述检索词与候选词列表中的候选词进行匹配;其中,所述候选词根据所述待检索数据的所述属性信息确定;
筛选模块,用于根据匹配结果,按照预定条件,对所述待检索数据进行筛选,得到目标数据。
6.根据权利要求5所述的数据检索装置,其特征在于,所述装置还包括:
正则化模块,用于对所述检索词进行正则化。
7.根据权利要求5所述的数据检索装置,其特征在于,所述匹配模块具体用于:
对所述检索词进行分割;
通过三叉搜索树来构建所述候选词列表;其中,所述三叉搜索树的节点存储的键值对基于所述待检索数据及其属性信息生成;
基于前缀匹配策略,将分割后的检索词与所述候选词列表中的所述候选词进行匹配。
8.一种数据排序装置,其特征在于,包括:
第二获取模块,用于获取待排序数据;其中,所述待排序数据根据权利要求5-7中任一所述的数据检索装置获得;
排列模块,用于按照预定策略,对所述待排序数据进行排列,得到目标数据;其中,所述预定策略包括以下中的一项或多项:数据代码完全匹配、去除前导零之后数据代码完全匹配、拼音首字母完全匹配、数据代码和数据名称前缀匹配、历史检索次数、数据权重。
9.一种终端,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1-4中任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4中任一所述的方法步骤。
CN201811536639.6A 2018-12-14 2018-12-14 数据检索方法、数据排序方法、装置、终端以及存储介质 Pending CN109657044A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811536639.6A CN109657044A (zh) 2018-12-14 2018-12-14 数据检索方法、数据排序方法、装置、终端以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811536639.6A CN109657044A (zh) 2018-12-14 2018-12-14 数据检索方法、数据排序方法、装置、终端以及存储介质

Publications (1)

Publication Number Publication Date
CN109657044A true CN109657044A (zh) 2019-04-19

Family

ID=66114283

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811536639.6A Pending CN109657044A (zh) 2018-12-14 2018-12-14 数据检索方法、数据排序方法、装置、终端以及存储介质

Country Status (1)

Country Link
CN (1) CN109657044A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110246592A (zh) * 2019-06-25 2019-09-17 山东健康医疗大数据有限公司 实现医疗机构异构数据值域代码标准化的映射方法及***
CN110377831A (zh) * 2019-07-25 2019-10-25 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN110377830A (zh) * 2019-07-25 2019-10-25 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN110895585A (zh) * 2019-10-18 2020-03-20 深圳市富途网络科技有限公司 股票数据获取方法、装置、终端设备及存储介质
CN111104375A (zh) * 2019-11-22 2020-05-05 泰康保险集团股份有限公司 核保规则编辑方法、***、设备及存储介质
CN111143661A (zh) * 2019-12-18 2020-05-12 深圳易伙科技有限责任公司 一种面向对象的语义检索方法和装置
CN113515940A (zh) * 2021-07-14 2021-10-19 上海芯翌智能科技有限公司 一种用于文本搜索的方法及设备
CN113921082A (zh) * 2021-10-27 2022-01-11 云舟生物科技(广州)有限公司 基因搜索权重调整方法、计算机存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388012A (zh) * 2007-09-13 2009-03-18 阿里巴巴集团控股有限公司 带有易混淆音识别的拼音检查***和方法
CN104125505A (zh) * 2014-06-23 2014-10-29 小米科技有限责任公司 电视节目处理方法和装置
CN104268157A (zh) * 2014-09-03 2015-01-07 乐视网信息技术(北京)股份有限公司 一种数据搜索中的纠错装置及其方法
CN106970936A (zh) * 2017-02-09 2017-07-21 阿里巴巴集团控股有限公司 数据处理方法及装置、数据查询方法及装置
CN108170852A (zh) * 2018-01-19 2018-06-15 深圳市富途网络科技有限公司 一种高效准确的股票搜索方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388012A (zh) * 2007-09-13 2009-03-18 阿里巴巴集团控股有限公司 带有易混淆音识别的拼音检查***和方法
CN104125505A (zh) * 2014-06-23 2014-10-29 小米科技有限责任公司 电视节目处理方法和装置
CN104268157A (zh) * 2014-09-03 2015-01-07 乐视网信息技术(北京)股份有限公司 一种数据搜索中的纠错装置及其方法
CN106970936A (zh) * 2017-02-09 2017-07-21 阿里巴巴集团控股有限公司 数据处理方法及装置、数据查询方法及装置
CN108170852A (zh) * 2018-01-19 2018-06-15 深圳市富途网络科技有限公司 一种高效准确的股票搜索方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110246592B (zh) * 2019-06-25 2023-07-14 山东浪潮智慧医疗科技有限公司 实现医疗机构异构数据值域代码标准化的映射方法及***
CN110246592A (zh) * 2019-06-25 2019-09-17 山东健康医疗大数据有限公司 实现医疗机构异构数据值域代码标准化的映射方法及***
CN110377831B (zh) * 2019-07-25 2022-05-17 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN110377831A (zh) * 2019-07-25 2019-10-25 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN110377830A (zh) * 2019-07-25 2019-10-25 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN110895585B (zh) * 2019-10-18 2022-08-23 深圳市富途网络科技有限公司 股票数据获取方法、装置、终端设备及存储介质
CN110895585A (zh) * 2019-10-18 2020-03-20 深圳市富途网络科技有限公司 股票数据获取方法、装置、终端设备及存储介质
CN111104375A (zh) * 2019-11-22 2020-05-05 泰康保险集团股份有限公司 核保规则编辑方法、***、设备及存储介质
CN111104375B (zh) * 2019-11-22 2023-06-09 泰康保险集团股份有限公司 核保规则编辑方法、***、设备及存储介质
CN111143661A (zh) * 2019-12-18 2020-05-12 深圳易伙科技有限责任公司 一种面向对象的语义检索方法和装置
CN113515940A (zh) * 2021-07-14 2021-10-19 上海芯翌智能科技有限公司 一种用于文本搜索的方法及设备
CN113515940B (zh) * 2021-07-14 2022-12-13 上海芯翌智能科技有限公司 一种用于文本搜索的方法及设备
CN113921082A (zh) * 2021-10-27 2022-01-11 云舟生物科技(广州)有限公司 基因搜索权重调整方法、计算机存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN109657044A (zh) 数据检索方法、数据排序方法、装置、终端以及存储介质
WO2021139325A1 (zh) 媒体信息推荐方法、装置、电子设备及存储介质
CN110532451A (zh) 针对政策文本的检索方法和装置、存储介质、电子装置
US20210158164A1 (en) Finding k extreme values in constant processing time
CN109062994A (zh) 推荐方法、装置、计算机设备和存储介质
CN108885624B (zh) 信息推荐***及方法
US10223453B2 (en) Dynamic search set creation in a search engine
CN109906451A (zh) 使用多义码的相似性搜索
CA2919878C (en) Refining search query results
CN100442284C (zh) 用于按类别提供关键字输入频率信息的搜索***及其方法
CN112818218B (zh) 信息推荐方法、装置、终端设备及计算机可读存储介质
CN104516910A (zh) 在客户端服务器环境中推荐内容
CN112825089B (zh) 文章推荐方法、装置、设备及存储介质
KR102108683B1 (ko) 비관심사 컨텐츠를 포함하는 추천 컨텐츠를 제공하는 방법
CN103412881A (zh) 提供搜索结果的方法及***
CN110275952A (zh) 基于用户短期兴趣的新闻推荐方法、装置及介质
CN110110139A (zh) 一种对推荐结果进行解释的方法、装置及电子设备
CN109325146A (zh) 一种视频推荐方法、装置、存储介质和服务器
CN104933044A (zh) 应用卸载原因的分类方法及分类装置
CN109800427A (zh) 一种分词方法、装置、终端及计算机可读存储介质
CN103365842B (zh) 一种页面浏览推荐方法及装置
CN112579854A (zh) 信息处理方法、装置、设备和存储介质
Liu et al. Detecting industry clusters from the bottom up based on co-location patterns mining: A case study in Dongguan, China
CN108446378B (zh) 基于用户搜索的方法、***及计算机存储介质
CN112749296A (zh) 一种视频推荐方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190419