CN109933702A - 一种检索展示方法、装置、设备及存储介质 - Google Patents

一种检索展示方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109933702A
CN109933702A CN201910180992.3A CN201910180992A CN109933702A CN 109933702 A CN109933702 A CN 109933702A CN 201910180992 A CN201910180992 A CN 201910180992A CN 109933702 A CN109933702 A CN 109933702A
Authority
CN
China
Prior art keywords
text filed
keyword
text
different
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910180992.3A
Other languages
English (en)
Other versions
CN109933702B (zh
Inventor
张济徽
尹华华
王新波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wisdom Bud Information Technology (suzhou) Co Ltd
Original Assignee
Wisdom Bud Information Technology (suzhou) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wisdom Bud Information Technology (suzhou) Co Ltd filed Critical Wisdom Bud Information Technology (suzhou) Co Ltd
Priority to CN201910180992.3A priority Critical patent/CN109933702B/zh
Publication of CN109933702A publication Critical patent/CN109933702A/zh
Application granted granted Critical
Publication of CN109933702B publication Critical patent/CN109933702B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种检索展示方法、装置、设备及存储介质。该方法包括:获取用户输入的关键词;将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;显示所述展示方式,通过本发明的技术方案,能够优化搜索功能,增强用户搜索体验。

Description

一种检索展示方法、装置、设备及存储介质
技术领域
本发明实施例涉及计算机技术,尤其涉及一种检索展示方法、装置、设备及存储介质。
背景技术
内容检索是提供数据服务的IT***、搜索引擎或者SaaS应用的核心功能,针对不同的检索关键词或者检索式生成的检索结果页面是给用户做结果预览、操作或者优化检索式进一步搜索,所以搜索结果页的具体展现方式对提供数据服务的产品至关重要。
现有的搜索引擎主要有Google的搜索引擎和百度搜索引擎。Google的搜索引擎主要采用Sergey Brin和Lawrence Page提出的PageRank算法,该算法基于从许多优质的网页链接过来的网页来判定网页的重要性,进而进行排序,目前已经有200多个维度来对网页进行排序。百度搜索引擎主要采用超链分析算法对网络爬虫的搜索结果进行排序。目前无论是Google还是百度搜索引擎的算法都只是解决网页或者文章排序的问题,并没有解决针对搜索结果页如何更好的展现的问题。
现有技术中,针对专利文献的搜索结果与搜索引擎搜索结果页的展现目的有所不同,一般的网页是非结构的文本,搜索引擎会根据标题或者局部文本的匹配来部分显示匹配的内容,并且显示出来。而一般论文或者专利文献是结构化的文本,有标题、摘要、权利要求、说明书和附图等,这些不同的部分都是专利搜索者,根据搜索的意图去查看和预览的部分,但是现有的搜索引擎的显示结果页都不能很好的展现这些不同的部分。
即使是专业的专利搜索引擎工具,有不同的显示视图,比如列表视图、表格视图、图文视图也不能很好的展现结构化的论文或者专利不同部分的搜索结果比重,有的是按照标题,有是按照摘要的匹配程度,但是没有按照标题、摘要、权利要求、说明书和附图的这些部分匹配程度来显示搜索结果。
目前搜索结果页的使用问题:如图1A所示,为表格视图的图示。根据“人工智能”关键字去搜索得到的搜索结果页,搜索结果页中无论是标题,摘要,还是描述说明书中,都无法看出这个专利跟“人工智能”的匹配程度。如图1B所示,为标准视图的图示。根据“人工智能”关键字去搜索得到的搜索结果页,搜索结果页中无论是标题,摘要,还是描述说明书中,都无法看出这个专利跟“人工智能”的匹配程度。如图1C所示,为一种搜索结果页示意图,是根据分类关键词或者学术的关键词做的匹配搜索,但是并不能比较出,跟摘要,说明书,权利要求等所有地方的直观的匹配比重。如图1D所示,为另一种搜索结果页示意图,是根据标题、摘要等地方显示文本匹配,以及略缩图显示,并不能很好的展现关键词对应的匹配密度和权重。
发明内容
本发明实施例提供一种检索展示方法、装置、设备及存储介质,以实现优化搜索功能,增强用户搜索体验。
第一方面,本发明实施例提供了一种检索展示方法,包括:
获取用户输入的关键词;
将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;
显示所述展示方式。
进一步的,所述将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式,包括:
预先设定所述目标文档的不同文本区域的面积权重;
根据所述文本区域的面积权重与所述文本区域对应文本内容的长度的乘积确定所述文本区域的展示面积;
根据所述展示面积生成不同文本区域的展示方式。
进一步的,生成不同文本区域的展示方式包括:
确定所述关键词在所述文本区域的第一命中数,所述第一命中数为所述关键词和文本区域的文本内容匹配的次数;
根据所述第一命中数确定所述文本区域的匹配权重;
根据所述匹配权重在第一数据库确认对应文本区域的展示颜色,所述第一数据库中预先建立关于展示颜色与匹配权重之间的对应关系;
根据所述展示颜色生成不同文本区域的展示方式。
进一步的,所述文本区域包括多个不同区块,生成不同文本区域的展示方式包括:
确定所述关键词在文本区域的不同区块的第二命中数,所述第二命中数为所述关键词和文本区域的不同区块的文本内容匹配的次数;
根据所述第二命中数确定所述不同区块的热力权重;
根据所述热力权重在第二数据库确认对应文本区域的颜色深度,所述第二数据库中预先建立关于颜色深度与热力权重之间的对应关系;
根据所述颜色深度生成不同文本区域的展示方式。
进一步的,所述文本区域包括多个不同区块,生成不同文本区域的展示方式之后,还包括:
确定所述关键词在所述文本区域的命中位置,所述命中位置为所述关键词和文本区域的文本内容匹配成功时的位置;
根据所述命中位置确定命中区块,所述命中位置处于所述命中区块的范围内;
突出显示所述命中区块或使用所述关键词、关键词的缩略词以及关键词的替代词之一对所述命中区块进行标记。
进一步的,所述确定所述关键词在所述文本区域的命中位置,包括:
获取所述关键词在所述文本区域匹配成功时的行数作为第一位置参数;
获取所述关键词在所述文本区域匹配成功时的行偏移量作为第二位置参数;
根据所述第一位置参数和第二位置参数确定所述命中位置。
进一步的,所述展示方式包括:矩形、圆形、椭圆中的至少一种。
第二方面,本发明实施例还提供了检索展示装置,该装置包括:
获取模块,用于获取用户输入的关键词;
生成模块,用于将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;
显示模块,用于显示所述展示方式。
进一步的,生成模块包括:
设定单元,用于预先设定所述目标文档的不同文本区域的面积权重;
确定单元,用于根据所述文本区域的面积权重与所述文本区域对应文本内容的长度的乘积确定所述文本区域的展示面积;
图形生成单元,用于根据所述展示面积生成不同文本区域的展示方式。
进一步的,生成模块包括:
第一命中数确定单元,用于确定所述关键词在所述文本区域的第一命中数,所述第一命中数为所述关键词和文本区域的文本内容匹配的次数;
匹配权重确定单元,用于根据所述第一命中数确定所述文本区域的匹配权重;
展示颜色确认单元,用于根据所述匹配权重在第一数据库确认对应文本区域的展示颜色,所述第一数据库中预先建立关于展示颜色与匹配权重之间的对应关系;
展示方式生成单元,用于根据所述展示颜色生成不同文本区域的展示方式。
进一步的,所述文本区域包括多个不同区块,生成模块具体用于:
确定所述关键词在文本区域的不同区块的第二命中数,所述第二命中数为所述关键词和文本区域的不同区块的文本内容匹配的次数;
根据所述第二命中数确定所述不同区块的热力权重;
根据所述热力权重在第二数据库确认对应文本区域的颜色深度,所述第二数据库中预先建立关于颜色深度与热力权重之间的对应关系;
根据所述颜色深度生成不同文本区域的展示方式。
进一步的,还包括:
命中位置确定单元,用于确定所述关键词在所述文本区域的命中位置,所述命中位置为所述关键词和文本区域的文本内容匹配成功时的位置;
命中区块确定单元,用于根据所述命中位置确定命中区块,所述命中位置处于所述命中区块的范围内;
标记单元,用于突出显示所述命中区块或使用所述关键词、关键词的缩略词以及关键词的替代词之一对所述命中区块进行标记。
进一步的,命中位置确定单元具体用于:
获取所述关键词在所述文本区域匹配成功时的行数作为第一位置参数;
获取所述关键词在所述文本区域匹配成功时的行偏移量作为第二位置参数;
根据所述第一位置参数和第二位置参数确定所述命中位置。
进一步的,所述展示方式包括:矩形、圆形、椭圆中的至少一种。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的检索展示方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的检索展示方法。
本发明实施例通过获取用户输入的关键词;将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;显示所述展示方式,能够优化搜索功能,方便用户迅速了解搜索的整体匹配结果,增强用户搜索体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1A为现有技术中表格视图的图示;
图1B为现有技术中标准视图的图示;
图1C为现有技术中一种搜索结果页示意图;
图1D为现有技术中另一种搜索结果页示意图;
图2是本发明实施例一中的一种检索展示方法的流程图;
图3A是本发明实施例二中的一种检索展示方法的流程图;
图3B是本发明实施例二中的专利搜索结果列表的一个子项通过矩形框的第二边框尺寸的展现方式与现有技术中专利搜索结果列表的一个子项的对比图;
图4A是本发明实施例三中的一种检索展示方法的流程图;
图4B是本发明实施例三中的专利搜索结果列表的一个子项通过矩形框的第二边框尺寸和颜色的展现方式与现有技术中专利搜索结果列表的一个子项的对比图;
图5A是本发明实施例四中的一种检索展示方法的流程图;
图5B是本发明实施例四中的专利搜索结果列表的一个子项通过矩形框的第二边框尺寸和热力图的展现方式与现有技术中专利搜索结果列表的一个子项的对比图;
图5C是本发明实施例四中的专利搜索结果列表的一个子项通过矩形框的第二边框尺寸和热力图的展现方式的图示;
图6A是本发明实施例五中的一种检索展示方法的流程图;
图6B是本发明实施例五中的一种检索关键词的图示;
图6C是本发明实施例五中的专利搜索结果列表的一个子项通过矩形框的第二边框尺寸和热力图的展现方式以及使用关键词进行标记与现有技术中专利搜索结果列表的一个子项的对比图;
图6D是本发明实施例五中的专利搜索结果列表的一个子项通过矩形框的第二边框尺寸和热力图的展现方式以及使用关键词进行标记的图示;
图6E是本发明实施例五中的多种不同的展示方式的图示;
图7是本发明实施例六中的一种检索展示装置的结构示意图;
图8是本发明实施例七中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例一
图2为本发明实施例一提供的一种检索展示方法的流程图,本实施例可适用于检索展示的情况,该方法可以由本发明实施例中的检索展示装置来执行,该装置可采用软件和/或硬件的方式实现,如图2所示,该方法具体包括如下步骤:
S110,获取用户输入的关键词。
其中,所述关键词可以是检索式,也可以是其他形式,例如可以是,关键词为5G通信或XX公司,本发明实施例对此不进行限制。
具体的,获取用户输入的关键词的方式可以为用户通过外接设备手动输入关键词,例如可以是,用户通过按压键盘上的控件实现输入关键词,还可以为用户通过语音形式输入关键词,例如可以是,用户语音输入关键词“5G通信”,获取用户输入的语音,通过语音识别技术将用户输入的语音转换为文字形式,进而得到用户输入的关键词,还可以通过其他方式获取用户输入的关键词,例如通过手势获取用户输入的关键词等,本发明实施例对此不进行限制。
S120,将关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式。
其中,所述目标文档可以为专利文献或专利申请文献,也可以为论文,还可以为其他的结构化的文档,本发明实施例对此不进行限制。
其中,所述目标文档的不同文本区域与目标文档的种类有关,若目标文档为专利文献或专利申请文献,根据专利文献或专利申请文献的结构化文本特点,则目标文档的不同文本区域为标题区域、摘要区域、权利要求区域、说明书区域和附图区域5个不同的文本区域。替代实施例中,目标文档的不同文本区域也可以进行选择性或省略性显示,例如,专利文献或专利申请文献的结构化文本中目标文档的不同文本区域可以为标题区域、摘要区域、权利要求区域和说明书区域4个不同的文本区域,也可以为摘要区域、权利要求区域和说明书区域3个不同的文本区域。
其中,所述关键词与目标文档的不同文本区域进行匹配的方式可以为,将关键词依次与目标文档的不同文本区域进行匹配,例如可以是,若关键词为关键词A,目标文档的不同文本区域包括:文本区域T、文本区域Q、文本区域C、文本区域D和文本区域B;依次将关键词A与文本区域T、文本区域Q、文本区域C、文本区域D和文本区域B进行匹配。
具体的,将关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式的方式可以为将关键词与目标文档的不同文本区域进行匹配,按照匹配的文字数量确定展示面积,根据展示面积确定展示方式,还可以为根据目标文档的不同文本区域的权重以及文本区域对应的文本内容的长度的乘积确定展示面积,根据展示面积确定展示方式,或者可以为根据关键词和文本区域的文本内容匹配的次数确定文本区域的匹配权重,进而根据匹配权重确定文本区域的展示颜色,根据展示颜色和展示面积确定展示图像,还可以根据关键词和文本区域的不同区块的文本内容匹配的次数确定不同区块的热力权重,色深度、展示颜色和展示面积生成展示方式,本发明实施例对此不进行限制。
S130,显示展示方式。
其中,所述展示方式可以包括矩形,还可以包括椭圆形,或者可以包括圆形,本发明实施例对此不进行限制。
具体的,显示展示方式的方式可以为将不同的文本区域用不同第二边框尺寸的矩形框包围,矩形框的第一边框尺寸相同,矩形框的第二边框尺寸与不同文本区域的文本内容的长度有关,通过矩形框的第二边框尺寸的不同可以给预览者一个直观的认识;还可以对应为不同的文本区域预先设定不同的颜色,通过颜色的不同可以给预览者一个直观的认识;或者可以使用不同颜色的深浅标识不同的文本区域的命中率,命中率指的是关键词和文本区域的文本内容匹配的次数;还可以为通过热力图展示命中的密度,需要先将文本区域进行划分,得到不同的区块,根据关键词和文本区域不同区块的文本内容匹配的次数得到热力图,不同的文本区域通过不同的热力图展现;还可以为通过标记的形式体现关键词的匹配位置,本发明实施例对此不进行限制。本实施例的矩形框的第一边框尺寸可以为展示方式沿宽度或水平方向的尺寸,展示方式矩形框的第二边框尺寸可以为展示方式沿高度或垂直方向的尺寸。
可选的,生成不同文本区域的展示方式包括:
确定所述关键词在所述文本区域的第一命中数,所述第一命中数为所述关键词和文本区域的文本内容匹配的次数;
根据所述第一命中数确定所述文本区域的匹配权重;
根据所述匹配权重在第一数据库确认对应文本区域的展示颜色,所述第一数据库中预先建立关于展示颜色与匹配权重之间的对应关系;
根据所述展示颜色生成不同文本区域的展示方式。
具体的,通过关键词在所述文本区域的第一命中数确认对应文本区域的展示颜色,进而根据展示颜色生成不同文本区域的展示方式,例如可以是,关键词在所述区域A的第一命中数为10次,关键词在所述区域B的第一命中数为5次,关键词在所述区域C的第一命中数为2次,确定区域A的匹配权重为Q,确定区域B的匹配权重为W,确定区域C的匹配权重为P,在第一数据库中,匹配权重为Q对应的文本展示颜色为蓝色,匹配权重为W对应的文本展示颜色为绿色,匹配权重为P对应的文本展示颜色为红色,则确定区域A展示颜色为蓝色,区域B展示颜色为绿色,区域C展示颜色为红色。可选的,所述文本区域包括多个不同区块,生成不同文本区域的展示方式包括:
确定所述关键词在文本区域的不同区块的第二命中数,所述第二命中数为所述关键词和文本区域的不同区块的文本内容匹配的次数;
根据所述第二命中数确定所述不同区块的热力权重;
根据所述热力权重在第二数据库确认对应文本区域的颜色深度,所述第二数据库中预先建立关于颜色深度与热力权重之间的对应关系;
根据所述颜色深度生成不同文本区域的展示方式。
具体的,通过关键词在文本区域的不同区块的第二命中数确认对应文本区域的颜色深度,进而根据颜色深度生成不同文本区域的展示方式,例如可以是,区域A包括区块X、区块Y和区块Z,关键词在所述区域A的区块X的第一命中数为10次,关键词在所述区域A的区块Y的第一命中数为5次,关键词在所述区域A的区块Z的第一命中数为2次,确定区块X的热力权重为U,确定区块Y的热力权重为V,确定区块Z的热力权重为W,在第二数据库中,热力权重为U对应的区块的颜色深度为L,热力权重为V对应的区块的颜色深度为M,热力权重为W对应的区块的颜色深度为N,则根据不同区块的颜色深度确定文本区域的颜色深度,进而确定区域A中区块X的颜色深度为L、区块Y的颜色深度为M和区块Z的颜色深度为N。
本实施例的技术方案,通过获取用户输入的关键词;将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;显示所述展示方式,能够针对不同的文本区域进行关键词匹配,进而优化搜索功能,通过不同的文本区域生成不同的展示方式,能够给检索用户一个直观的认识,增强用户搜索体验。
实施例二
图3A为本发明实施例二中的一种检索展示方法的流程图,本实施例以上述实施例为基础进行优化,在本实施例中,所述将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式,包括:预先设定所述目标文档的不同文本区域的面积权重;根据所述文本区域的面积权重与所述文本区域对应文本内容的长度的乘积确定所述文本区域的展示面积;根据所述展示面积生成不同文本区域的展示方式。
如图3A所示,本实施例的方法具体包括如下步骤:
S210,获取用户输入的关键词。
S220,预先设定目标文档的不同文本区域的面积权重。
其中,设定目标文档的不同文本区域的面积权重的方式可以根据不同文本区域的文本内容的字数确定,例如可以是,设定文本区域的文本内容的字数少的文本区域的面积权重较大;还可以根据用户的使用习惯直接进行设定,或者可以根据文本区域的重要程度进行设定,本发明实施例对此不进行限制。
具体的,预先设定目标文档的不同文本区域的面积权重,例如可以是,若目标文档为专利文献或专利申请文献,且目标文档的不同文本区域分别为标题区域、摘要区域、权利要求区域、说明书区域和附图区域,预先设定标题区域的权重为25%,摘要区域的权重为20%,权利要求区域的权重为25%,说明书区域的权重为15%,附图区域的权重为15%。
在一个具体的例子中,根据专利文献或专利申请文献的结构化文本特点,分成T、A、C、D、B,分别对应标题、摘要、权利要求、说明书、附图的5个不同区域,根据用户输入的关键词匹配如上5个不同部分的匹配比重做的图形化结果页展现方式。不同的矩形的面积表示不同的原文的文本比例,如图3B所示,是专利文献或专利申请文献搜索结果列表的一个子项,左边是本发明实施例中的专利文献或专利申请文献搜索结果列表的一个子项,右边是现有技术中的检索结果,其中,子项指的是搜索结果列表中的目标文档,若可以检索到与关键词相关的目标文档,则搜索结果列表中包括至少一个目标文档。根据标题,摘要,权利要求,说明书,以及附图做个矩形展现,如图3B所示,其中,每个矩形的高度1不一样,其相对大小根据专利文献或专利申请文献文本的文本长度做的示意图,目的是给预览者一个直观的认识,不同的文本区域对应不同的矩形高度1。为了不使这个矩形比例过于失真(标题可能文本很少,而说明书很大)所以针对这个矩形显示,会按照一定的权重来设计,这样使得比例适中,能够反映出专利文献或专利申请文献不同区域的文本高度。矩形的显示的高度计算方式有两个步骤:
步骤一:如表一所示,定义不同部分的文本的一个占得比重。
表一
步骤二:根据不同的区域权重乘以对应的文本长度可以得出不同区域的矩形框的第二边框尺寸,这样可以得出每个部分的高度比例关系,然后根据显示的缩略图的总高度,可以计算出每一部分的高度。如表二所示,矩形框的第二边框尺寸计算方式。
表二
S230,根据文本区域的面积权重与文本区域对应文本内容的长度的乘积确定文本区域的展示面积。
其中,所述文本区域对应文本内容的长度可以为文本的行数或者文本字数的数量,例如可以是,文本区域对应文本内容的长度为标题区域的文本长度、摘要区域的文本长度、权利要求区域的文本长度、说明书区域的文本长度和附图区域的文本长度,其中,附图区域对应的文本长度的获取方式可以为预先对附图区域进行文字识别,得到附图区域对应的文本,再获取附图区域对应的文本长度。
具体的,根据文本区域的面积权重与文本区域对应文本内容的长度的乘积确定文本区域的展示面积,例如可以是,根据文本区域的面积权重与文本区域对应文本内容的长度的乘积确定文本区域的矩形框的第二边框尺寸,进而得到不同文本区域的显示高度的比例关系,根据显示的缩略图的总高度,计算出不同文本区域的高度,由于不同文本区域的矩形框的第一边框尺寸相同,且根据缩略图可以得到矩形框的第一边框尺寸,则可以根据矩形框的第一边框尺寸和矩形框的第二边框尺寸确定矩形面积。
S240,根据展示面积生成不同文本区域的展示方式。
其中,所述展示面积指的是不同文本区域的展示面积,不同文本区域可以通过矩形的形式展示,也可以通过圆形的形式展示,还可以通过椭圆形的形式展示,本发明实施例对此不进行限制。
具体的,根据展示面积生成不同文本区域的展示方式,例如可以是,根据展示面积在不同文本区域***生成不同展示面积的矩形,由于矩形的长度相同,则可以通过矩形的高度给预览者一个直观的认识。
S250,显示展示方式。
可选的,所述展示方式包括:矩形、圆形、椭圆中的至少一种。
本实施例的技术方案,通过预先设定目标文档的不同文本区域的面积权重;根据文本区域的面积权重与文本区域对应文本内容的长度的乘积确定文本区域的展示面积;根据展示面积生成不同文本区域的展示方式,能够优化搜索功能,便于用户去精确定位位置,进行查看这个专利文献或专利申请文献是否跟用户想要搜索的内容相关,增强用户搜索体验。
实施例三
图4A为本发明实施例三中的一种检索展示方法的流程图,本实施例以上述实施例二为基础进行优化,在本实施例中,根据所述展示面积生成不同文本区域的展示方式包括:确定所述关键词在所述文本区域的第一命中数,所述第一命中数为所述关键词和文本区域的文本内容匹配的次数;根据所述第一命中数确定所述文本区域的匹配权重;根据所述匹配权重在第一数据库确认对应文本区域的展示颜色,所述第一数据库中预先建立关于展示颜色与匹配权重之间的对应关系;根据所述展示颜色和所述展示面积生成不同文本区域的展示方式。
如图4A所示,本实施例的方法具体包括如下步骤:
S310,获取用户输入的关键词。
S320,预先设定目标文档的不同文本区域的面积权重。
S330,根据文本区域的面积权重与文本区域对应文本内容的长度的乘积确定文本区域的展示面积。
S340,确定关键词在文本区域的第一命中数,第一命中数为关键词和文本区域的文本内容匹配的次数。
其中,所述关键词和文本区域的文本内容匹配的次数为将关键词依次与不同的文本区域的文本内容进行匹配,得到关键词在不同的文本区域的文本内容匹配的次数,例如可以是,关键词为关键词A,文本区域P对应的内容为“关键词A其他内容(其他内容中不包含关键词A)”则关键词A和文本区域P的文本内容匹配的次数为1次。
S350,根据第一命中数确定文本区域的匹配权重。
具体的,根据第一命中数确定所述文本区域的匹配权重的方式可以为第一命中数越多,文本区域的匹配权重越大,也可以为第一命中数越多,文本区域的匹配权重越小,本发明实施例对此不进行限制。
S360,根据匹配权重在第一数据库确认对应文本区域的展示颜色,第一数据库中预先建立关于展示颜色与匹配权重之间的对应关系。
其中,预先建立关于展示颜色与匹配权重之间的对应关系,例如可以是,预先建立展示颜色A对应匹配权重P,展示颜色B对应匹配权重Q,展示颜色C对应匹配权重W。
具体的,根据所述匹配权重在第一数据库确认对应文本区域的展示颜色,例如可以是,根据匹配权重查询第一数据库,得到与匹配权重对应的文本区域的展示颜色。
S370,根据展示颜色和展示面积生成不同文本区域的展示方式。
具体的,通过不同文本区域的展示颜色和展示面积不同,可以直观的体现不同文本区域的面积权重以及不同文本区域与关键词的匹配次数,更方便用户浏览。
S380,显示展示方式。
在一个具体的例子中,如图4B所示,左边是本发明实施例中的专利文献或专利申请文献搜索结果列表的一个子项,右边是现有技术中的检索结果,用不同颜色或者不同深浅的颜色表示关键词在不同的区域的命中数,这样便于专利文献或专利申请文献搜索者快速查找哪个部分是跟关键词密切相关的,跳转到相应的区域进行查看。具体选择哪种颜色,***可以配置,可以根据不同的客户的可见性的要求进行设置。图4B所示的颜色是一个示意图,不同的颜色,***可以做成可配置的。图4B所示,不同的文本区域对应不同的矩形高度1。也可以通过颜色的深度来展示匹配度,进行每种颜色的深度计算方式如下:第一命中数=关键词和文本区域的文本内容匹配的次数,用NHit来表示不同的第一命中数(N表示不同的部分),具体的关键词的匹配算法可以由业界通用成熟的方案solr或者lucene来实现。拿基本的RGB三原色来举例说明实现方法:按照RGB的规范,白色:(255,255,255)黑色:(0,0,0)。比如(139,35,39)代表全部命中的时候,默认的深红色(***可配置成其它颜色)。根据红、绿、蓝设置默认的偏移量:
Offsetred=255-139=116
Offsetgreen=255-35=220
Offsetblue=255-39=216
根据命中率计算红绿蓝的值:
red=max(255-(Offsetred*NHit),0)
green=max(255-(Offsetgren*NHit),0)
blue=max(255-(Offsetblue*NHit),0)
NHit命中的次数,最后根据命中次数得到red,green,blue的值。可以将得到red,green,blue的值直接作为对应区域的颜色,还可以结合每个区域的权重Nweight得到最终每个部分的颜色:
TColor=NWeight*RGB(red,green,blue,NHit)
因为标题的文本较少,所以权重较低,而说明书的权重会较高,这一点与计算矩形的高度方式正好相反。如表三所示,是矩形颜色的权重分布表。
表三
颜色权重 比重 说明
T<sub>Weight</sub> 20% 表示标题区域的权重
A<sub>weight</sub> 15% 表示摘要区域的权重
C<sub>weight</sub> 20% 表示权利要求区域的权重
D<sub>Weight</sub> 30% 表示说明书区域的权重
B<sub>weight</sub> 15% 表示附图区域的权重
如表四所示,是不同部分的颜色计算方式:
表四
本实施例的技术方案,通过预先设定目标文档的不同文本区域的面积权重,根据文本区域的面积权重与文本区域对应文本内容的长度的乘积确定文本区域的展示面积,确定关键词在文本区域的第一命中数,根据第一命中数确定文本区域的匹配权重,根据匹配权重在第一数据库确认对应文本区域的展示颜色,第一数据库中预先建立关于展示颜色与匹配权重之间的对应关系,根据展示颜色和展示面积生成不同文本区域的展示方式,能够优化搜索功能,通过不同的展示颜色和展示面积的显示,能够更加便于用户去精确定位位置,进行查看这个专利文献或专利申请文献是否跟用户想要搜索的内容相关,增强用户搜索体验。
实施例四
图5A为本发明实施例四中的一种检索展示方法的流程图,本实施例以上述实施例二为基础进行优化,在本实施例中,所述文本区域包括多个不同区块,根据所述展示面积生成不同文本区域的展示方式包括:确定所述关键词在文本区域的不同区块的第二命中数,所述第二命中数为所述关键词和文本区域的不同区块的文本内容匹配的次数;根据所述第二命中数确定所述不同区块的热力权重;根据所述热力权重在第二数据库确认对应文本区域的颜色深度,所述第二数据库中预先建立关于颜色深度与热力权重之间的对应关系;根据所述颜色深度、展示颜色和所述展示面积生成不同文本区域的展示方式。
如图5A所示,本实施例的方法具体包括如下步骤:
S410,获取用户输入的关键词。
S420,预先设定目标文档的不同文本区域的面积权重,文本区域包括多个不同区块。
S430,根据文本区域的面积权重与文本区域对应文本内容的长度的乘积确定文本区域的展示面积。
S440,确定关键词在文本区域的不同区块的第二命中数,第二命中数为关键词和文本区域的不同区块的文本内容匹配的次数。
其中,预先将文本区域分成不同的区块,每一个文本区域至少包括两个区块,具体的区块的分割形式本发明实施例对此不进行限制。
具体的,确定所述关键词在文本区域的不同区块的第二命中数的方式可以为将关键词依次与文本区域的不同区块进行匹配,得到关键词和文本区域的不同区块的文本内容匹配的次数。
S450,根据第二命中数确定不同区块的热力权重。
其中,所述第二命中数与热力权重的关系为第二命中数越大,热力权重越大。
具体的,根据第二命中数确定所述不同区块的热力权重的方式可以为预先设定第二命中数与热力权重的对应关系的数据库,根据当前得到的第二命中数查询数据库,得到与之对应的不同区块的热力权重。
S460,根据热力权重在第二数据库确认对应文本区域的颜色深度,第二数据库中预先建立关于颜色深度与热力权重之间的对应关系。
其中,根据所述热力权重在第二数据库确认对应文本区域的颜色深度,例如可以是,根据热力权重查询第二数据库,得到与热力权重对应的颜色深度,根据得到的颜色深度确定文本区域的颜色深度。
可选的,还可以预先建立关于区块的颜色深度与热力权重之间的对应关系,根据当前热力权重查询与之对应的区块的颜色深度,根据同一文本区域中的不同区块的颜色深度得到文本区域的颜色深度。
S470,根据颜色深度、展示颜色和展示面积生成不同文本区域的展示方式。
S480,显示展示方式。
在一个具体的例子中,如图5B所示,左边是本发明实施例中的专利文献或专利申请文献搜索结果列表的一个子项,右边是现有技术中的检索结果,不同的区域可以用不同的热力图来展现,同一个区域不同的部分搜索命中的分布不同,同一种颜色深的热力图来表示命中的密度,用户搜索条件的命中范围,这样便于用户去精确定位位置,进行查看这个专利文献或专利申请文献是否跟用户想要搜索的内容相关。如图5B所示,摘要区域的中间部分2对应的区块命中率最高,说明书区域的右上角部分3对应的区块命中率最高,针对同一个区域的不同部分的命中区块做的用热力图的展现方式表示文本命中匹配度。具体的匹配方法如图5C所示,举例用说明书区域做个说明:把说明书区域分成x*y区块,y表示每一行的offset,x表示行数,根据检索式搜索到的关键字的匹配情况也就是solr返回的offset数目计算落在哪个区块中,热力图的展现就是看,检索式匹配在那个区域来进行展现:Hotspots={Xn,Ym},其中,Hotspots表示热点的集合,Xn表示矩形横坐标,Ym表示矩形纵坐标,如图5C中所示,Hotspots对应三个区域4为命中率较高的区块。
本实施例的技术方案,通过预先设定目标文档的不同文本区域的面积权重,文本区域包括多个不同区块,根据文本区域的面积权重与文本区域对应文本内容的长度的乘积确定文本区域的展示面积,确定关键词在文本区域的不同区块的第二命中数,根据第二命中数确定不同区块的热力权重,根据热力权重在第二数据库确认对应文本区域的颜色深度,第二数据库中预先建立关于颜色深度与热力权重之间的对应关系,根据颜色深度、展示颜色和展示面积生成不同文本区域的展示方式,能够优化搜索功能,通过热力图能够更好的展现文本命中匹配度,便于用户去精确定位位置,进行查看这个专利文献或专利申请文献是否跟用户想要搜索的内容相关,增强用户搜索体验。
实施例五
图6A为本发明实施例五中的一种检索展示方法的流程图,本实施例以上述实施例二为基础进行优化,在本实施例中,所述文本区域包括多个不同区块,根据所述展示面积生成不同文本区域的展示方式之后,还包括:确定所述关键词在所述文本区域的命中位置,所述命中位置为所述关键词和文本区域的文本内容匹配成功时的位置;根据所述命中位置确定命中区块,所述命中位置处于所述命中区块的范围内;突出显示所述命中区块或使用所述关键词、关键词的缩略词以及关键词的替代词之一对所述命中区块进行标记。
如图6A所示,本实施例的方法具体包括如下步骤:
S510,获取用户输入的关键词。
S520,预先设定目标文档的不同文本区域的面积权重。
S530,根据文本区域的面积权重与文本区域对应文本内容的长度的乘积确定文本区域的展示面积。
S540,根据展示面积生成不同文本区域的展示方式。
S550,显示展示方式。
可选的,所述展示方式包括:矩形、圆形、椭圆中的至少一种。
S560,确定关键词在文本区域的命中位置,命中位置为关键词和文本区域的文本内容匹配成功时的位置。
具体的,确定所述关键词在所述文本区域的命中位置,例如可以是关键词和文本区域的文本内容匹配成功是的位置为位置A,则关键词在文本区域的命中位置为位置A。
S570,根据命中位置确定命中区块,命中位置处于命中区块的范围内。
S580,突出显示命中区块或使用关键词、关键词的缩略词以及关键词的替代词之一对命中区块进行标记。
其中,所述关键词可以为一个,也可以为多个,若关键词为一个,则直接对关键词进行标记,若关键词为多个,则可以依次对关键词进行标记,本发明实施例对此不进行限制。
具体的,突出显示所述命中区块或使用所述关键词、关键词的缩略词以及关键词的替代词之一对所述命中区块进行标记的方式可以为直接对命中区块标记关键词,也可以预先设定关键词与标记符号的对应关系,根据关键词查询到与之对应的标记符号,对命中区块标记查询到的标记符号,例如可以是,可以直接对命中区块标记关键词A,也可以预先设定关键词A对应Q,则可以对命中区块标记Q。
可选的,所述确定所述关键词在所述文本区域的命中位置,包括:
获取所述关键词在所述文本区域匹配成功时的行数作为第一位置参数。
其中,所述第一位置参数为关键词在所述文本区域匹配成功时的行数。
获取所述关键词在所述文本区域匹配成功时的行偏移量作为第二位置参数。
其中,所述第二位置参数为关键词在所述文本区域匹配成功时的行偏移量。
根据所述第一位置参数和第二位置参数确定所述命中位置。
具体的,不同的搜索条件同一个区域根据有不同的命中展现方式。比如,如图6B所示,有这样的检索式,有三个检索条件C1、C2、C3,检索之后,如图6C所示,左边是本发明实施例中的专利文献或专利申请文献搜索结果列表的一个子项,右边是现有技术中的检索结果,在搜索结果页的展现效果如下,命中区块5对应C1的命中区块,命中区块6对应C2的命中区块,命中区块7对应C3的命中区块,C1,C2,C3在说明书区域中的命中不同位置,这些不同的区块和提示信息,本实施例分别为C1,C2,C3,可以很好的帮助预览者,更好的快速定位到检索的地方,进行预览和查看。
例如可以是,以说明书区域来说明,其余的区域方法一样。如图6D所示,把说明书区域分成x*y区块。
针对不同的检索式中的关键词在文本区域的命中位置公式为:
SearchC[i]={Xn,Ym}
其中,SearchC[i]表示检索式中不同的关键词,不同的逻辑运算符之间为一个独立的关键词,比如TA:(5g)AND ALL_AN:(华为)AND DESC:(通信)这样的检索式就有三个关键词,分别是:SearchC[1]:就是TA:(5g),SearchC[2]:ALL_AN:(华为),SearchC[3]:DESC:(通信)。
具体的,{Xn,Ym}为不同关键词在文本区域的命中位置,具体来讲是根据搜索引擎solr返回的offset,来计算关键词在所述文本区域匹配成功时的行数Xn,然后根据具体行数以及每一行的字符宽度,Offset-Xn*Linewidth得到关键词在所述文本区域匹配成功时的行偏移量,然后根据矩形对文本区域的分割,最终可以计算出落在哪个区块中,也就是命中区块。需注意的是同一个关键词,可能会出现不同的匹配游标(offset),那么这个时候就是针对同一个关键词返回一个矩形的集合SearchC[i]={Xn,Ym}。
如图6E所示,其展示方式的展现方式,不仅仅是矩形,可以是椭圆形,正方形,圆形或者其它的不同布局方式来表示不同的区域命中的分布。也可以是横向的,后者纵向的排列方式。
本发明实施例可以提升用户搜索体验,专利文献或专利申请文献搜索是一种专业的结构化数据的搜索方式,那么结果页的展现方式也需要是结构化的,可以针对用户输入的关键词进行准确匹配。另外本发明实施例可以用于专利文献或专利申请文献搜索,或者其它文章的结构化搜索,比如论文、或者其它的结构化的文本,所以保护范围可以是任何的具有结构化的显示方式,它不仅仅局限于TACDB的表现方式,只要是结构化的可被搜索的数据,都可以通过本发明实施例中的检索展示方法进行展示,进而增强用户搜索体验。
本实施例的技术方案,通过预先设定目标文档的不同文本区域的面积权重,根据文本区域的面积权重与文本区域对应文本内容的长度的乘积确定文本区域的展示面积,根据展示面积生成不同文本区域的展示方式,确定关键词在文本区域的命中位置,命中位置为关键词和文本区域的文本内容匹配成功时的位置,突出显示命中区块或使用关键词、关键词的缩略词以及关键词的替代词之一对命中区块进行标记,能够很好的帮助预览者,更好的快速定位到检索的地方,进行预览和查看,增强用户搜索体验。
实施例六
图7为本发明实施例六提供的一种检索展示装置的结构示意图。本实施例可适用于检索展示的情况,该装置可采用软件和/或硬件的方式实现,该装置可集成在任何提供检索展示功能的设备中,如图7所示,所述检索展示装置具体包括:获取模块610、生成模块620和显示模块630。
其中,获取模块610,用于获取用户输入的关键词;
生成模块620,用于将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;
显示模块630,用于显示所述展示方式。
可选的,生成模块包括:
设定单元,用于预先设定所述目标文档的不同文本区域的面积权重;
确定单元,用于根据所述文本区域的面积权重与所述文本区域对应文本内容的长度的乘积确定所述文本区域的展示面积;
图形生成单元,用于根据所述展示面积生成不同文本区域的展示方式。
可选的,所述生成模块包括:
第一命中数确定单元,用于确定所述关键词在所述文本区域的第一命中数,所述第一命中数为所述关键词和文本区域的文本内容匹配的次数;
匹配权重确定单元,用于根据所述第一命中数确定所述文本区域的匹配权重;
展示颜色确认单元,用于根据所述匹配权重在第一数据库确认对应文本区域的展示颜色,所述第一数据库中预先建立关于展示颜色与匹配权重之间的对应关系;
展示方式生成单元,用于根据所述展示颜色生成不同文本区域的展示方式。
可选的,所述文本区域包括多个不同区块,生成模块具体用于:
确定所述关键词在文本区域的不同区块的第二命中数,所述第二命中数为所述关键词和文本区域的不同区块的文本内容匹配的次数;
根据所述第二命中数确定所述不同区块的热力权重;
根据所述热力权重在第二数据库确认对应文本区域的颜色深度,所述第二数据库中预先建立关于颜色深度与热力权重之间的对应关系;
根据所述颜色深度生成不同文本区域的展示方式。
可选的,还包括:
命中位置确定单元,用于确定所述关键词在所述文本区域的命中位置,所述命中位置为所述关键词和文本区域的文本内容匹配成功时的位置;
命中区块确定单元,用于根据所述命中位置确定命中区块,所述命中位置处于所述命中区块的范围内;
标记单元,用于突出显示所述命中区块或使用所述关键词、关键词的缩略词以及关键词的替代词之一对所述命中区块进行标记。
可选的,命中位置确定单元具体用于:
获取所述关键词在所述文本区域匹配成功时的行数作为第一位置参数;
获取所述关键词在所述文本区域匹配成功时的行偏移量作为第二位置参数;
根据所述第一位置参数和第二位置参数确定所述命中位置。
可选的,所述展示方式包括:矩形、圆形、椭圆中的至少一种。
上述产品可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
本实施例的技术方案,通过获取用户输入的关键词;将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;显示所述展示方式,能够优化搜索功能,增强用户搜索体验。
实施例七
图8为本发明实施例七中的一种计算机设备的结构示意图。图8示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图8显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储器28,连接不同***组件(包括***存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
计算机设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
***存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图8未显示,通常称为“硬盘驱动器”)。尽管图8中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。另外,本实施例中的计算机设备12,显示器24不是作为独立个体存在,而是嵌入镜面中,在显示器24的显示面不予显示时,显示器24的显示面与镜面从视觉上融为一体。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理单元16通过运行存储在***存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的检索展示方法:获取用户输入的关键词;将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;显示所述展示方式。
实施例八
本发明实施例八提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有发明实施例提供的检索展示方法:获取用户输入的关键词;将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;显示所述展示方式。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种检索展示方法,其特征在于,包括:
获取用户输入的关键词;
将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;
显示所述展示方式。
2.根据权利要求1所述的方法,其特征在于,所述将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式,包括:
预先设定所述目标文档的不同文本区域的面积权重;
根据所述文本区域的面积权重与所述文本区域对应文本内容的长度的乘积确定所述文本区域的展示面积;
根据所述展示面积生成不同文本区域的展示方式。
3.根据权利要求1所述的方法,其特征在于,生成不同文本区域的展示方式包括:
确定所述关键词在所述文本区域的第一命中数,所述第一命中数为所述关键词和文本区域的文本内容匹配的次数;
根据所述第一命中数确定所述文本区域的匹配权重;
根据所述匹配权重在第一数据库确认对应文本区域的展示颜色,所述第一数据库中预先建立关于展示颜色与匹配权重之间的对应关系;
根据所述展示颜色生成不同文本区域的展示方式。
4.根据权利要求1所述的方法,其特征在于,所述文本区域包括多个不同区块,生成不同文本区域的展示方式包括:
确定所述关键词在文本区域的不同区块的第二命中数,所述第二命中数为所述关键词和文本区域的不同区块的文本内容匹配的次数;
根据所述第二命中数确定所述不同区块的热力权重;
根据所述热力权重在第二数据库确认对应文本区域的颜色深度,所述第二数据库中预先建立关于颜色深度与热力权重之间的对应关系;
根据所述颜色深度生成不同文本区域的展示方式。
5.根据权利要求1所述的方法,其特征在于,所述文本区域包括多个不同区块,生成不同文本区域的展示方式之后,还包括:
确定所述关键词在所述文本区域的命中位置,所述命中位置为所述关键词和文本区域的文本内容匹配成功时的位置;
根据所述命中位置确定命中区块,所述命中位置处于所述命中区块的范围内;
突出显示所述命中区块或使用所述关键词、关键词的缩略词以及关键词的替代词之一对所述命中区块进行标记。
6.根据权利要求5所述的方法,其特征在于,所述确定所述关键词在所述文本区域的命中位置,包括:
获取所述关键词在所述文本区域匹配成功时的行数作为第一位置参数;
获取所述关键词在所述文本区域匹配成功时的行偏移量作为第二位置参数;
根据所述第一位置参数和第二位置参数确定所述命中位置。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述展示方式包括:矩形、圆形、椭圆中的至少一种。
8.一种检索展示装置,其特征在于,包括:
获取模块,用于获取用户输入的关键词;
生成模块,用于将所述关键词与目标文档的不同文本区域进行匹配,以生成不同文本区域的展示方式;
显示模块,用于显示所述展示方式。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN201910180992.3A 2019-03-11 2019-03-11 一种检索展示方法、装置、设备及存储介质 Active CN109933702B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910180992.3A CN109933702B (zh) 2019-03-11 2019-03-11 一种检索展示方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910180992.3A CN109933702B (zh) 2019-03-11 2019-03-11 一种检索展示方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109933702A true CN109933702A (zh) 2019-06-25
CN109933702B CN109933702B (zh) 2022-12-16

Family

ID=66986710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910180992.3A Active CN109933702B (zh) 2019-03-11 2019-03-11 一种检索展示方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109933702B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111144210A (zh) * 2019-11-26 2020-05-12 泰康保险集团股份有限公司 图像的结构化处理方法及装置、存储介质及电子设备
CN112445830A (zh) * 2020-11-26 2021-03-05 湖南智慧政务区块链科技有限公司 一种基于区块链技术的数据分析***
CN117573847A (zh) * 2024-01-16 2024-02-20 浙江同花顺智能科技有限公司 可视化答案的生成方法、装置、设备及存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008104621A1 (es) * 2007-02-28 2008-09-04 Classe Qsl, S.L. Sistema para la recuperación de unidades de información
CN101419661A (zh) * 2007-10-26 2009-04-29 国际商业机器公司 基于图像中的文本进行图像显示的方法和***
CN102902688A (zh) * 2011-07-27 2013-01-30 汉王科技股份有限公司 关键词查找结果显示方法和装置
CN103150368A (zh) * 2013-03-07 2013-06-12 青岛海信电器股份有限公司 信息搜索及显示方法和装置
US20130262442A1 (en) * 2012-03-30 2013-10-03 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of National Defence Method for Displaying Search Results
CN103473282A (zh) * 2013-08-29 2013-12-25 北京奇虎科技有限公司 一种生成热点内容页面的装置和方法
CN103631856A (zh) * 2013-10-17 2014-03-12 四川大学 一种中文文档集的主题可视化方法
CN104361042A (zh) * 2014-10-29 2015-02-18 中国建设银行股份有限公司 一种信息检索方法及装置
CN105005562A (zh) * 2014-04-15 2015-10-28 索意互动(北京)信息技术有限公司 检索结果的显示处理方法及装置
CN106503468A (zh) * 2016-11-05 2017-03-15 深圳市前海安测信息技术有限公司 医疗信息化基于匹配关键字的电子病历分析***及方法
CN106844717A (zh) * 2017-02-08 2017-06-13 北京小米移动软件有限公司 网页搜索显示方法及装置
CN108038096A (zh) * 2017-11-10 2018-05-15 平安科技(深圳)有限公司 知识库文档快速检索方法、应用服务器计算机可读存储介质
CN108984685A (zh) * 2018-06-29 2018-12-11 天津字节跳动科技有限公司 一种自动显示文档目录的方法及装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008104621A1 (es) * 2007-02-28 2008-09-04 Classe Qsl, S.L. Sistema para la recuperación de unidades de información
CN101419661A (zh) * 2007-10-26 2009-04-29 国际商业机器公司 基于图像中的文本进行图像显示的方法和***
CN102902688A (zh) * 2011-07-27 2013-01-30 汉王科技股份有限公司 关键词查找结果显示方法和装置
US20130262442A1 (en) * 2012-03-30 2013-10-03 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of National Defence Method for Displaying Search Results
CN103150368A (zh) * 2013-03-07 2013-06-12 青岛海信电器股份有限公司 信息搜索及显示方法和装置
CN103473282A (zh) * 2013-08-29 2013-12-25 北京奇虎科技有限公司 一种生成热点内容页面的装置和方法
CN103631856A (zh) * 2013-10-17 2014-03-12 四川大学 一种中文文档集的主题可视化方法
CN105005562A (zh) * 2014-04-15 2015-10-28 索意互动(北京)信息技术有限公司 检索结果的显示处理方法及装置
CN104361042A (zh) * 2014-10-29 2015-02-18 中国建设银行股份有限公司 一种信息检索方法及装置
CN106503468A (zh) * 2016-11-05 2017-03-15 深圳市前海安测信息技术有限公司 医疗信息化基于匹配关键字的电子病历分析***及方法
CN106844717A (zh) * 2017-02-08 2017-06-13 北京小米移动软件有限公司 网页搜索显示方法及装置
CN108038096A (zh) * 2017-11-10 2018-05-15 平安科技(深圳)有限公司 知识库文档快速检索方法、应用服务器计算机可读存储介质
CN108984685A (zh) * 2018-06-29 2018-12-11 天津字节跳动科技有限公司 一种自动显示文档目录的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
何明贵: "可视化搜索引擎模型与方法研究", 《中国博士学位论文全文数据库 信息科技辑》 *
唐培丽 等: "全文检索搜索引擎中文信息处理技术研究", 《情报科学》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111144210A (zh) * 2019-11-26 2020-05-12 泰康保险集团股份有限公司 图像的结构化处理方法及装置、存储介质及电子设备
CN111144210B (zh) * 2019-11-26 2023-07-18 泰康保险集团股份有限公司 图像的结构化处理方法及装置、存储介质及电子设备
CN112445830A (zh) * 2020-11-26 2021-03-05 湖南智慧政务区块链科技有限公司 一种基于区块链技术的数据分析***
CN112445830B (zh) * 2020-11-26 2024-05-14 湖南智慧政务区块链科技有限公司 一种基于区块链技术的数据分析***
CN117573847A (zh) * 2024-01-16 2024-02-20 浙江同花顺智能科技有限公司 可视化答案的生成方法、装置、设备及存储介质
CN117573847B (zh) * 2024-01-16 2024-05-07 浙江同花顺智能科技有限公司 可视化答案的生成方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN109933702B (zh) 2022-12-16

Similar Documents

Publication Publication Date Title
CN103329126B (zh) 利用联合图像-音频查询的搜索
US11449767B2 (en) Method of building a sorting model, and application method and apparatus based on the model
WO2022116537A1 (zh) 一种资讯推荐方法、装置、电子设备和存储介质
JP6381002B2 (ja) 検索推奨方法及び装置
CN102915322B (zh) 情感数据生成的***和方法
CN108897867A (zh) 用于知识问答的数据处理方法、装置、服务器和介质
US7065521B2 (en) Method for fuzzy logic rule based multimedia information retrival with text and perceptual features
CN109933702A (zh) 一种检索展示方法、装置、设备及存储介质
US20130124515A1 (en) Method for document search and analysis
JP5587989B2 (ja) 観点別特許マップの提供方法
JP2010511936A (ja) ランク・グラフ
CN109299320A (zh) 一种信息交互方法、装置、计算机设备和存储介质
CN101460947A (zh) 基于内容的图像检索
CN108563655A (zh) 基于文本的事件识别方法和装置
WO2015061046A2 (en) Method and apparatus for performing topic-relevance highlighting of electronic text
WO2020199600A1 (zh) 情感极性分析方法及相关装置
CN109033385A (zh) 图片检索方法、装置、服务器及存储介质
JP5516918B2 (ja) 画像要素検索
CN113010657B (zh) 基于解答文本的答案处理方法和答案推荐方法
KR20140050217A (ko) 키워드 연관 관계 시각화 제공 시스템 및 방법과, 이를 지원하는 장치
CN109035256A (zh) 用户界面图像切割方法、装置、服务器和存储介质
CN108319586A (zh) 一种信息提取规则的生成和语义解析方法及装置
CN107861948A (zh) 一种标签提取方法、装置、设备和介质
CN109657127A (zh) 一种答案获取方法、装置、服务器及存储介质
US11403339B2 (en) Techniques for identifying color profiles for textual queries

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant