CN112347324B - 一种文档查询方法、装置、电子设备及存储介质 - Google Patents

一种文档查询方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112347324B
CN112347324B CN201910731463.8A CN201910731463A CN112347324B CN 112347324 B CN112347324 B CN 112347324B CN 201910731463 A CN201910731463 A CN 201910731463A CN 112347324 B CN112347324 B CN 112347324B
Authority
CN
China
Prior art keywords
document
target
list
path
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910731463.8A
Other languages
English (en)
Other versions
CN112347324A (zh
Inventor
黄伟铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Original Assignee
Beijing Kingsoft Office Software Inc
Zhuhai Kingsoft Office Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Office Software Inc, Zhuhai Kingsoft Office Software Co Ltd filed Critical Beijing Kingsoft Office Software Inc
Priority to CN201910731463.8A priority Critical patent/CN112347324B/zh
Publication of CN112347324A publication Critical patent/CN112347324A/zh
Application granted granted Critical
Publication of CN112347324B publication Critical patent/CN112347324B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种文档查询方法、装置、电子设备及存储介质。该文档查询方法包括:获得按文档内容查询文档的查询指令,该查询指令中携带有关键词;从文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有关键词的目标文档;当查找到时,将所查找到的目标文档作为查询结果。本发明可以在不依赖于文档名称的前提下,实现文档查询。

Description

一种文档查询方法、装置、电子设备及存储介质
技术领域
本发明涉及数据检索技术领域,特别是涉及一种文档查询方法、装置、电子设备及存储介质。
背景技术
在数据检索技术领域中,很多文档处理客户端除了具有文档编辑功能,通常还具有查找文档的功能。
现有技术中,应用于文档处理客户端的文档查询方法包括:接收用户输入的关键词,从文档处理客户端自身所支持文档类型下的各个文档中,查找文档名称包含上述关键词的文档,并将查找到的文档作为查询结果。
然而,当用户忘记了文档名称时,现有的文档查询方法,无法为用户提供文档查询服务。可见,在不依赖于文档名称的前提下,如何实现文档查询,是一个亟待解决的问题。
发明内容
本发明实施例的目的在于提供一种文档查询方法、装置、电子设备及存储介质,以在不依赖于文档名称的前提下,如何实现文档查询。具体技术方案如下:
第一方面,本发明实施例提供了一种文档查询方法,该方法应用于文档处理客户端,包括:
获得按文档内容查询文档的查询指令,所述查询指令中携带有关键词;
从所述文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有所述关键词的目标文档;
当查找到时,将所查找到的目标文档作为查询结果。
可选地,所述从所述文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有所述关键词的目标文档的步骤,包括:
针对所述文档处理客户端所支持文档类型下的每个文档,读取该文档的文档内容,并从所读取的文档内容中查找包含有所述关键词的目标段落;当查找到所述目标段落时,将该文档作为包含有所述关键词的目标文档。
可选地,所述读取该文档的文档内容的步骤,包括:
以后台打开的方式打开该文档,从所打开的该文档中读取文档内容;
其中,所述后台打开的方式为向用户隐藏所打开的文档的文档打开方式。
可选地,所述方法还包括:
展示所查找到的目标文档的文档名称、文档路径以及目标段落。
可选地,所述展示所查找到的目标文档的文档名称、文档路径以及目标段落,包括:
展示以所查找到的目标文档的文档名称、文档路径以及目标段落作为列表内容的文档列表;其中,所述文档列表中的每一列表项包括一个目标文档的文档名称、文档路径以及目标段落。
可选地,所述展示以所查找到的目标文档的文档名称、文档路径以及目标段落作为列表内容的文档列表的步骤之后,所述方法还包括:
当接收到针对所述文档列表中任一列表项的点击指令时,根据该列表项所包括的文档路径,打开具有该列表项所包括文档名称的目标文档。
第二方面,本发明实施例提供了一种文档查询装置,该装置应用于文档处理客户端,包括:
获得模块,用于获得按文档内容查询文档的查询指令,所述查询指令中携带有关键词;
查找模块,用于从所述文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有所述关键词的目标文档;
确定模块,用于当查找到时,将所查找到的目标文档作为查询结果。
可选地,所述查找模块,包括查找子模块和确定子模块:
所述查找子模块,用于针对所述文档处理客户端所支持文档类型下的每个文档,读取该文档的文档内容,并从所读取的文档内容中查找包含有所述关键词的目标段落;
所述确定子模块,用于当所述查找子模块查找到所述目标段落时,将该文档作为包含有所述关键词的目标文档。
可选地,所述查找子模块读取该文档的文档内容,包括:
以后台打开的方式打开该文档,从所打开的该文档中读取文档内容;
其中,所述后台打开的方式为向用户隐藏所打开的文档的文档打开方式。
可选地,所述装置还包括:展示模块;
所述展示模块,用于展示所查找到的目标文档的文档名称、文档路径以及目标段落。
可选地,所述展示模块,具体用于:
展示以所查找到的目标文档的文档名称、文档路径以及目标段落作为列表内容的文档列表;其中,所述文档列表中的每一列表项包括一个目标文档的文档名称、文档路径以及目标段落。
可选地,所述装置还包括:文档打开模块;
所述文档打开模块,用于当接收到针对所述文档列表中任一列表项的点击指令时,根据该列表项所包括的文档路径,打开具有该列表项所包括文档名称的目标文档。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的文档查询方法。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的文档查询方法。
在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的文档查询方法。
本发明实施例提供的方案中,可以深入到文档内容中,查找查询关键词;当文档内容中包含有查询关键词,则找到目标文档。这样,即使在用户忘记了文档名称的情况下,也可以用文档内容中的词或句子作为查询关键词来查询文档。可见,本方案可以在不依赖于文档名称的前提下实现文档查询。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的一种文档查询方法的流程图;
图2为本发明实施例提供的一种文档查询装置的结构示意图;
图3为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
为了在不依赖于文档名称的前提下实现文档查询,本发明实施例提供了一种文档查询方法、装置、电子设备及存储介质。
需要说明的是,本发明实施例提供的文档查询方法的执行主体,可以为一种文档查询装置,该装置可以应用于电子设备中。可以理解的是,该装置为该电子设备中的文档处理客户端的一个软件功能模块。在具体应用中,该电子设备可以为智能手机、计算机、平板设备、医疗设备、娱乐设备、健身设备,或个人数字助理等。
另外,本发明实施例提供的文档查询方法,所针对的文档可以为后缀为wps、doc、docx、txt、rtf、ppt、et、xls、html以及pdf等类型的文档。
首先,对本发明实施例提供的一种文档查询方法进行详细说明。如图1所示,该方法可以包括以下步骤:
S101:获得按文档内容查询文档的查询指令,该查询指令中携带有关键词。
其中,用户发出按文档内容查询文档的查询指令的实现方式存在多种。
示例性的,在一种实现方式中,文档处理客户端中可以设置有输入框,在该输入框附近,可以分别设置有按文档名称查询文档的按钮和按文档内容查询文档的按钮;用户可以通过选择不同的按钮,选择不同的内容查询方式。如果用户在输入框中输入关键词,并点击按文档内容查询文档的按钮,则发出按文档内容查询文档的查询指令;相应的,文档处理客户端便可以获得按文档内容查询文档的查询指令,且该指令中携带有用户在输入框中所输入的关键词。
示例性的,在另一种实现方式中,文档处理客户端中可以设置有输入框,输入框附近可以只设置一个按钮。如果用户在输入框中输入关键词,并点击该按钮,则发出携带有关键词的查询指令;相应的,文档处理客户端可以获得查询指令,且默认查询指令是按文档内容查询文档的查询指令。
示例性的,在又一种实现方式中,文档处理客户端中可以设置有用于按文档内容查询文档的语音输入按钮。如果用户操作该语音输入按钮,并输入语音,则发出携带有该语音对应的关键词的查询指令;相应的,文档处理客户端可以获得查询指令,且查询指令默认是按文档内容查询文档的查询指令。
在具体应用中,上述的输入框附近可以为:与输入框的左侧、右侧、上侧或下侧相距预定距离的位置,该预定距离可以根据实际情况设定,在此不做限定。另外,可以理解的是,文档的文档内容也可以包含有文档名称,因此,按文档内容查询文档,也可以一并实现按文档名称查询文档的功能。
S102:从文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有该关键词的目标文档。
这里,文档处理客户端所支持文档类型,可以是文档处理客户端所能够打开并读取文档内容的文档类型。
其中,从文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有该关键词的目标文档的具体实现方式存在多种。示例性的,在一种实现方式中,从文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有该关键词的目标文档,可以包括:
针对文档处理客户端所支持文档类型下的每个文档,读取该文档的文档内容,并从所读取的文档内容中查找包含有关键词的目标段落;当查找到目标段落时,将该文档作为包含有关键词的目标文档。
其中,包含有关键词的目标段落可以为:文档内容中,由关键词所在位置的前m个字符、关键词以及关键词所在位置的后n个字符所构成的字符串。这里,m与n可以相等,例如m和n均可以等于20,当然m和n也可以不相等。或者,包含有关键词的目标段落可以为,文档内容中,关键词所在的句子。其中,文档内容中的句子可以是以标点符号来划分的。
在另一种实现方式中,从文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有该关键词的目标文档,可以包括:
针对文档处理客户端所支持文档类型下的每个文档,读取该文档的文档内容,判断所读取的文档内容中是否包含该关键词;如果存在,将该文档作为包含有关键词的目标文档。当然,从文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有该关键词的目标文档的具体实现方式,并不局限于上述所示出的两种。
在实际应用中,在查找目标文档时,可以预先创建两个空的文档集合,一个用于记录所遍历到的文档处理客户端所支持文档类型下的文档,另一个用于记录所查找到的目标文档。为了便于区分,可以对这两个集合分别进行命名。例如,将用于记录所查找到的目标文档的集合命名为“result_list”,另一个集合命名为“file_list”。
其中,在查找目标文档时,可以对安装有文档处理客户端的电子设备的本地磁盘进行递归遍历,每当遍历到一个文档处理客户端所支持文档类型下的文档,就将该文档的文档路径以及文档名称均记录至该“file_list”集合;或者,将该文档的文档路径记录至该“file_list”集合中。当遍历完成后,根据该“file_list”集合所记录的信息,依次确定该“file_list”集合所记录的每个文档是否为目标文档;当确定任一文档为目标文档时,将该目标文档的文档路径、文档名称记录至该“result_list”集合中;或者,可以将该目标文档的文档路径、文档名称以及目标段落记录至该“result_list”集合中。当然,还要从“file_list”集合中,移除该目标文档。
可以理解的是,上述的文档路径,是本地磁盘中的物理路径。并且,当“file_list”集合仅记录文档路径时,该物理路径可以是能够定位到文档的物理路径,也就是说,利用该物理路径,可以唯一地定位到一个文档。
S103:当查找到时,将所查找到的目标文档作为查询结果。
可以理解的是,文档内容包含有关键词的目标文档可以不止一个,因此,这里将所查找到的目标文档作为查询结果,是指将所查找到的所有目标文档作为查询结果。另外,在将所查找到的目标文档作为查询结果后,可以输出所查找的目标文档。
本发明实施例提供的文档查询方法,可以深入到文档内容中,查找查询关键词;当文档内容中包含有查询关键词,则找到目标文档。这样,即使在用户忘记了文档名称的情况下,也可以用文档内容中的词或句子作为查询关键词来查询文档。可见,本方案可以在不依赖于文档名称的前提下实现文档查询。
另外,由于用户更关心的是查找结果,因此,在具体应用中,可以将查找目标文档的过程向用户屏蔽,从而避免向用户展示过多的查询过程。基于该种处理思路,在一种实现方式中,针对文档处理客户端所支持文档类型下的每个文档,读取该文档的文档内容的步骤,可以包括:
以后台打开的方式打开该文档,从所打开的该文档中读取文档内容;
其中,该后台打开的方式为向用户隐藏所打开的文档的文档打开方式。
当然,以后台打开的方式打开该文档的具体实现方式,可以采用任一种能够实现文档后台打开的方式,在此不做限定。
可选地,在一种实现方式中,在通过查找目标段落的方式查找目标文档的实现方式的基础上,在将所查找到的目标文档作为查询结果后,所述方法还可以包括:
展示所查找到的目标文档的文档名称、文档路径以及目标段落。
其中,展示所查找到的目标文档的文档名称、文档路径以及目标段落的具体展示方式,可以存在多种。示例性的,展示所查找到的目标文档的文档名称、文档路径以及目标段落,可以包括:
展示以所查找到的目标文档的文档名称、文档路径以及目标段落作为列表内容的文档列表;其中,所述文档列表中的每一列表项包括一个目标文档的文档名称、文档路径以及目标段落。
其中,针对任一目标文档,当该文档目标中的目标段落的数量较多时,可以从该目标文档中选择一个目标段落,展示在上述的文档列表中。具体的,可以选择该目标文档的文档内容中,第一个目标段落;或者,当目标段落是关键字所在的句子时,可以选择字数最小的目标段落等等,这都是合理的。
另外,在展示时,可以将所展示的目标段落中的关键字,以区别于该目标段落中的其他文字的颜色进行展示。
在实际应用中,文档列表中的每一列表项可以是该文档列表的一行,也可以是该文档列表的一列。
在一种实现方式中,在展示以所查找到的目标文档的文档名称、文档路径以及目标段落作为列表内容的文档列表之后,本发明实施例提供的文档查询方法,还可以包括:
当接收到针对文档列表中任一列表项的点击指令时,根据该列表项所包括的文档路径,打开具有该列表项所包括文档名称的目标文档。
这里,该点击指令可以是由文档处理客户端的用户所发出的。
在实际应用中,可以将文档列表中的每一列表项设置为一个可点击的列表项;点击该列表项后的跳转地址即是该列表项所包括的文档路径;当点击列表项时,可以根据该跳转地址,打开具有该列表项所包括文档名称的目标文档。或者,可以将列表项中的文档路径设置为链接地址,这样,当接收到点击该链接地址的指令时,可以根据该链接地址,打开具有该列表项所包括文档名称的目标文档。
为了方案清楚,下面以一具体实施例为例,对本发明实施例提供的文档查询方法进行说明,该实施例具体可以包括以下步骤:
步骤1:获得按文档内容查询文档的查询指令,该查询指令中携带有关键词;
步骤2:对安装有文档处理客户端的电子设备的本地磁盘进行递归遍历,每当遍历到一个文档处理客户端所支持文档类型下的文档,将该文档的文档路径以及文档名称均记录至该“file_list”集合;递归遍历完成后,转入步骤3;
步骤3:针对“file_list”集合中的每个文档,以后台打开的方式打开该文档,从所打开的该文档中读取文档内容,并从所读取的文档内容中查找包含有该关键词的目标段落;当查找到目标段落时,将该目标文档的文档路径、文档名称记录至该“result_list”集合中;或者,将该目标文档的文档路径、文档名称以及目标段落记录至该“result_list”集合中;从“file_list”集合中移除该目标文档;
步骤4:展示以“result_list”集合中的目标文档的文档名称、文档路径以及目标段落作为列表内容的文档列表;其中,该文档列表中的每一列表项包括一个目标文档的文档名称、文档路径以及目标段落;并且,在展示时,将所展示的目标段落中的关键字,以区别于目标段落中的其他文字的颜色进行展示。
可选地,在一种实现方式中,每当“result_list”集合中新增一个目标文档,便实时地生成并展示该目标文档的文档名称、文档路径以及目标段落所形成的列表项。可以理解的是,当“file_list”集合中的文档全部被移除时,各个目标文档所生成的全部列表项即构成了目标文档的文档列表。
可选地,在一种实现方式中,当接收到针对文档列表中任一列表项的点击指令时,该实施例还可以包括步骤5:根据该列表项所包括的文档路径,打开具有该列表项所包括文档名称的目标文档。
根据该具体实施例可见,本方案可以在不依赖于文档名称的前提下实现文档查询,即使用户忘记了文档名称,也可以实现文档查询,相较于现有的文档查询方法,本方案扩大了文档查询的适用范围。
相应于上述的一种文档查询方法,本发明实施例还提供了一种文档查询装置,如图2所示,该装置包括:
获得模块201,用于获得按文档内容查询文档的查询指令,所述查询指令中携带有关键词;
查找模块202,用于从所述文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有所述关键词的目标文档;
确定模块203,用于当查找到时,将所查找到的目标文档作为查询结果。
可以理解的是,文档内容包含有关键词的目标文档可以不止一个,因此,这里将所查找到的目标文档作为查询结果,是指将所查找到的所有目标文档作为查询结果。
可选地,所述查找模块202,可以包括:查找子模块和确定子模块:
所述查找子模块,用于针对所述文档处理客户端所支持文档类型下的每个文档,读取该文档的文档内容,并从所读取的文档内容中查找包含有所述关键词的目标段落;
所述确定子模块,用于当所述查找子模块查找到所述目标段落时,将该文档作为包含有所述关键词的目标文档。
可选地,所述查找子模块读取该文档的文档内容,可以包括:
以后台打开的方式打开该文档,从所打开的该文档中读取文档内容;
其中,所述后台打开的方式为向用户隐藏所打开的文档的文档打开方式。
可选地,所述装置还可以包括:展示模块;
所述展示模块,用于展示所查找到的目标文档的文档名称、文档路径以及目标段落。
可选地,所述展示模块,可以具体用于:
展示以所查找到的目标文档的文档名称、文档路径以及目标段落作为列表内容的文档列表;其中,所述文档列表中的每一列表项包括一个目标文档的文档名称、文档路径以及目标段落。
在实际应用中,文档列表中的每一列表项可以是该文档列表的一行,也可以是该文档列表的一列。
另外,在展示时,可以将所展示的目标段落中的关键字,以区别于该目标段落中的其他文字的颜色进行展示。
可选地,所述装置还可以包括:文档打开模块;
所述文档打开模块,用于当接收到针对所述文档列表中任一列表项的点击指令时,根据该列表项所包括的文档路径,打开具有该列表项所包括文档名称的目标文档。
这里,该点击指令可以是由文档处理客户端的用户所发出的。
本发明实施例提供的文档查询装置,可以深入到文档内容中,查找查询关键词;当文档内容中包含有查询关键词,则找到目标文档。这样,即使在用户忘记了文档名称的情况下,也可以用文档内容中的词或句子作为查询关键词来查询文档。可见,本方案可以在不依赖于文档名称的前提下实现文档查询。
本发明实施例还提供了一种电子设备,如图3所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信,
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现如下步骤:
获得按文档内容查询文档的查询指令,所述查询指令中携带有关键词;
从所述文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有所述关键词的目标文档;
当查找到时,将所查找到的目标文档作为查询结果。
可选地,所述从所述文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有所述关键词的目标文档的步骤,包括:
针对所述文档处理客户端所支持文档类型下的每个文档,读取该文档的文档内容,并从所读取的文档内容中查找包含有所述关键词的目标段落;当查找到所述目标段落时,将该文档作为包含有所述关键词的目标文档。
可选地,所述读取该文档的文档内容的步骤,包括:
以后台打开的方式打开该文档,从所打开的该文档中读取文档内容;
其中,所述后台打开的方式为向用户隐藏所打开的文档的文档打开方式。
可选地,所述方法还包括:
展示所查找到的目标文档的文档名称、文档路径以及目标段落。
可选地,所述展示所查找到的目标文档的文档名称、文档路径以及目标段落,包括:
展示以所查找到的目标文档的文档名称、文档路径以及目标段落作为列表内容的文档列表;其中,所述文档列表中的每一列表项包括一个目标文档的文档名称、文档路径以及目标段落。
可选地,所述展示以所查找到的目标文档的文档名称、文档路径以及目标段落作为列表内容的文档列表的步骤之后,所述方法还包括:
当接收到针对所述文档列表中任一列表项的点击指令时,根据该列表项所包括的文档路径,打开具有该列表项所包括文档名称的目标文档。
本发明实施例提供的电子设备,可以深入到文档内容中,查找查询关键词;当文档内容中包含有查询关键词,则找到目标文档。这样,即使在用户忘记了文档名称的情况下,也可以用文档内容中的词或句子作为查询关键词来查询文档。可见,本方案可以在不依赖于文档名称的前提下实现文档查询。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的文档查询方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的文档查询方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备及计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (14)

1.一种文档查询方法,其特征在于,应用于文档处理客户端,所述方法包括:
获得按文档内容查询文档的查询指令,所述查询指令中携带有关键词;
从所述文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有所述关键词的目标文档;
当查找到时,将所查找到的目标文档作为查询结果;
其中,所述从所述文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有所述关键词的目标文档,包括:
对磁盘进行递归遍历,每当遍历到一个所述文档处理客户端所支持文档类型下的文档,就将该文档的文档路径以及文档名称均记录至文件列表集合;或者,将该文档的文档路径记录至该文件列表集合中;
当遍历完成后,根据该文件列表集合所记录的信息,依次确定该文件列表集合所记录的每个文档是否为目标文档;在确定任一文档为目标文档的情况下,将所述目标文档的文档路径、文档名称记录至结果列表集合中;或者,将所述目标文档的文档路径、文档名称以及目标段落记录至该结果列表集合中,并从文件列表集合中移除所述目标文档。
2.根据权利要求1所述的方法,其特征在于,所述从所述文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有所述关键词的目标文档的步骤,包括:
针对所述文档处理客户端所支持文档类型下的每个文档,读取该文档的文档内容,并从所读取的文档内容中查找包含有所述关键词的目标段落;当查找到所述目标段落时,将该文档作为包含有所述关键词的目标文档。
3.根据权利要求2所述的方法,其特征在于,所述读取该文档的文档内容的步骤,包括:
以后台打开的方式打开该文档,从所打开的该文档中读取文档内容;
其中,所述后台打开的方式为向用户隐藏所打开的文档的文档打开方式。
4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:
展示所查找到的目标文档的文档名称、文档路径以及目标段落。
5.根据权利要求4所述的方法,其特征在于,所述展示所查找到的目标文档的文档名称、文档路径以及目标段落,包括:
展示以所查找到的目标文档的文档名称、文档路径以及目标段落作为列表内容的文档列表;其中,所述文档列表中的每一列表项包括一个目标文档的文档名称、文档路径以及目标段落。
6.根据权利要求5所述的方法,其特征在于,所述展示以所查找到的目标文档的文档名称、文档路径以及目标段落作为列表内容的文档列表的步骤之后,所述方法还包括:
当接收到针对所述文档列表中任一列表项的点击指令时,根据该列表项所包括的文档路径,打开具有该列表项所包括文档名称的目标文档。
7.一种文档查询装置,其特征在于,应用于文档处理客户端,所述装置包括:
获得模块,用于获得按文档内容查询文档的查询指令,所述查询指令中携带有关键词;
查找模块,用于从所述文档处理客户端所支持文档类型下的各个文档中,查找文档内容包含有所述关键词的目标文档;
确定模块,用于当查找到时,将所查找到的目标文档作为查询结果;
其中,所述查找模块,具体用于:对磁盘进行递归遍历,每当遍历到一个所述文档处理客户端所支持文档类型下的文档,就将该文档的文档路径以及文档名称均记录至文件列表集合;或者,将该文档的文档路径记录至该文件列表集合中;
当遍历完成后,根据该文件列表集合所记录的信息,依次确定该文件列表集合所记录的每个文档是否为目标文档;在确定任一文档为目标文档的情况下,将所述目标文档的文档路径、文档名称记录至结果列表集合中;或者,将所述目标文档的文档路径、文档名称以及目标段落记录至该结果列表集合中,并从文件列表集合中移除所述目标文档。
8.根据权利要求7所述的装置,其特征在于,所述查找模块,包括查找子模块和确定子模块:
所述查找子模块,用于针对所述文档处理客户端所支持文档类型下的每个文档,读取该文档的文档内容,并从所读取的文档内容中查找包含有所述关键词的目标段落;
所述确定子模块,用于当所述查找子模块查找到所述目标段落时,将该文档作为包含有所述关键词的目标文档。
9.根据权利要求8所述的装置,其特征在于,所述查找子模块读取该文档的文档内容,包括:
以后台打开的方式打开该文档,从所打开的该文档中读取文档内容;
其中,所述后台打开的方式为向用户隐藏所打开的文档的文档打开方式。
10.根据权利要求8或9所述的装置,其特征在于,所述装置还包括:展示模块;
所述展示模块,用于展示所查找到的目标文档的文档名称、文档路径以及目标段落。
11.根据权利要求10所述的装置,其特征在于,所述展示模块,具体用于:
展示以所查找到的目标文档的文档名称、文档路径以及目标段落作为列表内容的文档列表;其中,所述文档列表中的每一列表项包括一个目标文档的文档名称、文档路径以及目标段落。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:文档打开模块;
所述文档打开模块,用于当接收到针对所述文档列表中任一列表项的点击指令时,根据该列表项所包括的文档路径,打开具有该列表项所包括文档名称的目标文档。
13.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6任一所述的方法步骤。
CN201910731463.8A 2019-08-08 2019-08-08 一种文档查询方法、装置、电子设备及存储介质 Active CN112347324B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910731463.8A CN112347324B (zh) 2019-08-08 2019-08-08 一种文档查询方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910731463.8A CN112347324B (zh) 2019-08-08 2019-08-08 一种文档查询方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112347324A CN112347324A (zh) 2021-02-09
CN112347324B true CN112347324B (zh) 2024-06-25

Family

ID=74366816

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910731463.8A Active CN112347324B (zh) 2019-08-08 2019-08-08 一种文档查询方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112347324B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113204579B (zh) * 2021-04-29 2024-06-07 北京金山数字娱乐科技有限公司 内容关联方法、***、装置、电子设备及存储介质
CN113435847A (zh) * 2021-06-30 2021-09-24 珠海金山办公软件有限公司 一种信息展示方法、装置、电子设备以及存储介质
CN117151051A (zh) * 2023-09-18 2023-12-01 上海鸿翼软件技术股份有限公司 文档处理方法、装置、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102902688A (zh) * 2011-07-27 2013-01-30 汉王科技股份有限公司 关键词查找结果显示方法和装置
CN109299244A (zh) * 2018-11-15 2019-02-01 天津字节跳动科技有限公司 一种在线文档检索方法、装置、存储介质及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5167821B2 (ja) * 2008-01-11 2013-03-21 株式会社リコー 文書検索装置、文書検索方法及び文書検索プログラム
US10430445B2 (en) * 2014-09-12 2019-10-01 Nuance Communications, Inc. Text indexing and passage retrieval
CN107391535B (zh) * 2017-04-20 2021-01-12 创新先进技术有限公司 在文档应用中搜索文档的方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102902688A (zh) * 2011-07-27 2013-01-30 汉王科技股份有限公司 关键词查找结果显示方法和装置
CN109299244A (zh) * 2018-11-15 2019-02-01 天津字节跳动科技有限公司 一种在线文档检索方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN112347324A (zh) 2021-02-09

Similar Documents

Publication Publication Date Title
US11816170B2 (en) Dynamic search set creation in a search engine
US10599643B2 (en) Template-driven structured query generation
US20160179816A1 (en) Near Real Time Auto-Suggest Search Results
RU2427896C2 (ru) Аннотирование документов в совместно работающих приложениях данными в разрозненных информационных системах
US9418128B2 (en) Linking documents with entities, actions and applications
CN112347324B (zh) 一种文档查询方法、装置、电子设备及存储介质
US20090300476A1 (en) Internet Guide Link Matching System
WO2015172490A1 (zh) 一种提供扩展搜索项的方法与装置
US20090248707A1 (en) Site-specific information-type detection methods and systems
CN109804364A (zh) 知识图谱构建***及方法
US8359307B2 (en) Method and apparatus for building sales tools by mining data from websites
US20090271388A1 (en) Annotations of third party content
CN110969022B (zh) 语义确定方法及相关设备
AU2016228246B2 (en) System and method for concept-based search summaries
US8862556B2 (en) Difference analysis in file sub-regions
EP2529323A2 (en) Improved searching using semantic keys
US11886477B2 (en) System and method for quote-based search summaries
CN110489032B (zh) 用于电子书的词典查询方法及电子设备
Kumar Apache Solr search patterns
CN105630837B (zh) 一种媒体记录搜索方法和装置
US20220284060A1 (en) Question Answering Method and Apparatus Based on Knowledge Graph
TWI547888B (zh) A method of recording user information and a search method and a server
KR101662215B1 (ko) 확장정보 기능을 제공하는 검색 시스템 및 방법
US20170270127A1 (en) Category-based full-text searching
CN113761213A (zh) 一种基于知识图谱的数据查询***、方法及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant