CN111368178A - 一种信息处理的方法及装置、可读存储介质 - Google Patents
一种信息处理的方法及装置、可读存储介质 Download PDFInfo
- Publication number
- CN111368178A CN111368178A CN202010149092.5A CN202010149092A CN111368178A CN 111368178 A CN111368178 A CN 111368178A CN 202010149092 A CN202010149092 A CN 202010149092A CN 111368178 A CN111368178 A CN 111368178A
- Authority
- CN
- China
- Prior art keywords
- user
- information
- searched
- identifier
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 19
- 238000003672 processing method Methods 0.000 title abstract description 9
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000012216 screening Methods 0.000 claims description 91
- 230000011218 segmentation Effects 0.000 claims description 77
- 238000001914 filtration Methods 0.000 claims description 42
- 238000012545 processing Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 208000025174 PANDAS Diseases 0.000 description 3
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 3
- 240000004718 Panda Species 0.000 description 3
- 235000016496 Panda oleosa Nutrition 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请提供一种信息处理的方法及装置、可读存储介质。信息处理的方法包括:接收用户发起的搜索请求;所述搜索请求包括待搜索的信息、所述用户的标识以及所述用户所在的企业的标识;根据所述用户的标识以及所述用户所在的企业的标识确定所述用户在所述用户所在的企业下可见的群组标识;所述可见的群组标识包括公有群组标识和私有群组标识;根据所述可见的群组标识和所述待搜索的信息确定与所述搜索请求对应的搜索结果;反馈所述搜索请求对应的搜索结果。该方法提高了信息的搜索结果的准确性。
Description
技术领域
本申请涉及信息处理技术领域,具体而言,涉及一种信息处理的方法及装置、可读存储介质。
背景技术
在云和移动互联网时代,企业对团队整体工作效率越来越重视。企业的成员可能分布在不同的物理位置,企业内部的沟通和协作依靠于办公即时通讯软件。
随着办公即时通讯软件越来越流行,企业内为各种目的创建的群聊也越来越多。现在,群聊中可发送的内容非常多样化,不仅能发送文字消息,还能发送图片及文件等。企业内产生的各种信息越来越多,通常员工会在企业内快速查找各种信息,例如查找群聊、聊天记录。企业内除了有各种性质,例如:部门、项目组等的私有群外,还包括一类特殊的群聊:公有群。企业内的所有成员无需加入公有群便可以查看并浏览该群的各种信息,比如:聊天消息、群成员、群文件等,只是,未加入公有群的企业成员不允许发送信息。
现有技术中,在用户搜索想要的信息时,通常在用户加入的群组中进行搜索。这种方式所搜索到的信息,具有局限性,并不能保证搜索到用户想要的信息。因此,现有的信息的搜索结果准确性较低。
发明内容
本申请实施例的目的在于提供一种信息处理的方法及装置、可读存储介质,用以提高信息的搜索结果的准确性。
第一方面,本申请实施例提供一种信息处理的方法,包括:接收用户发起的搜索请求;所述搜索请求包括待搜索的信息、所述用户的标识以及所述用户所在的企业的标识;根据所述用户的标识以及所述用户所在的企业的标识确定所述用户在所述用户所在的企业下可见的群组标识;所述可见的群组标识包括用户已加入的群组标识和公有群组标识;根据所述可见的群组标识和所述待搜索的信息确定与所述搜索请求对应的搜索结果;反馈所述搜索请求对应的搜索结果。
在本申请实施例中,通过用户的标识以及用户所在的企业的标识确定用户在用户所在的企业下可见的群组标识,可见的群组标识包括公有群组标识和用户已加入的群组标识,进而根据可见的群组标识和待搜索的信息确定对应的搜索结果。与现有技术相比,在确定搜索结果时,不仅利用到已加入的群组标识,还利用到了公有群组标识,使最终得到的搜索结果是在更广泛的范围内进行查找所得到的,避免了只在用户已加入的群组中进行查找的局限性,进而提高了最终的信息的搜索结果的准确性。
作为一种可能的实现方式,所述根据所述可见的群组标识和所述待搜索的信息确定与所述搜索请求对应的搜索结果,包括:根据所述待搜索的信息和所述可见的群组标识生成对应的查询语句;将所述查询语句发送给搜索引擎;接收所述搜索引擎反馈的所述搜索结果。
在本申请实施例中,在根据可见的群组标识和待搜索的信息确定搜索结果时,通过先生成查询语句,再发送给搜索引擎进行搜索,得到对应的搜索结果,能够提高信息搜索的效率和准确性。
作为一种可能的实现方式,在所述根据所述待搜索的信息和所述可见的群组标识生成对应的查询语句之前,所述方法还包括:确定所述待搜索的信息对应的分词策略;所述根据所述待搜索的信息和所述可见的群组标识生成对应的查询语句,包括:根据所述待搜索的信息、所述可见的群组标识以及所述对应的分词策略生成对应的查询语句。
在本申请实施例中,查询语句中除了待搜索信息,还可以包括待搜索的信息的分词策略,进而使搜索引擎根据查询语句所搜索到的内容更准确和更丰富。
作为一种可能的实现方式,所述对应的分词策略包括至少两个分词策略,在所述确定所述待搜索的信息对应的分词策略后,所述方法还包括:确定所述对应的分词策略的权重值;所述根据所述待搜索的信息、所述可见的群组标识以及所述对应的分词策略生成对应的查询语句,包括:根据所述待搜索的信息、所述可见的群组标识、所述对应的分词策略以及所述对应的分词策略的权重值生成对应的查询语句。
在本申请实施例中,不同的分词策略还可以有不同的权重值,进而使搜索引擎在反馈搜索结果时,还可以根据不同的权重值对不同的搜索结果进行排序或者评分等。
作为一种可能的实现方式,在所述反馈所述搜索请求对应的搜索结果后,所述方法还包括:接收用户发起的筛选请求,所述筛选请求包括筛选条件;根据所述筛选条件、所述待搜索的信息以及所述可见的群组标识生成新的查询语句;将所述新的查询语句发送给所述搜索引擎;接收所述搜索引擎反馈的筛选结果并反馈。
在本申请实施例中,在反馈搜索结果后,用户还可以对搜索结果进行筛选,在筛选时,可以根据筛选请求中的筛选条件待搜索的信息以及可见的群组标识生成新的查询语句,以使搜索引擎进一步地在搜索结果中进行筛选,反馈对应的筛选结果,进而提高了信息搜索的便利性。
作为一种可能的实现方式,所述根据所述筛选条件、所述待搜索的信息以及所述可见的群组标识生成新的查询语句,包括:将所述筛选条件转换为过滤条件;根据所述过滤条件、所述待搜索的信息以及所述可见的群组标识生成所述新的查询语句。
在本申请实施例中,在根据筛选条件生成新的查询语句时,可以先转化为过滤条件,然后再根据过滤条件和可见的群组标识生成新的查询语句,便于搜索引擎根据新的查询语句快速地进行搜索。
作为一种可能的实现方式,所述筛选条件包括:文件类型筛选条件、群组标识筛选条件以及创建时间范围筛选条件;所述将所述筛选条件转换为过滤条件,包括:若所述筛选条件为文件类型筛选条件,将所述文件类型筛选条件对应的文件后缀名作为所述过滤条件;若所述筛选条件为群组标识筛选条件,将所述群组标识筛选条件对应的群组标识作为所述过滤条件;若所述筛选条件为创建时间范围筛选条件,将所述创建时间范围筛选条件对应的创建时间作为所述过滤条件。
在本申请实施例中,用户可以对文件类型、群组标识、创建时间范围等进行筛选,提高了用户查看信息的便利性。
作为一种可能的实现方式,所述根据所述用户的标识以及所述用户所在的企业的标识确定所述用户在所述用户所在的企业下可见的群组标识,包括:根据所述用户的标识以及所述用户所在的企业的标识获取所述用户在所述用户所在的企业中已加入的群组标识;根据所述用户所在的企业的标识获取所述用户在所述用户所在的企业中的公有群组标识;对所述已加入的群组标识和所述公有群组标识进行去重,得到所述可见的群组标识。
在本申请实施例中,在确定可见的群组标识时,可以先获取用户已加入的群组标识,然后再获取公有群组标识,然后再对两种群组标识进行去重,进而快速和准确地确定可见的群组标识。
第二方面,本申请实施例提供一种信息处理的装置,所述装置包括用于实现第一方面以及第一方面任意一种可能的实现方式中所述的方法的功能模块。
第三方面,本申请实施例提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被计算机运行时执行如第一方面的以及第一方面的任意可能的实现方式中所述的方法中的步骤。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的即时通讯***的结构框图;
图2为本申请实施例提供的信息处理方法的流程图;
图3为本申请实施例提供的信息处理装置的功能模块结构框图。
图标:10-即时通讯***;11-客户端;12-服务器端;120-搜索服务器;122-数据库服务器;124-搜索引擎;30-信息处理的装置;301-接收模块;302-处理模块;303-反馈模块。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
本申请实施例提供的信息处理的方法可以应用于各种即时通讯软件,特别是办公即时通讯软件的硬件***中。可以理解,对于即时通讯软件来说,一般搭载在客户端上,例如手机或者电脑上,以各种应用程序的形式被用户所使用。要实现即时通讯软件的功能,例如日常办公、信息搜索等,除了客户端,还需要利用服务器端。
接下来请参照图1,为本申请实施例提供的即时通讯***10的结构示意图,即时通讯***10中包括客户端11和服务器端12,其中在服务器端12上,包括搜索服务器120、数据库服务器122和搜索引擎124。其中,搜索服务器120为响应用户搜索请求的服务器,数据库服务器122为存储数据的服务器,搜索引擎124为搜索或者查找数据的服务器,例如可以是Elastic Search服务器。Elastic Search服务器是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便地使大量数据具有搜索、分析和探索的能力。
此外,需要注意的是,对于用户来说,若需要使用即时通讯软件进行信息的搜索,前提是在用户已经通过客户端11进行注册,注册后,在使用即时通讯软件进行办公或者使用其他功能时,其过程中产生的各类数据或者存储的各类数据都会存储在数据库服务器122。例如,对于一个企业来说,数据库服务器122上会存储用户在使用即时通讯软件时产生的信息。这些信息包括用户在企业中创建的群聊,用户加入的群聊,用户与用户之间的好友关系,用户在群聊中发送的聊天消息及文件信息等。需要支持搜索的各类元信息都会从数据库服务器122同步到搜索引擎中,可供用户进行搜索或者查询。
当用户搜索信息时,在客户端11上发起搜索请求,然后客户端11将搜索请求发送给搜索服务器120,搜索服务器120对搜索请求进行处理,生成相应的查询语句,然后搜索服务器120将查询语句发送给搜索引擎124,搜索引擎124根据查询语句进行数据搜索,得到搜索结果,然后反馈给搜索服务器120,搜索服务器120再将搜索结果反馈给客户端11,进而使得用户能够在客户端11上查看搜索结果。
基于上述应用场景,接下来请参照图2,为本申请实施例提供的信息处理的方法的流程图,该方法可以应用于上述实施例中所述的搜索服务器120,该方法包括:
步骤201:接收用户发起的搜索请求。搜索请求包括待搜索的信息、用户的标识以及用户所在的企业的标识。
步骤202:根据用户的标识以及用户所在的企业的标识确定用户在用户所在的企业下可见的群组标识。可见的群组标识包括公有群组标识和私有群组标识。
步骤203:根据可见的群组标识和待搜索的信息确定与搜索请求对应的搜索结果。
步骤204:反馈搜索请求对应的搜索结果。
在本申请实施例中,通过用户的标识以及用户所在的企业的标识确定用户在用户所在的企业下可见的群组标识,可见的群组标识包括公有群组标识和私有群组标识,进而根据可见的群组标识和待搜索的信息确定对应的搜索结果。与现有技术相比,在确定搜索结果时,不仅利用到私有群组标识,还利用到了公有群组标识,使最终得到的搜索结果是在更广泛的范围内进行查找所得到的,避免了只在私有群组中进行查找的局限性,进而提高了最终的信息的搜索结果的准确性。
接下来对步骤201-步骤204的详细实施流程进行介绍。
在步骤201中,待搜索的信息可以是数据库服务器122中所存储的各类信息,以企业为例,这些信息可以包括:群组元信息:在群组创建时产生,包括群组所属企业唯一标识、群组唯一标识、群组名称、群类型(一对一、私有群、公有群)、群组创建目的描述、群组创建人唯一标识、群组创建时间、群组头像等。群成员元信息:在群成员加入时产生,包括群组所属企业唯一标识、所属的群组唯一标识、群类型、成员用户的唯一标识、成员名称、加入时间等。聊天记录元信息:由用户在群组中发送消息时产生,包括群组所属企业唯一标识、群组唯一标识、消息创建人唯一标识、创建时间、消息具体内容等。文件元信息:由用户在群组中发送文件时产生,包括群组所属企业唯一标识、群组唯一标识、文件的发送人唯一标识、文件上传时间、文件名称、文件后缀名、文件大小、文件的地址等。这里的文件包括各种图片、各种文本文件及二进制文件。
其中,企业唯一标识是指由本***为企业分配的一个唯一标识字符串(即企业的标识)。用户唯一标识是指由本***为用户分配的一个唯一标识字符串(即用户的标识)。群组唯一标识是指由本***为每一个群聊分配的一个唯一标识字符串(即群组标识)。本申请实施例中所述的唯一是指在某个特定的即时通讯***中是唯一的。
进一步的,用户在客户端11上发起搜索请求,该用户是指进行搜索的用户。此外,需要注意的是,待搜索的信息中包括了标识信息,该标识信息与搜索请求中的标识是不冲突的。当用户在客户端11上发起搜索请求时,该搜索请求中会携带发起搜索请求的用户的标识信息和用户所在的企业的标识信息,这样才能够根据搜索请求进行搜索,因此,待搜索信息中包括的用户标识或者企业的标识与待搜索请求中用户的标识和所在的企业的标识并不冲突。
此外,待搜索的信息可以是一句话,也可以是一个字或者多个词语等各种信息。
在步骤201后,执行步骤202,根据用户的标识以及用户所在的企业的标识确定用户在用户所在的企业下可见的群组标识。作为一种可选的实施方式,步骤202包括:根据用户的标识以及用户所在的企业的标识获取用户在用户所在的企业中已加入的群组标识;根据用户所在的企业的标识获取用户在用户所在的企业中的公有群组标识;对已加入的群组标识和公有群组标识进行去重,得到可见的群组标识。
其中,公有群组是指公开的群组,任何人都可以看到,并且任何人都可以加入,无需群内部人员的邀请或者拉入,其中不一定有搜索信息的用户,但是用户已加入的群组中一定有搜索信息的用户。因此,在确定可见的群组标识时,只需在企业的群组标识中将这些群组标识都筛选出来,然后做一个去重。对于去重,可以理解,公有群组是大家都可以加入的,那么搜索的用户也可能加入了其中,在获取用户已加入的群组标识时,可能会获取到用户已加入的公有群组标识,因此,需要根据最后的总结果进行一个去重处理,将用户已加入的群组中包含了的公有群组的部分给去掉。
在本申请实施例中,在确定可见的群组标识时,可以先获取用户已加入的群组标识,然后再获取公有群组标识,然后再对两种群组标识进行去重,进而快速和准确地确定可见的群组标识。
在步骤202后,执行步骤203,根据可见的群组标识和待搜索的信息确定与搜索请求对应的搜索结果,作为一种可选的实施方式,步骤203包括:根据待搜索的信息和可见的群组标识生成对应的查询语句;将查询语句发送给搜索引擎124;接收搜索引擎124反馈的搜索结果。
在这种实施方式中,待搜索的信息可以包括一个或者多个关键字,又或者包括一句话,关键字或者一句话可以表征用户想要搜索的内容。
对于搜索引擎124来说,在搜索时,需要根据查询语句得到对应的搜索对象,为了便于搜索引擎124根据查询语句得到较为准确的搜索对象,作为一种可选的实施方式,在生成对应的查询语句之前,该方法还包括:确定待搜索的信息对应的分词策略;对应的,根据待搜索的信息和可见的群组标识生成对应的查询语句,包括:根据待搜索的信息、可见的群组标识以及对应的分词策略生成对应的查询语句。
其中,分词策略可以包括:按空白字符分隔:比如:将“我是张三和李四的同学”拆分成:“我是”、“张三”、“和”、“李四”、“的同学”。常规分词:比如将“我是张三和李四的同学”拆分成:“我”、“是”、“张三”、“三和”、“三”、“和”、“李四”、“四”、“的”、“同学”。基于ngram语言模型的前缀分词。比如:将“我是张三和李四的同学”拆分成:“我是”、“我是张”、“我是张三”、“我是张三和”、“我是张三和李四”、“我是张三和李四的”、“我是张三和李四的同”、“我是张三和李四的同学”。
除了上述的常规的分词策略,还可以采用一些扩展式的分词策略,例如:同义或者同音或者其他方式的扩展,比如:将“熊猫”分词得到:“熊猫”和“xiongmao”或者“熊猫”和“xm”等。
进一步地,在确定待搜索信息对应的分词策略时,可以根据待搜索信息的分类(类型,描述信息)等确定。例如搜索群名称及用户名时,可以指定以拼音全拼及拼音首字母进行搜索(即采用同义或者同音的扩展分词策略)。再例如搜索的是聊天记录(例如一句话)时,可以指定采用常规的几种分词策略进行分词。对于待搜索信息的分类,可以理解为待搜索的信息的描述信息或者类型,例如:群组、用户、文件或者聊天消息等。在搜索服务器120接收到待搜索的信息后,可以对待搜索的信息作一个判断,确定其所属于的分类。或者也可以是,用户在输入待搜索的信息时,就附带有待搜索的信息对应的类型信息,例如:在用户的搜索界面,可以选择待搜索的信息的类型。
再进一步地,在根据待搜索的信息、可见的群组标识以及对应的分词策略生成对应的查询语句时,相当于将这些信息进行组合,生成用于指示搜索引擎124进行搜索的指令。比如,查询语句可以是:待搜索的信息:XX文件名;分词策略:001(分词策略对应的标识);可见的群组标识:XX项目群组(或者是以群号的形式标识,例如:1234567)。
此外,对于待搜索的信息的分类(类型或者描述信息),也可以指定对应的分词策略,并加入到查询语句中。
进一步地,在生成查询语句后,将查询语句和可见的群组标识均发送给搜索引擎124,搜索引擎124在可见的群组标识对应的群组中查找与查询语句相关的内容,然后反馈给搜索服务器120。
在本申请实施例中,查询语句中除了待搜索信息,还可以包括待搜索的信息的分词策略,进而使搜索引擎124根据查询语句所搜索到的内容更准确和更丰富。
进一步地,对应的分词策略可以包括至少两个分词策略,进而搜索引擎124可以按照不同的分词策略进行分词后,得到不同的分词结果,然后按照不同的分词结果进行搜索,得到更全面的搜索结果。因此,在有多个分词策略的情况下,确定待搜索的信息对应的分词策略后,该方法还包括:确定对应的分词策略的权重值。根据待搜索的信息、可见的群组标识以及对应的分词策略生成对应的查询语句,包括:根据待搜索的信息、可见的群组标识、对应的分词策略以及对应的分词策略的权重值生成对应的查询语句。
其中,在确定各个分词策略的权重值时,可以根据待搜索的信息进行确定。例如:假设待搜索的信息长度为1,那么此时单字分词策略的权重值可以较高。假设待搜索的信息长度不为1,且需要在前缀分词中查询,此时可以判断待搜索的信息中是否有分隔符,如果有分隔符,此时可以增加空白字符分词的权重值;如果没有分割符,增加前缀分词策略的权重值。更进一步地,还可以判断待搜索的信息中是否有字母,若有,还可以增加拼音分词策略的权重,若没有,则降低拼音分词策略的权重。
在本申请实施例中,不同的分词策略还可以有不同的权重值,进而使搜索引擎124在反馈搜索结果时,还可以根据不同的权重值对不同的搜索结果进行排序或者评分等。
当然,除了这种实施方式,也可以不将分词策略的权重值发送给搜索引擎124,即对搜索结果进行排序或者评分的任务由搜索服务器120执行。
进一步地,对于搜索引擎124来说,在接收到查询语句后,对查询语句中包含的待搜索的信息按照分词策略进行分词,以及对待搜索的信息的类型(分类或者描述信息)按照(指定的)分词策略进行分词,然后依据分词得到的结果在可见的群组标识所对应的信息中进行搜索,直至搜索到对应的搜索结果。当然,在实际情况中,搜索引擎124可能找不到对应的信息,此时的搜索结果可以为无或者空等,默认没有找到对应的信息。
进一步地,在前述实施例中提到,不同的分词策略可以设置权重值,因此,对于搜索引擎124来说,还可以将得到的搜索结果按照权重值进行排序或者评分等。然后按照排序或者评分的结果反馈搜索结果,例如仅将权重值大于0.5的分词策略对应得到的搜索结果反馈给搜索服务器120。
可以理解,前述实施例中提到过,分词策略的权重值也可以不发给搜索引擎124,在这种情况下,搜索引擎124反馈不同的分词策略对应的搜索结果,然后由搜索服务器120根据确定的权重值进行排序或者评分后反馈给客户端11即可。
当然,在没有采用分词策略,或者说采用了一种分词策略的情况下,搜索引擎124可以直接将得到的搜索结果全部反馈给搜索服务器120。搜索服务器120将其进行排列或者分类后发送给客户端11进行展示。排列或者分类的依据可以是信息的属性或者类型、以及信息的字符数量等。例如:假设得到的搜索结果为所有含“熊”的信息,那么可以将这些信息按照信息中包含的字数多少进行排列,字数多的排后面,字数少的排前面。
在本申请实施例中,在用户查看到搜索结果后,客户端11上还可以提供相应的筛选条件,以便用户对得到的搜索结果进行进一步的筛选。这里的筛选条件所指的是用户对搜索到的信息的限定条件,例如用户选择的筛选条件是文件,那么就将搜索结果中的文件信息进一步的展示给用户,其他非文件的信息不展示给用户。因此,在步骤204后,该方法还包括:接收用户发起的筛选请求,筛选请求包括筛选条件;根据筛选条件、待搜索的信息以及可见的群组标识生成新的查询语句;将新的查询语句发送给搜索引擎124;接收搜索引擎124反馈的筛选结果并反馈。
其中,用户发起的筛选请求为在客户端11上发起的筛选请求,客户端11将筛选请求发送给搜索服务器120,搜索服务器120接收该筛选请求。
作为一种可选的实施方式,根据筛选条件、待搜索的信息以及可见的群组标识生成新的查询语句,包括:将筛选条件转换为过滤条件;根据过滤条件、待搜索的信息以及可见的群组标识生成新的查询语句。
其中,筛选条件可以包括:文件类型筛选条件、群组标识筛选条件以及创建时间范围筛选条件。将筛选条件转换为过滤条件,包括:若筛选条件为文件类型筛选条件,将文件类型筛选条件对应的文件后缀名作为过滤条件;若筛选条件为群组标识筛选条件,将群组标识筛选条件对应的群组标识作为过滤条件;若筛选条件为创建时间范围筛选条件,将创建时间范围筛选条件对应的创建时间作为过滤条件。
在这种实施方式中,文件类型为文件信息的筛选条件;群组标识可以为各类信息的筛选条件,例如人员信息(人员所属的群组)、文件信息(文件所属的群组)等;创建时间范围也可以为各类信息的筛选条件,例如群组信息(群组的创建时间)、文件信息(文件的上传时间)、聊天记录(聊天记录的生成时间)等。
以文件类型为例,文件类型比如图片类型、视频类型、文档类型、压缩包类型。图片类型可能包含.jpg、.jpeg、.png、.bmp、gif等常见的图片后缀名。视频类型可能包含.mov、.mp4、.avi、.wmv、.mkv等常见的视频后缀名。文档类型可能包含.rar、.zip、tgz、.txt、.md、.doc等常见的压缩包后缀名。
需要注意的是,对于筛选条件以及过滤条件的设置方式,在不同的应用场景下可采用不同的实施方式,特别是筛选条件,根据不同的企业的员工的使用需求,可以设置各种筛选条件,来满足用户的筛选需求。
进一步地,在根据筛选条件和待搜索的信息生成新的查询语句时,如果在第一次搜索时,确定了对应的分词策略(或者和对应的分词策略的权重值),那么在生成新的查询语句时,也要将对应的分词策略(或者和对应的分词策略的权重值)加入到新的查询语句中。
进一步地,在生成新的查询语句时,与前述实施例中生成查询语句时的实施方式一致,将新的查询语句中所需要的包含的信息进行组合即可,所不同的是,新的查询语句中多了过滤条件。
进一步地,搜索服务器120将新的查询语句发送给搜索引擎124,搜索引擎124按照与第一次搜索时相同的搜索方式进行搜索,得到对应的搜索结果,作为筛选结果反馈给搜索服务器120,搜索服务器120再发送给客户端11。其中,在反馈筛选结果时,与第一次反馈时的实施方式一致,例如,如果采用了不同的分词策略,也会有排序或者评分这些过程。
需要理解的是,对于用户来说,是通过筛选条件筛选自己所需要的目标信息,但对于搜索引擎124(后台服务器)来说,本质上是根据筛选条件所限定的信息来进行进一步的搜索。
在本申请实施例中,在反馈搜索结果后,用户还可以对搜索结果进行筛选,在筛选时,可以根据筛选请求中的筛选条件待搜索的信息以及可见的群组标识生成新的查询语句,以使搜索引擎进一步地在搜索结果中进行筛选,反馈对应的筛选结果,进而提高了信息搜索的便利性。并且在根据筛选条件生成新的查询语句时,可以先转化为过滤条件,然后再根据过滤条件和可见的群组标识生成新的查询语句,便于搜索引擎根据新的查询语句快速地进行搜索。
基于同一发明构思,请参照图3,本申请实施例中还提供信息处理的装置30,包括接收模块301,处理模块302和反馈模块303。
接收模块301用于:接收用户发起的搜索请求;所述搜索请求包括待搜索的信息、所述用户的标识以及所述用户所在的企业的标识。处理模块302用于:根据所述用户的标识以及所述用户所在的企业的标识确定所述用户在所述用户所在的企业下可见的群组标识;所述可见的群组标识包括公有群组标识和私有群组标识;根据所述可见的群组标识和所述待搜索的信息确定与所述搜索请求对应的搜索结果。反馈模块303用于:反馈所述搜索请求对应的搜索结果。
可选的,处理模块302具体用于:根据所述待搜索的信息和所述可见的群组标识生成对应的查询语句;将所述查询语句发送给搜索引擎124;接收所述搜索引擎124反馈的所述搜索结果。
可选的,处理模块302具体用于:确定所述待搜索的信息对应的分词策略;根据所述待搜索的信息、所述可见的群组标识以及所述对应的分词策略生成对应的查询语句。
可选的,处理模块302还用于:确定所述对应的分词策略的权重值。处理模块302具体还用于:根据所述待搜索的信息、所述可见的群组标识、所述对应的分词策略以及所述对应的分词策略的权重值生成对应的查询语句。
可选的,接收模块301还用于:接收用户发起的筛选请求,所述筛选请求包括筛选条件。处理模块302还用于:根据所述筛选条件、所述待搜索的信息以及所述可见的群组标识生成新的查询语句;将所述新的查询语句发送给所述搜索引擎124。反馈模块303还用于:接收所述搜索引擎反馈的筛选结果并反馈。
可选的,处理模块302具体还用于:将所述筛选条件转换为过滤条件;根据所述过滤条件和所述关键字生成所述新的查询语句。
可选的,处理模块302具体还用于:若所述筛选条件为文件类型筛选条件,将所述文件类型筛选条件对应的文件后缀名作为所述过滤条件;若所述筛选条件为群组标识筛选条件,将所述群组标识筛选条件对应的群组标识作为所述过滤条件;若所述筛选条件为创建时间范围筛选条件,将所述创建时间范围筛选条件对应的创建时间作为所述过滤条件。
可选的,处理模块302具体还用于:根据所述用户的标识以及所述用户所在的企业的标识获取所述用户在所述用户所在的企业中已加入的群组标识;根据所述用户所在的企业的标识获取所述用户在所述用户所在的企业中的公有群组标识;对所述已加入的群组标识和所述公有群组标识进行去重,得到所述可见的群组标识。
前述实施例中的信息处理的方法中的各实施方式和具体实例同样适用于信息处理的装置30中的各个模块,通过前述对信息处理的方法的详细描述,本领域技术人员可以清楚的知道各个模块的实施方式,所以为了说明书的简洁,在此不再详述。
基于同一发明构思,本申请实施例还提供了一种可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被计算机运行时执行上述任一实施方式所述的信息处理的方法。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种信息处理的方法,其特征在于,包括:
接收用户发起的搜索请求;所述搜索请求包括待搜索的信息、所述用户的标识以及所述用户所在的企业的标识;
根据所述用户的标识以及所述用户所在的企业的标识确定所述用户在所述用户所在的企业下可见的群组标识;所述可见的群组标识包括用户已加入的群组标识和公有群组标识;
根据所述可见的群组标识和所述待搜索的信息确定与所述搜索请求对应的搜索结果;
反馈所述搜索请求对应的搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述可见的群组标识和所述待搜索的信息确定与所述搜索请求对应的搜索结果,包括:
根据所述待搜索的信息和所述可见的群组标识生成对应的查询语句;
将所述查询语句发送给搜索引擎;
接收所述搜索引擎反馈的所述搜索结果。
3.根据权利要求2所述的方法,其特征在于,在所述根据所述待搜索的信息和所述可见的群组标识生成对应的查询语句之前,所述方法还包括:
确定所述待搜索的信息对应的分词策略;
所述根据所述待搜索的信息和所述可见的群组标识生成对应的查询语句,包括:
根据所述待搜索的信息、所述可见的群组标识以及所述对应的分词策略生成对应的查询语句。
4.根据权利要求3所述的方法,其特征在于,所述对应的分词策略包括至少两个分词策略,在所述确定所述待搜索的信息对应的分词策略后,所述方法还包括:
确定所述对应的分词策略的权重值;
所述根据所述待搜索的信息、所述可见的群组标识以及所述对应的分词策略生成对应的查询语句,包括:
根据所述待搜索的信息、所述可见的群组标识、所述对应的分词策略以及所述对应的分词策略的权重值生成对应的查询语句。
5.根据权利要求2所述的方法,其特征在于,在所述反馈所述搜索请求对应的搜索结果后,所述方法还包括:
接收用户发起的筛选请求,所述筛选请求包括筛选条件;
根据所述筛选条件、所述待搜索的信息以及所述可见的群组标识生成新的查询语句;
将所述新的查询语句发送给所述搜索引擎;
接收所述搜索引擎反馈的筛选结果并反馈。
6.根据权利要求5所述的方法,其特征在于,所述根据所述筛选条件、所述待搜索的信息以及所述可见的群组标识生成新的查询语句,包括:
将所述筛选条件转换为过滤条件;
根据所述过滤条件、所述待搜索的信息以及所述可见的群组标识生成所述新的查询语句。
7.根据权利要求6所述的方法,其特征在于,所述筛选条件包括:文件类型筛选条件、群组标识筛选条件以及创建时间范围筛选条件;所述将所述筛选条件转换为过滤条件,包括:
若所述筛选条件为文件类型筛选条件,将所述文件类型筛选条件对应的文件后缀名作为所述过滤条件;
若所述筛选条件为群组标识筛选条件,将所述群组标识筛选条件对应的群组标识作为所述过滤条件;
若所述筛选条件为创建时间范围筛选条件,将所述创建时间范围筛选条件对应的创建时间作为所述过滤条件。
8.根据权利要求1所述的方法,其特征在于,所述根据所述用户的标识以及所述用户所在的企业的标识确定所述用户在所述用户所在的企业下可见的群组标识,包括:
根据所述用户的标识以及所述用户所在的企业的标识获取所述用户在所述用户所在的企业中已加入的群组标识;
根据所述用户所在的企业的标识获取所述用户在所述用户所在的企业中的公有群组标识;
对所述已加入的群组标识和所述公有群组标识进行去重,得到所述可见的群组标识。
9.一种信息处理的装置,其特征在于,包括:
接收模块,用于接收用户发起的搜索请求;所述搜索请求包括待搜索的信息、所述用户的标识以及所述用户所在的企业的标识;
处理模块,用于:根据所述用户的标识以及所述用户所在的企业的标识确定所述用户在所述用户所在的企业下可见的群组标识;所述可见的群组标识包括用户已加入的群组标识和公有群组标识;根据所述可见的群组标识和所述待搜索的信息确定与所述搜索请求对应的搜索结果;
反馈模块,用于反馈所述搜索请求对应的搜索结果。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被计算机运行时执行如权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010149092.5A CN111368178A (zh) | 2020-03-05 | 2020-03-05 | 一种信息处理的方法及装置、可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010149092.5A CN111368178A (zh) | 2020-03-05 | 2020-03-05 | 一种信息处理的方法及装置、可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111368178A true CN111368178A (zh) | 2020-07-03 |
Family
ID=71206723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010149092.5A Pending CN111368178A (zh) | 2020-03-05 | 2020-03-05 | 一种信息处理的方法及装置、可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111368178A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112163104A (zh) * | 2020-09-29 | 2021-01-01 | 北京字跳网络技术有限公司 | 搜索目标内容的方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101996200A (zh) * | 2009-08-19 | 2011-03-30 | 华为技术有限公司 | 一种搜索文档的方法和装置 |
CN103390000A (zh) * | 2012-05-09 | 2013-11-13 | ***通信集团公司 | 一种网页搜索方法及网页搜索*** |
EP2922014A1 (en) * | 2014-03-20 | 2015-09-23 | Facebook, Inc. | Polygon-based indexing of places |
CN105205140A (zh) * | 2015-09-17 | 2015-12-30 | 小米科技有限责任公司 | 消息推送方法及装置 |
CN105447162A (zh) * | 2015-12-01 | 2016-03-30 | 腾讯科技(深圳)有限公司 | 群组文件搜索方法和装置 |
-
2020
- 2020-03-05 CN CN202010149092.5A patent/CN111368178A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101996200A (zh) * | 2009-08-19 | 2011-03-30 | 华为技术有限公司 | 一种搜索文档的方法和装置 |
CN103390000A (zh) * | 2012-05-09 | 2013-11-13 | ***通信集团公司 | 一种网页搜索方法及网页搜索*** |
EP2922014A1 (en) * | 2014-03-20 | 2015-09-23 | Facebook, Inc. | Polygon-based indexing of places |
CN105205140A (zh) * | 2015-09-17 | 2015-12-30 | 小米科技有限责任公司 | 消息推送方法及装置 |
CN105447162A (zh) * | 2015-12-01 | 2016-03-30 | 腾讯科技(深圳)有限公司 | 群组文件搜索方法和装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112163104A (zh) * | 2020-09-29 | 2021-01-01 | 北京字跳网络技术有限公司 | 搜索目标内容的方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7657603B1 (en) | Methods and systems of electronic message derivation | |
CN104835072B (zh) | 用于社交网络中用户的兼容性评分的方法和*** | |
US7593924B2 (en) | Method, system, and apparatus for receiving and responding to knowledge interchange queries | |
US7730113B1 (en) | Network-based system and method for accessing and processing emails and other electronic legal documents that may include duplicate information | |
RU2463654C2 (ru) | Агрегирование и поиск данных профиля от различных служб | |
US20200401554A1 (en) | Selective data migration and sharing | |
US12008032B2 (en) | Automatic detection and transfer of relevant image data to content collections | |
US9619571B2 (en) | Method for searching related entities through entity co-occurrence | |
US20130166543A1 (en) | Client-based search over local and remote data sources for intent analysis, ranking, and relevance | |
US20130085745A1 (en) | Semantic-based approach for identifying topics in a corpus of text-based items | |
US20060253550A1 (en) | System and method for providing data for decision support | |
US20060085373A1 (en) | Method and apparatus for creating relationships over a network | |
US20030093477A1 (en) | Information processing system, information processing method, a software program for executing such method, and information storage medium comprising such software program | |
US7693866B1 (en) | Network-based system and method for accessing and processing legal documents | |
WO2013026325A1 (zh) | 一种人物搜索方法、装置及存储介质 | |
US8812602B2 (en) | Identifying conversations in a social network system having relevance to a first file | |
JP2003016109A (ja) | 文書情報管理方法および装置、および管理サーバ | |
CN105447162B (zh) | 群组文件搜索方法和装置 | |
US8972398B1 (en) | Integrating online search results and social networks | |
US20240020305A1 (en) | Systems and methods for automatic archiving, sorting, and/or indexing of secondary message content | |
WO2014029314A1 (zh) | 信息聚合归类的显示方法及*** | |
US7529803B2 (en) | Searching electronic mail and messages | |
CN104252537B (zh) | 基于邮件特征的索引分片方法 | |
CN111368178A (zh) | 一种信息处理的方法及装置、可读存储介质 | |
US9135625B1 (en) | Systems and methods of detecting keyword-stuffed business titles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200703 |