CN104657397B - 一种信息处理方法及终端 - Google Patents

一种信息处理方法及终端 Download PDF

Info

Publication number
CN104657397B
CN104657397B CN201310607926.2A CN201310607926A CN104657397B CN 104657397 B CN104657397 B CN 104657397B CN 201310607926 A CN201310607926 A CN 201310607926A CN 104657397 B CN104657397 B CN 104657397B
Authority
CN
China
Prior art keywords
encyclopedic
intention
encyclopedia
entries
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310607926.2A
Other languages
English (en)
Other versions
CN104657397A (zh
Inventor
郭强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310607926.2A priority Critical patent/CN104657397B/zh
Publication of CN104657397A publication Critical patent/CN104657397A/zh
Application granted granted Critical
Publication of CN104657397B publication Critical patent/CN104657397B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开一种信息处理方法及终端,其中方法包括如下步骤:获取与所输入的查询信息相关联的至少一个百科意图;计算所述至少一个百科意图中每个百科意图的意图强度;根据所述至少一个百科意图中每个百科意图的意图强度,对所述至少一个百科意图对应的百科文档进行排序处理。可以提升百科文档排序位置的准确性。

Description

一种信息处理方法及终端
技术领域
本发明涉及互联网技术领域,尤其涉及一种信息处理方法及终端。
背景技术
随着互联网技术的飞速前进,人们的生活日益网络化、信息化。当用户遇到一些不懂的问题,可以通过在搜索网页中输入查询信息,由网页根据所输入的查询信息查找相应的文档,例如:百科文档、非百科文档等,非百科文档包括视频、小说、广告等文档。
由于网页对文档输出的方式是按照用户的点击行为进行排序输出,因此会导致非百科文档的排序过高,而百科文档的排序则相对偏后,进而使得用户难以针对查询信息找到所需的百科文档,降低了百科文档排序位置的准确性。
发明内容
本发明实施例提供一种信息处理方法及终端,可以提升百科文档排序位置的准确性。
本发明实施例第一方面提供了一种信息处理方法,可包括:
获取与所输入的查询信息相关联的至少一个百科意图;
计算所述至少一个百科意图中每个百科意图的意图强度;
根据所述至少一个百科意图中每个百科意图的意图强度,对所述至少一个百科意图对应的百科文档进行排序处理。
本发明实施例第二方面提供了一种信息处理终端,可包括:
第一获取模块,用于获取与所输入的查询信息相关联的至少一个百科意图;
强度计算模块,用于计算所述至少一个百科意图中每个百科意图的意图强度;
文档排序模块,用于根据所述至少一个百科意图中每个百科意图的意图强度,对所述至少一个百科意图对应的百科文档进行排序处理。
在本发明实施例中,通过获取所输入的查询信息相关联的至少一个百科意图,并计算每个百科意图的意图强度,根据意图强度对每个百科意图对应的百科文档进行排序,可以针对查询信息获取到所需的百科文档,提高了查询信息和百科文档的关联性以及对查询信息的针对性,并对所需的百科文档进行排序处理,有效的提升了对所需的百科文档排序位置的准确性,进而提升了信息处理终端的智能性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种信息处理方法的流程示意图;
图2是本发明实施例提供的另一种信息处理方法的流程示意图;
图3是本发明实施例提供的一种信息处理终端的结构示意图;
图4是本发明实施例提供的另一种信息处理终端的结构示意图;
图5是本发明实施例提供的第一获取模块的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中,信息处理终端可以包括:计算机(PC)、平板电脑、智能手机、笔记本电脑、掌上电脑以及移动互联网设备(MID)、PAD等终端设备。
本发明实施例提供的信息处理方法可以应用于查询网页中百科文档的排序显示的场景,例如:所述信息处理终端可以获取用户在查询网页中指定位置所输入的查询信息,并根据所述查询信息获取相关联的至少一个百科意图,所述信息处理终端可以计算所述至少一个百科意图中每个百科意图的意图强度,再根据所述每个百科意图的意图强度,对所述至少一个百科意图对应的百科文档信息排序处理,优选的,所述查询网页对排序处理后的百科文档进行输出显示等。所述信息处理终端可以针对查询信息获取到所需的百科文档,提高了查询信息和百科文档的关联性以及对查询信息的针对性,并对所需的百科文档进行排序处理,有效的提升了对所需的百科文档排序位置的准确性。
本发明实施例中涉及的查询信息可以包括百科词条和查询词条,例如:XX是谁,其中,“XX”为百科词条,“是谁”为查询词条,所述百科意图为针对所述查询信息相关联的意图信息。
下面将结合附图1和附图2,对本发明实施例提供的信息处理方法进行详细介绍。
请参见图1,为本发明实施例提供了一种信息处理方法的流程示意图。如图1所示,本发明实施例的所述方法包括以下步骤S101-步骤S103。
S101,获取与所输入的查询信息相关联的至少一个百科意图;
具体的,信息处理终端可以监听搜索网页中的输入框,获取用户所输入的查询信息,并根据所述所输入的查询信息,获取相关联的至少一个百科意图。
需要说明的是,所述信息处理终端在获取与所输入的查询信息相关联的至少一个百科意图之前,可以对预设时间段内所记录的查询信息进行计算统计,生成百科意图模板,则所述信息处理终端可以通过计算所输入的查询信息中的百科词条和查询词条的关联程度,根据所述所输入的查询信息中的百科词条和查询词条的关联程度在所述百科意图模板中筛选出至少一个百科意图。
S102,计算所述至少一个百科意图中每个百科意图的意图强度;
具体的,所述信息处理终端可以对所述至少一个百科意图中每个百科意图的意图强度进行计算。
需要说明的是,所述信息处理终端在计算所述至少一个百科意图中每个百科意图的意图强度之前,还可以获取与所输入的查询信息相关联的至少一个非百科意图,所述信息处理终端可以根据所述至少一个百科意图的个数、所述至少一个非百科意图的个数、所述至少一个百科意图对应的百科文档的点击次数以及所述至少一个非百科意图对应的非百科文档的点击次数,计算所述至少一个百科意图中每个百科意图的意图强度。
计算所述至少一个百科意图中每一个百科意图的意图强度所采用的公式可以为:意图强度=α*((1+A)/(1+A+B))+β*((1+A_num)/(1+A_num+B_num)),其中,A表示是否具有百科意图,如果有百科意图,则A=1;如果没有百科意图,则A=0;
B表示与所输入的查询信息相关联的非百科意图的个数;
A_num表示所述信息处理终端所记录的该百科意图对应的百科文档被点击的次数,点击的次数可以按照点击时间由近到远依次衰减,例如:记录在最近的一个月内的点击均算为1次点击,而记录在最近的一个月之前的点击均算为0.5次;
B_num表示所述信息处理终端所记录的所有与所输入的查询信息相关联的非百科意图对应的非百科文档被点击的次数,点击的次数也可以按照点击时间由近到远依次衰减,例如:记录在最近的一个月内的点击均算为1次点击,而记录在最近的一个月之前的点击均算为0.5次;
α和β均表示为权重系数,优选的,α+β=1。
可以理解的是,采用点击的次数可以按照点击时间由近到远依次衰减,可以根据大量的记录对意图强度进行计算,更好的增加意图强度计算的准确性。
S103,根据所述至少一个百科意图中每个百科意图的意图强度,对所述至少一个百科意图对应的百科文档进行排序处理;
具体的,所述信息处理终端采用预设的排序规则,根据所述至少一个百科意图中每个百科意图的意图强度,对所述至少一个百科意图对应的百科文档进行排序处理。所述预设的排序规则可以为:
第一百科文档的排序高于第二百科文档;
对于意图强度属于同一预设范围内的至少两个第二百科文档,根据点击次数和/或文档长度进行排序;
其中,所述第一百科文档为大于或等于预设强度阈值的意图强度对应的百科文档,所述第二百科文档为小于所述预设强度阈值的意图强度对应的百科文档。
需要说明的是,所述第一百科文档又称为完全匹配百科意图文档,所述第二百科文档又称为部分匹配百科意图文档,其中,完全匹配百科意图文档需要满足下列任意一个条件:
1、第一百科文档的文档标题与所输入的查询信息一致;
2、第一百科文档的文档标题与获取的所输入的查询信息中的百科词条一致;
3、所输入的查询信息相关联的至少一个百科意图对应的百科文档中,所记录的点击次数最高的百科文档。
部分匹配百科意图文档为与所输入的查询信息中的百科词条和查询词条部分匹配的文档,例如:如果所输入的查询信息为“XX是谁”,则所获取的部分匹配百科意图文档的内容可以为“XX的音乐、XX的事件”等。
进一步的,所述信息处理终端可以将排序处理后的所有百科文档进行输出显示,优选的,每个页面所显示的百科文档中可以只有一个完全匹配百科意图文档。当然,对于所有与所输入的查询信息相关联的非百科意图对应的非百科文档也可以加入排序处理,非百科文档则可以根据所记录的点击次数进行排序,所述信息处理终端可以优先显示排序处理后的百科文档,再显示排序处理后的非百科文档。
在本发明实施例中,通过获取所输入的查询信息相关联的至少一个百科意图,并计算每个百科意图的意图强度,根据意图强度对每个百科意图对应的百科文档进行排序,采用大量所记录的信息,可以针对查询信息获取到所需的百科文档,提高了查询信息和百科文档的关联性以及对查询信息的针对性,提升了用户体验,并对所需的百科文档进行排序处理,有效的提升了对所需的百科文档排序位置的准确性,进而提升了信息处理终端的智能性。
请参见图2,为本发明实施例提供了另一种信息处理方法的流程示意图。如图2所示,本发明实施例的所述方法包括以下步骤S201-步骤S208。
S201,获取预设时间段内所记录的查询信息;
具体的,信息处理终端获取预设时间段内所记录的查询信息,例如:记录一年之内所有用户输入的查询信息。
S202,计算所述所记录的查询信息中的百科词条和查询词条的关联程度;
具体的,所述信息处理终端可以采用共现概率公式对所述所记录的查询信息中的百科词条和查询词条的关联程度进行计算。优选的,假设所述信息处理终端中存在N篇文档,其中包含所述百科词条的文档有O篇,包含所述查询词条的文档有P篇,同时包含所述百科词条和所述查询词条的文档有Q篇,可以理解的是,Q<=(O+P)<=N,则所述共现概率公式可以为:
P(百科词条,查询词条)=Q/(O+P)。
S203,根据所述所记录的查询信息中的百科词条和查询词条的关联程度,设置百科意图模板;
具体的,如果P(百科词条,查询词条)大于预设阈值,则认为所述百科词条和所述查询词条具备关联性,其中,所述预设阈值为大于0且小于等于1的数,所述信息处理终端可以根据所述所记录的查询信息中具备关联性的百科词条和查询词条,进行百科意图模板设置,例如:
问答类百科意图模板可以包括:XX是什么、XX是什么意思等;
知识类百科意图模板可以包括:XX的功效、XX的功能等;
人物类百科意图模板可以包括:XX的生平、XX的简历等;
事件类百科意图模板可以包括:XX的事件等。
当然,上述百科意图模板的设置仅为举例,模板还可以根据人物、事物等进行分类,也可以根据出现的时间顺序进行分类。通过进行百科意图模板的设置,可以为后续用户所输入的查询信息,快速对所输入的查询信息相关联的至少一个百科意图进行定位,增加了获取百科意图的准确性。
S204,计算所输入的查询信息中的百科词条和查询词条的关联程度;
具体的,所述信息处理终端可以监听搜索网页中的输入框,获取用户所输入的查询信息,所述信息处理终端计算所输入的查询信息中的百科词条和查询词条的关联程度,优选的,所述信息处理终端同样可以采用共现概率公式对所述所输入的查询信息中的百科词条和查询词条的关联程度进行计算,具体的可以参见上述举例。
S205,根据所述所输入的查询信息中的百科词条和查询词条的关联程度在所述百科意图模板中筛选出至少一个百科意图;
具体的,所述信息处理终端根据对所述所输入的查询信息中的百科词条和查询词条的关联程度进行计算所得到的共现概率值,在所设置的所述百科意图模板中筛选出至少一个百科意图。
S206,获取与所输入的查询信息相关联的至少一个非百科意图;
具体的,所述信息处理终端在获取至少一个百科意图的同时,还可以获取与所输入的查询信息相关联的至少一个非百科意图。
S207,计算所述至少一个百科意图中每个百科意图的意图强度;
S208,根据所述至少一个百科意图中每个百科意图的意图强度,对所述至少一个百科意图对应的百科文档进行排序处理。
其中,本发明实施例的步骤S207和S208可以分别参见图1所示实施例的步骤S102和S103,在此不进行赘述。
在本发明实施例中,通过获取所输入的查询信息相关联的至少一个百科意图,并计算每个百科意图的意图强度,根据意图强度对每个百科意图对应的百科文档进行排序,采用大量所记录的信息,可以针对查询信息获取到所需的百科文档,提高了查询信息和百科文档的关联性以及对查询信息的针对性,提升了用户体验,并对所需的百科文档进行排序处理,有效的提升了对所需的百科文档排序位置的准确性,在获取百科意图之前,通过进行百科意图模板的设置,可以为后续用户所输入的查询信息,快速对所输入的查询信息相关联的至少一个百科意图进行定位,增加了获取百科意图的准确性,进而提升了信息处理终端的智能性。
下面将结合附图3-附图5,对本发明实施例提供的信息处理终端进行详细介绍。需要说明的是,附图3-附图5所示的信息处理终端,用于执行本发明图1和图2所示实施例的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明图1和图2所示的实施例。
请参见图3,为本发明实施例提供了一种信息处理终端的结构示意图。如图3所示,本发明实施例的所述信息处理终端1可以包括:第一获取模块11、强度计算模块12和文档排序模块13。
第一获取模块11,用于获取与所输入的查询信息相关联的至少一个百科意图;
具体实现中,所述信息处理终端1可以监听搜索网页中的输入框,所述第一获取模块11获取用户所输入的查询信息,并根据所述所输入的查询信息,获取相关联的至少一个百科意图。
需要说明的是,所述第一获取模块11在获取与所输入的查询信息相关联的至少一个百科意图之前,所述信息处理终端1可以对预设时间段内所记录的查询信息进行计算统计,生成百科意图模板,则所述第一获取模块11可以通过计算所输入的查询信息中的百科词条和查询词条的关联程度,根据所述所输入的查询信息中的百科词条和查询词条的关联程度在所述百科意图模板中筛选出至少一个百科意图。
强度计算模块12,用于计算所述至少一个百科意图中每个百科意图的意图强度;
具体实现中,所述强度计算模块12可以对所述至少一个百科意图中每个百科意图的意图强度进行计算。
需要说明的是,所述强度计算模块12在计算所述至少一个百科意图中每个百科意图的意图强度之前,所述信息处理终端1还可以获取与所输入的查询信息相关联的至少一个非百科意图,所述强度计算模块12可以根据所述至少一个百科意图的个数、所述至少一个非百科意图的个数、所述至少一个百科意图对应的百科文档的点击次数以及所述至少一个非百科意图对应的非百科文档的点击次数,计算所述至少一个百科意图中每个百科意图的意图强度。
计算所述至少一个百科意图中每一个百科意图的意图强度所采用的公式可以为:意图强度=α*((1+A)/(1+A+B))+β*((1+A_num)/(1+A_num+B_num)),其中,A表示是否具有百科意图,如果有百科意图,则A=1;如果没有百科意图,则A=0;
B表示与所输入的查询信息相关联的非百科意图的个数;
A_num表示所述信息处理终端1所记录的该百科意图对应的百科文档被点击的次数,点击的次数可以按照点击时间由近到远依次衰减,例如:记录在最近的一个月内的点击均算为1次点击,而记录在最近的一个月之前的点击均算为0.5次;
B_num表示所述信息处理终端1所记录的所有与所输入的查询信息相关联的非百科意图对应的非百科文档被点击的次数,点击的次数也可以按照点击时间由近到远依次衰减,例如:记录在最近的一个月内的点击均算为1次点击,而记录在最近的一个月之前的点击均算为0.5次;
α和β均表示为权重系数,优选的,α+β=1。
可以理解的是,采用点击的次数可以按照点击时间由近到远依次衰减,可以根据大量的记录对意图强度进行计算,更好的增加意图强度计算的准确性。
文档排序模块13,用于根据所述至少一个百科意图中每个百科意图的意图强度,对所述至少一个百科意图对应的百科文档进行排序处理;
具体实现中,所述文档排序模块13采用预设的排序规则,根据所述至少一个百科意图中每个百科意图的意图强度,对所述至少一个百科意图对应的百科文档进行排序处理。所述预设的排序规则可以为:
第一百科文档的排序高于第二百科文档;
对于意图强度属于同一预设范围内的至少两个第二百科文档,根据点击次数和/或文档长度进行排序;
其中,所述第一百科文档为大于或等于预设强度阈值的意图强度对应的百科文档,所述第二百科文档为小于所述预设强度阈值的意图强度对应的百科文档。
需要说明的是,所述第一百科文档又称为完全匹配百科意图文档,所述第二百科文档又称为部分匹配百科意图文档,其中,完全匹配百科意图文档需要满足下列任意一个条件:
1、第一百科文档的文档标题与所输入的查询信息一致;
2、第一百科文档的文档标题与获取的所输入的查询信息中的百科词条一致;
3、所输入的查询信息相关联的至少一个百科意图对应的百科文档中,所记录的点击次数最高的百科文档。
部分匹配百科意图文档为与所输入的查询信息中的百科词条和查询词条部分匹配的文档,例如:如果所输入的查询信息为“XX是谁”,则所获取的部分匹配百科意图文档的内容可以为“XX的音乐、XX的事件”等。
进一步的,所述信息处理终端1可以将所述文档排序模块13排序处理后的所有百科文档进行输出显示,优选的,每个页面所显示的百科文档中可以只有一个完全匹配百科意图文档。当然,对于所有与所输入的查询信息相关联的非百科意图对应的非百科文档也可以加入排序处理,非百科文档则可以根据所记录的点击次数进行排序,所述信息处理终端1可以优先显示排序处理后的百科文档,再显示排序处理后的非百科文档。
在本发明实施例中,通过获取所输入的查询信息相关联的至少一个百科意图,并计算每个百科意图的意图强度,根据意图强度对每个百科意图对应的百科文档进行排序,采用大量所记录的信息,可以针对查询信息获取到所需的百科文档,提高了查询信息和百科文档的关联性以及对查询信息的针对性,提升了用户体验,并对所需的百科文档进行排序处理,有效的提升了对所需的百科文档排序位置的准确性,进而提升了信息处理终端的智能性。
请参见图4,为本发明实施例提供了另一种信息处理终端的结构示意图。如图4所示,本发明实施例的所述信息处理终端1可以包括第一获取模块11、强度计算模块12、文档排序模块13、信息获取模块14、程度计算模块15、模板设置模块16和第二获取模块17;其中,强度计算模块12和文档排序模块13可以参见图3所示实施例的相关描述,在此不进行赘述。
信息获取模块14,用于获取预设时间段内所记录的查询信息;
具体实现中,所述信息获取模块14获取预设时间段内所记录的查询信息,例如:所述信息获取模块14记录一年之内所有用户输入的查询信息。
程度计算模块15,用于计算所述所记录的查询信息中的百科词条和查询词条的关联程度;
具体实现中,所述程度计算模块15可以采用共现概率公式对所述所记录的查询信息中的百科词条和查询词条的关联程度进行计算。优选的,假设所述信息处理终端1中存在N篇文档,其中包含所述百科词条的文档有O篇,包含所述查询词条的文档有P篇,同时包含所述百科词条和所述查询词条的文档有Q篇,可以理解的是,Q<=(O+P)<=N,则所述共现概率公式可以为:
P(百科词条,查询词条)=Q/(O+P)。
模板设置模块16,用于根据所述所记录的查询信息中的百科词条和查询词条的关联程度,设置百科意图模板;
具体实现中,如果P(百科词条,查询词条)大于预设阈值,则认为所述百科词条和所述查询词条具备关联性,其中,所述预设阈值为大于0且小于等于1的数,所述模板设置模块16可以根据所述所记录的查询信息中具备关联性的百科词条和查询词条,进行百科意图模板设置,例如:
问答类百科意图模板可以包括:XX是什么、XX是什么意思等;
知识类百科意图模板可以包括:XX的功效、XX的功能等;
人物类百科意图模板可以包括:XX的生平、XX的简历等;
事件类百科意图模板可以包括:XX的事件等。
当然,上述百科意图模板的设置仅为举例,模板还可以根据人物、事物等进行分类,也可以根据出现的时间顺序进行分类。通过进行百科意图模板的设置,可以为后续用户所输入的查询信息,快速对所输入的查询信息相关联的至少一个百科意图进行定位,增加了获取百科意图的准确性。
第一获取模块11,用于获取与所输入的查询信息相关联的至少一个百科意图;
具体实现中,所述信息处理终端1可以监听搜索网页中的输入框,所述第一获取模块11获取用户所输入的查询信息,并根据所述所输入的查询信息,获取相关联的至少一个百科意图。
需要说明的是,所述第一获取模块11在获取与所输入的查询信息相关联的至少一个百科意图之前,所述信息处理终端1可以对预设时间段内所记录的查询信息进行计算统计,生成百科意图模板,则所述第一获取模块11可以通过计算所输入的查询信息中的百科词条和查询词条的关联程度,根据所述所输入的查询信息中的百科词条和查询词条的关联程度在所述百科意图模板中筛选出至少一个百科意图。
具体的,请一并参见图5,为本发明实施例提供了第一获取模块的结构示意图。如图5所示,所述第一获取模块11可以包括:计算单元111和筛选单元112。
计算单元111,用于计算所输入的查询信息中的百科词条和查询词条的关联程度;
具体实现中,所述信息处理终端1可以监听搜索网页中的输入框,所述计算单元111获取用户所输入的查询信息,计算所输入的查询信息中的百科词条和查询词条的关联程度,优选的,所述计算单元111同样可以采用共现概率公式对所述所输入的查询信息中的百科词条和查询词条的关联程度进行计算,具体的可以参见上述举例。
筛选单元112,用于根据所述所输入的查询信息中的百科词条和查询词条的关联程度在所述百科意图模板中筛选出至少一个百科意图;
具体实现中,所述筛选单元112根据对所述所输入的查询信息中的百科词条和查询词条的关联程度进行计算所得到的共现概率值,在所设置的所述百科意图模板中筛选出至少一个百科意图。
第二获取模块17,用于获取与所输入的查询信息相关联的至少一个非百科意图;
具体实现中,所述第一获取模块11在获取至少一个百科意图的同时,所述第二获取模块17还可以获取与所输入的查询信息相关联的至少一个非百科意图。
在本发明实施例中,通过获取所输入的查询信息相关联的至少一个百科意图,并计算每个百科意图的意图强度,根据意图强度对每个百科意图对应的百科文档进行排序,采用大量所记录的信息,可以针对查询信息获取到所需的百科文档,提高了查询信息和百科文档的关联性以及对查询信息的针对性,提升了用户体验,并对所需的百科文档进行排序处理,有效的提升了对所需的百科文档排序位置的准确性,在获取百科意图之前,通过进行百科意图模板的设置,可以为后续用户所输入的查询信息,快速对所输入的查询信息相关联的至少一个百科意图进行定位,增加了获取百科意图的准确性,进而提升了信息处理终端的智能性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (11)

1.一种信息处理方法,其特征在于,包括:
监听搜索网页中的输入框,获取用户所输入的查询信息;
计算所输入的查询信息中的百科词条和查询词条的关联程度,获取所述查询信息中包含的查询词条关联的百科词条,其中所述查询词条与所述百科词条之间的关联程度为根据预设时间段内所记录的查询信息计算得到的查询信息中的百科词条和查询词条的共现概率确定,若所述共现概率大于预设阈值,则确定所述百科词条和所述查询词条具备关联性;
根据所述查询词条关联的百科词条的类型在预设的多个百科意图模板中筛选出至少一个百科意图,其中不同类型的百科词条对应不同的百科意图模板;
计算所述至少一个百科意图中每个百科意图的意图强度;
根据所述至少一个百科意图中每个百科意图的意图强度,对所述至少一个百科意图对应的百科文档进行排序处理。
2.根据权利要求1所述的方法,其特征在于,所述根据所述查询词条关联的百科词条的类型在预设的多个百科意图模板中筛选出至少一个百科意图之前,还包括:
获取预设时间段内所记录的查询信息;
计算所述所记录的查询信息中的百科词条和查询词条的关联程度;
根据所述所记录的查询信息中的百科词条和查询词条的关联程度,设置百科意图模板。
3.根据权利要求1所述的方法,其特征在于,所述计算所述至少一个百科意图中每个百科意图的意图强度之前,还包括:
获取与所输入的查询信息相关联的至少一个非百科意图;
所述计算所述至少一个百科意图中每个百科意图的意图强度,包括:
根据所述至少一个百科意图的个数、所述至少一个非百科意图的个数、所述至少一个百科意图对应的百科文档的点击次数以及所述至少一个非百科意图对应的非百科文档的点击次数,计算所述至少一个百科意图中每个百科意图的意图强度。
4.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个百科意图中每个百科意图的意图强度,对所述至少一个百科意图对应的百科文档进行排序处理,包括:
采用预设的排序规则,根据所述至少一个百科意图中每个百科意图的意图强度,对所述至少一个百科意图对应的百科文档进行排序处理。
5.根据权利要求4所述的方法,其特征在于,所述预设的排序规则为:
第一百科文档的排序高于第二百科文档;
对于意图强度属于同一预设范围内的至少两个第二百科文档,根据点击次数和/或文档长度进行排序;
其中,所述第一百科文档为大于或等于预设强度阈值的意图强度对应的百科文档,所述第二百科文档为小于所述预设强度阈值的意图强度对应的百科文档。
6.一种信息处理终端,其特征在于,包括:
第一获取模块,用于监听搜索网页中的输入框,获取用户所输入的查询信息,获取与所输入的查询信息相关联的至少一个百科意图;所述第一获取模块包括计算单元和筛选单元,其中:
所述计算单元,用于计算所输入的查询信息中的百科词条和查询词条的关联程度,获取所述查询信息中包含的查询词条关联的百科词条,其中所述查询词条与所述百科词条之间的关联程度为根据预设时间段内所记录的查询信息计算得到的查询信息中的百科词条和查询词条的共现概率确定,若所述共现概率大于预设阈值,则确定所述百科词条和所述查询词条具备关联性;
所述筛选单元,用于根据所述查询词条关联的百科词条的类型在预设的多个百科意图模板中筛选出至少一个百科意图,其中不同类型的百科词条对应不同的百科意图模板;
强度计算模块,用于计算所述至少一个百科意图中每个百科意图的意图强度;
文档排序模块,用于根据所述至少一个百科意图中每个百科意图的意图强度,对所述至少一个百科意图对应的百科文档进行排序处理。
7.根据权利要求6所述的终端,其特征在于,还包括:
信息获取模块,用于获取预设时间段内所记录的查询信息;
程度计算模块,用于计算所述所记录的查询信息中的百科词条和查询词条的关联程度;
模板设置模块,用于根据所述所记录的查询信息中的百科词条和查询词条的关联程度,设置百科意图模板。
8.根据权利要求6所述的终端,其特征在于,还包括:
第二获取模块,用于获取与所输入的查询信息相关联的至少一个非百科意图;
所述强度计算模块具体用于根据所述至少一个百科意图的个数、所述至少一个非百科意图的个数、所述至少一个百科意图对应的百科文档的点击次数以及所述至少一个非百科意图对应的非百科文档的点击次数,计算所述至少一个百科意图中每个百科意图的意图强度。
9.根据权利要求6所述的终端,其特征在于,所述文档排序模块具体用于采用预设的排序规则,根据所述至少一个百科意图中每个百科意图的意图强度,对所述至少一个百科意图对应的百科文档进行排序处理。
10.根据权利要求9所述的终端,其特征在于,所述预设的排序规则为:
第一百科文档的排序高于第二百科文档;
对于意图强度属于同一预设范围内的至少两个第二百科文档,根据点击次数和/或文档长度进行排序;
其中,所述第一百科文档为大于或等于预设强度阈值的意图强度对应的百科文档,所述第二百科文档为小于所述预设强度阈值的意图强度对应的百科文档。
11.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-5中任一项所述的方法。
CN201310607926.2A 2013-11-25 2013-11-25 一种信息处理方法及终端 Active CN104657397B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310607926.2A CN104657397B (zh) 2013-11-25 2013-11-25 一种信息处理方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310607926.2A CN104657397B (zh) 2013-11-25 2013-11-25 一种信息处理方法及终端

Publications (2)

Publication Number Publication Date
CN104657397A CN104657397A (zh) 2015-05-27
CN104657397B true CN104657397B (zh) 2020-03-03

Family

ID=53248539

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310607926.2A Active CN104657397B (zh) 2013-11-25 2013-11-25 一种信息处理方法及终端

Country Status (1)

Country Link
CN (1) CN104657397B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446213B (zh) * 2016-09-30 2020-04-14 北京百度网讯科技有限公司 基于人工智能的服务排序方法和装置
CN108062295B (zh) * 2016-11-09 2021-11-05 北京国双科技有限公司 内容处理方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101976246A (zh) * 2010-09-30 2011-02-16 互动在线(北京)科技有限公司 百科词条分类检索方法
CN102096717A (zh) * 2011-02-15 2011-06-15 百度在线网络技术(北京)有限公司 搜索方法及搜索引擎
CN102129454A (zh) * 2011-03-08 2011-07-20 国网信息通信有限公司 一种基于云存储的百科数据处理方法及***
CN102567408A (zh) * 2010-12-31 2012-07-11 阿里巴巴集团控股有限公司 推荐搜索关键词的方法和装置
CN102622417A (zh) * 2012-02-20 2012-08-01 北京搜狗信息服务有限公司 对信息记录进行排序的方法和装置
CN102637173A (zh) * 2011-02-10 2012-08-15 北京百度网讯科技有限公司 网络百科内容形成方法、网络服务器和客户端

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101976246A (zh) * 2010-09-30 2011-02-16 互动在线(北京)科技有限公司 百科词条分类检索方法
CN102567408A (zh) * 2010-12-31 2012-07-11 阿里巴巴集团控股有限公司 推荐搜索关键词的方法和装置
CN102637173A (zh) * 2011-02-10 2012-08-15 北京百度网讯科技有限公司 网络百科内容形成方法、网络服务器和客户端
CN102096717A (zh) * 2011-02-15 2011-06-15 百度在线网络技术(北京)有限公司 搜索方法及搜索引擎
CN102129454A (zh) * 2011-03-08 2011-07-20 国网信息通信有限公司 一种基于云存储的百科数据处理方法及***
CN102622417A (zh) * 2012-02-20 2012-08-01 北京搜狗信息服务有限公司 对信息记录进行排序的方法和装置

Also Published As

Publication number Publication date
CN104657397A (zh) 2015-05-27

Similar Documents

Publication Publication Date Title
US10140368B2 (en) Method and apparatus for generating a recommendation page
CN108460082B (zh) 一种推荐方法及装置,电子设备
US10169449B2 (en) Method, apparatus, and server for acquiring recommended topic
US9310879B2 (en) Methods and systems for displaying web pages based on a user-specific browser history analysis
US7860878B2 (en) Prioritizing media assets for publication
CN109190049B (zh) 关键词推荐方法、***、电子设备和计算机可读介质
US10977317B2 (en) Search result displaying method and apparatus
WO2018069449A1 (en) Machine learning-based data aggregation using social media content
CN106250464B (zh) 排序模型的训练方法及装置
CN109829108B (zh) 信息推荐方法、装置、电子设备及可读存储介质
CN109241451B (zh) 一种内容组合推荐方法、装置及可读存储介质
CN109670101B (zh) 爬虫调度方法、装置、电子设备及存储介质
CN110968765B (zh) 书籍搜索方法、计算设备及计算机存储介质
US20170046440A1 (en) Information processing device, information processing method, and program
JP2018206361A (ja) ユーザ指向トピック選択及びブラウジングのためのシステム及び方法、複数のコンテンツ項目を表示する方法、プログラム、及びコンピューティングデバイス
CN112087667A (zh) 一种信息处理方法、装置以及计算机存储介质
CN107885875B (zh) 检索词的同义变换方法、装置及服务器
EP3543877A1 (en) Method and device for processing accumulative retrieval, terminal and storage medium
CN106919593B (zh) 一种搜索的方法和装置
CN104657397B (zh) 一种信息处理方法及终端
CN113392329A (zh) 内容推荐方法、装置、电子设备及存储介质
CN110990701B (zh) 书籍搜索方法、计算设备及计算机存储介质
WO2020057237A1 (zh) 适用于关注对象的影响力检测方法、电子终端及存储介质
CN110909130B (zh) 文本主题提取分析方法、装置及计算机可读存储介质
CN110147488B (zh) 页面内容的处理方法、处理装置、计算设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant