CN106294656A - 一种映射查询关键字到相关问题的方法 - Google Patents

一种映射查询关键字到相关问题的方法 Download PDF

Info

Publication number
CN106294656A
CN106294656A CN201610631777.7A CN201610631777A CN106294656A CN 106294656 A CN106294656 A CN 106294656A CN 201610631777 A CN201610631777 A CN 201610631777A CN 106294656 A CN106294656 A CN 106294656A
Authority
CN
China
Prior art keywords
word
cps
inquiry
key word
descriptor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610631777.7A
Other languages
English (en)
Other versions
CN106294656B (zh
Inventor
黄浩
颜钱
李宗鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Yuanfeng Intelligent Technology Co.,Ltd.
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201610631777.7A priority Critical patent/CN106294656B/zh
Publication of CN106294656A publication Critical patent/CN106294656A/zh
Application granted granted Critical
Publication of CN106294656B publication Critical patent/CN106294656B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种映射查询关键字到相关问题的方法;首先爬取问题信息,然后抽取查询关键字和问题的主题词,选择出候选问题集合CPS q ,对于CPS q 中的每个问题,计算其与查询关键字的相关程度,通过构造相关程度和受欢迎程度计算出该问题的综合得分,并按照得分从高到低的顺序对CPS q 中的问题进行排序得到集合RP,随后通过计算RP中问题之间的余弦相似度来从各类相似问题中选择代表性的问题组成集合FP,最后更新FP中每个问题的综合得分,并按照分数从高到低的顺序对FP中的问题进行排序,返回排序后的问题集合FP作为与查询关键字相关的问题;本发明能够直接获得与用户查询关键字相关的问题和答案,从而更加深入地理解用户需求,获得更好的搜索体验。

Description

一种映射查询关键字到相关问题的方法
技术领域
本发明属于信息检索技术领域,尤其涉及一种映射查询关键字到相关问题的方法。
背景技术
伴随着web2.0的发展,基于社区的问答网站(community based questionanswering sites,简写CQA)变得更加流行,越来越多的人通过在CQA提出问题和回答问题来进行知识分享。相对于通过关键字在搜索引擎中查询所需信息,CQA上的问题能够更加明确的表达用户需求,而且CQA的每一个问题背后由许多的用户来提供答案,并标记出一个最佳答案,从而可以更好的满足用户的信息检索需求。通过CQA这样一个高质量信息平台的存在,将用户提供的查询关键字映射到CQA上的问题,不仅可以为用户提供答案,而且还可以深入理解用户需求并将其作为明确的问题来服务于web搜索结果。
在将用户提供的查询关键字映射到CQA上的问题时,有些查询关键字不可能全部包含于问题中,所以就需要确立一个标准来对查询关键字与问题之间的相关性进行判断。同时,在获得多个与查询关键字相关的问题后,应当给出能够准确的反应用户需求的问题。并且,由于CQA上很多问题具有相似性,为了满足用户多方面的需求,可以将相似的问题归为同一类别,从中选出代表性的问题,而不需要全部都展现出来。
发明内容
为了解决上述技术问题,本发明提供了一种映射查询关键字到相关问题的方法。对于给定的信息需求,人们可以直接提出问题或从问题中选择相关的单词进行查询,称这些单词为主题词。通过对查询关键字和所有问题的主题词进行分析,得到与查询关键字相关的候选问题,然后经过对候选问题进行排序和分类来准确得到用户查询关键字所映射的问题。
本发明所采用的技术方案是:一种映射查询关键字至相关问题的方法,包括以下步骤:
步骤1:在CQA上进行问题爬取,并记录每个问题所属类别,得到由N个问题组成的问题集合PS,记PS={P1,P2,...,PN},对于集合PS中的每个问题Pj,通过一个标准的POStagger程序来抽取其中的名词短语,然后联合其所属类别单词得到对应的主题词集合PTSj;对于n个单词组成的查询关键字q,记q={w1,w2,...,wn},计算q中每个单词wi的主题词得分Tgrade(wi),并将得分大于阈值θt的单词加入q对应的主题词集合;所述的θt∈[0,1];若某个问题的主题词集合包含查询关键字的主题词集合,则将该问题加入查询关键字的候选问题集合CPSq,否则将该问题视为与查询关键字无关的问题,不予考虑;q中每个单词wi主题词得分Tgrade(wi)的计算公式为:
T g r a d e ( w i ) = Σ j = 1 N T i m e s ( w i | PTS j ) Σ j = 1 N p t i m e s ( w i | P j ) , ( i = 1 , 2 , ... , n )
其中,n是查询关键字q包含的单词数目;wi是q中的单词;N是问题集合PS中包含的问题数目;Times(wi|PTSj)是单词wi在集合PS里的每一个问题Pj对应的主题词集合PTSj中的出现次数;ptimes(wi|Pj)是单词wi在集合PS里的每一个问题Pj中的出现次数。
步骤2:对于集合CPSq中的每一个问题Pc,如果Pc和查询关键字q之间的相关程度越高,越有可能准确反应用户这次的信息检索需求,故而可以将问题与查询关键字的相关程度作为选择最终问题集合的一个重要参考依据,计算集合CPSq中每一个问题Pc与查询关键字q的相关程度,对应的结果使用Cor(Pc,q)表示,Cor(Pc,q)的具体计算为:
C o r ( P c , q ) = Π i = 1 n ( λ × c t i m e s ( w i | P c ) l e n g t h ( P c ) + ( 1 - λ ) Σ j = 1 N p t i m e s ( w i | P j ) Σ k = 1 n Σ j = 1 N p t i m e s ( w k | P j ) ) , ( c = 1 , 2 , ... , N c )
其中,Nc是候选问题集合CPSq包含的问题数目;n是查询关键字q包含的单词数目;wi是q中的单词;ctimes(wi|Pc)是单词wi在集合CPSq里的每一个问题Pc中的出现次数;length(Pc)是集合CPSq中的每一个问题Pc所包含的单词个数;N是问题集合PS中包含的问题数目;ptimes(wi|Pj)是单词wi在集合PS里的每一个问题Pj中的出现次数;λ(λ∈(0,1))为给定的抑制因子;所述的λ∈(0,1)。
步骤3:构造一个图G,把集合CPSq中问题作为节点,并且每一个问题对应于图G的一个节点;初始时图G只包含节点,而且任意两个节点Vm和Vn之间都不存在边;然后对于图G中的任意两个节点Vm和Vn,假设其对应于集合CPSq中的问题Pm和Pn,计算Pm和Pn的主题词覆盖率Cover(Pm,Pn),若Cover(Pm,Pn)大于给定阈值θc,则存在节点Vm到节点Vn的一条边,否则节点Vm和节点Vn仍不存在边;所述的θc∈[0,1];其中主题词覆盖率Cover(Pm,Pn)的计算公式为:
其中PTSm为问题Pm的主题词集合;||PTSm||表示集合PTSm中的元素个数cos(Pm,Pn)是两个问题的余弦相似度;α为给定的抑制因子;所述的α∈(0,1)。
步骤4:对于集合CPSq中的每一个问题Pc,如果被访问的次数越多,则表明该问题越受欢迎,越有可能是这次关键字查询所对应的问题,故将问题的受欢迎程度作为选择最终问题集合的一个重要参考依据,使用Wel(Pc)表示集合CPSq中每一个问题Pc的受欢迎程度,Wel(Pc)的具体计算为:
W e l ( P c ) = 1 N c + d Σ v ∈ a d j ( P c ) W e l ( v ) deg ( v ) , ( c = 1 , 2 , ... , N c )
其中,Nc是候选问题集合CPSq包含的问题数目;adj(Pc)代表图G中与每一个问题Pc相连的节点集合;v为集合adj(Pc)中的一个节点;deg(v)为节点v的度;d(d∈(0,1))给定的抑制因子;
步骤5:对于集合CPSq中的每一个问题Pc,联合其受欢迎程度和与查询关键字的相关程度,计算每个问题的综合得分Grade(Pc),按照综合性得分从大到小的顺序对CPSq中的问题进行排序,得到排序后的问题集合RP;综合性得分Grade(Pc)的具体计算为:
Grade(Pc)=log(Cor(Pc,q))+log(Wel(Pc)),(c=1,2,...,Nc)
其中Nc是候选问题集合CPSq包含的问题数目;Cor(Pc,q)是每一个问题Pc和查询关键字q的相关程度;Wel(Pc)为每一个问题Pc的受欢迎程度;
步骤6:初始化一个空集合FP,将RP中的第一个问题加入FP,然后依次选择RP中剩余的每个问题Pr,计算Pr和FP中每个问题的余弦相似度csim,记录最大的余弦相似度maxcsim和对应FP中的问题Pf,将Pr的分数Grade(Pr)加Grade(Pf)到上,同时若maxcsim小于给定阈值θs,则将Pr加入FP,若maxcsim大于给定阈值θs,所述的θs∈[0,1],则认为问题Pr和Pf相似,并记录与问题Pf相似的问题个数Nfq
步骤7:更新FP集合中每个问题Pt的综合得分,并按照更新后的分数从大到小的顺序对FP中的问题排序,返回排序后的集合FP。更新得分的公式为:
G r a d e ( P t ) N e w = G r a d e ( P t ) O l d N t q
其中Grade(Pt)Old为FP中每个问题Pt的更新前的分数;Ntq是与每一个问题Pt相似的问题数目;Grade(Pt)New是FP中每一个问题Pt的更新后的分数。
优选的,在步骤1中,θt∈[0.3,0.9]。
优选的,在步骤2中,λ∈(0.2,0.9)。
优选的,在步骤3中,α∈(0.1,1),θc∈[0.3,0.9]。
优选的,在步骤4中,d∈(0.1,1)。
优选的,在步骤6中,θs∈[0.2,0.9]。
本发明将用户查询关键字映射为明确的问题,可以将CQA上的高质量信息整合入搜索引擎,并且能够直接获得与用户查询关键字相关的问题和答案,从而更加深入地理解用户需求,获得更好的搜索体验。
附图说明
图1:本发明实施例的流程图。
图2:本发明实施例中RP集合中得分排名前三的问题结果图;
图3:本发明实施例中排序后的FP集合中得分排名前三的问题结果图;
图4:本发明实施例中查询关键字在搜索引擎中查询得到排名前三的结果图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施实例仅用于说明和解释本发明,并不用于限定本发明。
本发明提供了一种映射查询关键字到相关问题的方法。对于给定的查询关键字,映射与其相关的问题。
请见图1,本发明包括以下步骤:
步骤1:在Yahoo!Answers上选择“iPod”类别进行问题爬取,得到问题集合PS,记PS={P1,P2,...,PN}。对于集合PS中的每个问题Pj,通过一个标准的POS tagger程序来抽取其中的名词短语,然后结合“iPod”得到对应的主题词集合PTSj
给定查询关键字q=“iPod downloaded videos”,,计算q中每个单词wi的主题词得分Tgrade(wi),并将得分大于阈值θt的单词加入q对应的主题词集合;所述的θt∈[0,1];若某个问题的主题词集合包含查询关键字的主题词集合,则将该问题加入查询关键字的候选问题集合CPSq,否则将该问题视为与查询关键字无关的问题,不予考虑;q中每个单词wi主题词得分Tgrade(wi)的计算公式为:
T g r a d e ( w i ) = Σ j = 1 N T i m e s ( w i | PTS j ) Σ j = 1 N p t i m e s ( w i | P j ) , ( i = 1 , 2 , ... , n )
其中,n是查询关键字q包含的单词数目;wi是q中的单词;N是问题集合PS中包含的问题数目;Times(wi|PTSj)是单词wi在集合PS里的每一个问题Pj对应的主题词集合PTSj中的出现次数;ptimes(wi|Pj)是单词wi在集合PS里的每一个问题Pj中的出现次数。
步骤2:对于集合CPSq中的每一个问题Pc,如果Pc和查询关键字q之间的相关程度越高,越有可能准确反应用户这次的信息检索需求,故而可以将问题与查询关键字的相关程度作为选择最终问题集合的一个重要参考依据,计算集合CPSq中每一个问题Pc与查询关键字q的相关程度,对应的结果使用Cor(Pc,q)表示,Cor(Pc,q)的具体计算为:
C o r ( P c , q ) = Π i = 1 n ( λ × t i m e s ( w i | P c ) l e n g t h ( P c ) ( 1 - λ ) Σ j = 1 N t i m e s ( w i | P j ) Σ k = 1 n Σ j = 1 N t i m e s ( w k | P j ) ) , ( c = 1 , 2 , ... , N c )
其中,Nc是候选问题集合CPSq包含的问题数目;n是查询关键字q包含的单词数目;wi是q中的单词;ctimes(wi|Pc)是单词wi在集合CPSq里的每一个问题Pc中的出现次数;length(Pc)是集合CPSq中的每一个问题Pc所包含的单词个数;N是问题集合PS中包含的问题数目;ptimes(wi|Pj)是单词wi在集合PS里的每一个问题Pj中的出现次数;λ(λ∈(0,1))为给定的抑制因子;所述的λ∈(0,1)。
步骤3:构造一个图G,把集合CPSq中问题作为节点,并且每一个问题对应于图G的一个节点;初始时图G只包含节点,而且任意两个节点Vm和Vn之间都不存在边;然后对于图G中的任意两个节点Vm和Vn,假设其对应于集合CPSq中的问题Pm和Pn,计算Pm和Pn的主题词覆盖率Cover(Pm,Pn),若Cover(Pm,Pn)大于给定阈值θc,则存在节点Vm到节点Vn的一条边,否则节点Vm和节点Vn仍不存在边;所述的θc∈[0,1];其中主题词覆盖率Cover(Pm,Pn)的计算公式为:
其中PTSm为问题Pm的主题词集合;||PTSm||表示集合PTSm中的元素个数cos(Pm,Pn)是两个问题的余弦相似度;α为给定的抑制因子;所述的α∈(0,1)。
步骤4:对于集合CPSq中的每一个问题Pc,如果被访问的次数越多,则表明该问题越受欢迎,越有可能是这次关键字查询所对应的问题,故将问题的受欢迎程度作为选择最终问题集合的一个重要参考依据,使用Wel(Pc)表示集合CPSq中每一个问题Pc的受欢迎程度,Wel(Pc)的具体计算为:
W e l ( P c ) = 1 N c + d Σ v ∈ a d j ( P c ) W e l ( v ) deg ( v ) , ( c = 1 , 2 , ... , N c )
其中,Nc是候选问题集合CPSq包含的问题数目;adj(Pc)代表图G中与每一个问题Pc相连的节点集合;v为集合adj(Pc)中的一个节点;deg(v)为节点v的度;d(d∈(0,1))给定的抑制因子;
步骤5:对于集合CPSq中的每一个问题Pc,联合其受欢迎程度和与查询关键字的相关程度,计算每个问题的综合得分Grade(Pc),按照综合性得分从大到小的顺序对CPSq中的问题进行排序,得到排序后的问题集合RP。RP集合中得分排名前三的问题如图2所示。综合性得分Grade(Pc)的具体计算为
Grade(Pc)=log(Cor(Pc,q))+log(Wel(Pc)),(c=1,2,...,Nc)
其中Nc是候选问题集合CPSq包含的问题数目;Cor(Pc,q)是每一个问题Pc和查询关键字q的相关程度;Wel(Pc)为每一个问题Pc的受欢迎程度;
步骤6:初始化一个空集合FP,将RP中的第一个问题加入FP,然后依次选择RP中剩余的每个问题Pr,计算Pr和FP中每个问题的余弦相似度csim,记录最大的余弦相似度maxcsim和对应FP中的问题Pf,将Pr的分数Grade(Pr)加Grade(Pf)到上,同时若maxcsim小于给定阈值θs,则将Pr加入FP,若maxcsim大于给定阈值θs,所述的θs∈[0,1],则认为问题Pr和Pf相似,并记录与问题Pf相似的问题个数Nfq
步骤7:更新FP集合中每个问题Pt的综合得分,并按照更新后的分数从大到小的顺序对FP中的问题排序,排序后的FP集合中综合性得分排名前三的问题如图3所示。查询关键字在搜索引擎中查询得到排名前三的结果如图4所示。返回排序后的集合FP。更新得分的公式为:
G r a d e ( P t ) N e w = G r a d e ( P t ) O l d N t q
其中Grade(Pt)Old为FP中每个问题Pt的更新前的分数;Ntq是与每一个问题Pt相似的问题数目;Grade(Pt)New是FP中每一个问题Pt的更新后的分数。
本发明将用户查询关键字映射为明确的问题,不仅可以为用户提供答案,而且还可以深入理解用户需求并将其作为明确的问题来服务于web搜索结果,从而获得更好的搜索体验。
在步骤1中,θt∈[0.3,0.9]。
在步骤2中,λ∈(0.2,0.9)。
在步骤3中,α∈(0.1,1),θc∈[0.3,0.9]。
在步骤4中,d∈(0.1,1)。
在步骤6中,θs∈[0.2,0.9]。
应当理解的是,本说明书为详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (6)

1.一种映射查询关键字到相关问题的方法,其特征在于,包括以下步骤:
步骤1:在CQA上进行问题爬取,并记录每个问题所属类别,得到问题集合PS,记PS={P1,P2,...,PN},对于集合PS中的每个问题Pi,通过一个标准的POS tagger程序来抽取其中的名词短语,然后联合其所属类别单词得到对应的主题词集合PTSi;对于n个单词组成的查询关键字q,记q={w1,w2,...,wn},计算q中每个单词wi的主题词得分Tgrade(wi),并将得分大于阈值θtt∈[0,1])的单词加入q对应的主题词集合;若某个问题的主题词集合包含查询关键字的主题词集合,则将该问题加入查询关键字的候选问题集合CPSq;q中每个单词wi主题词得分Tgrade(wi)的计算公式为:
T g r a d e ( w i ) = Σ j = 1 N T i m e s ( w i | PTS j ) Σ j = 1 N t i m e s ( w i | P j ) , ( i = 1 , 2 , ... , n )
其中n是q包含的单词数目;wi是q中的单词;N是PS中包含的问题数目;Times(wi|PTSj)是wi在PTSj中的出现次数;times(wi|Pj)是wi在Pj中的出现次数;
步骤2:对于集合CPSq中的每一个问题Pc,如果Pc和查询关键字q之间的相关程度越高,越有可能准确反应用户这次的信息检索需求,使用Cor(Pc,q)表示Pc与查询关键字q的相关程度,Cor(Pc,q)的具体计算为:
C o r ( P c , q ) = Π i = 1 n ( λ × t i m e s ( w i | P c ) l e n g t h ( P c ) + ( 1 - λ ) Σ j = 1 N t i m e s ( w i | P j ) Σ k = 1 n Σ j = 1 N t i m e s ( w k | P j ) ) , ( c = 1 , 2 , ... , N c )
其中Nc是CPSq包含的问题数目;n是q包含的单词数目;wi是q中的单词;times(wi|Pc)是wi在Pc中的出现次数;length(Pc)是Pc包含的单词个数;N是PS中包含的问题数目;λ(λ∈(0,1))为给定的抑制因子;
步骤3:构造一个图G,将集合CPSq中的每一个问题作为图G的一个节点,然后计算集合CPSq中的任意两个问题Pi和Pj的主题词覆盖率Cover(Pi,Pj),若Cover(Pi,Pj)大于给定阈值θcc∈[0,1]),则存在Pi到Pj的一条边;其中主题词覆盖率Cover(Pi,Pj)的计算公式为:
其中PTSi为问题Pi的主题词集合;||PTSi||表示集合PTSi中的元素个数cos(Pi,Pj)是两个问题的余弦相似度;α(α∈(0,1))为给定的抑制因子;
步骤4:对于集合CPSq中的每一个问题Pc,如果被访问的次数越多,则表明该问题越受欢迎,越有可能是这次关键字查询所对应的问题,使用Wel(Pc)表示Pc的受欢迎程度,Wel(Pc)的具体计算为:
W e l ( P c ) = 1 N c + d Σ v ∈ a d j ( P c ) W e l ( v ) deg ( v ) , ( c = 1 , 2 , ... , N c )
其中Nc是CPSq包含的问题数目;adj(Pc)为图G中与Pc相连的节点集合;v为集合adj(Pc)中的一个节点;deg(v)为节点v的度;d(d∈(0,1))给定的抑制因子;
步骤5:对于集合CPSq中的每一个问题Pc,联合其受欢迎程度和与查询关键字的相关程度,计算每个问题的综合得分Grade(Pc),按照综合性得分从大到小的顺序对CPSq中的问题进行排序,得到排序后的问题集合RP;综合性得分Grade(Pc)的具体计算为
Grade(Pc)=log(Cor(Pc|q))+log(Wel(Pc))
其中Cor(Pc|q)为Pc和q的相关程度;Wel(Pc)为Pc的受欢迎程度;
步骤6:初始化一个空集合FP,将RP中的第一个问题加入FP,然后依次选择RP中剩余的每个问题Pr,计算Pr和FP中每个问题的余弦相似度csim,记录最大的余弦相似度maxcsim和对应FP中的问题Pf,将Pr的分数Grade(Pf)加Grade(Pf)到上,同时若maxcsim小于给定阈值θss∈[0,1]),则将Pr加入FP,否则认为问题Pr和Pf相似,并记录与问题Pf相似的问题个数Nfq
步骤7:更新FP集合中每个问题的综合得分,并按照更新后的分数从大到小的顺序对FP中的问题排序,返回排序后的集合FP;更新得分的公式为:
G r a d e ( P f ) N e w = G r a d e ( P f ) O l d N f q
其中Grade(Pf)Old为FP中问题Ps的更新前的分数;Nfq是与Pf相似的问题数目;Grade(Pf)New是FP中问题Pf的更新后的分数。
2.根据权利要求1所述的一种映射查询关键字到相关问题的方法,其特征在于:在步骤1中,θt∈[0.3,0.9]。
3.根据权利要求1所述的一种映射查询关键字到相关问题的方法,其特征在于:在步骤2中,λ∈(0.2,0.9)。
4.根据权利要求1所述的一种映射查询关键字到相关问题的方法,其特征在于:在步骤3中,α∈(0.1,1),θc∈[0.3,0.9]。
5.根据权利要求1所述的一种映射查询关键字到相关问题的方法,其特征在于:在步骤4中,d∈(0.1,1)。
6.根据权利要求1所述的一种映射查询关键字到相关问题的方法,其特征在于:在步骤6中,θs∈[0.2,0.9]。
CN201610631777.7A 2016-08-04 2016-08-04 一种映射查询关键字到相关问题的方法 Active CN106294656B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610631777.7A CN106294656B (zh) 2016-08-04 2016-08-04 一种映射查询关键字到相关问题的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610631777.7A CN106294656B (zh) 2016-08-04 2016-08-04 一种映射查询关键字到相关问题的方法

Publications (2)

Publication Number Publication Date
CN106294656A true CN106294656A (zh) 2017-01-04
CN106294656B CN106294656B (zh) 2019-03-19

Family

ID=57664941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610631777.7A Active CN106294656B (zh) 2016-08-04 2016-08-04 一种映射查询关键字到相关问题的方法

Country Status (1)

Country Link
CN (1) CN106294656B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103885966A (zh) * 2012-12-20 2014-06-25 北京京东尚科信息技术有限公司 电子商务交易平台中的问答交互方法和***
CN104899273A (zh) * 2015-05-27 2015-09-09 东南大学 一种基于话题和相对熵的网页个性化推荐方法
CN105447080A (zh) * 2015-11-05 2016-03-30 华建宇通科技(北京)有限责任公司 一种社区问答搜索中的查询补全方法
CN105786794A (zh) * 2016-02-05 2016-07-20 青岛理工大学 一种问答对检索方法及社区问答检索***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103885966A (zh) * 2012-12-20 2014-06-25 北京京东尚科信息技术有限公司 电子商务交易平台中的问答交互方法和***
CN104899273A (zh) * 2015-05-27 2015-09-09 东南大学 一种基于话题和相对熵的网页个性化推荐方法
CN105447080A (zh) * 2015-11-05 2016-03-30 华建宇通科技(北京)有限责任公司 一种社区问答搜索中的查询补全方法
CN105786794A (zh) * 2016-02-05 2016-07-20 青岛理工大学 一种问答对检索方法及社区问答检索***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
徐振: "面向问答社区的问题类型敏感的答案摘要算法研究", 《中国优秀硕士论文全文数据库 信息科技辑》 *
杨海天: "社区问答***中问句检索技术的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Also Published As

Publication number Publication date
CN106294656B (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
Eirinaki et al. Web path recommendations based on page ranking and markov models
US8380716B2 (en) Mind map with data feed linkage and social network interaction
CN107688606A (zh) 一种推荐信息的获取方法及装置,电子设备
CN103593425B (zh) 基于偏好的智能检索方法及***
US20100318537A1 (en) Providing knowledge content to users
Popescu et al. Mining social media to create personalized recommendations for tourist visits
US10019513B1 (en) Weighted answer terms for scoring answer passages
Priyogi Preference elicitation strategy for conversational recommender system
CN110443571A (zh) 基于知识图谱进行简历评估的方法、装置及设备
CN102663022B (zh) 一种基于url的分类识别方法
KR102090237B1 (ko) 시맨틱 트리플 기반의 지식 확장 시스템, 방법 및 컴퓨터 프로그램
CN105677780A (zh) 可拓展的用户意图挖掘方法及其***
US20110238491A1 (en) Suggesting keyword expansions for advertisement selection
Kantor et al. Capturing human intelligence in the net
CN105139211A (zh) 产品简介生成方法及***
CN105761154B (zh) 一种社会化推荐方法及装置
US20210326399A1 (en) System and Method for Search Engine Results Page Ranking with Artificial Neural Networks
CN110147494A (zh) 信息搜索方法、装置,存储介质及电子设备
US9965474B2 (en) Dynamic summary generator
CN103842997A (zh) 搜索和创建自适应内容
CN103294670B (zh) 一种基于词表的搜索方法和***
CN111506596A (zh) 信息检索方法、装置、计算机设备和存储介质
Liang et al. SMS: A framework for service discovery by incorporating social media information
Yu et al. “An image is worth a thousand features”: scalable product representations for in-session type-ahead personalization
CN113392321A (zh) 一种信息推荐方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190617

Address after: 212000 298 South Xu Road, hi tech Zone, Zhenjiang, Jiangsu

Patentee after: Zhenjiang Jiaoze Information Technology Co., Ltd.

Address before: 430072 Wuhan University, Luojia mountain, Wuchang District, Wuhan, Hubei

Patentee before: Wuhan University

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211015

Address after: 210042 rooms 601 and 605, 6 / F, building 5, Juhui Park, phase II, Xuzhuang high tech Zone, 108 Xuanwu Avenue, Xuanwu District, Nanjing, Jiangsu Province

Patentee after: Nanjing Yuanfeng Intelligent Technology Co.,Ltd.

Address before: 212000 298 South Xu Road, hi tech Zone, Zhenjiang, Jiangsu

Patentee before: ZHENJIANG JIAOZE INFORMATION TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right