CN109033386A - 搜索排序方法、装置、计算机设备和存储介质 - Google Patents

搜索排序方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109033386A
CN109033386A CN201810848394.4A CN201810848394A CN109033386A CN 109033386 A CN109033386 A CN 109033386A CN 201810848394 A CN201810848394 A CN 201810848394A CN 109033386 A CN109033386 A CN 109033386A
Authority
CN
China
Prior art keywords
weight
initial retrieval
retrieval result
user
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810848394.4A
Other languages
English (en)
Other versions
CN109033386B (zh
Inventor
彭钊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Tianjin ByteDance Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin ByteDance Technology Co Ltd filed Critical Tianjin ByteDance Technology Co Ltd
Priority to CN201810848394.4A priority Critical patent/CN109033386B/zh
Priority to US16/760,414 priority patent/US11481402B2/en
Priority to PCT/CN2018/113428 priority patent/WO2020019565A1/zh
Publication of CN109033386A publication Critical patent/CN109033386A/zh
Application granted granted Critical
Publication of CN109033386B publication Critical patent/CN109033386B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种搜索排序方法、装置、计算机设备和存储介质。所述方法包括:获取搜索关键词,确定与所述关键词匹配的多个初始检索结果;获取每个所述初始检索结果相关的多个特征因子及每个所述特征因子的权重;根据多个所述特征因子的权重,对每个所述初始检索结果进行融合计算,得到每个初始检索结果的综合权值;根据所述综合权值对所述多个初始检索结果进行排序。本发明实施例通过对多个栏目的初始检索结果综合排序,能够快速查找到目标结果,节约了操作时间和提高搜索效率。

Description

搜索排序方法、装置、计算机设备和存储介质
技术领域
本申请涉及企业即时通讯***技术领域,特别是涉及一种搜索排序方法、装置、计算机设备和存储介质。
背景技术
随着智能设备的快速发展,聊天应用软件越来越多,聊天应用软件的使用能够方便用户进行异地沟通。其中聊天应用软件包括个人聊天应用软件和企业聊天应用软件。企业聊天应用软件的使用过程中,用户需要查找相关信息时,会启动搜索功能,如搜索聊天信息、联系人或者群聊,以便快速查找到相关信息或者快速建立聊天链接。
目前,在实现企业聊天应用软件搜索功能时,发现存在如下问题:
企业聊天应用软件的初始检索结果是按不同的对象分开展示的,如联系人、群聊、消息等信息都是分栏目展示的,且显示的对象是通过时间先后来进行排序,用户根据展示的栏目来查找相关信息,操作繁琐且耗时多。
发明内容
基于此,有必要针对上述技术问题,提供一种能够快速查找到相关信息的搜索排序方法、装置、计算机设备和存储介质。
一种搜索排序方法,所述方法包括:
获取搜索关键词,确定与所述关键词匹配的多个初始检索结果;
获取每个所述初始检索结果相关的多个特征因子及每个所述特征因子的权重;
根据多个所述特征因子的权重,对每个所述初始检索结果进行融合计算,得到每个初始检索结果的综合权值;
根据所述综合权值对所述多个初始检索结果进行排序。
在其中一个实施例中,所述多个特征因子包括文本相似度、聊天更新时间、初始召回搜索引擎分数、部门相近度、联系人客观重要度、聊天消息数、点击率以及用户关联程度中的至少一种;
所述获取每个所述初始检索结果相关的多个特征因子及每个所述特征因子的权重包括:
根据所述初始检索结果的字段,获取所述初始检索结果所包含的特征因子;其中,所述字段中包括对象类型、对象状态、对象名称、初始召回搜索引擎分数、聊天更新时间、最近一条消息位置、对象拼音名、对象英文名、所在部门中的至少一种信息;
根据所述字段中信息分别计算每种所述特征因子对应的权重;其中,所述特征因子对应的权重包括文本相似度的权重、聊天更新时间的权重、初始召回搜索引擎分数的权重、部门相近度的权重、联系人客观重要度的权重、聊天消息数的权重、点击率的权重以及用户关联程度的权重中的至少一种。
在其中一个实施例中,所述计算文本相似度的权重包括:计算所述关键词在所述初始检索结果中的命中率、顺序一致性指标、位置紧密度和覆盖率;
根据所述命中率、顺序一致性指标、位置紧密度和覆盖率,计算文本相似度的权重。
在其中一个实施例中,所述根据所述命中率、顺序一致性指标、位置紧密度和覆盖率计算文本相似度的权重的步骤包括:
根据所述命中率、顺序一致性指标、位置紧密度和覆盖率分别获取偏移值和修正值;
根据所述命中率、顺序一致性指标、位置紧密度和覆盖率和所述偏移值和修正值进行融合计算,得到文本相似度的权重。
在其中一个实施例中,所述计算聊天更新时间的权重包括:
根据所述初始检索结果,获取最后一次聊天时间距离当前时间的时间间隔;
计算衰减常数与所述时间间隔与所述衰减常数之和的比值,得到所述聊天更新时间的权重。
在其中一个实施例中,所述计算初始召回搜索引擎分数的权重包括:
对所述初始检索结果根据词频-逆文本频率指数模型打分,获得初始召回搜索引擎分数的权重。
在其中一个实施例中,所述计算部门相近度的权重包括:
将所述初始检索结果中的所在部门与当前进行搜索的用户所在部门进行比对;
若为同一个部门,部门相近度的权重设为1;
若不为同一个部门,部门相近度的权重设为0。
在其中一个实施例中,所述计算联系人客观重要度的权重包括:
获取所述初始检索结果职位级别、发表文章数目比值、受关注数据和点赞数据;
根据所述职位级别、发表文章数目比值、受关注数据和点赞数据,计算联系人客观重要度的权重。
在其中一个实施例中,所述根据所述职位级别、发表文章数目比值、受关注数据和点赞数据,计算联系人客观重要度的权重包括:
根据所述职位级别、发表文章数目比值、受关注数据和点赞数据分别获取偏移值和修正值;
根据所述职位级别、发表文章数目比值、受关注数据、点赞数据和所述偏移值和修正值进行融合计算,得到联系人客观重要度的权重。
在其中一个实施例中,所述计算聊天消息数的权重包括:
获取所述初始检索结果与当前进行搜索的用户之间的聊天消息总数目;
获取所述聊天消息总数目的参数r;
根据所述聊天消息总数目与参数r计算得到聊天消息数的权重;
其中,参数r为以数量单位。
在其中一个实施例中,所述计算点击率的权重包括:
获取所述初始检索结果的用户点击数;
根据所述用户点击数,向点击率的权重赋值;其中,点击率的权重与所述用户点击数成正比。
在其中一个实施例中,计算所述用户关联程度的权重包括:
计算所述初始检索结果与所述当前进行搜索的用户共同联系人数目、共同部门特征数、共同办公地点特征数和共同个人标签数;
根据所述共同联系人数目、共同部门特征数、共同办公地点特征数、共同个人标签数,计算用户关联程度的权重。
在其中一个实施例中,所述根据多个所述特征因子的权重,对每个所述初始检索结果进行融合计算,得到每个初始检索结果的综合权值包括:
根据所述初始检索结果的每个特征因子分别获取偏移值和修正值;
计算所述特征因子与与其对应的所述偏移值之积再与与其对应的所述修正值之和得到融合系数;
将所述多个特征因子的融合系数相乘得到所述初始检索结果的综合权值。
一种搜索排序装置,所述装置包括:
初始检索结果提取模块,获取搜索关键词,确定与所述关键词匹配的多个初始检索结果;
特征因子提取模块,获取每个所述初始检索结果相关的多个特征因子及每个所述特征因子的权重;
权值计算模块,根据所述多个特征因子及每个所述特征因子的权重,对每个所述初始检索结果初始检索结果进行融合计算,得到每个初始检索结果的综合权值;
排序模块,根据所述综合权值对所述多个初始检索结果进行排序。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求上述的方法的步骤。
上述搜索排序方法、装置、计算机设备和存储介质,从多个栏目来获取初始检索结果,保证所获取的信息更加全面,在企业沟通工具中,栏目会包括多种,如果漏掉其中某个栏目可能会导致搜索失败;再根据初始检索结果来进行权值计算,实现统一的排序标准,对综合排序提供了基础;最后根据权值进行综合排序能够方便用户快速查找到相关信息,简化了操作提高了查找效率。
附图说明
图1为一个实施例中搜素排序方法的应用环境图;
图2为一个实施例中搜素排序方法的流程示意图;
图3为一个实施例特征因子的权重的步骤的流程示意图;
图4为一个实施例中搜索排序装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的搜索排序方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。在终端102输入搜索关键词,服务器104获取搜索关键词,确定与所述关键词匹配的多个初始检索结果;获取每个所述初始检索结果相关的多个特征因子及每个所述特征因子的权重;根据多个所述特征因子的权重,对每个所述初始检索结果进行融合计算,得到每个初始检索结果的综合权值;根据所述综合权值对所述多个初始检索结果进行排序,综合排序的结果显示于终端102。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种搜索排序的方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤210,获取搜索关键词,确定与所述关键词匹配的多个初始检索结果。
其中,搜索关键词为用户在使用搜索引擎查找相关信息时输入的字、词、符号等输入信息。本实施例中栏目包括联系人栏、群聊栏、消息栏。
具体地,在终端输入搜索关键词,终端获取用户输入的搜素关键词发送至服务器。
步骤220,获取每个所述初始检索结果相关的多个特征因子及每个所述特征因子的权重。
其中,初始检索结果为与搜索关键词所匹配的文本文档;从初始检索结果中获取多个特征因子,根据文本文档提取与关键词相关的一些信息。作为较佳的一个实施方式,多个特征因子包括文本相似度、聊天更新时间、初始召回搜索引擎分数、部门相近度、联系人客观重要度、聊天消息数、点击率、用户关联程度中的至少一种。在本实施例中,每个栏目的初始检索结果的特征因子可以相同也可以不同。
作为一个优选的实施方式,所述获取每个所述初始检索结果相关的多个特征因子及每个所述特征因子的权重之前包括:对所述初始检索结果依进行筛选。其中,所述对所述初始检索结果依进行筛选包括:离职用户且无聊天记录不进行排序、未注册用户排在最后。聊天记录可以通过聊天更新时间或最近一条消息对应位置确定。
步骤230,根据多个所述特征因子的权重,对每个所述初始检索结果进行融合计算,得到每个初始检索结果的综合权值。
其中,每个初始检索结果包括多个特征因子,利用多个特征因子的权重进行融合计算每个初始检索结果的权值。
步骤240,根据所述综合权值对所述多个初始检索结果进行排序。
其中,进行综合排序时,可以依据权值从大到小来进行排序,也可以依据权值从小到大来进行排序。采用此种技术方案不依据栏目来区分排序方式,而是根据权值来进行排序,实现快速查找到相关信息。
其中,初始检索结果,针对的对象是联系人或群。每条初始检索结果包含的字段包括:对象类型、对象状态、对象名称、初始召回搜索引擎分数、聊天更新时间、最近一条消息位置、对象拼音名、对象英文名、所在部门。其中,对象类型包括聊天应用、邮件,对象状态包括是否注册、是否离职。
上述搜素排序方法中,从多个栏目来获取初始检索结果,保证所获取的信息更加全面,在企业沟通工具中,栏目会包括多种,如果漏掉其中某个栏目可能会导致搜索失败;再根据初始检索结果来进行权值计算,实现统一的排序标准,对综合排序提供了基础;最后根据权值进行综合排序能够方便用户快速查找到相关信息,简化了操作提高了查找效率。
本实施例中,如图3所示,所述获取每个所述初始检索结果相关的多个特征因子及每个所述特征因子的权重包括:
步骤302,根据所述初始检索结果的字段,获取所述初始检索结果所包含的特征因子;其中,所述字段中包括对象类型、对象状态、对象名称、初始召回搜索引擎分数、聊天更新时间、最近一条消息位置、对象拼音名、对象英文名、所在部门中的至少一种信息。
步骤304,根据所述字段中信息分别计算每种所述特征因子对应的权重;其中,所述特征因子对应的权重包括文本相似度的权重、聊天更新时间的权重、初始召回搜索引擎分数的权重、部门相近度的权重、联系人客观重要度的权重、聊天消息数的权重、点击率的权重以及用户关联程度的权重中的至少一种。
在其中一个实施例中,根据所述字段中信息计算文本相似度的权重包括:计算所述关键词在所述初始检索结果中的命中率、顺序一致性指标、位置紧密度和覆盖率;根据所述命中率、顺序一致性指标、位置紧密度和覆盖率,计算文本相似度的权重。
其中,所述根据所述命中率、顺序一致性指标、位置紧密度和覆盖率计算文本相似度的权重的步骤包括:根据所述命中率、顺序一致性指标、位置紧密度和覆盖率分别获取偏移值和修正值;根据所述命中率、顺序一致性指标、位置紧密度和覆盖率和所述偏移值和修正值进行融合计算,得到文本相似度的权重;其中,所述偏移值和修正值可通过机器学习确定。其中,根据所述命中率、顺序一致性指标、位置紧密度和覆盖率分别获取偏移值和修正值包括:根据所述命中率获取偏移值和修正值,根据所述顺序一致性指标获取偏移值和修正值,根据所述位置紧密度指标获取偏移值和修正值,根据所述覆盖率获取偏移值和修正值。
在其中一个实施例中,根据所述字段中信息计算文本相似度的权重具体公式为:
text_similar=(a*hit+b)*(c*sequence+d)*(e*position+f)*(g*cover+h);其中,text_similar为文本相似度的权重,hit为文本命中率,sequence为顺序一致性指标,position为位置紧密度,cover为覆盖率。其中,a、b为命中率的偏移值和修正值,c、d为顺序一致性指标的偏移值和修正值,e、f为位置紧密度的偏移值和修正值,g、h为覆盖率的偏移值和修正值,其中,偏移值越大表示该项的重要程度越高。其中,文本命中率表示搜索关键词在对应的文本文档中命中的个数与搜索关键词的总个数的比率,显然所占的比率越高表示初始检索结果越接近搜索目标。顺序一致性指标表示搜索关键词的顺序与对应的文本文档的出现的搜索关键词的顺序的一致性,顺序一致性通过逆序的个数的比例来表达,如(1,2,3)逆序个数为0,即最有序的排列,(3,2,1)逆序个数为3,为最无序的排列。位置紧密度表示命中的文本文档个数与命中文本文档个数与命中的间隔数之和的比率,如关键词“张三张四李四”,命中的初始检索结果“张三”、“李四的群”,命中的关键词“张三李四”,命中文本文档个数t为2,命中的间隔数之和为1(因为中间隔了一个张四),因此,位置紧密度=2/(1+2)=2/3。覆盖率表示命中的关键字占全部命中文本文档总字段的比率。
在其中一个实施例中,根据所述字段中信息计算聊天更新时间的权重包括:根据所述初始检索结果,获取最后一次聊天时间距离当前时间的时间间隔;计算衰减常数与所述时间间隔与所述衰减常数之和的比值,得到所述聊天更新时间的权重。
聊天更新时间的权重具体计算公式如下:
update_time_weight=factor/(factor+update_time_secs);
其中,update_time_weight为聊天更新时间的权重,更新时间维度中,factor是一个自定义的衰减常数,单位是秒,这里按照30天衰减一半来计算,factor=30*24*3600=2592000。update_time_secs是最后一次聊天时间距离现在的秒数,比如最后一次聊天时间是30天前,则update_time_secs=30*24*3600=259200,那么更新时间维度update_time_weight=259200/(259200+259200)=1/2。
在其中一个实施例中,根据所述字段中信息计算初始召回搜索引擎分数的权重包括:对所述初始检索结果根据词频-逆文本频率指数(term frequency–inverse documentfrequency,TF/IDF)模型打分,获得初始召回搜索引擎分数的权重。
对每个初始检索结果的文本文档进行打分获得初始召回搜索引擎分数的权重,初始召回搜索引擎分数的权重为一个浮点数。打分策略主要使用TF/IDF模型,TF/IDF模型是一种用于信息检索与数据挖掘的常用加权技术,其评分公式计算如下:得分公式是一个关于查询和文档的函数,与文档词向协调因子coord,查询范数queryNorm,词频tf,逆文档频率idf,词项的权重boost,长度范数norm有关。从公式中我们可以导出一些初始召回搜索引擎的基本规则:越多罕见的词项被匹配上,文档得分越高;文档字段越短(包含更少的词项),文档得分越高;词项的权重越高,文档得分越高。
在其中一个实施例中,根据所述字段中信息计算部门相近度的权重包括:将所述初始检索结果中的所在部门与当前进行搜索的用户所在部门进行比对;若为同一个部门,部门相近度的权重设为1;若不为同一个部门,部门相近度的权重设为0。
在企业即时通讯(Enterprise Instant Messaging,EIM)应用中,用户与同部门人的聊天概率,一般是大于其他部门的。当召回多个同名的人,位于同一个部门的,很大程度上接近搜索目标。因此,在计算相关性过程中,比较用户和联系人的部门,如果存在部门的交集,则增加部门的权重。
在其中一个实施例中,所述根据所述职位级别、发表文章数目比值、受关注数据和点赞数据,计算联系人客观重要度的权重包括:根据所述职位级别、发表文章数目比值、受关注数据和点赞数据分别获取偏移值和修正值;根据所述职位级别、发表文章数目比值、受关注数据、点赞数据和所述偏移值和修正值进行融合计算,得到联系人客观重要度的权重;其中,所述偏移值和修正值可通过机器学习确定。其中,根据所述职位级别、发表文章数目比值、受关注数据和点赞数据分别获取偏移值和修正值包括:根据所述职位级别获取偏移值和修正值,根据所述发表文章数目比值获取偏移值和修正值,根据所述受关注数据获取偏移值和修正值,根据所述点赞数据获取偏移值和修正值。
在其中一个实施例中,根据所述字段中信息计算联系人客观重要度的权重具体公式为:
static_weight=(i*position+j)*(k*article_num+l)*(m*concerned_num+n)*(o*liked_num+p);
其中,static_weight为联系人客观重要度的权重,position为职位级别、article_num为发表文章数目比值、concerned_num为受关注数据、liked_num为点赞数据。其中,i、j为职位级别偏移值和修正值,k、l为发表文章数目比值的偏移值和修正值,m、n为受关注数据的偏移值和修正值,o、p为点赞数据的偏移值和修正值,其中,偏移值越大表示该项的重要程度越高。其中,客观重要度是一种静态维度,和用户及搜索关键词无关,一般是大多数用户知道且希望找到的对象。在其它条件相同情况下,越被广泛熟知的人,越倾向于排在前面,其客观重要度也越高。客观重要度的权重通过离线计算得出,以一个周期更新一次(比如每周计算一次)。
在其中一个实施例中,根据所述字段中信息计算聊天消息数的权重包括:获取所述初始检索结果与当前进行搜索的用户之间的聊天消息总数目;获取所述聊天消息总数目的参数r;根据所述聊天消息总数目与参数r计算得到聊天消息数的权重。其中,参数r为一数量单位。
其中,所述计算聊天消息数的权重具体计算公式可表达为:
message_num_weight=q+min(message_num/r,s);
其中,参数q为具体常数,可根据需要进行设定,参数r为设定的阈值,参数s的含义为具体常数,可根据需要进行设定。
作为一个具体的例子:
message_num_weight=1+min(message_num/100,1);其中,message_num_weight为聊天消息数的权重,message_num为聊天消息总数目,参数q、r、s分别为1、100、1。当前进行搜索的用户与联系人的聊天消息数目也是一个衡量相关性的因子,在其他条件相同情况下,具有聊天消息的,比不具有聊天消息的排序靠前;聊天消息数目多的,比聊天消息数目少的排序靠前;当聊天消息数目都很多时,可以认为得分相同。因此,通过聊天消息数目计算聊天消息数的权重,当聊天消息数目不超过某个阈值r(如100条)时,用一个线性公式拟合;当大于阈值r(如100条)时,对聊天消息数的权重取预设的最大值。
在其中一个实施例中,根据所述字段中信息计算点击率的权重包括:获取所述初始检索结果的用户点击数;根据所述用户点击数,向点击率的权重赋值;其中,点击率的权重与所述用户点击数成正比。当前进行搜索的用户对结果的点击,也常常反应初始检索结果的好坏。对于高频点击的初始检索结果,调高所述初始检索结果权值,在排序时优先展示。初始检索结果的点击热度可以通过实时计算,例如在某一个时间段,某个热门的人被点击次数多,就能够立即排到前面。目前初始检索结果点击次数记录在数据库,可以通过实时扫描初始检索结果点击次数,计算每个初始检索结果的排名,赋予与排名等比例的权重。
在其中一个实施例中,根据所述字段中信息计算所述用户关联程度的权重包括:计算所述初始检索结果与所述当前进行搜索的用户共同联系人数目、共同部门特征数、共同办公地点特征数和共同个人标签数;根据所述共同联系人数目、共同部门特征数、共同办公地点特征数、共同个人标签数,计算用户关联程度的权重。用户关联程度可以描述用户和初始检索结果对应的联系人的共同特征,比如共同联系过的人,共同个人标签等。如果与初始检索结果对应的联系人进行联系的人数越多,往往更接近搜索目标。通过计算用户关联程度的权重,可以优化用户的个性化搜索,能够优先呈现与用户有类似偏好的初始检索结果。优选的,通过离线的数据挖掘计算用户关联程度的权重。
本实施例中,根据多个所述特征因子的权重,对每个所述初始检索结果进行融合计算,得到每个初始检索结果的综合权值包括:根据所述初始检索结果的每个特征因子分别获取偏移值和修正值;计算所述特征因子权重与与其对应的所述偏移值之积再与与其对应的所述修正值之和得到融合系数;将所述多个特征因子的融合系数相乘得到所述初始检索结果的综合权值。其中,所述偏移值和修正值可通过机器学习确定。
其中,综合权值计算公式如下:
weight=(a1*text_weight+b1)*(a2*update_time_weight+b2)*(a3*es_score+b3)*(a4*department_weight+b4)*(a5*static_weight+b5)*(a6*message_num_weight+b6)*(a7*click_rate+b7)*(a8*user_relevant+b8);其中,weight表示综合权值,text_weight表示文本相似度的权重,update_time_weight表示聊天更新时间的权重,es_score表示初始召回搜索引擎分数的权重,department_weight表示部门相近度的权重,static_weight表示联系人客观重要度的权重,message_num_weight表示聊天消息数的权重,click_rate表示点击率的权重,user_relevant表示用户关联程度的权重。如式中,每个括号内为一个融合系数的计算,text_weight表示文本相似度的权重,a1为偏移值,b1为修正值,a1*text_weight+b1计算得到第一融合系数;update_time_weight表示聊天更新时间的权重,a2为偏移值,b2为修正值,a2*update_time_weight+b2计算得到第二融合系数;多个融合系数相乘得到初始检索结果的综合权值。式中,a1、a2、a3、a4、a5、a6、a7、a8均为偏移值,b1、b2、b3、b4、b5、b6、b7、b8均为修正值。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种搜索排序装置400,包括:初始检索结果提取模块401、特征因子提取模块402、权值计算模块403和排序模块404,其中:
初始检索结果提取模块401,获取搜索关键词,确定与所述关键词匹配的多个初始检索结果。
其中,搜索关键词为用户在使用搜索引擎查找相关信息时输入的字、词、符号等输入信息。本实施例中栏目包括联系人栏、群聊栏、消息栏。
具体地,在终端输入搜索关键词,终端获取用户输入的搜素关键词发送至服务器。
特征因子提取模块402,获取每个所述初始检索结果相关的多个特征因子及每个所述特征因子的权重。
其中,初始检索结果为与搜索关键词所匹配的文本文档;从初始检索结果中提取多个特征因子,根据文本文档提取与关键词相关的一些信息。作为较佳的一个实施方式,多个特征因子包括:文本相似度、聊天更新时间、初始召回搜索引擎分数、部门相近度、联系人客观重要度、聊天消息数、点击率、用户关联程度一种或多种。在本实施例中,每个栏目的初始检索结果的特征因子可以相同也可以不同。
权值计算模块403,根据多个所述特征因子的权重,对每个所述初始检索结果进行融合计算,得到每个初始检索结果的综合权值。
其中,每个初始检索结果包括多个特征因子,利用多个特征因子的权重进行融合计算每个初始检索结果的权值。
排序模块404,用于根据所述权值的大小对所述多个栏目的初始检索结果进行综合排序。
其中,进行综合排序时,可以依据权值从大到小来进行排序,也可以依据权值从小到大来进行排序。采用此种技术方案不依据栏目来区分排序方式,而是根据权值来进行排序,实现快速查找到相关信息。
其中,初始检索结果针对的对象是联系人或群。每条初始检索结果包含的字段包括:对象类型、对象状态、对象名称、初始召回搜索引擎分数、聊天更新时间、最近一条消息位置、对象拼音名、对象英文名、所在部门。其中,对象类型包括聊天应用、邮件,对象状态包括是否注册、是否离职。
上述搜素排序装置,从多个栏目来获取初始检索结果,保证所获取的信息更加全面,在企业沟通工具中,栏目会包括多种,如果漏掉其中某个栏目可能会导致搜索失败;再根据初始检索结果来进行权值计算,实现统一的排序标准,对综合排序提供了基础;最后根据权值进行综合排序能够方便用户快速查找到相关信息,简化了操作提高了查找效率。
关于搜索排序装置的具体限定可以参见上文中对于搜索排序方法的限定,在此不再赘述。上述搜索排序装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储文本数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种搜索排序方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取搜索关键词,确定与所述关键词匹配的多个初始检索结果;获取每个所述初始检索结果相关的多个特征因子及每个所述特征因子的权重;根据多个所述特征因子的权重,对每个所述初始检索结果进行融合计算,得到每个初始检索结果的综合权值;根据所述综合权值对所述多个初始检索结果进行排序。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取搜索关键词,确定与所述关键词匹配的多个初始检索结果;获取每个所述初始检索结果相关的多个特征因子及每个所述特征因子的权重;根据多个所述特征因子的权重,对每个所述初始检索结果进行融合计算,得到每个初始检索结果的综合权值;根据所述综合权值对所述多个初始检索结果进行排序。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (16)

1.一种搜索排序方法,其特征在于,所述方法包括:
获取搜索关键词,确定与所述关键词匹配的多个初始检索结果;
获取每个所述初始检索结果相关的多个特征因子及每个所述特征因子的权重;
根据多个所述特征因子的权重,对每个所述初始检索结果进行融合计算,得到每个初始检索结果的综合权值;
根据所述综合权值对所述多个初始检索结果进行排序。
2.根据权利要求1所述的方法,其特征在于,所述多个特征因子包括文本相似度、聊天更新时间、初始召回搜索引擎分数、部门相近度、联系人客观重要度、聊天消息数、点击率以及用户关联程度中的至少一种;
所述获取每个所述初始检索结果相关的多个特征因子及每个所述特征因子的权重包括:
根据所述初始检索结果的字段,获取所述初始检索结果所包含的特征因子;其中,所述字段中包括对象类型、对象状态、对象名称、初始召回搜索引擎分数、聊天更新时间、最近一条消息位置、对象拼音名、对象英文名、所在部门中的至少一种信息;
根据所述字段中信息分别计算每种所述特征因子对应的权重;其中,所述特征因子对应的权重包括文本相似度的权重、聊天更新时间的权重、初始召回搜索引擎分数的权重、部门相近度的权重、联系人客观重要度的权重、聊天消息数的权重、点击率的权重以及用户关联程度的权重中的至少一种。
3.根据权利要求2所述的方法,其特征在于,所述计算文本相似度的权重包括:
计算所述关键词在所述初始检索结果中的命中率、顺序一致性指标、位置紧密度和覆盖率;
根据所述命中率、顺序一致性指标、位置紧密度和覆盖率,计算文本相似度的权重。
4.根据权利要求3所述的方法,其特征在于,所述根据所述命中率、顺序一致性指标、位置紧密度和覆盖率计算文本相似度的权重的步骤包括:
根据所述命中率、顺序一致性指标、位置紧密度和覆盖率分别获取偏移值和修正值;
根据所述命中率、顺序一致性指标、位置紧密度和覆盖率和所述偏移值和修正值进行融合计算,得到文本相似度的权重。
5.根据权利要求2所述的方法,其特征在于,所述计算聊天更新时间的权重包括:
根据所述初始检索结果,获取最后一次聊天时间距离当前时间的时间间隔;
计算衰减常数与所述时间间隔与所述衰减常数之和的比值,得到所述聊天更新时间的权重。
6.根据权利要求2所述的方法,其特征在于,所述计算初始召回搜索引擎分数的权重包括:
对所述初始检索结果根据词频-逆文本频率指数模型打分,获得初始召回搜索引擎分数的权重。
7.根据权利要求2所述的方法,其特征在于,所述计算部门相近度的权重包括:
将所述初始检索结果中的所在部门与当前进行搜索的用户所在部门进行比对;
若为同一个部门,部门相近度的权重设为1;
若不为同一个部门,部门相近度的权重设为0。
8.根据权利要求2所述的方法,其特征在于,所述计算联系人客观重要度的权重包括:
获取所述初始检索结果职位级别、发表文章数目比值、受关注数据和点赞数据;
根据所述职位级别、发表文章数目比值、受关注数据和点赞数据,计算联系人客观重要度的权重。
9.根据权利要求8所述的方法,其特征在于,所述根据所述职位级别、发表文章数目比值、受关注数据和点赞数据,计算联系人客观重要度的权重包括:
根据所述职位级别、发表文章数目比值、受关注数据和点赞数据分别获取偏移值和修正值;
根据所述职位级别、发表文章数目比值、受关注数据、点赞数据和所述偏移值和修正值进行融合计算,得到联系人客观重要度的权重。
10.根据权利要求2所述的方法,其特征在于,所述计算聊天消息数的权重包括:
获取所述初始检索结果与当前进行搜索的用户之间的聊天消息总数目;
获取所述聊天消息总数目的参数r;
根据所述聊天消息总数目与参数r计算得到聊天消息数的权重;
其中,参数r为一数量单位。
11.根据权利要求2所述的方法,其特征在于,所述计算点击率的权重包括:
获取所述初始检索结果的用户点击数;
根据所述用户点击数,向点击率的权重赋值;其中,点击率的权重与所述用户点击数成正比。
12.根据权利要求2所述的方法,其特征在于,计算所述用户关联程度的权重包括:
计算所述初始检索结果与所述当前进行搜索的用户共同联系人数目、共同部门特征数、共同办公地点特征数和共同个人标签数;
根据所述共同联系人数目、共同部门特征数、共同办公地点特征数和共同个人标签数,计算用户关联程度的权重。
13.根据权利要求1-12中任意一项所述的方法,其特征在于,所述根据多个所述特征因子的权重,对每个所述初始检索结果进行融合计算,得到每个初始检索结果的综合权值包括:
根据所述初始检索结果的每个特征因子分别获取偏移值和修正值;
计算所述特征因子权重与与其对应的所述偏移值之积再与与其对应的所述修正值之和得到融合系数;
将所述多个特征因子的融合系数相乘得到所述初始检索结果的综合权值。
14.一种搜索排序装置,其特征在于,所述装置包括:
初始检索结果提取模块,获取搜索关键词,确定与所述关键词匹配的多个初始检索结果;
特征因子提取模块,获取每个所述初始检索结果相关的多个特征因子及每个所述特征因子的权重;
权值计算模块,根据所述多个特征因子及每个所述特征因子的权重,对每个所述初始检索结果初始检索结果进行融合计算,得到每个初始检索结果的综合权值;
排序模块,根据所述综合权值对所述多个初始检索结果进行排序。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至13中任一项所述的方法的步骤。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。
CN201810848394.4A 2018-07-27 2018-07-27 搜索排序方法、装置、计算机设备和存储介质 Active CN109033386B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201810848394.4A CN109033386B (zh) 2018-07-27 2018-07-27 搜索排序方法、装置、计算机设备和存储介质
US16/760,414 US11481402B2 (en) 2018-07-27 2018-11-01 Search ranking method and apparatus, electronic device and storage medium
PCT/CN2018/113428 WO2020019565A1 (zh) 2018-07-27 2018-11-01 搜索排序方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810848394.4A CN109033386B (zh) 2018-07-27 2018-07-27 搜索排序方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN109033386A true CN109033386A (zh) 2018-12-18
CN109033386B CN109033386B (zh) 2020-04-10

Family

ID=64647510

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810848394.4A Active CN109033386B (zh) 2018-07-27 2018-07-27 搜索排序方法、装置、计算机设备和存储介质

Country Status (3)

Country Link
US (1) US11481402B2 (zh)
CN (1) CN109033386B (zh)
WO (1) WO2020019565A1 (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110096655A (zh) * 2019-04-29 2019-08-06 北京字节跳动网络技术有限公司 搜索结果的排序方法、装置、设备及存储介质
CN111125083A (zh) * 2019-12-31 2020-05-08 北京金堤科技有限公司 历史记录筛选方法以及装置
CN111260435A (zh) * 2020-01-10 2020-06-09 京东数字科技控股有限公司 多因子权重赋值修正方法、装置、计算机设备和存储介质
CN112925872A (zh) * 2019-12-05 2021-06-08 北京沃东天骏信息技术有限公司 一种数据搜索方法和装置
CN113010585A (zh) * 2021-04-20 2021-06-22 携程旅游网络技术(上海)有限公司 信息搜索方法、***、设备及介质
CN113127761A (zh) * 2019-12-31 2021-07-16 中国科学技术信息研究所 用于科技要素检索的智能排序方法、电子设备和存储介质
CN113254766A (zh) * 2021-05-20 2021-08-13 北京百度网讯科技有限公司 信息的检索方法和装置
CN113326363A (zh) * 2021-05-27 2021-08-31 北京百度网讯科技有限公司 搜索方法及装置、预测模型训练方法及装置、电子设备
CN113343104A (zh) * 2021-06-29 2021-09-03 深圳前海微众银行股份有限公司 信息推荐方法、装置、设备及计算机存储介质
CN113343046A (zh) * 2021-05-20 2021-09-03 成都美尔贝科技股份有限公司 一种智能搜索排序***
CN113886685A (zh) * 2021-09-23 2022-01-04 北京三快在线科技有限公司 一种搜索方法、装置、存储介质及电子设备
CN114154046A (zh) * 2022-02-07 2022-03-08 深圳华强电子交易网络有限公司 一种网站搜索排名方法及***
CN114666176A (zh) * 2022-03-23 2022-06-24 瓴里网络科技(上海)有限公司 基于场景的自适应人员排序方法和***及智能终端
WO2022134824A1 (en) * 2020-12-23 2022-06-30 International Business Machines Corporation Tuning query generation patterns
CN117150144A (zh) * 2023-10-30 2023-12-01 南通苏鹏计算机技术有限公司 一种基于大数据的搜索引擎优化方法
CN118170870A (zh) * 2024-05-14 2024-06-11 南京智能时空机器人技术服务有限公司 一种教学材料检索方法及***
CN118170870B (zh) * 2024-05-14 2024-07-05 南京智能时空机器人技术服务有限公司 一种教学材料检索方法及***

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113626462B (zh) * 2021-07-15 2022-11-15 北京百度网讯科技有限公司 即时通讯对象的搜索方法、装置、电子设备和存储介质
CN113407586B (zh) * 2021-07-16 2023-09-22 北京百度网讯科技有限公司 数据检索方法、装置、办公***、存储介质及电子设备
CN114510661B (zh) * 2022-02-18 2024-04-16 焦点科技股份有限公司 一种分布式一致性的搜索结果随机排序方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7617176B2 (en) * 2004-07-13 2009-11-10 Microsoft Corporation Query-based snippet clustering for search result grouping
CN102902681A (zh) * 2011-07-26 2013-01-30 腾讯科技(深圳)有限公司 一种群信息查找方法、装置及即时通讯工具
CN103635903A (zh) * 2011-06-03 2014-03-12 脸谱公司 基于上下文的搜索结果的排名
CN104899200A (zh) * 2014-03-04 2015-09-09 高德软件有限公司 一种poi搜索反馈方法及装置
CN106682925A (zh) * 2015-11-06 2017-05-17 北京奇虎科技有限公司 广告内容的推荐方法及装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8775396B2 (en) * 1999-04-15 2014-07-08 Intellectual Ventures I Llc Method and system for searching a wide area network
US20080177994A1 (en) * 2003-01-12 2008-07-24 Yaron Mayer System and method for improving the efficiency, comfort, and/or reliability in Operating Systems, such as for example Windows
JP2008227702A (ja) * 2007-03-09 2008-09-25 Oki Electric Ind Co Ltd 動きベクトル探索装置、動きベクトル探索方法及び動きベクトル探索プログラム
US8620658B2 (en) * 2007-04-16 2013-12-31 Sony Corporation Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition
US20080294624A1 (en) * 2007-05-25 2008-11-27 Ontogenix, Inc. Recommendation systems and methods using interest correlation
CN100557612C (zh) * 2007-11-15 2009-11-04 深圳市迅雷网络技术有限公司 一种基于搜索引擎的搜索结果排序方法及装置
EP2438571A4 (en) * 2009-06-02 2014-04-30 Yahoo Inc AUTOMATICALLY ADDRESSED ADDRESS BOOK
US9065779B2 (en) * 2009-06-12 2015-06-23 Wi-Lan Labs, Inc. Systems and methods for prioritizing and scheduling packets in a communication network
CN102298594A (zh) * 2010-06-28 2011-12-28 上海律闻商务咨询有限公司 一种适用于大信息量网站的搜索处理方法及装置
CN102385585A (zh) * 2010-08-27 2012-03-21 阿里巴巴集团控股有限公司 网页数据库的建立方法、网页搜索方法以及相关装置
US8676937B2 (en) * 2011-05-12 2014-03-18 Jeffrey Alan Rapaport Social-topical adaptive networking (STAN) system allowing for group based contextual transaction offers and acceptances and hot topic watchdogging
US9846916B2 (en) * 2011-07-10 2017-12-19 Facebook, Inc. Clustering a user's connections in a social networking system
KR20140007294A (ko) * 2012-07-09 2014-01-17 삼성전자주식회사 콘텍스트 가중 및 인센티브들에 기초하여 폰북 연락처들을 소팅하기 위한 시스템 및 방법
US9461876B2 (en) * 2012-08-29 2016-10-04 Loci System and method for fuzzy concept mapping, voting ontology crowd sourcing, and technology prediction
US9514217B2 (en) * 2013-05-31 2016-12-06 Linkedin Corporation Message index subdivided based on time intervals
CN104182488B (zh) * 2014-08-08 2016-09-07 腾讯科技(深圳)有限公司 搜索方法、服务器及客户端
US20160283481A1 (en) * 2014-12-30 2016-09-29 Socialtopias, Llc Method and apparatus for combining text search and recommendation engines
US10200824B2 (en) * 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US20170168692A1 (en) * 2015-12-14 2017-06-15 Microsoft Technology Licensing, Llc Dual-Modality Client Application
US10469424B2 (en) * 2016-10-07 2019-11-05 Google Llc Network based data traffic latency reduction
US10581775B2 (en) * 2018-06-28 2020-03-03 Microsoft Technology Licensing, Llc Automatic usage control of instant messages in computing systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7617176B2 (en) * 2004-07-13 2009-11-10 Microsoft Corporation Query-based snippet clustering for search result grouping
CN103635903A (zh) * 2011-06-03 2014-03-12 脸谱公司 基于上下文的搜索结果的排名
CN102902681A (zh) * 2011-07-26 2013-01-30 腾讯科技(深圳)有限公司 一种群信息查找方法、装置及即时通讯工具
CN104899200A (zh) * 2014-03-04 2015-09-09 高德软件有限公司 一种poi搜索反馈方法及装置
CN106682925A (zh) * 2015-11-06 2017-05-17 北京奇虎科技有限公司 广告内容的推荐方法及装置

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110096655B (zh) * 2019-04-29 2021-04-09 北京字节跳动网络技术有限公司 搜索结果的排序方法、装置、设备及存储介质
CN110096655A (zh) * 2019-04-29 2019-08-06 北京字节跳动网络技术有限公司 搜索结果的排序方法、装置、设备及存储介质
CN112925872A (zh) * 2019-12-05 2021-06-08 北京沃东天骏信息技术有限公司 一种数据搜索方法和装置
CN113127761A (zh) * 2019-12-31 2021-07-16 中国科学技术信息研究所 用于科技要素检索的智能排序方法、电子设备和存储介质
CN111125083A (zh) * 2019-12-31 2020-05-08 北京金堤科技有限公司 历史记录筛选方法以及装置
CN111125083B (zh) * 2019-12-31 2020-11-10 北京金堤科技有限公司 历史记录筛选方法以及装置
CN111260435A (zh) * 2020-01-10 2020-06-09 京东数字科技控股有限公司 多因子权重赋值修正方法、装置、计算机设备和存储介质
GB2617302A (en) * 2020-12-23 2023-10-04 Ibm Tuning query generation patterns
WO2022134824A1 (en) * 2020-12-23 2022-06-30 International Business Machines Corporation Tuning query generation patterns
US11681732B2 (en) 2020-12-23 2023-06-20 International Business Machines Corporation Tuning query generation patterns
CN113010585A (zh) * 2021-04-20 2021-06-22 携程旅游网络技术(上海)有限公司 信息搜索方法、***、设备及介质
CN113254766A (zh) * 2021-05-20 2021-08-13 北京百度网讯科技有限公司 信息的检索方法和装置
CN113343046B (zh) * 2021-05-20 2023-08-25 成都美尔贝科技股份有限公司 一种智能搜索排序***
CN113343046A (zh) * 2021-05-20 2021-09-03 成都美尔贝科技股份有限公司 一种智能搜索排序***
CN113326363B (zh) * 2021-05-27 2023-07-25 北京百度网讯科技有限公司 搜索方法及装置、预测模型训练方法及装置、电子设备
CN113326363A (zh) * 2021-05-27 2021-08-31 北京百度网讯科技有限公司 搜索方法及装置、预测模型训练方法及装置、电子设备
CN113343104A (zh) * 2021-06-29 2021-09-03 深圳前海微众银行股份有限公司 信息推荐方法、装置、设备及计算机存储介质
CN113886685B (zh) * 2021-09-23 2023-01-06 北京三快在线科技有限公司 一种搜索方法、装置、存储介质及电子设备
CN113886685A (zh) * 2021-09-23 2022-01-04 北京三快在线科技有限公司 一种搜索方法、装置、存储介质及电子设备
CN114154046A (zh) * 2022-02-07 2022-03-08 深圳华强电子交易网络有限公司 一种网站搜索排名方法及***
CN114666176A (zh) * 2022-03-23 2022-06-24 瓴里网络科技(上海)有限公司 基于场景的自适应人员排序方法和***及智能终端
CN117150144A (zh) * 2023-10-30 2023-12-01 南通苏鹏计算机技术有限公司 一种基于大数据的搜索引擎优化方法
CN117150144B (zh) * 2023-10-30 2023-12-29 南通苏鹏计算机技术有限公司 一种基于大数据的搜索引擎优化方法
CN118170870A (zh) * 2024-05-14 2024-06-11 南京智能时空机器人技术服务有限公司 一种教学材料检索方法及***
CN118170870B (zh) * 2024-05-14 2024-07-05 南京智能时空机器人技术服务有限公司 一种教学材料检索方法及***

Also Published As

Publication number Publication date
US20200341988A1 (en) 2020-10-29
WO2020019565A1 (zh) 2020-01-30
CN109033386B (zh) 2020-04-10
US11481402B2 (en) 2022-10-25

Similar Documents

Publication Publication Date Title
CN109033386A (zh) 搜索排序方法、装置、计算机设备和存储介质
Zhou et al. Atrank: An attention-based user behavior modeling framework for recommendation
CN108959644A (zh) 搜索排序方法、装置、计算机设备和存储介质
CN109086394A (zh) 搜索排序方法、装置、计算机设备和存储介质
CN110232403B (zh) 一种标签预测方法、装置、电子设备及介质
CN109063108A (zh) 搜索排序方法、装置、计算机设备和存储介质
US7987191B2 (en) System and method for generating a relationship network
CN109670837A (zh) 债券违约风险的识别方法、装置、计算机设备和存储介质
CN109766491A (zh) 商品搜索方法、装置、计算机设备和存储介质
CN109447958B (zh) 图像处理方法、装置、存储介质及计算机设备
CN111782947B (zh) 一种搜索内容展示方法、装置、电子设备及存储介质
CN108509466A (zh) 一种信息推荐方法和装置
CN109684627A (zh) 一种文本分类方法及装置
CN107545276A (zh) 联合低秩表示和稀疏回归的多视角学习方法
CN109376741A (zh) 商标侵权的识别方法、装置、计算机设备和存储介质
CN109245996A (zh) 邮件推送方法、装置、计算机设备和存储介质
CN108334625A (zh) 用户信息的处理方法、装置、计算机设备和存储介质
CN107590505A (zh) 联合低秩表示和稀疏回归的学习方法
CN108133058A (zh) 一种视频检索方法
CN111737558A (zh) 一种资讯推荐方法、装置及计算机可读存储介质
CN111506733B (zh) 对象画像的生成方法、装置、计算机设备和存储介质
CN116017043A (zh) 视频生成方法、装置、电子设备和存储介质
CN110647504B (zh) 司法文书的检索方法及装置
CN110020957A (zh) 维修对象的定损方法及装置、电子设备
CN110362478A (zh) 应用升级测试方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20190606

Address after: Room B0035, 2nd floor, No. 3 Courtyard, 30 Shixing Street, Shijingshan District, Beijing, 100041

Applicant after: BEIJING ZIJIE TIAODONG NETWORK TECHNOLOGY CO., LTD.

Address before: 300457 Tianjin Binhai New Area 9-3-401, No. 39, Binhai Science Park, Tianjin Binhai High-tech Zone

Applicant before: Tianjin bytes pulsation Technology Co., Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant