CN111078986B - 数据检索方法、装置及计算机可读存储介质 - Google Patents

数据检索方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN111078986B
CN111078986B CN201911281003.6A CN201911281003A CN111078986B CN 111078986 B CN111078986 B CN 111078986B CN 201911281003 A CN201911281003 A CN 201911281003A CN 111078986 B CN111078986 B CN 111078986B
Authority
CN
China
Prior art keywords
data
recall
data retrieval
information
retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911281003.6A
Other languages
English (en)
Other versions
CN111078986A (zh
Inventor
孙凯
李辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201911281003.6A priority Critical patent/CN111078986B/zh
Publication of CN111078986A publication Critical patent/CN111078986A/zh
Application granted granted Critical
Publication of CN111078986B publication Critical patent/CN111078986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种数据检索方法、装置及计算机可读存储介质。本发明实施例可以接收数据检索请求,对数据检索请求进行预处理,以得到数据检索请求的意图信息,通过多个检索逻辑分别对意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源,根据数据源分别提取多个召回结果的数据特征,根据数据特征对多个召回结果进行排序,并展示排序结果。本申请实施例可以通过多个检索逻辑分别对数据检索请求进行召回,然后综合后排序展示,每个检索入口的检索逻辑都独立成一个文件,不同检索入口的逻辑独立开来互不干扰,提升了代码可读性以及扩展的灵活性。

Description

数据检索方法、装置及计算机可读存储介质
技术领域
本发明涉及数据处理领域,具体涉及一种数据检索方法、装置及计算机可读存储介质。
背景技术
目前,用户在进行目标文件搜索时,可以采用百度或谷歌等搜索引擎,通过目标文件的名称或者模糊查询检索词进行检索,在显示搜索结果的网页信息中逐条进行筛选;用户也可以浏览包含有目标文件的门户网站,在门户网站的文件库中查找所需要的目标文件。
现在互联网搜索业务中,搜索引擎服务提供方提供了多种多样的检索入口,比如只检索图片、只检索问答类数据、只检索音乐、检索全部数据等。同时,提供了众多种类的数据以丰富检索结果。目前,常见的方案是,将所有检索入口的逻辑和所有数据源的召回、数据解析等放在同一个文件中实现;并且将排序逻辑和数据检索召回逻辑放在同一个服务部署。
申请人发现在现有技术当中,检索逻辑和排序逻辑耦合在一个服务中,开发人员多,为了保证上线质量,只能每周固定时间上线,影响产品和策略迭代效率。另外检索入口很多,每个检索入口的逻辑不尽相同,每新增一个逻辑就打补丁,时间一长,导致代码可读性差,难以维护,业务逻辑修改困难,容易相互影响,很多逻辑冗余,功能界定不清楚。
发明内容
本发明实施例提供一种数据检索方法、装置及计算机可读存储介质,旨在将检索入口和数据源解耦开来,提升了代码可读性以及扩展的灵活性。
为解决上述技术问题,本发明实施例提供以下技术方案:
一种数据检索方法,所述方法包括:
接收数据检索请求,对所述数据检索请求进行预处理,以得到所述数据检索请求的意图信息;
通过多个检索逻辑分别对所述意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源;
根据所述数据源分别提取所述多个召回结果的数据特征;
根据所述数据特征对所述多个召回结果进行排序,并展示排序结果。
一种数据检索装置,包括:
预处理单元,用于接收数据检索请求,对所述数据检索请求进行预处理,以得到所述数据检索请求的意图信息;
召回单元,用于通过多个检索逻辑分别对所述意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源;
提取单元,用于根据所述数据源分别提取所述多个召回结果的数据特征;
排序单元,用于根据所述数据特征对所述多个召回结果进行排序,并展示排序结果。
一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行上述数据检索方法中的步骤。
本申请提供的实施例可以接收数据检索请求,对数据检索请求进行预处理,以得到数据检索请求的意图信息,通过多个检索逻辑分别对意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源,根据数据源分别提取多个召回结果的数据特征,根据数据特征对多个召回结果进行排序,并展示排序结果。本申请实施例可以通过多个检索逻辑分别对数据检索请求进行召回,然后综合后排序展示,每个检索入口的检索逻辑都独立成一个文件,不同检索入口的逻辑独立开来互不干扰,提升了代码可读性以及扩展的灵活性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的数据检索***的一种场景示意图;
图2a是本发明实施例提供的数据检索方法的流程示意图;
图2b是本发明实施例提供的多个检索入口拆分的示意图;
图2c是本发明实施例提供的数据检索方法的另一流程示意图;
图3是本发明实施例提供的数据检索方法的又一流程示意图;
图4为本申请实施例提供的数据检索方法的再一流程示意图;
图5为本发明实施例提供的数据检索装置的结构示意图;
图6为本发明实施例提供的数据检索装置的另一种结构示意图;
图7是本发明实施例提供的终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明实施例提供一种数据检索方法,该数据检索方法的执行主体可以是本发明实施例提供的数据检索装置,或者集成了该数据检索装置的服务器,其中该数据检索装置可以采用硬件或者软件的方式实现。
在描述本发明的技术方案之前,先对相关的技术术语进行简单解释:
检索入口:每个搜索引擎,都有多个检索入口,比如会有图片检索入口、视频检索入口、资讯检索入口等。
rpc(Remote Procedure Call):远程过程调用,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。
tcp copy:是一种请求复制(所有基于tcp的packets)工具,可以把在线流量导入到测试***中去。
检索服务:本文中特指一种服务,用于处理用户的检索请求,并调用数据源获取检索结果。
排序服务:获取到检索结果后,比如500个结果,需要排序后,才能得到质量最好、相关性最好的结果,这就是排序服务的作用。
请参阅图1,图1为本发明实施例所提供的数据检索***的场景示意图,包括:终端10和服务器20,比如上述终端10可以为基于安卓***的终端或者基于IOS***的终端,还可以为基于Windows***或者MAC***的PC等等。终端10与服务器20之间可以通过通信网络连接,该通信网络,包括无线网络以及有线网络,其中无线网络包括无线广域网、无线局域网、无线城域网、以及无线个人网中的一种或多种的组合。网络中包括路由器、网关等等网络实体,图中并未示意出。终端10可以通过通信网络与服务器20进行信息交互,比如可以从服务器20下载应用(如即时通讯应用)。
该数据检索***可以包括数据检索装置,该数据检索装置具体可以集成在平板电脑、电视、手机、笔记本电脑、台式电脑等具备储存单元并安装有微处理器而具有运算能力的终端中,在图1中,该终端即为图1中的终端10,该终端10中可以安装有应用,比如浏览器应用。该终端10可以通过浏览器应用输入数据检索请求,将数据检索请求发送至服务器20,并接收服务器20根据数据检索请求返回的召回结果,终端10接收到召回结果后可以进行展示。
该数据检索***还可以包括服务器20,主要用于接收终端10发送的数据检索请求,然后根据该数据检索请求进行数据召回并将召回结果发送至终端10。该数据检索***还可以包括存储器,用于存储信息库,该信息库中包括多个数据源,以使得服务器可以从存储器中根据数据源对数据检索请求进行召回并发送至终端10。
需要说明的是,图1所示的数据检索***的场景示意图,仅仅是一个示例,本发明实施例描述的数据检索***以及场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定,本领域普通技术人员可知,随着数据检索***的演变和新业务场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。
以下分别进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。
在本实施例中,将从数据检索装置的角度进行描述,该数据检索装置具体可以集成在终端中,终端为在具备储存单元并能够运行应用程序的终端。
一种数据检索方法,包括:
接收数据检索请求,对所述数据检索请求进行预处理,以得到所述数据检索请求的意图信息;
通过多个检索逻辑分别对所述意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源;
根据所述数据源分别提取所述多个召回结果的数据特征;
根据所述数据特征对所述多个召回结果进行排序,并展示排序结果。
请参阅图2a,图2a是本发明实施例提供的数据检索方法的流程示意图。该数据检索方法包括:
在步骤101中,接收数据检索请求,对数据检索请求进行预处理,以得到数据检索请求的意图信息。
在一实施例中,上述数据检索请求可以为用户输入的文本信息,比如“某某某演的电影有什么”,对数据检索请求的预处理可以为意图识别,以得到对应的意图信息。具体实施时,用户可通过终端设备的信息输入接口输入文本信息。例如,该终端设备可展示一信息输入界面,该信息输入界面设置有信息输入控件,用户可通过该信息输入控件输入文本信息,以实现与设备之间的人机交互。
在一实施例中,用户在输入上述文本信息时,可以通过多种输入方式,例如可以文本信息的方式输入,也可以语音信息的方式输入。相应的,设备接收到语音信息后,可以将其进行转换为文本信息,以作为数据检索请求。
在一实施例中,对数据检索请求进行意图识别也即query识别,query识别指的是通过对用户查询词的拆解与分析,了解用户意图与需求。其中意图识别的方法可以有多种,比如词表穷举法、规则解析法以及机器学习方法等等。
进一步的,词表穷举法是通过词表直接匹配的方式来获取查询意图的,同时,也可以加入比较简单并且查询模式较为集中的类别。举例来说,比如查询词为:德国[addr]某品牌[brand]奶粉[product]三段[attr]。查询模式:[brand]+[product];[product]+[attr];[brand]+[product]+[attr]。当然查询模式是可以做成无序的。这种意图识别的方式实现较为简单,能够较准确的解决高频词。由于query一般是满足20/80定律,20%的query占据搜索80%的流量。但是,80%得长尾query是无法通过这种方式来解决的,也就是说这种方式在识别意图的召回可能只占20%。同时,需要人工参与较多,很难自动化实现。
规则解析法比较适用于查询非常符合规则的类别,通过规则解析的方式来获取查询的意图。比如:北京到上海今天的机票价格,可以转换为[地点]到[地点][日期][汽车票/机票/火车票]价格,再比如:1吨等于多少公斤,可以转换为[数字][计量单位]等于[数字][计量单位]。这种靠规则进行意图识别的方式对规则性较强的query有较好的识别精度,能够较好的提取准确信息。也即对数据检索请求进行分词处理,得到多个候选词,然后基于候选词进行意图识别,在其他实施例中,为进一步提升意图识别的准确性,还可以结合用户信息,具体可以在得到多个候选词后,进一步获取用户信息,然后基于候选词以及用户信息来进行意图识别。上述用户信息可以包括用户的属性信息,比如性别、年龄、体重等,还可以包括用户使用终端的用户习惯信息,比如用户玩游戏的时长大于看电影的时长大于听音乐的时长。这样在对用户输入的数据检索请求进行意图识别时可以提升准确性。也即对所述数据检索请求进行预处理,以得到所述数据检索请求的意图信息的步骤,包括:
按照预设规则对所述数据检索请求进行解析,以得到分词信息;
获取当前用户的用户信息,并根据所述用户信息以及所述分词信息生成所述意图信息。
机器学习方法则是对于用户输入的query,根据统计分类模型计算出每一个意图的概率,最终给出查询的意图。具体的,***可以将数据检索请求分解为对应的词序列,然后将词序列输入意图识别组件,得到数据检索请求的编码以及所述数据检索请求的意图,将数据检索请求的编码输入类型确定组件,对词序列进行槽位填充,并通过类型选择组件对词序列中每个词的属性添加约束,最终得到词序列的解码即词序列中每个词的属性。其中,意图识别组件组可以包括双向长短期记忆网络模型(BiLSTM)和意图注意力意模型(Attention),类型确定组件可以包括槽位门模型(Slot-Gate),类型选择组件可以为条件随机场(CRF)。也即对所述数据检索请求进行预处理,以得到所述数据检索请求的意图信息的步骤,包括:
将所述数据检索请求分解为对应的词序列;
将所述词序列输入预设意图识别模型并确定所述数据检索请求的意图信息。
在步骤102中,通过多个检索逻辑分别对意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源。
在一实施例中,检索入口垂直拆分,如图2b所示,图2b是本发明实施例提供的多个检索入口拆分的示意图。其中每个检索入口的检索逻辑,都独立成一个文件,不同检索入口的逻辑独立开来,因此在识别出意图信息后可以通过多个检索逻辑分别对意图信息进行数据召回,以得到多个召回结果,多个检索逻辑互不干扰。这样在后期修改时也只需要关心当前场景的检索逻辑即可,不需要担心影响其他业务场景,代码可读性好。
由于每个数据源的数据格式不统一(特征数据格式不一致、摘要数据格式不一致),并且检索文章和取摘要的接口不一致,如果混合在一个代码文件中,会导致代码臃肿,并且数据源变更字段,需要修改多处代码,如果同一个数据源应用于多个检索入口,那么一旦该数据源增加、删除一个字段,需要在多个检索入口都同时修改才行,修改成本高,因此在一实施例中,每个数据源都独立成数据源组件,将数据源和检索入口解耦开来,不同的检索入口只需要实例化数据源组件,即可使用。
举例来说,搜索引擎服务提供方提供了多种多样的检索入口,比如检索图片、检索电影、检索新闻报道、检索问答类数据、检索音乐等等,每个检索入口都有对应的数据源。比如用户输入的是某人名,则通过图片检索入口以及图片数据源召回的是图片召回结果,通过电影检索入口以及电影数据源召回的是电影召回结果,过新闻报道检索入口以及新闻报道数据源召回的是新闻报道召回结果等等,从而得到多种数据源对应的多个召回结果。
在一实施例中,在通过多个检索逻辑分别对所述意图信息进行数据召回之前,还可以对上述多个检索逻辑进行筛选,具体可以根据数据源的类别与用户数据的检索请求的类别进行筛选。比如,用户输入的是“某某某有哪些歌曲”,则可以确定该检索请求的类别与上述图片数据源和电影数据源不相关,与新闻报道数据源、问答类数据源以及音乐数据源相关,因此可以通过新闻报道检索入口以及新闻报道数据源进行召回以得到新闻报道召回结果,通过问答类检索入口以及问答类数据源进行召回以得到问答类召回结果,通过音乐检索入口以及音乐数据源进行召回以得到音乐召回结果。
在步骤103中,根据数据源分别提取多个召回结果的数据特征。
在一实施例中,每种数据源都有不同的特征数据,比如新闻报道的特征可以为阅读数、视频的特征可以为播放量,图片的特征可以为点赞数等,上述特征数据可以为一个或多个,比如音乐的特征数据可以包括播放了、下载量、评论数等等。
在其他实施例中,还可以提取上述多个召回结果中同一类别的数据特征,比如点击量,检索引擎可以记录所有用户在使用检索引擎时对每一个召回结果的点击量信息,也即历史信息,然后当前用户在检索时就可以直接提取每个召回结果的点击量信息。
在步骤104中,根据数据特征对多个召回结果进行排序,并展示排序结果。
在一实施例中,在根据数据特征对多个召回结果进行排序时,可以先判断上述多个召回结果的数据特征的类型是否相同,若相同,比如为阅读量,则可以直接按照阅读量对多个召回结果进行排序;若不相同则可以先将召回结果的数据特征转化为数值,然后根据数值进行排序。比如根据新闻报道检索入口以及新闻报道数据源进行召回以得到新闻报道召回结果A,其对应的数据特征为阅读量X,转化后的数值比如为85;通过问答类检索入口以及问答类数据源进行召回以得到问答类召回结果B,其对应的数据特征为点赞数量Y,转化后的数值比如为88;通过音乐检索入口以及音乐数据源进行召回以得到音乐召回结果C,其对应的数据特征为下载量Z,转化后的数值比如为70,因此按照上述数值进行排序后的顺序是问答类召回结果B高于新闻报道召回结果A高于音乐召回结果C,在用户端进行展示时可以使用户优先看到优先级更高的召回结果。
在实际使用过程中,排序的效果,需要经常调整排序策略,才能得到最优的排序效果,给用户带来最好、最相关的检索结果。而检索、排序逻辑耦合在同一个服务中将会导致排序效果验证需要花费较多人力,因为数据源检索可能存在不稳定的现象,比如同一个检索串,先后请求服务两次,得到的检索结果可能不一样,这样导致排序的输入就存在不一致,从而排序结果也会存在一定比例的不一致。另外需要更多的开发人员,为了保证上线质量,只能每周固定时间上线,影响产品和策略迭代效率。
因此,在一实施例中,如图2c所示,可以将排序逻辑独立成服务,在线检索文章时,检索服务先从各个数据源检索到结果,然后将结果通过RPC(Remote Procedure Call,远程过程调用)调用排序服务,拿到排序结果后,返回给前端展现。检索服务请求排序服务的时候,通过TCPCopy方式,将流量复制下来,然后离线将流量回放给测试的两个排序服务,用于对比两个排序服务的结果差异,这种方式的输入是完全无差异的,从而可以专注于排序自身导致的结果差异。也即,根据所述数据特征对所述多个召回结果进行排序,并展示排序结果的步骤包括:
调用第一排序服务与第二排序服务分别根据所述数据特征对所述多个召回结果进行排序,生成第一排序结果和第二排序结果;
若所述第一排序结果与第二排序结果相同,则展示所述第一排序结果或第二排序结果。
其中,TCPCopy是一种请求复制(所有基于tcp的packets)工具,可以把在线流量导入到测试***中去。具体的,TCPCopy分为TCPCopyclient和TCPCopyserver。其中TCPCopyclient运行在在线服务器上面,用来捕获在线请求数据包;TCPCopyserver(监听端口为36524)运行在测试机器上面,在测试服务器的响应包丢弃之前截获测试服务器的响应包,并通过TCPCopyclient和TCPCopyserver之间的tcp连接传递响应包的tcp和ip,头部信息给TCPCopyclient,以完成TCP交互。
由上可知,本申请实施例提供的数据检索方法可以接收数据检索请求,对数据检索请求进行预处理,以得到数据检索请求的意图信息,通过多个检索逻辑分别对意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源,根据数据源分别提取多个召回结果的数据特征,根据数据特征对多个召回结果进行排序,并展示排序结果。本申请实施例可以通过多个检索逻辑分别对数据检索请求进行召回,然后综合后排序展示,每个检索入口的检索逻辑都独立成一个文件,不同检索入口的逻辑独立开来互不干扰,提升了代码可读性以及扩展的灵活性。
根据上一实施例中所描述的数据检索方法,以下将举例作进一步详细说明。
在本实施例中,将以该数据检索装置具体集成在终端中为例进行说明。
请参阅图3,图3为本发明实施例提供的数据检索方法的另一流程示意图。
该方法流程可以包括:
步骤201,接收数据检索请求,对问答数据检索请求进行预处理,以得到问答数据检索请求的意图信息。
在一实施例中,上述数据检索请求可以为用户输入的文本信息,对数据检索请求的预处理可以为意图识别也即query识别,query识别指的是通过对用户查询词的拆解与分析,了解用户意图与需求。其中意图识别的方法可以有多种,比如词表穷举法、规则解析法以及机器学习方法等等,本申请对此不做进一步限制。
在一实施例中,上述数据检索请求的预处理还可以包括query改写,其中,query改写包括:query纠错,query扩展,query删除,query转换。本实施例中的query改写主要包括query扩展,query删除和query转换。query扩展具体为对用户输入的语句进行扩展或填充,具体可以依据同义词或是上下文关系,比如,在用户首先输入“查询深圳的天气”,待收到相关应答信息后,再输入“广州的呢”。很明显,广州也是需要查询天气。因此,可以基于历史的信息输入,对当前的自然语言信息进信息填充,以完善当前输入请求。仍以上述“广州的呢”为例,则可以从上文信息“查询深圳的天气”中提取“查询”和“天气”,对“广州的呢”进行信息填充。然后,基于上文信息中关键词之间的关联关系,信息填充后的语句进行语序调整,得到完整的语句。例如,以“广州的呢”为例,进行信息填充和语序调整后可以为“查询广州的天气”。
上述query删除一般的应用场景是在当用户输入query过多时导致无法正常召回,可以通过丢词的方式来筛选用户的query,从而召回与query最相关的商品。比如,当用户的query为“XX水果麦片”时,由于这款商品可能被下架,或者商品种类较少,通过query删除,可以把原query改写为“水果麦片”,进而可以召回其他品牌的水果麦片。query删除是需要用到实体识别的,因为要决定query中的哪些数据被删除才能对用户原意图造成的影响最小。像“XX水果麦片”,通过意图识别得到“XX”是品牌,“水果麦片”是产品,显然用户更需要的是水果麦片,而不是“XX”其他类型的麦片。
上述query转换是当用户输入query无法召回时进行转换。比如,用户在某购物网站搜索“A品牌香水”,该网站并没有这款商品。也无法通过query同义词扩展和query删除来对原query进行处理。通过session数据可以发现,用户搜索“A品牌”后会伴随着“香水”这个query出现,利用用户行为数据是可以挖掘出“A品牌”和“香水”这两个query是相关的。当用户搜索“A品牌”而无法召回时,是可以把query转换为“香水”来尽可能满足用户的需求。
步骤202,通过多个检索逻辑分别对问答意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源。
在一实施例中,检索入口垂直拆分,每个检索入口的检索逻辑,都独立成一个文件,不同检索入口的逻辑独立开来,因此在识别出意图信息后可以通过多个检索逻辑调用不同的数据源分别对意图信息进行数据召回,以得到多个召回结果。
步骤203,根据多个数据源分别对应的属性提取多个召回结果的数据特征。
在一实施例中,每种数据源都有不同的特征数据,比如新闻报道的特征可以为阅读数、视频的特征可以为播放量,图片的特征可以为点赞数等,上述特征数据可以为一个或多个,比如音乐的特征数据可以包括播放量、下载量、评论数等等。
步骤204,根据数据特征分别计算多个召回结果的关联度。
上述关联度可以理解为与当前用户之间的感兴趣程度,关联度越高代表当前用户越想看到。可以通过预设算法进行转换,比如根据新闻报道检索入口以及新闻报道数据源进行召回以得到新闻报道召回结果A,其对应的数据特征为阅读量X,转化后的数值比如为85;通过问答类检索入口以及问答类数据源进行召回以得到问答类召回结果B,其对应的数据特征为点赞数量Y,转化后的数值比如为88;通过音乐检索入口以及音乐数据源进行召回以得到音乐召回结果C,其对应的数据特征为下载量Z,转化后的数值比如为70。
步骤205,根据关联度对多个召回结果进行排序。
比如按照上述数值进行排序后的顺序是问答类召回结果B高于新闻报道召回结果A高于音乐召回结果C,在用户端进行展示时可以使用户优先看到优先级更高的召回结果。
步骤206,获取多个召回结果分别对应的摘要信息,并按照排序结果展示多个召回结果所对应的摘要信息。
在一申请实施例中,由于排序后的多个召回结果是分别对应于不同的数据源的,每种数据源也有不同的展现数据,比如图片、评论、标题、摘要、作者、作者昵称等等,因此可以根据召回结果对应的数据源的种类获取摘要信息,比如音乐类召回结果对应的摘要信息可以包括歌手、作词、作曲、专辑名等;电影类召回结果对应的摘要信息可以包括演员、导演、编剧等;新闻报道类召回结果对应的摘要信息可以包括标题、记者、出版社等。最后根据排序结果展示多个召回结果所对应的摘要信息,以供用户查看。
在本申请实施例中,将排序逻辑独立成服务,在线检索文章时,检索服务先从各个数据源检索到结果,然后将结果通过RPC调用排序服务,拿到排序结果后,返回给前端展现。检索服务请求排序服务的时候,通过TCPCopy方式,将流量复制下来,然后离线将流量回放给测试的两个排序服务,用于对比两个排序服务的结果差异,这种方式的输入是完全无差异的,从而可以专注于排序自身导致的结果差异。
另外,本申请实施例还可以将数据源组件化,如图4所示,将每个数据源都独立成数据源组件,将数据源的检索文章、特征适配、取摘要、摘要适配等操作,包装到一个数据源组件代码文件中,这样高内聚低耦合的设计,将数据源和检索入口解耦开来,数据源组件理解复杂的数据格式,并提供设计良好的接口给检索入口使用。不同的检索入口只需要实例化数据源组件即可使用,而不需要理解数据源组件内部的实现细节,这样修改数据源的字段时,只需要修改数据源组件一处代码文件即可在所有检索入口生效。这样设计的好处是功能接口解耦合,修改只需要关心当前检索入口的检索逻辑即可,不需要担心影响其他检索入口的检索逻辑,代码可读性好。扩展灵活,成本低,新增的检索入口,复用数据源组件搭建即可;新增的数据源,也是新增一个数据源组件即可嵌入现有检索入口中。另外,数据源组件自带适配器,检索入口不需要理解各种数据的格式,只需要专注于检索流程调度即可,功能职责定义清晰。
由上可知,本申请实施例提供的数据检索方法可以接收数据检索请求,对问答数据检索请求进行预处理,以得到问答数据检索请求的意图信息,通过多个检索逻辑分别对问答意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源,根据多个数据源分别对应的属性提取多个召回结果的数据特征,根据数据特征分别计算多个召回结果的关联度,根据关联度对多个召回结果进行排序,获取多个召回结果分别对应的摘要信息,并按照排序结果展示多个召回结果所对应的摘要信息,本申请实施例可以通过多个检索逻辑分别对数据检索请求进行召回,然后综合后排序展示,每个检索入口的检索逻辑都独立成一个文件,不同检索入口的逻辑独立开来互不干扰,提升了代码可读性以及扩展的灵活性。
为便于更好的实施本发明实施例提供的数据检索方法,本发明实施例还提供一种基于上述数据检索方法的装置。其中名词的含义与上述数据检索方法中相同,具体实现细节可以参考方法实施例中的说明。
在本实施例中,将从数据检索装置的角度进行描述,该数据检索装置具体可以集成由多个终端组成的***中,每一终端为在具备储存单元并安装有显示屏而具有视频播放功能的终端。
请参阅图5,图5为本发明实施例提供的数据检索装置的一种结构示意图。其中,上述数据检索装置可以包括:
预处理单元301,用于接收数据检索请求,对所述数据检索请求进行预处理,以得到所述数据检索请求的意图信息。
在一实施例中,上述数据检索请求可以为用户输入的文本信息,比如“某某某演的电影有什么”,预处理单元301对数据检索请求的预处理可以为意图识别,以得到对应的意图信息。具体实施时,用户可通过终端设备的信息输入接口输入文本信息。例如,该终端设备可展示一信息输入界面,该信息输入界面设置有信息输入控件,用户可通过该信息输入控件输入文本五年信息,以实现与设备之间的人机交互。
在一实施例中,对数据检索请求进行意图识别也即query识别,query识别指的是通过对用户查询词的拆解与分析,了解用户意图与需求。其中意图识别的方法可以有多种,比如词表穷举法、规则解析法以及机器学习方法等等。
召回单元302,用于通过多个检索逻辑分别对所述意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源。
在一实施例中,检索入口垂直拆分,每个检索入口的检索逻辑,都独立成一个文件,不同检索入口的逻辑独立开来,因此在识别出意图信息后召回单元302可以通过多个检索逻辑分别对意图信息进行数据召回,以得到多个召回结果,多个检索逻辑互不干扰。这样在后期修改时也只需要关心当前场景的检索逻辑即可,不需要担心影响其他业务场景,代码可读性好。
提取单元303,用于根据所述数据源分别提取所述多个召回结果的数据特征。
在一实施例中,每种数据源都有不同的特征数据,比如新闻报道的特征可以为阅读数、视频的特征可以为播放量,图片的特征可以为点赞数等,上述特征数据可以为一个或多个,比如音乐的特征数据可以包括播放了、下载量、评论数等等。
排序单元304,用于根据所述数据特征对所述多个召回结果进行排序,并展示排序结果。
在一实施例中,排序单元304在根据数据特征对多个召回结果进行排序时,可以先判断上述多个召回结果的数据特征的类型是否相同,若相同,比如为阅读量,则可以直接按照阅读量对多个召回结果进行排序;若不相同则可以先将召回结果的数据特征转化为数值,然后根据数值进行排序。
在一实施例中,如图6所示,所述预处理单元301包括:
解析子单元3011,用于按照预设规则对所述数据检索请求进行解析,以得到分词信息;
生成子单元3012,用于获取当前用户的用户信息,并根据所述用户信息以及所述分词信息生成所述意图信息。
在一实施例中,所述提取单元303包括:
提取子单元3031,用于根据所述多个数据源分别对应的属性提取所述多个召回结果的数据特征;
计算子单元3032,用于根据所述数据特征分别计算所述多个召回结果的关联度。
在一实施例中,所述排序单元304包括:
排序子单元3041,用于根据所述关联度对所述多个召回结果进行排序;
展示子单元3042,用于获取所述多个召回结果分别对应的摘要信息,并按照排序结果展示所述多个召回结果所对应的摘要信息。
由上述可知,本发明实施例可以接收数据检索请求,对数据检索请求进行预处理,以得到数据检索请求的意图信息,通过多个检索逻辑分别对意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源,根据数据源分别提取多个召回结果的数据特征,根据数据特征对多个召回结果进行排序,并展示排序结果。本申请实施例可以通过多个检索逻辑分别对数据检索请求进行召回,然后综合后排序展示,每个检索入口的检索逻辑都独立成一个文件,不同检索入口的逻辑独立开来互不干扰,提升了代码可读性以及扩展的灵活性。
本发明实施例还提供一种终端,如图7所示,该终端可以包括射频(RF,RadioFrequency)电路601、包括有一个或一个以上计算机可读存储介质的存储器602、输入单元603、显示单元604、传感器605、音频电路606、无线保真(WiFi,Wireless Fidelity)模块607、包括有一个或者一个以上处理核心的处理器608、以及电源609等部件。本领域技术人员可以理解,图7中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路601可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器608处理;另外,将涉及上行的数据发送给基站。通常,RF电路601包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM,Subscriber IdentityModule)卡、收发信机、耦合器、低噪声放大器(LNA,Low Noise Amplifier)、双工器等。此外,RF电路601还可以通过无线通信与网络和其他设备通信。无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯***(GSM,Global System of Mobile communication)、通用分组无线服务(GPRS,General PacketRadio Service)、码分多址(CDMA,Code Division Multiple Access)、宽带码分多址(WCDMA,Wideband Code Division Multiple Access)、长期演进(LTE,Long TermEvolution)、电子邮件、短消息服务(SMS,Short Messaging Service)等。
存储器602可用于存储软件程序以及模块,处理器608通过运行存储在存储器602的软件程序以及模块,从而执行各种功能应用以及信息处理。存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器602还可以包括存储器控制器,以提供处理器608和输入单元603对存储器602的访问。
输入单元603可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元603可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器608,并能接收处理器608发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元603还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元604可用于显示由用户输入的信息或提供给用户的信息以及终端的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元604可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid Crystal Display)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器608以确定触摸事件的类型,随后处理器608根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图7中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
终端还可包括至少一种传感器605,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在终端移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路606、扬声器,传声器可提供用户与终端之间的音频接口。音频电路606可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路606接收后转换为音频数据,再将音频数据输出处理器608处理后,经RF电路601以发送给比如另一终端,或者将音频数据输出至存储器602以便进一步处理。音频电路606还可能包括耳塞插孔,以提供外设耳机与终端的通信。
WiFi属于短距离无线传输技术,终端通过WiFi模块607可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图7示出了WiFi模块607,但是可以理解的是,其并不属于终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器608是终端的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器602内的软件程序和/或模块,以及调用存储在存储器602内的数据,执行终端的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器608可包括一个或多个处理核心;优选的,处理器608可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器608中。
终端还包括给各个部件供电的电源609(比如电池),优选的,电源可以通过电源管理***与处理器608逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源609还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,终端还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,终端中的处理器608会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器602中,并由处理器608来运行存储在存储器602中的应用程序,从而实现各种功能:
接收数据检索请求,对所述数据检索请求进行预处理,以得到所述数据检索请求的意图信息;
通过多个检索逻辑分别对所述意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源;
根据所述数据源分别提取所述多个召回结果的数据特征;
根据所述数据特征对所述多个召回结果进行排序,并展示排序结果。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对数据检索方法的详细描述,此处不再赘述。
由上可知,本发明实施例的终端可以接收数据检索请求,对数据检索请求进行预处理,以得到数据检索请求的意图信息,通过多个检索逻辑分别对意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源,根据数据源分别提取多个召回结果的数据特征,根据数据特征对多个召回结果进行排序,并展示排序结果。本申请实施例可以通过多个检索逻辑分别对数据检索请求进行召回,然后综合后排序展示,每个检索入口的检索逻辑都独立成一个文件,不同检索入口的逻辑独立开来互不干扰,提升了代码可读性以及扩展的灵活性。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种数据检索方法中的步骤。例如,该指令可以执行如下步骤:
接收数据检索请求,对所述数据检索请求进行预处理,以得到所述数据检索请求的意图信息;
通过多个检索逻辑分别对所述意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源;
根据所述数据源分别提取所述多个召回结果的数据特征;
根据所述数据特征对所述多个召回结果进行排序,并展示排序结果。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本发明实施例所提供的任一种数据检索方法中的步骤,因此,可以实现本发明实施例所提供的任一种数据检索方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本发明实施例所提供的数据检索方法、装置及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种数据检索方法,其特征在于,所述方法包括:
接收数据检索请求,对所述数据检索请求进行预处理,以得到所述数据检索请求的意图信息;
通过多个检索逻辑分别对所述意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源;
根据多个数据源分别对应的属性提取所述多个召回结果的数据特征;
根据所述数据特征分别计算所述多个召回结果的关联度;
根据所述关联度对所述多个召回结果进行排序;
获取所述多个召回结果分别对应的摘要信息,并按照排序结果展示所述多个召回结果所对应的摘要信息;
调用第一排序服务与第二排序服务分别根据所述数据特征对所述多个召回结果进行排序,生成第一排序结果和第二排序结果;
若所述第一排序结果与第二排序结果相同,则展示所述第一排序结果或第二排序结果。
2.根据权利要求1所述的数据检索方法,其特征在于,对所述数据检索请求进行预处理,以得到所述数据检索请求的意图信息的步骤,包括:
按照预设规则对所述数据检索请求进行解析,以得到分词信息;
获取当前用户的用户信息,并根据所述用户信息以及所述分词信息生成所述意图信息。
3.根据权利要求1所述的数据检索方法,其特征在于,对所述数据检索请求进行预处理,以得到所述数据检索请求的意图信息的步骤,包括:
将所述数据检索请求分解为对应的词序列;
将所述词序列输入预设意图识别模型并确定所述数据检索请求的意图信息。
4.一种数据检索装置,其特征在于,包括:
预处理单元,用于接收数据检索请求,对所述数据检索请求进行预处理,以得到所述数据检索请求的意图信息;
召回单元,用于通过多个检索逻辑分别对所述意图信息进行数据召回,以得到多个召回结果,其中每个检索逻辑都包含对应的检索入口以及至少一个数据源;
提取单元,用于根据多个数据源分别对应的属性提取所述多个召回结果的数据特征;根据所述数据特征分别计算所述多个召回结果的关联度;根据所述关联度对所述多个召回结果进行排序;获取所述多个召回结果分别对应的摘要信息,并按照排序结果展示所述多个召回结果所对应的摘要信息;
排序单元,用于调用第一排序服务与第二排序服务分别根据所述数据特征对所述多个召回结果进行排序,生成第一排序结果和第二排序结果;若所述第一排序结果与第二排序结果相同,则展示所述第一排序结果或第二排序结果。
5.根据权利要求4所述的数据检索装置,其特征在于,所述预处理单元包括:
解析子单元,用于按照预设规则对所述数据检索请求进行解析,以得到分词信息;
生成子单元,用于获取当前用户的用户信息,并根据所述用户信息以及所述分词信息生成所述意图信息。
6.根据权利要求4所述的数据检索装置,其特征在于,所述提取单元包括:
提取子单元,用于根据多个数据源分别对应的属性提取所述多个召回结果的数据特征;
计算子单元,用于根据所述数据特征分别计算所述多个召回结果的关联度。
7.根据权利要求6所述的数据检索装置,其特征在于,所述排序单元包括:
排序子单元,用于根据所述关联度对所述多个召回结果进行排序;
展示子单元,用于获取所述多个召回结果分别对应的摘要信息,并按照排序结果展示所述多个召回结果所对应的摘要信息。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至6任一项所述的数据检索方法中的步骤。
CN201911281003.6A 2019-12-13 2019-12-13 数据检索方法、装置及计算机可读存储介质 Active CN111078986B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911281003.6A CN111078986B (zh) 2019-12-13 2019-12-13 数据检索方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911281003.6A CN111078986B (zh) 2019-12-13 2019-12-13 数据检索方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111078986A CN111078986A (zh) 2020-04-28
CN111078986B true CN111078986B (zh) 2023-10-20

Family

ID=70314345

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911281003.6A Active CN111078986B (zh) 2019-12-13 2019-12-13 数据检索方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111078986B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111708870A (zh) * 2020-05-27 2020-09-25 盛视科技股份有限公司 基于深度神经网络的问答方法、装置及存储介质
CN112084393A (zh) * 2020-09-09 2020-12-15 北京百度网讯科技有限公司 用于输出信息的方法、装置、设备以及存储介质
CN112487275A (zh) * 2020-12-11 2021-03-12 杭州安恒信息技术股份有限公司 一种数据检索的方法、***、设备及可读存储介质
CN113792125B (zh) * 2021-08-25 2024-04-02 北京库睿科技有限公司 基于文本相关性和用户意图的智能检索排序方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339394A (zh) * 2015-07-09 2017-01-18 腾讯科技(北京)有限公司 一种信息处理方法及装置
CN110472206A (zh) * 2018-05-09 2019-11-19 成都野望数码科技有限公司 一种信息搜索方法、装置以及终端设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339394A (zh) * 2015-07-09 2017-01-18 腾讯科技(北京)有限公司 一种信息处理方法及装置
CN110472206A (zh) * 2018-05-09 2019-11-19 成都野望数码科技有限公司 一种信息搜索方法、装置以及终端设备

Also Published As

Publication number Publication date
CN111078986A (zh) 2020-04-28

Similar Documents

Publication Publication Date Title
CN111078986B (zh) 数据检索方法、装置及计算机可读存储介质
CN110795528B (zh) 一种数据查询方法、装置、电子设备及存储介质
CN106227774B (zh) 信息搜索方法及装置
US9241242B2 (en) Information recommendation method and apparatus
CN103605656B (zh) 一种推荐音乐的方法、装置及一种移动终端
CN104866505B (zh) 一种应用的推荐方法及装置
CN110019840B (zh) 一种知识图谱中实体更新的方法、装置和服务器
CN111177180A (zh) 一种数据查询方法、装置以及电子设备
CN109948090B (zh) 网页加载方法及装置
CN108427761B (zh) 一种新闻事件处理的方法、终端、服务器及存储介质
CN110989847B (zh) 信息推荐方法、装置、终端设备及存储介质
CN108184143B (zh) 获取资源的方法及装置
CN109871524B (zh) 一种图表生成方法及装置
CN108595107B (zh) 一种界面内容处理方法及移动终端
CN110276010A (zh) 一种权重模型训练方法和相关装置
CN112925878B (zh) 数据处理方法和装置
CN110196833A (zh) 应用程序的搜索方法、装置、终端及存储介质
CN108491502B (zh) 一种新闻追踪的方法、终端、服务器及存储介质
CN113220848A (zh) 用于人机交互的自动问答方法、装置和智能设备
CN110287398B (zh) 一种信息更新的方法以及相关装置
CN112307198A (zh) 一种单文本的摘要确定方法和相关装置
CN116758362A (zh) 图像处理方法、装置、计算机设备及存储介质
US20220197939A1 (en) Image-based search method, server, terminal, and medium
CN110764668B (zh) 评论信息获取方法及电子设备
CN108897774B (zh) 一种获取新闻热点的方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40022483

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant