CN116775813A - 业务搜索方法、装置、电子设备及可读存储介质 - Google Patents
业务搜索方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN116775813A CN116775813A CN202311065041.4A CN202311065041A CN116775813A CN 116775813 A CN116775813 A CN 116775813A CN 202311065041 A CN202311065041 A CN 202311065041A CN 116775813 A CN116775813 A CN 116775813A
- Authority
- CN
- China
- Prior art keywords
- service
- information
- target
- target user
- business
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000000605 extraction Methods 0.000 claims abstract description 22
- 238000003058 natural language processing Methods 0.000 claims description 50
- 230000008451 emotion Effects 0.000 claims description 42
- 230000006399 behavior Effects 0.000 claims description 38
- 230000006870 function Effects 0.000 claims description 30
- 230000011218 segmentation Effects 0.000 claims description 21
- 238000011156 evaluation Methods 0.000 claims description 17
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000013135 deep learning Methods 0.000 claims description 3
- 238000009825 accumulation Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 11
- 238000003032 molecular docking Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种业务搜索方法、装置、电子设备及可读存储介质,该方法包括:获取各个业务的预设信息以及提取信息,所述提取信息通过对各个所述业务的隐含信息进行分析得到;根据目标用户的业务搜索需求,从所述预设信息以及所述提取信息中确定备选业务;向所述目标用户展示所述备选业务。
Description
技术领域
本申请属于人工智能领域,具体涉及一种业务搜索方法、装置、电子设备及可读存储介质。
背景技术
在新一代信息技术应用不断深入的今天,用户可以通过线上办事渠道搜索想要办理的业务入口进行业务办理。目前,针对用户业务的搜索,主要通过业务***在发布时提供的业务名称字段、关键词以及推荐词进行搜索,搜索能力非常有限,例如,用户只知道自己的需求,而可能不知道业务***内某件业务的事项名称,在根据自己的需求进行搜索时,业务***不能检索到相关业务信息。因此,当前的搜索方法存在由于搜索的字段局限于业务的名称、关键词以及***内置的推荐词,而无法准确得到搜索结果,也不能满足用户搜索业务的需求的问题。
发明内容
本申请实施例提供一种业务搜索方法、装置、电子设备及可读存储介质,能够解决由于搜索的字段局限于业务的名称、关键词以及***内置的推荐词,而无法准确得到搜索结果,也不能满足用户搜索业务的需求的问题。
第一方面,本申请实施例提供了一种业务搜索方法,该方法包括:获取各个业务的预设信息以及提取信息,所述提取信息通过对各个所述业务的隐含信息进行分析得到;根据目标用户的业务搜索需求,从所述预设信息以及所述提取信息中确定备选业务;向所述目标用户展示所述备选业务。
第二方面,本申请实施例提供了一种业务搜索装置,该装置包括:获取模块,用于获取各个业务的预设信息以及提取信息,所述提取信息通过对各个所述业务的隐含信息进行分析得到;确定模块,用于根据目标用户的业务搜索需求,从所述预设信息以及所述提取信息中确定备选业务;展示模块,用于向所述目标用户展示所述备选业务。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
在本申请实施例中,通过获取各个业务的预设信息以及提取信息,所述提取信息通过对各个所述业务的隐含信息进行分析得到,该提取信息对各个业务的预设信息进行了有效补充,丰富了可用于搜索业务的信息,然后根据目标用户的业务搜索需求,从所述预设信息以及所述提取信息中确定备选业务;向所述目标用户展示所述备选业务,能够结合目标用户的业务搜索需求,准确地搜索到满足目标用户的业务搜索需求的备选业务,将该备选业务展示给目标用户以供目标用户选择。
附图说明
图1是本申请实施例提供的一种业务搜索方法的流程示意图;
图2是本申请实施例提供的一种业务搜索***的结构示意图;
图3是本申请实施例提供的另一种业务搜索方法的流程示意图;
图4是本申请实施例提供的一种业务搜索装置的结构示意图;
图5是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的业务搜索方法、装置、电子设备及可读存储介质进行详细地说明。
图1示出本申请实施例提供的业务搜索方法的流程示意图,该方法可以由电子设备执行,该电子设备可以包括:终端设备,其中终端设备可以例如车载终端或手机终端等。参见图1,该方法可以包括如下步骤:
步骤102:获取各个业务的预设信息以及提取信息,所述提取信息通过对各个所述业务的隐含信息进行分析得到;
其中,各个业务的预设信息包括业务名称、关键词以及推荐词,这些预设信息都由***预先设置。各个业务的隐含信息包括对所述各个业务的评价信息以及咨询问题的回复信息,通过对各个业务的评价信息以及咨询问题的回复信息的分析,提取出与业务相关的信息,这类信息也可以作为确定搜索业务的信息。
步骤104:根据目标用户的业务搜索需求,从所述预设信息以及所述提取信息中确定备选业务;
可选的,目标用户的业务搜索需求往往可能与业务信息不能完全匹配,需要对该业务搜索需求进行分析,得到业务搜索需求所表达的核心含义,从而根据该核心含义,从所述预设信息以及所述提取信息中确定备选业务,提高搜索的准确性。
步骤106:向所述目标用户展示所述备选业务。
在本申请实施例中,通过获取各个业务的预设信息以及对各个所述业务的隐含信息进行分析后得到的提取信息,该提取信息在各个业务的预设信息的基础上对可用于搜索业务的信息进行了有效补充,丰富了可用于搜索业务的信息,然后根据目标用户的业务搜索需求,从所述预设信息以及所述提取信息中确定与目标用户的业务搜索需求相匹配的备选业务,向所述目标用户展示所述备选业务,能够结合目标用户的业务搜索需求,准确地搜索到满足目标用户的业务搜索需求的备选业务,将该备选业务展示给目标用户以供目标用户选择,既解决了可用于搜索业务的信息匮乏的问题,也能够满足目标用户的业务搜索需求,使得能够得到更准确的搜索结果。
在一种实现方式中,上述的步骤102中所述获取各个业务的提取信息可以包括:
步骤1021:通过自然语言处理(Natural Language Processing,NLP)的分词功能对所述隐含信息进行分词,得到至少一个第一信息;
其中,为了提高业务搜索的效率以及方便用户操作,用户输入的搜索信息通常是以字、词、短句等简短的形式表达,而隐含信息例如对所述各个业务的评价信息以及咨询问题的回复信息通常以句子、长句等繁复的形式表达,故在分析隐含信息时,将隐含信息进行分词,以便后续提取以及使用有用的信息。
步骤1022:通过自然语言处理NLP的文本功能,提取所述第一信息中与所述业务相关的情感词;
其中,隐含信息中例如对所述各个业务的评价信息以及咨询问题的回复信息,都带有明显的情感色彩,例如评论“在线办理出生证明,简单方便了我的生活,之前需要跑很多部门,提交很多材料,现在只需网上进行一次办理就行了,对政府这种方便民生的举措很满意。”分词得到“在线办理”、“出生证明”、“方便”、“满意”等,提取其中的情感词“方便”、“满意”,可以知道得到的情感词表达出正面评价,在用户有搜索这项业务的需求时可以向用户推荐该项业务。
可选的,判断第一信息中的情感词可以通过将第一信息与情感词字典进行对比,可以提取到与业务相关的情感词。
步骤1023:通过自然语言处理NLP的命名实体识别功能,提取所述第一信息中与所述业务相关的实体词;
其中,所述提取信息包括所述情感词和所述实体词。隐含信息中例如对所述各个业务的评价信息以及咨询问题的回复信息会包含用户已使用或查询的业务,根据上述例子,在分词后得到的第一信息中可以提取到“在线办理”、“出生证明”这类与业务相关的实体词,该类实体词可能与预设信息中的名称不全相同,但表达意思相同,在存在用户使用该实体词进行搜索而没有使用预设信息进行搜索的情况下,***仍然能够向用户展示与用户的业务搜索需求相匹配且***存在的对应业务,而不会出现无查询结果的情况。
也就是说,各个业务的预设信息中一般不包括上述的情感词以及实体词,但用户可能会使用情感词或实体词进行业务搜索,将包括情感词和实体词的提取信息补充到可以用于搜索业务的信息中,能够更全面地满足用户的业务搜索需求,准确确定满足用户的业务搜索需求的备选业务。
在一种实现方式中,上述的步骤104可以包括如下步骤:
步骤1041:通过自然语言处理NLP功能对所述目标用户的业务搜索需求进行分析,得到与所述业务搜索需求中目标业务相关的目标情感词和目标实体词;
可选的,该步骤1041具体可以包括:
步骤1,通过所述自然语言处理NLP的分词功能对所述目标用户的业务搜索需求进行分词,得到至少一个第二信息;
步骤2,通过所述自然语言处理NLP的文本功能,提取所述第二信息中与所述目标业务相关的目标情感词;
步骤3,通过所述自然语言处理NLP的命名实体识别功能以及同义词发散功能,提取所述第二信息中与所述目标业务相关的目标实体词。
步骤1042:根据所述目标情感词和所述目标实体词,从所述预设信息中确定第一备选业务;
步骤1043:根据所述目标情感词和所述目标实体词,从所述提取信息中确定第二备选业务;其中,通过第二备选业务对上述的第一备选业务进行补充,为目标用户提供更多可供选择的业务。
步骤1044:根据所述目标用户的历史行为轨迹,对所述第一备选业务以及所述第二备选业务进行排序,得到有序备选业务。
在本申请实施例中,在获取到各个业务的预设信息以及提取信息之后,由于各个业务的预设信息以及提取信息与目标用户的业务搜索需求不全匹配,可能存在不便直接根据业务搜索需求从各个业务的预设信息以及提取信息中进行搜索的问题,通过对目标用户输入的业务搜索需求进行分析,获取与所述业务搜索需求中目标业务相关的目标情感词和目标实体词,从而根据该目标情感词和目标实体词从各个业务的预设信息以及提取信息中进行搜索,其中,分别从预设信息确定第一备选业务,以及从提取信息中确定第二备选业务;为了将与目标用户的业务搜索需求更匹配的备选业务优先展示给目标用户,通过根据目标用户的历史行为轨迹,对上述的第一备选业务以及第二备选业务进行排序,以实现将得到的有序备选业务展示给目标用户。
例如,用户搜索“社保缴纳”,备选结果中有公积金缴纳、医保缴纳,而用户历史行为轨迹存在公积金缴纳,则调整备选结果中公积金缴纳的权重,使其在搜索的备选结果列表中排序靠前。
在一种实现方式中,上述的步骤1044中的所述目标用户的历史行为轨迹通过对所述目标用户的业务查阅记录、业务办理记录以及业务知识收藏记录进行提取得到。
其中,通过对目标用户的行为例如业务查阅、业务办理以及业务知识收藏的记录进行提取,对目标用户的各项行为加上标签,形成目标用户的标签库,以便进行调用,具体通过以下步骤为目标用户构建标签库。
步骤110:通过自然语言处理NLP功能以及深度学习算法对所述目标用户的所述业务查阅记录、所述业务办理记录以及所述业务知识收藏记录进行分词,得到至少一个第三信息;
步骤112:提取所述第三信息中与所述各个业务相关的标签;
步骤114:将所述标签作为所述目标用户的历史行为轨迹。
在本申请实施例中,通过提取目标用户的业务查阅记录、业务办理记录以及业务知识收藏记录中与各个业务相关的标签,该标签能够清楚表达目标用户的历史行为轨迹,在对备选业务进行排序时,通过查阅该目标用户的标签库中的标签可以确定目标用户对各个备选业务的权重,从而实现将更符合目标用户的业务搜索需求的备选业务排序在前以便用户进行选择。
在一种实现方式中,所述隐含信息包括对所述各个业务的评价信息以及咨询问题的回复信息;在上述的步骤102所述获取各个业务的预设信息以及提取信息之后,所述方法还可以包括:为所述各个业务的预设信息以及所述提取信息建立索引;其中,所述预设信息的索引包括所述业务名称、标题、内容提要以及内容;所述提取信息的索引包括所述业务标识、所述评价信息以及所述咨询问题的回复信息。
在本申请实施例中,通过为各个业务的预设信息以及所述提取信息建立索引,以使在用户输入业务搜索需求之后,能够快速搜索到备选业务并且向用户展示,提高了搜索效率也提升了用户体验。
图2是本申请实施例提供的一种业务搜索***的结构示意图。如图2所示,该***包括隐含信息对接模块21、隐含信息搜集模块22、普通信息搜集模块23、隐含信息分析模块24、信息索引模块25、用户行为轨迹数据对接模块26、用户行为收集打标签模块27、检索模块28以及实体词情感词库29、索引库210、用户标签库211。
其中,隐含信息对接模块21可以通过RESTFul接口,和共享交换平台上挂载的好差评、咨询问题的答复信息接口进行对接,通过定时任务调度方式,获取好差评、咨询问题的答复信息,作为隐含信息搜集模块22的前置模块,实现隐含信息的对接。
隐含信息搜集模块22可以针对业务服务平台中的好差评***、咨询问题的答复信息,通过隐含信息对接模块21,收集关联的信息,并过滤其中非必要字段和垃圾数据将相关评论信息解析出来。例如解析出来的内容包括:办事评价和热线咨询。
普通信息搜集模块23可以通过RESTFul接口对接的形式,采用http协议,与各个业务的资源库进行对接,通过定时任务,定时对资源库中的各个业务的信息,包括服务事项、政策标题、政策内容、服务清单、服务应用等进行搜集。
隐含信息分析模块24对隐含信息搜集模块22收集的信息通过人工智能技术进行分析,提取与各个业务相关的实体词、情感词等,构成实体词情感词库29。其中,具体可以通过NPL分词技术对隐含信息进行分词,再通过NLP文本对比技术将分词结果与情感词字典进行比对,提取出与业务相关的情感词。以及通过NLP命名实体识别技术,提取出与业务相关的实体词。
信息索引模块25对上述的普通信息以及根据隐含信息提取的实体词和情感词建立索引,构建索引库210,方便进行搜索。具体包括1、普通信息索引:索引的内容主要包括事项名称、标题、内容提要、内容。2、实体词索引:索引的内容主要是部分隐含信息分析模块24提取出来的实体词和情感词。3、隐含信息索引:索引的内容主要是抓取过来的隐含信息,隐含信息索引内容主要包括事项/政策标识、办事评价信息、热线咨询回复信息等。这个索引的主要目前是为了当普通信息索引和实体词索引都没法命中时,由隐含信息索引来提供信息。
可选的,建立索引可以通用搜索引擎的倒排索引技术,既词条-文档(Term-Doc)索引,Term-Doc是Term到Document的一个映射,在搜索相关功能处理的时候,如排序、高亮,需要通过文档标识找到相应的Term值、Term的位置信息等,当用户输入一个Term时,可以返回包含这个Term的文档。
用户行为轨迹数据对接模块26通过RESTFul接口,和用户行为轨迹数据接口进行对接,通过定时任务调度方式,获取用户行为轨迹数据。
用户行为收集打标签模块27通过用户行为轨迹数据对接模块26对用户的行为轨迹进行收集,根据用户在服务网进行政策查阅、事项办理、政务知识收藏等行为,对用户打标签,形成用户标签库211。
其中,对用户打标签通过文本分析、变压器的双向编码器表示(BidirectionalEncoder Representation from Transformers,bert)预训练模型,对内容进行意图理解和分类、打标,对业务内容多维度分析、深层次意图挖掘,并为实现预设规则下的自动分类和为推荐搜索提供有利条件。
首先,对业务内容的文本进行分类,可以通过多层神经网络、支撑向量机。然后通过深度神经网络语言模型,将业务内容以高维的嵌入向量表示。其次,将处理后的嵌入向量进行数据清洗,例如过滤重复数据,形成行为模型。然后每一个用户的行为标签由前述的行为模型中的行为数据构成,以标签树的形式存储,例如,用户A,标签分类1:职业,标签分类2:爱好;职业这一分支包括标签:教师、运动员;爱好这一分支包括:讲课、跑步;多个用户的标签树构成标签库。此外,形成该类标签树可以通过人工智能算法实现,通过行为数据调用算法打标接口,将行为数据文本传递给算法服务,算法服务根据当前行为模型中的行为数据文本进行分词,根据分词结果对当前模型中的关键词和标签进行匹配,将符合当前匹配结果的标签数据抽取出来并计算匹配分值,并且对不符合要求的低分值数据进行过滤,形成一组由匹配分值倒序排序的标签信息返回给标签库。标签库接收到当前标签数组后,由标签数据匹配当前画像维度,将符合当前维度的标签赋值到对应维度上。
例如:算法返回标签为:公积金缴纳。标签库获取到公积金缴纳这个标签后,将公积金缴纳标签通过维度配置进行匹配,发现当前标签的维度匹配为历史事项办理,则将当前个人标签的历史事项办理信息中补充公积金办理标签。
检索模块28根据用户输入的业务搜索需求,返回用户想要的备选业务。具体通过1、检索模块28的检索RESTFul接口,获取上层应用(例如业务服务网、业务服务移动端)搜索窗口用户输入的关键词。2、通过NLP文本分词、NLP命名实体识别、NLP同义词技术,对用户输入进行分词、分析、同义词发散。提取里面的实体词、情感词。3、通过上一步的分词结果和实体词、情感词,通过ElasticSearch搜索引擎在各索引中检索业务信息,得到备选结果。4、结合用户行为轨迹标签库,从备选结果筛选出其中符合用户行为轨迹标签的结果数据,调整排序。例如:用户搜索社保缴纳,在备选结果中有公积金缴纳、医保缴纳,用户行为轨迹标签库中有公积金标签,则调整备选结果中公积金缴纳的权重,使其在备选结果列表中排序靠前。
图3是本申请实施例提供的另一种业务搜索方法的流程示意图,如图3所示,该方法包括如下步骤:
步骤301:接收目标用户在业务服务网输入的搜索条件;例如“在哪可以进行社保缴纳查询”;
步骤302:对搜索条件进行分词并提取目标实体词;分词后得到“在哪 可以 进行社保 缴纳 查询”,分析核心词“社保”,发散同义词“社会保险”等,并提取实体词“社保缴纳查询”。
步骤303:根据目标实体词从普通信息索引中检索,得到第一备选结果;例如“社会保险缴纳”业务。
步骤304:根据目标实体词从实体词索引中检索,得到第二备选结果;例如“社会保险费缴纳(城镇企业职工)”业务。
步骤305:根据目标实体词从隐含信息索引中检索,得到第三备选结果;例如从隐含信息中搜索到公积金缴纳、医保缴纳等可以在线办理的事项。
步骤306:结合用户标签库中的行为轨迹标签,对第一备选结果、第二备选结果以及第三备选结果进行排序,并将排序后的结果返回给目标用户;其中将符合目标用户行为标签的备选结果排序提前。例如,目标用户的真实意图是查询公积金缴纳,用户在输入检索条件“在哪 可以 进行 社保 缴纳 查询”,前三步获取到的备选数据中有社会保险缴纳、医保缴纳、公积金缴纳等事项,结合用户行为轨迹标签中历史事项办理包括公积金缴纳标签,将备选结果中的公积金缴纳事项的排序权重调整,使其排序为第一个。
本申请实施例解决了用户搜索业务数据不准确、无法识别搜索意图的问题,不再只针对业务名称、关键词等少数字段进行搜索,而且提取用户评价反馈数据隐含信息中的实体词、情感词等核心关键词,并对这些词建索引,提供检索功能,并且根据个人、企业用户在业务服务网的行为轨迹,给用户打标签,结合用户标签,对搜索的备选结果进行过滤,优化备选结果的排序,提高了业务搜索效率和准确率,更加方便用户搜索业务并进行业务办理,提升了用户体验。
需要说明的是,本申请实施例提供的业务搜索方法,执行主体可以为业务搜索装置,或者该业务搜索装置中的用于执行业务搜索方法的控制模块。本申请实施例中以业务搜索装置执行业务搜索方法为例,说明本申请实施例提供的业务搜索装置。
图4是本申请实施例提供的一种业务搜索装置的结构示意图。如图4所示,该装置400包括:获取模块41、确定模块42以及展示模块43。
其中,获取模块41,用于获取各个业务的预设信息以及提取信息,所述提取信息通过对各个所述业务的隐含信息进行分析得到;确定模块42,用于根据目标用户的业务搜索需求,从所述预设信息以及所述提取信息中确定备选业务;展示模块43,用于向所述目标用户展示所述备选业务。
在一种实现方式中,上述的获取模块41可以用于通过自然语言处理NLP的分词功能对所述隐含信息进行分词,得到至少一个第一信息;通过自然语言处理NLP的文本功能,提取所述第一信息中与所述业务相关的情感词;通过自然语言处理NLP的命名实体识别功能,提取所述第一信息中与所述业务相关的实体词;其中,所述提取信息包括所述情感词和所述实体词。
在一种实现方式中,上述的确定模块42可以用于通过自然语言处理NLP功能对所述目标用户的业务搜索需求进行分析,得到与所述业务搜索需求中目标业务相关的目标情感词和目标实体词;根据所述目标情感词和所述目标实体词,从所述预设信息中确定第一备选业务;根据所述目标情感词和所述目标实体词,从所述提取信息中确定第二备选业务;根据所述目标用户的历史行为轨迹,对所述第一备选业务以及所述第二备选业务进行排序,得到有序备选业务。
在一种实现方式中,上述的确定模块42中通过自然语言处理NLP功能对所述目标用户的业务搜索需求进行分析,得到与所述业务搜索需求中目标业务相关的目标情感词和目标实体词,可以包括:
通过所述自然语言处理NLP的分词功能对所述目标用户的业务搜索需求进行分词,得到至少一个第二信息;通过所述自然语言处理NLP的文本功能,提取所述第二信息中与所述目标业务相关的目标情感词;通过所述自然语言处理NLP的命名实体识别功能以及同义词发散功能,提取所述第二信息中与所述目标业务相关的目标实体词。
在一种实现方式中,上述的确定模块42中的目标用户的历史行为轨迹通过对所述目标用户的业务查阅记录、业务办理记录以及业务知识收藏记录进行提取得到。
在一种实现方式中,上述的确定模块42中的通过对所述目标用户的业务查阅记录、业务办理记录以及业务知识收藏记录进行提取,可以包括:通过自然语言处理NLP功能以及深度学习算法对所述目标用户的所述业务查阅记录、所述业务办理记录以及所述业务知识收藏记录进行分词,得到至少一个第三信息;提取所述第三信息中与所述各个业务相关的标签;将所述标签作为所述目标用户的历史行为轨迹。
在一种实现方式中,上述的业务搜索装置400还可以包括标记模块,用于为所述各个业务的预设信息以及所述提取信息建立索引;其中,所述预设信息的索引包括所述业务名称、标题、内容提要以及内容;所述提取信息的索引包括所述业务标识、所述评价信息以及所述咨询问题的回复信息。
本申请实施例中的业务搜索装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobilepersonal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,非移动电子设备可以为个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的业务搜索装置可以为具有操作***的装置。该操作***可以为安卓(Android)操作***,可以为ios操作***,还可以为其他可能的操作***,本申请实施例不作具体限定。
本申请实施例提供的业务搜索装置能够实现图1或图3的方法实施例中实现的各个过程,为避免重复,这里不再赘述。
基于相同的技术构思,本申请实施例还提供了一种电子设备,该电子设备用于执行上述的业务搜索方法,图5为实现本申请各个实施例的一种电子设备的结构示意图。电子设备可因配置或性能不同而产生比较大的差异,可以包括处理器(processor)501、通信接口(Communications Interface)502、存储器(memory)503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信。处理器501可以调用存储在存储器503上并可在处理器501上运行的计算机程序,以执行下述步骤:
获取各个业务的预设信息以及提取信息,所述提取信息通过对各个所述业务的隐含信息进行分析得到;根据目标用户的业务搜索需求,从所述预设信息以及所述提取信息中确定备选业务;向所述目标用户展示所述备选业务。
具体执行步骤可以参见上述信号异常的检测方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括:终端或除终端之外的其他设备。
以上电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,例如,输入单元,可以包括图形处理器(Graphics Processing Unit,GPU)和麦克风,显示单元可以采用液晶显示器、有机发光二极管等形式来配置显示面板。用户输入单元包括触控面板以及其他输入设备中的至少一种。触控面板也称为触摸屏。其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
存储器可用于存储软件程序以及各种数据。存储器可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作***、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器可以包括易失性存储器或非易失性存储器,或者,存储器可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。
处理器可包括一个或多个处理单元;可选的,处理器集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作***、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器中。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述业务搜索方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory, ROM)、随机存取存储器(Random Access Memory, RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述业务搜索方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为***级芯片、***芯片、芯片***或片上***芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (10)
1.一种业务搜索方法,其特征在于,包括:
获取各个业务的预设信息以及提取信息,所述提取信息通过对各个所述业务的隐含信息进行分析得到;
根据目标用户的业务搜索需求,从所述预设信息以及所述提取信息中确定备选业务;
向所述目标用户展示所述备选业务。
2.根据权利要求1所述的方法,其特征在于,所述获取各个业务的提取信息,包括:
通过自然语言处理NLP的分词功能对所述隐含信息进行分词,得到至少一个第一信息;
通过自然语言处理NLP的文本功能,提取所述第一信息中与所述业务相关的情感词;
通过自然语言处理NLP的命名实体识别功能,提取所述第一信息中与所述业务相关的实体词;
其中,所述提取信息包括所述情感词和所述实体词。
3.根据权利要求1所述的方法,其特征在于,根据目标用户的业务搜索需求,从所述预设信息以及所述提取信息中确定备选业务,包括:
通过自然语言处理NLP功能对所述目标用户的业务搜索需求进行分析,得到与所述业务搜索需求中目标业务相关的目标情感词和目标实体词;
根据所述目标情感词和所述目标实体词,从所述预设信息中确定第一备选业务;
根据所述目标情感词和所述目标实体词,从所述提取信息中确定第二备选业务;
根据所述目标用户的历史行为轨迹,对所述第一备选业务以及所述第二备选业务进行排序,得到有序备选业务。
4.根据权利要求3所述的方法,其特征在于,所述通过自然语言处理NLP功能对所述目标用户的业务搜索需求进行分析,得到与所述业务搜索需求中目标业务相关的目标情感词和目标实体词,包括:
通过所述自然语言处理NLP的分词功能对所述目标用户的业务搜索需求进行分词,得到至少一个第二信息;
通过所述自然语言处理NLP的文本功能,提取所述第二信息中与所述目标业务相关的目标情感词;
通过所述自然语言处理NLP的命名实体识别功能以及同义词发散功能,提取所述第二信息中与所述目标业务相关的目标实体词。
5.根据权利要求3所述的方法,其特征在于,所述目标用户的历史行为轨迹通过对所述目标用户的业务查阅记录、业务办理记录以及业务知识收藏记录进行提取得到。
6.根据权利要求5所述的方法,其特征在于,所述通过对所述目标用户的业务查阅记录、业务办理记录以及业务知识收藏记录进行提取,包括:
通过自然语言处理NLP功能以及深度学习算法对所述目标用户的所述业务查阅记录、所述业务办理记录以及所述业务知识收藏记录进行分词,得到至少一个第三信息;
提取所述第三信息中与所述各个业务相关的标签;
将所述标签作为所述目标用户的历史行为轨迹。
7.根据权利要求1所述的方法,其特征在于,所述隐含信息包括对所述各个业务的评价信息以及咨询问题的回复信息;在所述获取各个业务的预设信息以及提取信息之后,所述方法还包括:
为所述各个业务的预设信息以及所述提取信息建立索引;
其中,所述预设信息的索引包括所述业务名称、标题、内容提要以及内容;所述提取信息的索引包括所述业务标识、所述评价信息以及所述咨询问题的回复信息。
8.一种业务搜索装置,其特征在于,包括:
获取模块,用于获取各个业务的预设信息以及提取信息,所述提取信息通过对各个所述业务的隐含信息进行分析得到;
确定模块,用于根据目标用户的业务搜索需求,从所述预设信息以及所述提取信息中确定备选业务;
展示模块,用于向所述目标用户展示所述备选业务。
9.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至7任一项所述的业务搜索方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至7任一项所述的业务搜索方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311065041.4A CN116775813B (zh) | 2023-08-23 | 2023-08-23 | 业务搜索方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311065041.4A CN116775813B (zh) | 2023-08-23 | 2023-08-23 | 业务搜索方法、装置、电子设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116775813A true CN116775813A (zh) | 2023-09-19 |
CN116775813B CN116775813B (zh) | 2023-11-24 |
Family
ID=87989880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311065041.4A Active CN116775813B (zh) | 2023-08-23 | 2023-08-23 | 业务搜索方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116775813B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040162815A1 (en) * | 2003-02-13 | 2004-08-19 | Klaus Irle | Adapting business objects for searches and searching adapted business objects |
US20140095253A1 (en) * | 2012-09-28 | 2014-04-03 | Oracle International Corporation | Business process global searching |
CN111191133A (zh) * | 2019-12-31 | 2020-05-22 | 口口相传(北京)网络技术有限公司 | 业务搜索处理方法、装置及设备 |
CN111859154A (zh) * | 2020-07-06 | 2020-10-30 | 中国银行股份有限公司 | 一种应用推荐方法及装置 |
CN112733024A (zh) * | 2021-01-05 | 2021-04-30 | 北京三快在线科技有限公司 | 一种信息推荐的方法及装置 |
CN112765974A (zh) * | 2021-01-19 | 2021-05-07 | 海尔数字科技(北京)有限公司 | 一种业务辅助方法、电子设备及可读存储介质 |
CN114330329A (zh) * | 2021-12-23 | 2022-04-12 | 广东太平洋互联网信息服务有限公司 | 一种业务内容搜索方法、装置、电子设备及存储介质 |
-
2023
- 2023-08-23 CN CN202311065041.4A patent/CN116775813B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040162815A1 (en) * | 2003-02-13 | 2004-08-19 | Klaus Irle | Adapting business objects for searches and searching adapted business objects |
US20140095253A1 (en) * | 2012-09-28 | 2014-04-03 | Oracle International Corporation | Business process global searching |
CN111191133A (zh) * | 2019-12-31 | 2020-05-22 | 口口相传(北京)网络技术有限公司 | 业务搜索处理方法、装置及设备 |
CN111859154A (zh) * | 2020-07-06 | 2020-10-30 | 中国银行股份有限公司 | 一种应用推荐方法及装置 |
CN112733024A (zh) * | 2021-01-05 | 2021-04-30 | 北京三快在线科技有限公司 | 一种信息推荐的方法及装置 |
CN112765974A (zh) * | 2021-01-19 | 2021-05-07 | 海尔数字科技(北京)有限公司 | 一种业务辅助方法、电子设备及可读存储介质 |
CN114330329A (zh) * | 2021-12-23 | 2022-04-12 | 广东太平洋互联网信息服务有限公司 | 一种业务内容搜索方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116775813B (zh) | 2023-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112632385B (zh) | 课程推荐方法、装置、计算机设备及介质 | |
CN106649818B (zh) | 应用搜索意图的识别方法、装置、应用搜索方法和服务器 | |
CN105824959B (zh) | 舆情监控方法及*** | |
US8549016B2 (en) | System and method for providing robust topic identification in social indexes | |
CN110888990B (zh) | 文本推荐方法、装置、设备及介质 | |
US9460193B2 (en) | Context and process based search ranking | |
CN103514299B (zh) | 信息搜索方法和装置 | |
CN111708949B (zh) | 医疗资源的推荐方法及装置、电子设备、存储介质 | |
CN111767716B (zh) | 企业多级行业信息的确定方法、装置及计算机设备 | |
US20130282704A1 (en) | Search system with query refinement | |
CN111324771B (zh) | 视频标签的确定方法、装置、电子设备及存储介质 | |
CN111144723A (zh) | 人岗匹配推荐方法及***、存储介质 | |
US11023503B2 (en) | Suggesting text in an electronic document | |
Puccetti et al. | Technology identification from patent texts: A novel named entity recognition method | |
US20190377824A1 (en) | Schemaless systems and methods for automatically building and utilizing a chatbot knowledge base or the like | |
CN110941702A (zh) | 一种法律法规和法条的检索方法及装置、可读存储介质 | |
CN112182145A (zh) | 文本相似度确定方法、装置、设备和存储介质 | |
CN110647504B (zh) | 司法文书的检索方法及装置 | |
CN113988057A (zh) | 基于概念抽取的标题生成方法、装置、设备及介质 | |
CN112307314A (zh) | 搜索引擎精选摘要的生成方法和装置 | |
CN111274483B (zh) | 关联推荐方法及关联推荐交互方法 | |
CN116775813B (zh) | 业务搜索方法、装置、电子设备及可读存储介质 | |
CN113792230B (zh) | 服务链接方法、装置、电子设备和存储介质 | |
CN113870998A (zh) | 问诊方法、装置、电子设备和存储介质 | |
CN113204697A (zh) | 一种搜索方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |