CN114168837A - 一种Chatbot的搜索方法、设备及存储介质 - Google Patents
一种Chatbot的搜索方法、设备及存储介质 Download PDFInfo
- Publication number
- CN114168837A CN114168837A CN202111372122.XA CN202111372122A CN114168837A CN 114168837 A CN114168837 A CN 114168837A CN 202111372122 A CN202111372122 A CN 202111372122A CN 114168837 A CN114168837 A CN 114168837A
- Authority
- CN
- China
- Prior art keywords
- information
- chatbot
- account
- message
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000013145 classification model Methods 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 20
- 238000002372 labelling Methods 0.000 claims description 5
- 230000009193 crawling Effects 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 description 32
- 230000008569 process Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/12—Messaging; Mailboxes; Announcements
- H04W4/14—Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请提供了Chatbot的搜索方法、设备及存储介质,该方法包括:接收用户的输入信息;将输入信息与多个Chatbot账号分别对应的第一关联信息进行匹配,该第一关联信息包括:Chatbot账号的第一摘要信息和第一标签信息;将输入信息与多个消息卡片分别对应的第二关联信息进行匹配,该第二关联信息包括:消息卡片的第二摘要信息和第二标签信息;显示匹配成功的第一关联信息对应的Chatbot账号;显示匹配的第二关联信息对应的消息卡片。本申请提供的方法,解决了用户不能快速利用搜索信息确定出和搜索信息匹配的检索结果的问题,提高了用户的搜索效率以及用户体验。
Description
技术领域
本申请属于通信技术领域,尤其涉及一种Chatbot的搜索方法、设备及存储介质。
背景技术
5G消息是短信业务的升级,是运营商的一种基础电信服务,基于IP技术实现业务体验的飞跃,支持的媒体格式更多,表现形式更丰富,5G消息更是一种基于短信收件箱为手机用户提供富媒体消息及智能会话服务的通讯渠道。
目前5G消息场景下的Chatbot的搜索引擎,能够根据用户输入的内容进行精确匹配。如果匹配成功,则会反馈匹配成功的Chatbot账号,用户通过点击所反馈的Chatbot账号进入该账号的页面;如果匹配失败,则不会返回任何Chatbot账号。
目前Chatbot搜索的方法,由于只能在匹配成功的情况下才反馈Chatbot账号,在匹配失败的情况,可能需要用户进行多次搜索才能得到其需要的结果,搜索效率极低。
发明内容
本申请实施例提供了一种Chatbot的搜索方法、设备及存储介质,可以解决用户不能快速利用搜索信息精准匹配出搜索结果的问题,提高了用户的搜索效率。
第一方面,提供了一种Chatbot的搜索方法,该方法包括:接收用户的输入信息;将输入信息与多个Chatbot账号分别对应的第一关联信息进行匹配,第一关联信息包括:Chatbot账号的第一摘要信息和第一标签信息;将输入信息与多个消息卡片分别对应的第二关联信息进行匹配,第二关联信息包括:消息卡片的第二摘要信息和第二标签信息;显示匹配成功的第一关联信息对应的Chatbot账号;显示匹配成功的第二关联信息对应的消息卡片。
第一方面提供的方法,当终端设备接收到用户的输入信息后,利用输入信息和多个Chatbot账号分别对应的第一关联信息进行匹配,该第一关联信息包括了Chatbot账号的第一摘要信息和第一标签信息,并且将输入信息与多个消息卡片分别对应的第二关联信息进行匹配,该第二关联信息包括消息卡片的第二摘要信息和第二标签信息。由于Chatbot账号的第一摘要信息和第一标签信息以及消息卡片的第二摘要信息和第二标签信息中包含更多的Chatbot账号和消息卡片相关的信息,因此将输入信息和Chatbot账号的第一关联信息进行匹配以及将输入信息和消息卡片的第二关联信息进行匹配,提高了匹配成功的概率,进而提高了用户的搜索效率。最后将匹配成功的第一关联信息对应的Chatbot账号和匹配成功的第二关联信息对应的消息卡片显示给用户,提高了用户体验。
可选的,获取Chatbot账号的第一主页信息;将第一主页信息确定为第一摘要信息,第一主页信息至少包括:Chatbot账号的服务介绍、服务类型、短信号码和认证信息。在该种实现方式中,由于第一主页信息中至少包括了Chatbot账号的服务介绍、服务类型、短信号码和认证信息,因此将第一主页信息确定为第一摘要信息,提高了根据用户的输入信息进行精准匹配的效率。
可选的,获取消息卡片的第二主页信息;将第二主页信息确定为第二摘要信息,第二主页信息至少包括:消息卡片的服务介绍、服务类型、短信号码和认证信息。在该种实现方式中,由于第二主页信息中至少包括了消息卡片的服务介绍、服务类型、短信号码和认证信息,因此将第二主页信息确定为第二摘要信息,提高了根据用户的输入信息进行精准匹配的效率。
可选的,提取第一摘要信息的第一关键词,将第一关键词作为Chatbot账号的第一标签信息。
可选的,提取第二摘要信息的第二关键词,将第二关键词作为消息卡片的第二标签信息。
可选的,获取用户与Chatbot账号的历史会话信息;提取历史会话消息中出现次数大于预设次数的第三关键词,将第三关键词添加到Chatbot账号的第一标签信息中;和/或,爬取网络消息中的主题信息,获取主题信息中与Chatbot账号关联的第四关键词,将第四关键词添加到Chatbot账号的第一标签信息中。在该种实现方式中,利用用户与Chatbot账号的历史会话信息和网络消息中的主题信息中的关键词作为第一标签信息,使得第一标签信息的范围更加全面,从而提高了匹配效率。
可选的,将输入信息与多个Chatbot账号分别对应的第一关联信息进行匹配之前,方法还包括;获取训练样本,训练样本包括:Chatbot账号的摘要信息;利用训练样本和初始第一分类模型生成预测标签信息;根据预测标签信息和样本标注信息计算损失函数;根据损失函数对初始第一分类模型进行迭代训练,得到训练好的第一分类模型;利用训练好的第一分类模型确定Chatbot账号的第一标签信息。在该种实现方式中,利用训练好的分类模型确定第一Chatbot账号的第一标签信息,使得第一标签信息更加精确,从而进一步提高了搜索效率。
第二方面,提供了一种Chatbot的搜索装置,该装置包括用于执行以上第一方面或者第一方面的任意一方面可能的实现方式中的各个步骤的单元。
第三方面,提供了一种Chatbot的搜索装置,该装置包括至少一个处理器和存储器,该至少一个处理器用于执行以上第一方面或第一方面的任意可能的实现方式中的方法。
第四方面,提供了一种Chatbot的搜索装置,该装置包括至少一个处理器和接口电路,该至少一个处理器用于执行以上第一方面或者第一方面中的任意一方面可能的实现方式中的方法。
第五方面,提供了一种Chatbot的搜索设备,该设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,该设备用于执行以上第一方面或者第一方面中的任意一方面可能的实现方式中的方法。
第六方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序在被处理器执行时,用于执行第一方面或第一方面的任意可能的实现方式中的方法。
第七方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当该计算机程序被执行时,用于执行第一方面或第一方面的任意可能的实现方式中的方法。
第八方面,提供了一种芯片或者集成电路,该芯片或者集成电路包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有该芯片或者集成电路的设备执行第一方面或第一方面的任意可能的实现方式中的方法。
可以理解的是,上述第二方面至第八方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
本申请实施例与现有技术相比存在的有益效果是:
本申请提供的方法,当终端设备接收到用户的输入信息后,利用输入信息和多个Chatbot账号分别对应的第一关联信息进行匹配,该第一关联信息包括了Chatbot账号的第一摘要信息和第一标签信息,并且将输入信息与多个消息卡片分别对应的第二关联信息进行匹配,该第二关联信息包括消息卡片的第二摘要信息和第二标签信息。由于Chatbot账号的第一摘要信息和第一标签信息以及消息卡片的第二摘要信息和第二标签信息中包含更多的Chatbot账号和消息卡片相关的信息,因此将输入信息和Chatbot账号的第一关联信息进行匹配以及将输入信息和消息卡片的第二关联信息进行匹配,提高了匹配成功的概率,进而提高了用户的搜索效率。最后将匹配成功的第一关联信息对应的Chatbot账号和第二关联信息对应的消息卡片显示给用户,提高了用户体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是传统5G消息搜索方式的示意图;
图2是本申请实施例提供的一例Chatbot的搜索方法的示意性流程图;
图3是本申请实施例提供的Chatbot账号为梦网科技的第一主页信息的示意图;
图4是本申请实施例提供的输入信息和Chatbot账号的第一摘要信息进行匹配的方法的示意性流程图;
图5是本申请实施例提供的另一例Chatbot的搜索方法的示意性流程图;
图6是本申请实施例提供的又一例Chatbot的搜索方法的示意性流程图;
图7是本申请实施例提供的又又一例Chatbot的搜索方法的示意性流程图;
图8是本申请实施例提供的Chatbot的搜索方法的界面示意图;
图9是本申请实施例提供的Chatbot的搜索装置的示意图;
图10是本申请实施例提供的Chatbot的搜索设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
首先,在介绍本申请提供的方法和***之前,需要对下文中即将提及的部分术语进行说明。当本申请提及术语“第一”或者“第二”等序数词时,除非根据上下文其确实表达顺序之意,否则应当理解为仅仅是起区分之用。
术语“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
除非另有说明,本文中“/”一般表示前后关联对象是一种“或”的关系,例如,A/B可以表示A或B。术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,在本申请的描述中,“多个”是指两个或两个以上。
5G消息,又称RCS融合通信(Rich Communications Services,RCS),是基于RCS国际标准和传统短信渠道之上,所打造的全新短消息投放解决方案。5G消息以“融合通信(RCS)+平台(MaaP)+智能聊天机器人(Chatbot)”为核心,实现传统短信的全面升级,支持图文、视音频、位置、联系人、文档以及专属服务卡片发送,精确满足业务终端的多样化需求,帮助企业更好地应对5G时代下更加丰富多样的用户需求,
其中,Chatbot,即短信小程序、短信机器人、短信聊天机器人、会话机器人,是5G消息业务手机展现载体,提供富媒体消息展示及会话消息。通常以企业、产品的身份面向运营商申请,并为终端用户提供服务。很多用户与商家对话的场景都使用Chatbot,目前Chatbot能够根据用户输入的内容进行搜索并反馈用户搜索到的内容。5G消息场景下的Chatbot能够为用户提高文字、图片、视频和链接等富媒体信息。
图1示出了传统5G消息搜索方式的示意图。如图1中的(a)所示的,现有5G消息的Chatbot搜索引擎,仅提供了Chatbot主页的Chatbot账号与搜索关键词的检索,然后将精准匹配的Chatbot账号列表显示给用户。如图1中的(b)所示的,为传统5G消息搜索的界面图,从图(b)可以看出,当搜索关键词为梦网时,仅显示了与梦网匹配的梦网科技的账号。因此,传统的5G消息的搜索效率低、功能单一满足不了行业客户对业务检索的多样化需求。因此,亟需一种Chatbot的搜索方式,可以提高用户的搜索效率,并且实现Chatbot地区、业务、场景、服务等相关属性的搜索以及Chatbot服务的相关推送。
有鉴于此,本申请提供了一种Chatbot的搜索方法,终端设备通过将输入信息与多个Chatbot账号分别对应的第一关联信息进行匹配,该第一关联信息包括了Chatbot账号的第一摘要信息和第一标签信息,并且将输入信息与多个消息卡片分别对应的第二关联信息进行匹配,该第二关联信息包括消息卡片的第二摘要信息和第二标签信息。由于Chatbot账号的第一摘要信息和第一标签信息以及消息卡片的第二摘要信息和第二标签信息中包含更多的Chatbot账号和消息卡片相关的信息,进而提高了用户的搜索效率。最后将匹配成功的第一关联信息对应的Chatbot账号和匹配成功的第二关联信息对应的消息卡片显示给用户。
为了说明本申请提供的技术方案,下面通过具体实施例来进行说明。
请参见图2,图2是本申请实施例提供的一例Chatbot的搜索方法的示意性流程图。本实施例中Chatbot的搜索方法的执行主体为终端设备,该设备包括但不限于智能手机、平板电脑、可穿戴设备等移动终端,还可以是台式电脑、机器人或者服务器等。
如图2所示的,该Chatbot的搜索方法包括:S210至S230。
S210、接收用户的输入信息。
在本申请实施例中,用户根据当前需求在5G消息的搜索界面中输入相关的输入信息。该输入信息可以为文本信息、音频信息或者视频信息中的至少一种形式。该文本信息可以为词语、短句或者长句等。
示例性的,当用户想要了解短信业务时,可以在5G消息的搜索界面中输入企业名称比如:梦网科技,或者业务名称比如:短信验证码等。
S220、将用户的输入信息和多个Chatbot账号分别对应的第一摘要信息进行匹配。
需要说明的是,每个Chatbot账号在注册时都有该Chatbot账号对应的企业简介或者用户简介,该企业简介或者用户简介可以为该Chatbot账号的摘要信息。
在一个实施例中,终端设备可以获取Chatbot账号的第一主页信息,将该第一主页信息作为第一摘要信息。然后,将用户的输入信息和Chatbot账号的第一主页信息进行匹配。
需要说明的是,该第一主页信息至少包括:Chatbot账号的服务介绍、服务类型、短信号码和认证信息。因此,将第一主页信息确定为第一摘要信息,提高了根据用户的输入信息进行精准匹配的效率。
示例性的,以Chatbot账号为梦网科技为例,图3示出了Chatbot账号为梦网科技的第一主页信息的示意图,如图3所示的,该Chatbot账号的主要信息包括服务介绍:用于5G消息业务同码号测试;服务类型:信息传输、软件和信息技术服务业;短信号码:1069052807270000000以及认证信息为***股份有限公司。
可以理解的是,Chatbot账号的第一摘要信息可以预先存储在本地,当终端设备接收到输入信息后,在本地进行输入信息和第一摘要信息的匹配。或者,当终端设备接收到输入信息之后,在线进行输入信息和第一摘要信息的匹配。
具体地,当多个Chatbot账号的第一摘要信息预先存储在本地数据库中,在终端设备接收到输入信息后,将输入信息与数据中保存的多个Chatbot账号的第一摘要信息逐一进行匹配。或者,在终端设备接收到输入信息后,实时逐个获取每个Chatbot账号的第一摘要信息,然后将输入信息与Chatbot账号的第一摘要信息进行逐一匹配。
值得说明的是,从本地数据库中获取Chatbot账号的第一摘要信息可以提高匹配效率,从服务器端获取Chatbot账号的第一摘要信息可以实时获取最新的Chatbot账号的第一摘要信息,提高了匹配精度。本申请实施例对该Chatbot账号的第一摘要信息的获取方式不做限定。
下面在步骤S220的基础上具体介绍如何将输入信息和Chatbot账号的第一摘要信息进行匹配,图4示出了本申请实施例提供的输入信息和Chatbot账号的第一摘要信息进行匹配的方法的示意性流程图,如图4所示的,该方法包括:S410-S440。
S410、将输入信息进行分词,得到第一分词结果集。
在步骤S410中,为了将用户的输入信息和Chatbot账号对应的第一摘要信息进行精准匹配,首先需要对用户的输入信息进行分词处理。
在本申请实施例中,当终端设备获取到用户的输入信息为文本信息时,可以直接将文本信息进行分词处理,得到相应的第一分词结果集,此处提及的文本信息是指输入信息为短句或者长句的文本信息。
在本申请实施例中,当终端设备获取到用户的输入信息为音频信息时,终端设备需要对该音频信息进行语音识别,将得到的语音识别结果转化为文本数据,并对文本数据进行分词处理,得到相应的第一分词结果集。
同样的,当终端设备获取到用户的输入信息为视频信息时,终端设备可以对该视频信息进行解析,从而得到解析后的文本数据和图像,对图像进行识别后,结合识别到的图像内容,对文本数据进行分词处理,得到第一分词结果集。
可以理解的是,分词是将连续的字序列按照一定的规范重新组成词序列的过程。
示例性的,当用户的输入信息为“梦网科技目前主营中国最大规模之一的企业云通信平台”时,利用分词工具将该输入信息进行分词后,该输入信息被分为:“梦网”、“科技”、“目前”、“主营”、“中国”、“最大”、“规模”、“之一”、“的”、“企业”、“云通信”、“平台”。
在一个实施例中,可以使用Python版的JieBa分词工具对文本信息进行分词处理。
在另一个实施例中,可以根据Word分词器或者Ansj分词器进行分词处理。当然,还可以根据其他的分词器对输入信息进行分词,本申请实施例不做限定。
可以理解的是,当步骤S210中用户的输入信息为词语时,终端设备可以不用执行步骤S410。
S420、将Chatbot账号的第一摘要信息进行分词,得到第二分词结果集。
在本申请实施例中,为了更好的将输入信息和Chatbot账号的第一摘要信息的匹配程度进行判断,终端设备需要对Chatbot账号的第一摘要信息进行分词。
对Chatbot账号的第一摘要信息进行分词的过程可参考步骤S410,在此不再赘述。
将第一摘要信息进行分词后,为了更精确的将输入信息和Chatbot账号的第一摘要信息相匹配,可以过滤掉第一摘要信息中无实际意义的词语,最终得到第二分词结果集。
首先,为了对摘要信息中的无实际意义的词语进行过滤,首先需要对摘要信息对应的多个词语进行词性和实体识别,最终得到识别结果。
需要说明的是,该词性是指名词、动词、形容词、虚词、助词或者介词等,该实体识别是指该词表示地点、时间或者人物等信息。
其中,无实际意义的词是指不具有特定意义或者指代性的词语,比如:虚词、介词或者助词等。
作为了一种可能的实现方式,在本申请实施例中,可以利用开源框架LTP对第一摘要信息进行句法分析。通过句法分析后可以去掉第一摘要信息中的网络标签、移除标点信息、切分成词,去掉停用词和句子重组,然后将第一摘要信息中的多个词语赋予词性和实体信息。
在本实施例中,通过步骤S420可以将第一摘要信息中分词后的多个词语赋予词性和实体信息,然后将分词后的无实际意义的词语删除,以消除这些无意义词对匹配结果的影响。
S430、利用文本编辑距离算法获得过滤后的第一分词结果集和第二分词结果集之间的差异词集合。
在本申请实施例中,可以利用文本编辑距离算法对第一分词结果集和经过过滤的第二分词结果集中剩下的词语进行处理,以确定出第一分词结果和第二分词结果之间的差异词,并利用第一分词结果中存在的差异词组成输入信息对应的差异词集合,同时,利用第二分词结果中存在的差异词组成第一摘要信息对应的差异词集合。
S440、利用差异词集合分别确定输入信息和Chatbot账号的第一摘要信息的语义相似度。
在本申请实施例中,可以利用这些差异词集合构建用于判断输入信息和第一摘要信息间的语义相似度的语料库,以便于后续当确定出另外某两个文本之间同样存在这些差异词集合时,可根据该语料库中已存储的差异词集合数据,快速的判断出另外这输入信息和第一摘要信息之间的语义相似度。
通过上述步骤S410-步骤S440,先对输入信息和关联信息进行分词,再对两个分词结果中的差异词进行对比,根据差异词来判断输入信息和关联信息的语义是否相似。由于输入信息和关联信息是否相似取决于差异词的语义是否相同。该方法可以有效消除输入信息和关联信息中非差异词对判断结果带来的影响,从而能够得到更加准确的匹配结果。
S230、显示匹配成功的第一摘要信息对应的Chatbot账号。
在本申请实施例中,获取与第一分词结果集语义相似度大于或者等于预设第一阈值的第二分词结果集对应的第一摘要信息,将该第一摘要信息对应的Chatbot账号显示在当前终端设备的搜索界面上。
需要说明的是,该预设第一阈值可以根据具体情况设定,本申请实施例不做限定。
具体地,筛选出的与第一分词结果集语义相似度大于或者等于第一阈值的第一摘要信息可能为一个或者多个。在筛选出至少存在一个时,将多个第一摘要信息对应的多个Chatbot账号显示在当前终端设备的搜索界面上。
上述步骤S210-S230介绍了本申请实施例提供的将输入信息和多个Chatbot账号分别对应的第一摘要信息进行匹配的过程的具体介绍,下面介绍本申请实施例提供的将输入信息和多个消息卡片分别对应的第二摘要信息进行匹配的过程。
图5示出了本申请实施例提供的另一例Chatbot的搜索方法的示意性流程图,如图5所示的,该方法包括:S510-S530。
S510、接收用户的输入信息。
在本申请实施例中,用户根据当前需求在5G消息的搜索界面中输入相关的输入信息。该输入信息可以为文本信息、音频信息或者视频信息中的至少一种形式。该文本信息可以为词语、短句或者长句等。
S520、将用户的输入信息和多个消息卡片分别对应的第二摘要信息进行匹配。
需要说明的是,消息卡片是指该企业中的某一个具体服务或者产品。每一消息卡片具有相应的名称及内容介绍。每个消息卡片对应的摘要信息则是指该消息卡片的具体产品或者服务的介绍、产品或者服务的类型,区域等。
例如,梦网科技的Chatbot账号对应的多个消息卡片包括“5G消息”,“视频短信”和“短信”等。
又例如,对于“南山政务服务”这一Chatbot账号而言,可以分出一个或者多个消息卡片,如第一个消息卡片为“在线预约”,第二个消息卡片为“取号”
可以理解的是,一个Chatbot账号对应一个或者多个消息卡片。该消息卡片为某项或者多项服务或者产品的细化。
在一个实施例中,终端设备可以获取消息卡片的第二主页信息,将第二主页信息确定为第二摘要信息,然后将用户的输入信息和第二主页信息进行匹配。
需要说明的是,该第二主页信息中至少包括了消息卡片的服务介绍、服务类型、短信号码或者认证信息。因此,将第二主页信息确定为第二摘要信息,提高了根据用户的输入信息进行精准匹配的效率。
消息卡片的第二摘要信息可以预先存储在本地,当终端设备接收到输入信息后,在本地进行输入信息和第二摘要信息的匹配。或者,当终端设备接收到输入信息之后,在线进行输入信息和第二摘要信息的匹配。
具体的,将用户的输入信息和多个消息卡片分别对应的摘要信息进行匹配的具体过程参见步骤S410至步骤S430。在此处不再赘述。
S530、显示匹配成功第二摘要信息对应的消息卡片。
在本申请实施例中,获取与第一分词结果集语义相似度大于或者等于预设第二阈值的第二分词结果集对应的消息卡片的第二摘要信息,并将该第二摘要信息对应的消息卡片显示在当前终端设备的搜索界面上。
需要说明的是,该预设第二阈值可以根据具体情况设定,本申请实施例不做限定。
具体地,筛选出的与第一分词结果集语义相似度大于或者等于第二阈值的第二分词结果对应的消息卡片的第二摘要信息可能为一个或者多个。在筛选出至少存在一个时,将与所有消息卡片对应的第二摘要信息对应的多个消息卡片显示在当前终端设备的搜索界面上。
上述步骤S510-S530介绍了本申请实施例提供的将输入信息和多个消息卡片分别对应的第二摘要信息进行匹配的过程的具体介绍,下面介绍本申请实施例提供的将输入信息和Chatbot账号的第一标签信息进行匹配的过程。
图6示出了本申请实施例提供的又一例Chatbot的搜索方法的示意性流程图,如图6所示的,该方法包括:S610-S630。
S610、接收用户的输入信息。
步骤S610可以参考上述步骤S210,在此不再赘述。
S620、将用户的输入信息和Chatbot账号的第一标签信息进行匹配。
在本申请实施例中,为了进一步根据用户的输入信息查找相匹配的搜索结果,终端设备将用户的输入信息和Chatbot账号的第一标签信息进行匹配。
需要说明的是,每一个Chatbot账号都具备多个标签信息,该标签信息可以包括公司属性、地域标签、企业标签、产品标签、用途标签和场景标签等。当然,还有和该企业相关的任何属性都可以作为该Chatbot账号的第一标签信息,对此,本申请实施例不做限制。
示例性的,对于“南山政务服务”的Chatbot账号而言,其标签有政务标签、服务标签和地域标签等。其中,服务标签又包括:网上申办、在线预约、取号或者缴费等。
又例如,对于“梦网科技”的Chatbot账号而言,公司属性包括:短信业务;地域标签包括:广东、深圳和南山等;企业标签包括:通信企业;产品标签包括:短信、视频短信、5G消息和云通讯等;用途标签包括:生产、服务和营销活动等;场景标签包括:验证码、会员通知、会议通知和工资条等。
在一个实施例中,终端设备可以提取第一摘要信息中的第一关键词,将第一关键词作为Chatbot账号的第一标签信息。
需要说明的是,该第一关键词表示和Chatbot账号相关的服务介绍或者服务类型相关的关键词。
在另一个实施例中,终端设备可以将第一摘要信息输入至训练好的第一分类模型中得到Chatbot账号的第一标签信息。
具体地,将Chatbot账号的摘要信息作为训练样本,对训练样本中的关键词进行标注,然后将标注后的训练样本输入至初始第一分类模型中,利用训练样本和初始第一分类模型生成预测的标签信息,根据预测标签信息和样本标注信息计算损失函数,根据该损失函数对初始第一分类模型进行迭代训练,当输出的关键词与标注的关键词的损失函数满足预设条件时,表示该初始第一分类模型已经训练完成,即得到了训练好的第一分类模型。
然后,将待获取标签的Chatbot账号的摘要信息输入至训练好的第一分类模型中最终得到该Chatbot账号的第一标签信息。
需要说明的是,步骤S620中涉及到的第一分类模型可以为卷积神经网络模型CNN、循环神经网络RNN以及支持向量机模型SVM等。当然,还可以是其他的分类模型,对此,本申请实施例不做限制。
本申请实施例中的Chatbot账号的第一标签信息可以预先设置并存储在数据库中,并且可以根据用户在于Chatbot账号的会话内容中不断增加或者更新数据库中预先存储的第一标签信息。
具体地,在一个实施例中,可以通过获取用户与Chatbot账号的历史会话信息,提取历史会话信息中出现次数大于或者等于预设次数的第三关键词,将该第三关键词添加到Chatbot账号的第一标签信息中,从而更新数据库中预先存储的第一标签信息。
需要说明的是,该预设次数可以根据具体情况设定,本申请实施例不做限定。
在另一个实施例中,可以通过爬取网络消息中的主题信息的方式,提取和主题信息中与Chatbot账号关联的第四关键词,将该第四关键词添加到Chatbot账号的第一标签信息中,从而更新数据库中预先存储的第一标签信息。
步骤S620中利用用户的输入信息和Chatbot账号的第一标签信息进行匹配的详细过程可参考步骤S220。在此不再赘述。
需要说明的是,当输入信息为词语,并且第一标签信息也为词语时,直接计算输入信息和第一标签信息的相似度即可。
S630、显示匹配成功的第一标签信息对应的Chatbot账号。
在本申请实施例中,获取与输入信息相似度大于或者等于预设第三阈值的第一标签信息,并将该第一标签信息对应的Chatbot账号显示在当前终端设备的搜索界面上。
需要说明的是,该预设第三阈值可以根据具体情况设定,本申请实施例不做限定。
可选的,筛选出的与输入信息相似度大于或者等于第三阈值的第一标签信息可能为一个或者多个。在筛选出至少存在一个时,将多个第一标签信息对应的多个Chatbot账号显示在当前终端设备的搜索界面上。
上述步骤S610-S630介绍了本申请实施例提供的将输入信息和Chatbot账号的第一标签信息进行匹配的过程的具体介绍,下面介绍本申请实施例提供的将输入信息和消息卡片对应的第二标签信息进行匹配的过程。
图7示出了本申请实施例提供的又又一例Chatbot的搜索方法的示意性流程图,如图7所示的,该方法包括:S710-S730。
S710、接收用户的输入信息。
步骤S710可以参考上述步骤S210,在此不再赘述。
S720、将用户的输入信息和消息卡片对应的第二标签信息进行匹配。
在本申请实施例中,为了进一步根据用户的输入信息查找相匹配的搜索结果,终端设备将用户的输入信息和消息卡片的第二标签信息进行匹配。
可以理解的是,步骤S720中的消息卡片的第二标签信息和Chatbot账号的第一标签类似,表示该消息卡片相关的属性标签。
在一个实施例中,终端设备可以提取第二摘要信息中的第二关键词,将第二关键词作为消息卡片的第二标签信息。
需要说明的是,该第二关键词表示和消息卡片相关的服务介绍或者消息卡片的服务类型相关的关键词。
在另一个实施例中,终端设备可以将第二摘要信息输入至训练好的第二分类模型中得到消息卡片的第二标签信息。
具体地,将消息卡片的摘要信息作为训练样本,对训练样本中的关键词进行标注,然后将标注后的训练样本输入至初始第二分类模型中,利用训练样本和初始第二分类模型生成预测的第二标签信息,根据预测标签信息和样本标注信息计算损失函数,根据该损失函数对初始第二分类模型进行迭代训练,当输出的关键词与标注的关键词的损失函数满足预设条件时,表示该初始第二分类模型已经训练完成,即得到了训练好的第二分类模型。
然后,将待获取标签的消息卡片的摘要信息输入至训练好的第二分类模型中最终得到该消息卡片的标签。
需要说明的是,步骤S720中涉及到的第二分类模型可以为卷积神经网络模型CNN、循环神经网络RNN以及支持向量机模型SVM等。当然,还可以是其他的分类模型,对此,本申请实施例不做限制。
本申请实施例中的消息卡片的第二标签信息可以预先设置并存储在数据库中,并且可以根据用户在于Chatbot的会话内容中不断增加或者更新数据库中预先存储的第二标签信息。
该数据库中的第二标签信息的增加或者更新可以参考数据库中的第一标签信息的增加或者更新,在此不再赘述。
步骤S720中利用用户的输入信息和消息卡片的第二标签信息进行匹配的详细过程可参考步骤S220。在此,不再赘述。
需要说明的是,当输入信息为词语,并且第二标签信息也为词语时,直接计算输入信息和第一标签信息的相似度即可。
S730、显示匹配成功的第二标签信息对应的消息卡片。
在本申请实施例中,获取与输入信息相似度大于或者等于预设第四阈值的第二标签信息,并将该第二标签信息对应的消息卡片显示在当前终端设备的搜索界面上。
需要说明的是,该预设第四阈值可以根据具体情况设定,本申请实施例不做限定。
可选的,筛选出的与输入信息相似度大于或者等于第四阈值的第二标签信息可能为一个或者多个。在筛选出至少存在一个时,将多个第二标签信息对应的多个消息卡片显示在当前终端设备的搜索界面上。
图8示出了本申请实施例提供的Chatbot账号的搜索方法的界面示意图,如图8中的(a)所示的,本申请实施例提供的搜索方法用户可以搜索关键词也可以搜索业务标签,例如产品、功能、问题等属性。然后利用根据搜索的关键词或者标签信息最终展示Chatbot账号匹配结果,Chatbot账号匹配结果包括:精准匹配的Chatbot账号列表和Chatbot账号的关联推送。以及展示Chatbot业务匹配结果,该Chatbot业务的匹配结果包括:精准匹配的Chatbot模板列表和Chatbot模板的关联推送。图8中的(b)为终端设备的搜索界面图,如图8中的(b)所示的,当输入的搜索词为物联网时利用本申请实施例提供的Chatbot账号的搜索方法,可以搜索出为梦网科技和梦网云创的分别对应的Chatbot账号,以及与物联网相关的多个消息卡片。因此,从图8可以看出利用本申请提供的搜索方法相比于传统的搜索方法更加的全面和完善。
本申请实施例中,当终端设备接收到用户的输入信息后,利用输入信息和多个Chatbot账号分别对应的第一关联信息进行匹配,该第一关联信息包括了Chatbot账号的第一摘要信息和第一标签信息,并且将输入信息与多个消息卡片分别对应的第二关联信息进行匹配,该第二关联信息包括消息卡片的第二摘要信息和第二标签信息。由于Chatbot账号的第一摘要信息和第一标签信息以及消息卡片的第二摘要信息和第二标签信息中包含更多的Chatbot账号和消息卡片相关的信息,因此将输入信息和Chatbot账号的第一关联信息进行匹配以及将输入信息和消息卡片的第二关联信息进行匹配,提高了匹配成功的概率,进而提高了用户的搜索效率。最后将匹配成功的第一关联信息对应的Chatbot账号和匹配成功的第二关联信息对应的消息卡片显示给用户,提高了用户体验。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
结合图1-图8对本申请实施例提供的Chatbot的搜索方法进行了具体的介绍,下面对本申请实施例提供的Chatbot的搜索装置和Chatbot的搜索设备进行具体介绍。
图9是本申请实施例提供的Chatbot的搜索装置的示意图。包括各单元用于执行图1-图8对应的实施例中的各步骤,具体请参阅图1-图8各自对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图9,Chatbot的搜索装置900包括:
接收单元910,该接收单元910用于接收用户的输入信息。
第一匹配单元920,该匹配单元920用于将输入信息与多个Chatbot账号分别对应的第一关联信息进行匹配。
第二匹配单元930,该第二匹配单元930用于将输入信息与多个消息卡片分别对应的第二关联信息进行匹配。
显示单元940,该显示单元940用于显示匹配成功的第一关联信息对应的Chatbot账号和显示匹配成功第二关联信息对应的消息卡片。
可选的,该Chatbot的搜索装置900还包括确定单元950,该确定单元950用于获取Chatbot账号的第一主页信息;将第一主页信息确定为第一摘要信息。
可选的,该确定单元950还用于获取消息卡片的第二主页信息;将第二主页信息确定为第二摘要信息。
可选的,该Chatbot的搜索装置900还包括提取单元960,该提取单元960用于提取第一摘要信息的第一关键词,将第一关键词作为Chatbot账号的第一标签信息。
可选的,该提取单元960还用于提取第二摘要信息的第二关键词,将第二关键词作为消息卡片的第二标签信息。
可选的,该确定单元950还用于获取用户与Chatbot账号的历史会话信息;提取历史会话消息中出现次数大于或者等于预设次数的第三关键词,将第三关键词添加到Chatbot账号的第一标签信息中;和/或,爬取网络消息中的主题信息,获取主题信息中与Chatbot账号关联的第四关键词,将第四关键词添加到Chatbot账号的第一标签信息中。
可选的,该确定单元950还用于获取训练样本;利用训练样本和初始第一分类模型生成预测标签信息;根据预测标签信息和样本标注信息计算损失函数;根据损失函数对初始第一分类模型进行迭代训练,得到训练好的第一分类模型;利用训练好的第一分类模型确定Chatbot账号的第一标签信息。
图10是本申请实施例提供的Chatbot的搜索设备的示意图。如图10所示,该实施例的Chatbot的搜索设备1000包括:处理器1010、存储器1020以及存储在所述存储器1020中并可在所述处理器1010上运行的计算机程序1030。处理器1010执行所述计算机程序1030时实现上述各个Chatbot的搜索的方法实施例中的步骤,例如图2、图4、图5、图6和图7中所示的步骤。或者,所述处理器1010执行所述计算机程序1030时实现上述各装置实施例中各模块/单元的功能,例如图9所示模块910-940的功能。
示例性的,所述计算机程序1030可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器1020中,并由处理器1010执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序1030在所述Chatbot的搜索设备1000中的执行过程。
所述Chatbot的搜索设备1000可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述Chatbot的搜索设备可包括,但不仅限于,处理器1010、存储器1020。本领域技术人员可以理解,图10仅仅是Chatbot的搜索设备的示例,并不构成对Chatbot的搜索设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述Chatbot的搜索设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器1010可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器1020可以是所述Chatbot的搜索设备1000的内部存储单元,例如Chatbot的搜索设备1000的硬盘或内存。所述存储器1020也可以是所述Chatbot的搜索设备1000的外部存储设备,例如所述Chatbot的搜索设备1000上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器1020还可以既包括所述Chatbot的搜索设备1000的内部存储单元也包括外部存储设备。所述存储器1020用于存储所述计算机程序以及所述Chatbot的搜索设备所需的其他程序和数据。所述存储器1020还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述Chatbot的搜索方法。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在Chatbot的搜索设备上运行时,使得Chatbot的搜索设备执行时实现可实现上述Chatbot的搜索方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述***中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种Chatbot的搜索方法,其特征在于,所述方法包括:
接收用户的输入信息;
将所述输入信息与多个Chatbot账号分别对应的第一关联信息进行匹配,所述第一关联信息包括:Chatbot账号的第一摘要信息和第一标签信息;
将所述输入信息与多个消息卡片分别对应的第二关联信息进行匹配,所述第二关联信息包括:消息卡片的第二摘要信息和第二标签信息;
显示匹配成功的第一关联信息对应的Chatbot账号;
显示匹配成功的第二关联信息对应的消息卡片。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取Chatbot账号的第一主页信息;
将所述第一主页信息确定为所述第一摘要信息,所述第一主页信息至少包括:所述Chatbot账号的服务介绍、服务类型、短信号码和认证信息。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
获取所述消息卡片的第二主页信息;
将所述第二主页信息确定为所述第二摘要信息,所述第二主页信息至少包括:所述消息卡片的服务介绍、服务类型、短信号码和认证信息。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
提取所述第一摘要信息的第一关键词,将所述第一关键词作为Chatbot账号的第一标签信息。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
提取所述第二摘要信息的第二关键词,将所述第二关键词作为消息卡片的第二标签信息。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
获取用户与Chatbot账号的历史会话信息;
提取所述历史会话消息中出现次数大于或者等于预设次数的第三关键词,将所述第三关键词添加到所述Chatbot账号的第一标签信息中;和/或,
爬取网络消息中的主题信息,获取所述主题信息中与Chatbot账号关联的第四关键词,将所述第四关键词添加到所述Chatbot账号的第一标签信息中。
7.根据权利要求1或2所述的方法,其特征在于,所述将所述输入信息与多个Chatbot账号分别对应的第一关联信息进行匹配之前,所述方法还包括;
获取训练样本,所述训练样本包括:Chatbot账号的摘要信息;
利用所述训练样本和初始第一分类模型生成预测标签信息;
根据所述预测标签信息和样本标注信息计算损失函数;
根据所述损失函数对所述初始第一分类模型进行迭代训练,得到训练好的第一分类模型;
利用所述训练好的第一分类模型确定Chatbot账号的第一标签信息。
8.一种Chatbot的搜索设备,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
9.一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
10.一种芯片,其特征在于,包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有所述芯片的设备执行如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111372122.XA CN114168837A (zh) | 2021-11-18 | 2021-11-18 | 一种Chatbot的搜索方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111372122.XA CN114168837A (zh) | 2021-11-18 | 2021-11-18 | 一种Chatbot的搜索方法、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114168837A true CN114168837A (zh) | 2022-03-11 |
Family
ID=80479678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111372122.XA Pending CN114168837A (zh) | 2021-11-18 | 2021-11-18 | 一种Chatbot的搜索方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114168837A (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050222985A1 (en) * | 2004-03-31 | 2005-10-06 | Paul Buchheit | Email conversation management system |
US20100153354A1 (en) * | 2008-12-17 | 2010-06-17 | International Business Machines Corporation | Web Search Among Rich Media Objects |
CN104090963A (zh) * | 2014-07-14 | 2014-10-08 | 百度在线网络技术(北京)有限公司 | 查询信息推荐方法和装置 |
WO2017024878A1 (zh) * | 2015-08-07 | 2017-02-16 | 腾讯科技(深圳)有限公司 | 一种对象搜索方法、装置及服务器 |
CN106682170A (zh) * | 2016-12-27 | 2017-05-17 | 北京奇虎科技有限公司 | 一种应用搜索方法和装置 |
CN109271579A (zh) * | 2018-11-16 | 2019-01-25 | 珠海市魅族科技有限公司 | 一种基于输入信息的应用推荐方法、电子设备及存储介质 |
CN109962834A (zh) * | 2017-12-22 | 2019-07-02 | 中兴通讯股份有限公司 | 信息处理方法、***、终端和计算机存储介质 |
CN110069675A (zh) * | 2019-04-16 | 2019-07-30 | 百度在线网络技术(北京)有限公司 | 一种检索方法及移动终端 |
CN110209450A (zh) * | 2019-05-22 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 页面生成方法、装置、存储介质及服务器 |
US20190387031A1 (en) * | 2018-06-18 | 2019-12-19 | Verizon Patent And Licensing Inc. | Systems and methods for generating a shortcut associated with a rich communication services messaging session |
CN111314202A (zh) * | 2018-12-11 | 2020-06-19 | 中兴通讯股份有限公司 | 消息发送方法和装置 |
US20210105236A1 (en) * | 2019-10-04 | 2021-04-08 | Verizon Patent And Licensing Inc. | Systems and methods for including enriched calling information in rich communications services (rcs) messaging |
CN113282772A (zh) * | 2021-04-25 | 2021-08-20 | 夏贵军 | 一种基于5g消息的用户搜索方法及*** |
-
2021
- 2021-11-18 CN CN202111372122.XA patent/CN114168837A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050222985A1 (en) * | 2004-03-31 | 2005-10-06 | Paul Buchheit | Email conversation management system |
US20100153354A1 (en) * | 2008-12-17 | 2010-06-17 | International Business Machines Corporation | Web Search Among Rich Media Objects |
CN104090963A (zh) * | 2014-07-14 | 2014-10-08 | 百度在线网络技术(北京)有限公司 | 查询信息推荐方法和装置 |
WO2017024878A1 (zh) * | 2015-08-07 | 2017-02-16 | 腾讯科技(深圳)有限公司 | 一种对象搜索方法、装置及服务器 |
CN106682170A (zh) * | 2016-12-27 | 2017-05-17 | 北京奇虎科技有限公司 | 一种应用搜索方法和装置 |
CN109962834A (zh) * | 2017-12-22 | 2019-07-02 | 中兴通讯股份有限公司 | 信息处理方法、***、终端和计算机存储介质 |
US20190387031A1 (en) * | 2018-06-18 | 2019-12-19 | Verizon Patent And Licensing Inc. | Systems and methods for generating a shortcut associated with a rich communication services messaging session |
CN109271579A (zh) * | 2018-11-16 | 2019-01-25 | 珠海市魅族科技有限公司 | 一种基于输入信息的应用推荐方法、电子设备及存储介质 |
CN111314202A (zh) * | 2018-12-11 | 2020-06-19 | 中兴通讯股份有限公司 | 消息发送方法和装置 |
CN110069675A (zh) * | 2019-04-16 | 2019-07-30 | 百度在线网络技术(北京)有限公司 | 一种检索方法及移动终端 |
CN110209450A (zh) * | 2019-05-22 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 页面生成方法、装置、存储介质及服务器 |
US20210105236A1 (en) * | 2019-10-04 | 2021-04-08 | Verizon Patent And Licensing Inc. | Systems and methods for including enriched calling information in rich communications services (rcs) messaging |
CN113282772A (zh) * | 2021-04-25 | 2021-08-20 | 夏贵军 | 一种基于5g消息的用户搜索方法及*** |
Non-Patent Citations (2)
Title |
---|
王悉尼等: "基于5G消息的网元智能监控应用的研究与实现", 5G网络创新研讨会(2021), 13 October 2021 (2021-10-13) * |
袁国宝、袁国庆、袁国栋: "微信小程序运营实战", vol. 2017, 30 June 2017, 中国经济出版社, pages: 216 - 220 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11645517B2 (en) | Information processing method and terminal, and computer storage medium | |
CN108153901B (zh) | 基于知识图谱的信息推送方法和装置 | |
CN107220386B (zh) | 信息推送方法和装置 | |
CN107679039B (zh) | 用于确定语句意图的方法和装置 | |
CN106960030B (zh) | 基于人工智能的推送信息方法及装置 | |
CN108885623B (zh) | 基于知识图谱的语意分析***及方法 | |
US8516052B2 (en) | Dynamically managing online communication groups | |
CN110888990B (zh) | 文本推荐方法、装置、设备及介质 | |
WO2015185019A1 (zh) | 一种基于语义理解的表情输入方法和装置 | |
CN110929125B (zh) | 搜索召回方法、装置、设备及其存储介质 | |
US11055373B2 (en) | Method and apparatus for generating information | |
CN110298029B (zh) | 基于用户语料的好友推荐方法、装置、设备及介质 | |
CN112035599B (zh) | 基于垂直搜索的查询方法、装置、计算机设备及存储介质 | |
CN112699645B (zh) | 语料标注方法、装置及设备 | |
CN109522399B (zh) | 用于生成信息的方法和装置 | |
CN111339295A (zh) | 用于展示信息的方法、装置、电子设备和计算机可读介质 | |
CN111414471B (zh) | 用于输出信息的方法和装置 | |
CN110941702A (zh) | 一种法律法规和法条的检索方法及装置、可读存储介质 | |
CN113051380A (zh) | 信息生成方法、装置、电子设备和存储介质 | |
CN116882372A (zh) | 文本生成方法、装置、电子设备以及存储介质 | |
CN113836316B (zh) | 三元组数据的处理方法、训练方法、装置、设备及介质 | |
CN112148958A (zh) | 用于信息推荐的方法、设备和计算机存储介质 | |
CN111538817A (zh) | 人机交互方法和装置 | |
CN114491010A (zh) | 信息抽取模型的训练方法及装置 | |
CN111555960A (zh) | 信息生成的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |