CN111859096B - 信息推送装置、方法、电子设备及计算机可读存储介质 - Google Patents
信息推送装置、方法、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111859096B CN111859096B CN201910319748.0A CN201910319748A CN111859096B CN 111859096 B CN111859096 B CN 111859096B CN 201910319748 A CN201910319748 A CN 201910319748A CN 111859096 B CN111859096 B CN 111859096B
- Authority
- CN
- China
- Prior art keywords
- information
- response
- request
- sample
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000004044 response Effects 0.000 claims abstract description 514
- 239000013598 vector Substances 0.000 claims abstract description 240
- 238000005520 cutting process Methods 0.000 claims abstract description 33
- 238000000605 extraction Methods 0.000 claims description 76
- 238000012549 training Methods 0.000 claims description 29
- 238000012545 processing Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 5
- 230000003993 interaction Effects 0.000 abstract description 15
- 230000008569 process Effects 0.000 description 15
- 230000011218 segmentation Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 239000002699 waste material Substances 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供了一种信息推送装置、方法、电子设备及计算机可读存储介质,该方法包括:获取模块,用于获取用户端的请求信息;生成模块,用于对所述获取模块获取的所述请求信息进行词汇切割,为得到的各个切割后的请求词汇分别生成特征向量;预测模块,将所述生成模块生成的各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系,输入到预先设置的响应信息预测模型中,输出所述请求信息对应的响应信息;推送模块,用于将所述预测模块输出的响应信息推送给所述用户端。本申请实施例可以提高用户端与自助服务平台之间的交互效率,节省网络资源。
Description
技术领域
本申请涉及信息技术领域,具体而言,涉及一种信息推送装置、方法、电子设备及计算机可读存储介质。
背景技术
目前,随着互联网技术的持续快速发展,各种用户端服务应用得到了长足发展,在人们日常生活中起到了不可替代的作用,为广大人民的日常生活、社交活动带来了极大方便。
目前,用户端在向自助服务平台发起咨询请求时,自助服务平台一般是向用户端推送预先设定好的推送信息,比如,针对用户端发送的不同的咨询请求“我要申诉”、“我要购买物品”,自助服务平台的推送信息都是“好的!”,这种方式下推送的信息比较单一,所起到的作用不大,用户端为了得到实际需要的反馈结果,需要与自助服务平台之间进行多次交互,并尝试使用多种提问语句,交互效率较低,浪费了两端的网络和处理资源。
发明内容
有鉴于此,本申请的目的在于提供一种信息推送装置、方法、电子设备及计算机可读存储介质,以提高用户端与自助服务平台之间的交互效率。
第一方面,本申请实施例提供了一种信息推送装置,该装置包括:
获取模块,用于获取用户端的请求信息;
生成模块,用于对所述获取模块获取的所述请求信息进行词汇切割,为得到的各个切割后的请求词汇分别生成特征向量;
预测模块,用于将所述生成模块生成的各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系,输入到预先设置的响应信息预测模型中,输出所述请求信息对应的响应信息;
推送模块,用于将所述预测模块输出的响应信息推送给所述用户端。
可选地,所述预测模块具体用于:
将所述响应信息中前j个响应词汇对应的特征向量和各个请求词汇分别对应的特征向量按照上下文关系输入到响应信息预测模型中,得到第j+1个响应词汇,其中,j为大于或等于0的正整数,第j+1个响应词汇为按照上下文关系,在第j个响应词汇之后的一个响应词汇。
可选地,所述预测模块具体用于:
将各个请求词汇对应的特征向量按照上下文关系输入到所述响应信息预测模型的编码器中进行上下文关系特征提取,得到所述请求信息对应的特征提取向量;
将所述请求信息对应的特征提取向量输入到所述响应信息预测模型的话题预测模块进行话题特征提取,得到所述请求信息对应的响应话题特征向量;
将所述响应话题特征向量、所述响应信息中前j个响应词汇对应的特征向量、请求信息对应的特征提取向量输入到所述响应信息预测模型的解码器中,得到所述第j+1个响应词汇。
可选地,该装置还包括:训练模块,所述训练模块用于:
构建训练样本库,所述训练样本库中包括请求样本信息和真实响应样本信息;
将所述真实响应样本信息中前i个真实响应样本词汇对应的特征向量和所述请求样本信息中各个请求样本词汇分别对应的特征向量按照对应的请求样本词汇在所述请求样本信息中的上下文关系输入初始响应信息预测模型中,得到第i+1个预测响应样本词汇,其中,i为大于或等于0的正整数,第i+1个预测响应样本词汇为按照上下文关系,在第i个预测响应样本词汇之后的一个预测响应样本词汇;
根据得到的所有预测响应样本词汇和所述真实响应样本信息,对所述初始响应信息预测模型进行调整,得到调整后的响应信息预测模型。
可选地,所述训练模块具体用于:
将所述请求样本信息中各个请求样本词汇分别对应的特征向量按照上下文关系输入到所述初始响应信息预测模型的初始编码器中,得到所述请求样本信息对应的特征提取向量;
将所述请求样本信息对应的特征提取向量输入到所述初始响应信息预测模型的初始话题预测模块中,得到所述请求样本信息对应的样本响应话题特征向量;
将所述样本响应话题特征向量、所述真实响应样本信息中前i个真实响应样本词汇对应的特征向量、请求样本信息对应的特征提取向量输入到所述响应信息预测模型的初始解码器中,得到所述第i+1个预测响应样本词汇。
可选地,所述训练模块还用于:
根据所述请求样本信息对应的样本响应话题特征向量和所述真实响应样本信息对应的真实样本响应话题特征向量,对所述初始响应信息预测模型的初始话题预测模块参数进行调整,得到调整后的话题预测模块。
可选地,所述训练模块还用于:
将所述真实响应样本信息中各个真实响应样本词汇对应的特征向量按照对应的真实响应样本词汇在所述真实响应样本信息中的上下文关系输入到所述初始响应信息预测模型的初始编码器中,得到所述真实响应样本信息对应的特征提取向量;
根据所述真实响应样本信息对应的特征提取向量和所述请求样本信息对应的特征提取向量,对所述初始响应信息预测模型进行调整,得到调整后的响应信息预测模型。
可选地,所述生成模块还用于:
去除所述请求信息中的干扰信息。
可选地,所述请求样本词汇为对请求样本信息进行词汇切割处理得到的,所述真实响应样本词汇为对真实响应样本信息进行词汇切割处理得到的。
第二方面,本申请实施例提供了一种信息推送方法,该方法包括:
获取用户端的请求信息;
对所述请求信息进行词汇切割,为得到的各个切割后的请求词汇分别生成特征向量;
将各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系,输入到预先设置的响应信息预测模型中,输出所述请求信息对应的响应信息;
将输出的响应信息推送给所述用户端。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如上述信息推送方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述信息推送方法的步骤。
本申请实施例提供的信息推送方法,为各个切割后的请求词汇分别生成特征向量,通过将各个请求词汇对应的所述特征向量按照请求信息中各个请求词汇的上下文关系输入到预先设置的响应信息预测模型中,预测得到请求信息对应的响应信息,得到的响应信息能够满足用户端的实际需要,减少了用户端与自助服务平台之间的交互次数,提高了交互效率,减少了对用户端和自助服务平台的网络和处理资源的浪费,提高了自助服务平台的服务质量。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种信息推送装置的第一种结构示意图;
图2示出了本申请实施例所提供的一种信息推送装置的第二种结构示意图;
图3示出了本申请实施例所提供的一种信息推送方法的第一种流程示意图;
图4示出了本申请实施例所提供的一种信息推送方法的第二种流程示意图;
图5示出了本申请实施例所提供的一种信息推送方法的第三种流程示意图;
图6示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“自助咨询场景”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕对咨询场景进行描述,但是应该理解,这仅是一个示例性实施例。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
本申请实施例可以服务于自助服务平台,该自助服务平台用于根据接收的用户端的咨询服务请求为用户提供相应的咨询服务。咨询服务平台可以包括多个咨询***,如包括社交网络***、物品购买***、心理咨询***等。
本申请实施例的信息推送方法可以应用于自助服务平台的服务器,也可以应用于其它任意具有处理功能的计算设备。在一些实施例中,上述服务器或计算设备可以包括处理器。处理器可以处理与服务请求有关的信息和/或数据,以执行本申请中描述的一个或多个功能。
目前,用户端在向自助服务平台发起咨询请求时,用户端将自身需要咨询的咨询信息发送至自助服务平台,自助服务平台在接收到用户端的咨询信息时,可以向用户端推送预先设定好的推送信息,那么,自助服务平台在向用户端推送信息时,针对不同用户端发送的不同的咨询信息,自助服务平台推送的信息一般为相同的,如,用户端发送的咨询请求为“我要投诉”,自助服务平台推送信息为“好的!”,或者,用户端发送的咨询请求为“我要购买物品”,自助服务平台推送信息为“好的!”,采用上述方式为用户端推送的信息比较单一,而且无法满足用户端的实际需求,给出的推送信息对用户端而言作用不大,此时,需要用户端与自助服务平台进行多次交互,也需要用户端尝试多种提问语句,交互效率低,同时浪费了用户端和自助服务平台的网络和处理资源。
为了使得自助服务平台推送的信息能够在一定程度上满足用户端的需求,自助服务平台还可以根据历史咨询信息,选择多个咨询最多的问题,并将选择的多个问题设置为候选问题集,并为候选问题集中的每个问题预先设置回复信息,这样,用户端在发送咨询请求时,可以直接从用户端显示的候选问题集中选择能够满足自身咨询需求的问题发送给自助服务平台,自助服务平台为该用户端推送相应的回复信息,这样,可以更好的满足用户的需求,同时,推送的信息对用户端而言价值会更高,但是,当用户端需要咨询的内容不再候选问题集内时,自助服务平台针对用户的回复一般为固定推送信息,对于用户端而言,无法得到有价值的反馈结果。
为了便于描述,本文通过预设的响应信息预测模型预测与用户端的请求信息对应的响应信息,高效、准确地预测针对用户端的响应信息,减少用户端与自助服务后台之间的交互次数。基于此目的,本申请针对获取的用户端的请求信息,为各个切割后的请求词汇分别生成特征向量,通过将各个请求词汇对应的特征向量按照请求信息中各个请求词汇的上下文关系输入到预先设置的响应信息预测模型中,预测得到请求信息对应的响应信息,得到的响应信息能够满足用户端的实际需要,减少了用户端与自助服务平台之间的交互次数,提高了交互效率,减少了对用户端和自助服务平台的网络和处理资源的浪费,提高了自助服务平台的服务质量。本申请实施例将基于该思想进行详细描述。
针对上述情况,本申请实施例提供了一种信息推送装置,如图1所示,该装置包括:获取模块11、生成模块12、预测模块13、推送模块14。
获取模块11,用于获取用户端的请求信息。
这里,用户端包括终端设备,如:计算机、笔记本电脑、平板电脑、移动电话、便携设备、车载设备等,也包括应用网络***的服务器,如:应用视听服务***、大屏幕***、客户端/服务器***(C/S)、浏览器/服务器***、云计算***等的服务器,本申请对此不予限制。
生成模块12,用于对所述获取模块11获取的所述请求信息进行词汇切割,为得到的各个切割后的请求词汇分别生成特征向量。
这里,在进行词汇切割处理时,可以利用分词器对请求信息进行分词处理,分词器包括ansj分词器、Hanlp分词器、结巴分词、oracle_sdk分词等,可以根据实际情况确定;每个切割后的请求词汇的特征向量一般为表征词汇语义的特征向量,该特征向量一般是将词汇输入到预先设置的特征向量生成模型中得到的,特征向量生成模型的训练过程不在此处进行详细介绍。
在具体应用过程中,在对请求信息进行词汇切割之间,还包括:去除请求信息中的干扰信息。其中,干扰信息一般为非中文字符,如数字、英文字符、标点符号、特殊字符等。一般地,若请求信息中包括用户端发送的多条对话条目,在去除干扰信息之前,还可以按照对话条目的产生时间对各对话条目进行顺次连接。
由于请求信息中可能不仅仅包含有中文字符,还包括有非中文字符,如,英文字符、标点符号等,若不去除非中文字符,在后续训练响应信息预测模型时,每一次对模型进行训练均需要将非中文字符输入模型,增加了训练次数,降低了训练效率,因此,为了提高训练效率,以及为了减少数字、标点符号、特殊符号等对确定的请求词汇的特征向量的影响,需要将非中文字符从请求信息中去除。
例如,请求信息为“我想休假,不知道去哪里。”、“你有推荐的地方吗?”,按照对话条目产生时间将对话条目顺次连接得到“我想休假,不知道去哪里。你有推荐的地方吗?”,将顺次连接的对话条目中非中文字符剔除,得到“我想休假不知道去哪里你有推荐的地方吗”,进一步对去除非中文字符的多条对话条目进行分词处理得到切割后的请求词汇:“我”、“想”、“休假”、“不知道”、“去”、“哪里”、“你”、“有”、“推荐”、“的”、“地方”、“吗”。
预测模块13,用于将所述生成模块12生成的各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系,输入到预先设置的响应信息预测模型中,输出所述请求信息对应的响应信息。
这里,响应信息预测模型可以是但不限于时间递归神经网络模型(Long Short-Term Memory,LSTM)、卷积神经网络模型(Convolutional Neural Network,CNN)、循环神经网络模型(Recurrent Neural Network,RNN)等,可以根据实际情况确定;上下文关系表征各个请求词汇在请求信息中的位置关系,如,请求信息会“欢迎进入客服咨询时间”,请求信息中包括的“欢迎”、“进入”、“客服”、“咨询”、“时间”词汇,排序为“欢迎”、“进入”、“客服”、“咨询”、“时间”的词汇为具有上下文关系的词汇。
本申请提供的响应信息预测模型至少包括编码器、话题预测模块、解码器、分类器等,编码器用于对输入的请求词汇的特征向量进行上下文关系特征提取,编码器与话题预测模块连接,话题预测模块用于预测用户端与自助服务平台在对话过程中话题转移,以得到能够表征用户端可能会沟通的话题,解码器分别与编码器、话题预测模块连接,解码器用于预测得到预测的话题下的响应信息。
在利用响应信息预测模型预测响应信息时,需要通过训练模块15对响应信息预测模型进行训练,如图2所示,训练模块15根据以下步骤对响应信息预测模型进行训练:
构建训练样本库,所述训练样本库中包括请求样本信息和真实响应样本信息;
将所述真实响应样本信息中前i个真实响应样本词汇对应的特征向量和所述请求样本信息中各个请求样本词汇分别对应的特征向量按照对应的请求样本词汇在所述请求样本信息中的上下文关系输入初始响应信息预测模型中,得到第i+1个预测响应样本词汇,其中,i为大于或等于0的正整数,第i+1个预测响应样本词汇为按照上下文关系,在第i个预测响应样本词汇之后的一个预测响应样本词汇;
根据得到的所有预测响应样本词汇和所述真实响应样本信息,对所述初始响应信息预测模型进行调整,得到调整后的响应信息预测模型。
这里,请求样本信息和真实响应样本信息一般为从自助服务平台获取的,请求样本信息一般为用户端和自助服务平台之间的多条对话条目,请求样本信息中包括多个会话条目,请求样本信息一般是按照会话条目产生时间排列的,可以包括用户端发送给自助服务平台的会话条目,也可以包括自助服务平台回复给用户端的会话条目;真实响应样本信息一般为用户端和自助服务平台之间的一条会话条目,该真实响应样本信息一般为针对上述请求样本信息的真实反馈信息;请求样本词汇为将对请求样本信息进行切割词汇处理得到的,真实响应样本词汇为对真实响应样本信息进行切割词汇处理得到的,切割词汇的过程可以参考请求信息的切割词汇处理过程;初始响应信息预测模型为未经训练、调整的模型。
在具体实施过程中,在获取到训练样本库后,首先,将请求样本信息中各个请求样本词汇对应的特征向量按照请求样本信息中各个请求样本词汇的上下文关系输入到初始响应信息预测模型中,预测得到第一个预测响应样本词汇。其中,在预测得到第一个预测响应样本词汇时,并不会输入真实响应样本词汇对应的特征向量,也就是说,i为0。
在得到第一个预测响应样本词汇后,将真实响应样本信息中的第一个真实响应样本词汇对应的特征向量和请求样本信息中各请求词汇对应的特征向量按照请求样本信息中各个请求样本词汇的上下文关系输入到初始响应信息预测预测模型中,预测得到第二个预测响应响应样本词汇。
在得到第二个响应样本词汇后,将真实响应样本信息中的前两个真实响应样本词汇对应的特征向量和请求样本信息中各请求词汇对应的特征向量按照请求样本信息中各个请求样本词汇的上下文关系输入到初始响应信息预测预测模型中,预测地道第三个预测响应响应样本词汇,直到预测得到所有预测响应样本词汇为止,将所有的预测响应样本词汇按照产生时间顺次连接起来,得到预测响应样本信息。
训练模块15在将所述真实响应样本信息中前i个真实响应样本词汇对应的特征向量和所述请求样本信息中各个请求样本词汇分别对应的特征向量按照请求样本信息中各个请求样本词汇的上下文关系输入初始响应信息预测模型中,得到第i+1个预测响应样本词汇时,具体包括以下内容:
将所述请求样本信息中各个请求样本词汇分别对应的特征向量按照上下文关系输入到所述初始响应信息预测模型的初始编码器中,得到所述请求样本信息对应的特征提取向量;
将所述请求样本信息对应的特征提取向量输入到所述初始响应信息预测模型的初始话题预测模块中,得到所述请求样本信息对应的样本响应话题特征向量;
将所述样本响应话题特征向量、所述真实响应样本信息中前i个真实响应样本词汇对应的特征向量、请求样本信息对应的特征提取向量按照上下文关系输入到所述响应信息预测模型的初始解码器中,得到所述第i+1个预测响应样本词汇。
在具体实施过程中,训练模块15将请求样本信息中各个请求样本词汇分别对应的特征向量按照上下文关系输入到初始响应信息预测模型的初始编码器中进行上下文关系特征提取,得到请求样本信息对应的特征提取向量。其中,初始编码器得到的请求样本信息对应的特征提取向量表征请求样本信息中请求样本词汇与请求样本词汇之间的上下文关系,也就是说,得到的请求样本信息对应的特征提取向量除了具有各个请求样本词汇本身具有的语义外,还具有各请求样本词汇在请求样本信息中的上下文关系。
在得到请求样本信息对应的特征提取向量外,将请求样本信息对应的特征提取向量输入到初始响应信息预测模型的初始话题预测模块中,得到请求样本信息对应的样本响应话题特征向量。其中,样本响应话题特征向量能够表征请求样本信息中话题的转移。
将样本响应话题特征向量和请求样本信息对应的特征提取向量输入到响应信息预测模型的初始解码器中,得到第一个预测响应样本词汇。
在得到第一预测响应样本词汇后,可以将样本响应话题特征向量、第一个真实响应样本词汇对应的特征向量、请求样本信息对应的特征提取向量输入到初始响应信息预测模型中,预测得到第二个预测响应样本词汇。
在得到第二个预测响应样本词汇后,进一步将样本响应话题特征向量、前i个真实响应样本词汇对应的特征向量按照对应响应样本词汇在真实响应样本信息中的上下文关系、请求样本信息对应的特征提取向量输入到初始响应信息预测模型中,预测得到第三个预测响应样本词汇。其中,第三个预测响应样本词汇之后的每个预测响应样本词汇的预测过程与第三个响应样本词汇的预测过程相同,可参考第三个预测响应样本词汇的生成过程。
在对初始响应信息预测模型进行调整时,可以基于以下方式中的一个对初始响应信息预测模型进行调整,也可以使用以下方式中的两个或两个以上进行结合对初始响应信息预测模型进行调整:
方法一:将所述真实响应样本信息中各个真实响应样本词汇对应的特征向量按照对应的真实响应样本词汇在所述真实响应样本信息中的上下文关系输入到所述初始响应信息预测模型的初始编码器中,得到所述真实响应样本信息对应的特征提取向量;
根据所述真实响应样本信息对应的特征提取向量和所述请求样本信息对应的特征提取向量,对所述初始响应信息预测模型进行调整,得到调整后的响应信息预测模型。
在具体实施过程中,将真实响应样本信息中各个真实响应样本词汇对应的特征向量按照对应的真实响应样本词汇在真实响应样本信息中的上下文关系输入到初始响应信息预测模型的初始编码器中进行上下文特征提取,得到真实响应样本信息对应的特征提取向量,根据真实响应样本信息对应的特征提取向量和请求样本信息对应的特征提取向量,以及模型后验值公式,得到模型后验值,根据请求样本信息对应的特征提取向量,以及模型先验值公式,得到模型先验值,分别对模型先验值和模型后验值进行归一化处理,得到归一化后的模型先验值和模型后验值,利用KL散度算法对归一化后的模型先验值和模型后验值进行处理,得到初始响应信息预测模型对应的损失函数值,使得损失函数值最小,对初始响应信息预测模型进行调整,得到调整后的响应信息预测模型。
方法二:在得到所有预测响应样本词汇后,根据每个预测响应样本词汇对应的特征向量和真实响应样本信息中各个真实响应样本词汇对应的特征向量,对初始响应信息预测模型进行调整,得到调整后的响应信息预测模型。在对初始响应信息预测模型进行调整时,可以根据预测响应样本信息中各个预测响应样本词汇对应的特征向量与真实响应样本词汇对应的特征向量,确定预测响应样本信息和真实响应样本信息之间的相似度,使得相似度最大原则调整初始响应信息预测模型,或者,将初始解码器在对样本响应话题特征向量、真实响应样本信息中前i个真实响应样本词汇对应的特征向量、请求样本信息对应的特征提取向量进行处理得到的中间向量输入到分类器,得到每个预测响应样本词汇对应的概率值,使得概率值与真实响应样本词汇的概率值之间的差值最小,调整初始响应信息预测模型,得到调整后的响应信息预测模型。
方法三:在得到样本响应话题特征向量后,可以根据请求样本信息对应的样本响应话题特征向量和真实响应样本信息对应的真实样本响应话题特征向量,对初始响应信息预测模块的初始话题预测模型参数进行调整,得到调整后的话题预测模块。在对话题预测模块进行调整时,可以根据请求样本信息对应的样本响应话题特征向量和真实响应样本信息对应的真实样本响应话题特征向量,计算样本响应话题和真实样本响应话题之间的距离,按照距离最小原则,调整初始响应信息预测模型的初始话题预测模块,最终得到调整后的话题预测模块,或者,将初始响应信息预测模型输出的样本响应话题特征向量输入到分类器中,得到样本预测响应话题的概率,使得样本预测响应话题的概率与真实样本响应话题的概率的差值最小,调整初始响应信息预测模型的初始话题预测模块,最终得到调整后的话题预测模块。
应当注意,在使用上述方式结合调整初始响应信息预测模型时,使得总损失值最小调整初始响应信息预测模型。
在得到响应信息预测模型后,利用得到响应信息预测模型针对用户端的请求信息预测得到响应信息,以下进行详细介绍:
预测模块13在预测得到请求信息对应的响应信息时,将所述响应信息中前j个响应词汇对应的特征向量和各个请求词汇分别对应的特征向量按照上下文关系输入到响应信息预测模型中,得到第j+1个响应词汇,其中,j为大于或等于0的正整数,第j+1个响应词汇为按照上下文关系,在第j个响应词汇之后的一个响应词汇。
在具体实施过程中,在将请求信息中各个请求词汇对应的特征向量按照请求信息中各请求词汇之间的上下文关系输入到响应信息预测模型中时,响应信息预测模型在预测得到响应信息时,首先预测得到响应信息中的第一个响应词汇,在预测第二个响应词汇时,将预测得到的第一个响应词汇和请求信息中各个请求词汇的特征向量输入到响应信息预测模型得到第二响应词汇,在预测第j+1(大于2)个响应词汇时,需要将前j个词汇对应的特征向量和各个请求词汇对应的特征向量按照上下文关系输入到响应信息预测模型中,直到得到所有的响应词汇位置,按照响应词汇的产生时间,将响应词汇顺次连接,得到响应信息。其中,在预测得到响应信息时,响应信息预测模型中预先设置有响应信息的长度,也就是,响应信息中包含的响应词汇的数目,针对用户端的请求信息得到的响应信息的长度不超过响应信息预测模型中预先设置的响应信息的长度。
以下详细介绍各个响应词汇的生成过程:
预测模块13在预测响应信息中的各个响应词汇时,将各个请求词汇对应的特征向量按照上下文关系输入到所述响应信息预测模型的编码器中进行上下文关系特征提取,得到请求信息对应的特征提取向量。
将请求信息对应的特征提取向量输入到所述响应信息预测模型的话题预测模块进行话题特征提取,得到所述请求信息对应的响应话题特征向量。
将所述响应话题特征向量、所述响应信息中前j个响应词汇对应的特征向量、请求信息对应的特征提取向量输入到所述响应信息预测模型的解码器中,得到所述第j+1个响应词汇。
这里,编码器提取得到的请求信息对应的特征提取向量能够表征请求信息中请求词汇与请求词汇之间的上下文关系,也就是说,得到的请求信息的特征向量除了具有各请求词汇本身具有的语义外,还具有各请求词汇在请求信息中的上下文关系;话题特征向量表征请求信息中话题的转移;解码器输出的响应词汇一般为在话题提取模块输出的响应话题特征向量对应的响应话题下的词汇。
在具体实施过程中,在得到各个请求词汇对应的特征向量后,首次将请求词汇的特征向量输入到响应信息预测模型预测第一个响应词汇时,将各个请求词汇对应的特征向量按照请求信息中各请求词汇的上下文关系输入到响应信息预测模型的编码器中对上下文关系特征进行提取,得到请求信息对应的特征提取向量;
将请求信息对应的特征提取向量输入到响应信息预测模型的话题预测模块进行话题特征提取,得到请求信息对应的响应话题特征向量。
将响应话题特征向量、请求信息对应的特征提取向量输入到响应信息预测模型的解码器中,得到第一个响应词汇。在得到第一个响应词汇之前,仅将响应话题特征向量和请求信息对应的特征提取向量输入到响应信息预测模型的解码器,也就是,j为0。
在得到第一个响应词汇后,将响应话题特征向量、响应信息中前一个响应词汇对应的特征向量、请求信息对应的特征提取向量输入到响应信息预测模型的解码器中,得到第二个响应词汇。
在得到第二个响应词汇后,将响应话题特征向量、响应信息中前两个响应词汇对应的特征向量、请求信息对应的特征提取向量输入到响应信息预测模型的解码器中,得到第三个响应词汇。第三个响应词汇之后的其它响应词汇的生成方式与第三个响应词汇的生成方法相似,可参考第三个响应词汇的生成方法。
例如,接收到的用户端的请求信息为“适合出游的景点推荐”,对请求信息进行词汇切割处理,得到切割后的请求词汇为“适合”、“出游”、“的”、“景点”、“推荐”,将“适合”、“出游”、“的”、“景点”、“推荐”分别对应的特征向量输入到响应信息预测模型的编码器,分别得到“适合出游的景点推荐”对应的特征提取向量,将上述特征提取向量输入到响应信息预测模型的话题提取模块,得到请求信息对应的话题特征向量,将请求信息对应对应的话题特征向量和“适合”、“出游”、“的”、“景点”、“推荐”分别对应的特征提取向量按照上下文关系输入到响应信息预测模型的解码器,预测得到第一个响应词汇“我”,在得到第一个响应词汇后,将“我”的特征向量、请求信息对应对应的话题特征向量和“适合出游的景点推荐”对应的特征提取向量输入到响应信息预测模型的解码器,得到第二各响应词汇“推荐”,在得到第二个响应词汇后,将“我”和“推荐”的特征向量、请求信息对应对应的话题特征向量和“适合出游的景点推荐”对应的特征提取向量输入到响应信息预测模型的解码器,得到第二各响应词汇“古镇”,最终得到针对用户端的响应信息。
推送模块14,用于将所述预测模块13输出的响应信息推送给所述用户端。
这里,响应信息为自助服务平台针对用户端的访问信息反馈的响应信息,响应信息可以以短信息、网页推送信息等形式推荐给用户端。
在具体实施过程中,自助服务平台在得到针对用户端的响应信息后,通过短信息或网页推送信息的形式将响应信息推送给用户端。
本申请针对获取的用户端的请求信息,为各个切割后的请求词汇分别生成特征向量,通过将各个请求词汇对应的所述特征向量按照请求信息中各个请求词汇的上下文关系输入到预先设置的响应信息预测模型中,预测得到请求信息对应的响应信息,得到的响应信息能够满足用户端的实际需要,减少了用户端与自助服务平台之间的交互次数,提高了交互效率,减少了对用户端和自助服务平台的网络和处理资源的浪费,提高了自助服务平台的服务质量。
参照图3所示,为本申请实施例提供的一种信息推送方法的示意图,该方法包括以下步骤:
S301,获取用户端的请求信息;
S302,对所述请求信息进行词汇切割,为得到的各个切割后的请求词汇分别生成特征向量;
S303,将各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系,输入到预先设置的响应信息预测模型中,输出所述请求信息对应的响应信息;
S304,将输出的响应信息推送给所述用户端。
可选地,在执行步骤S302时,所述将各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系,输入到预先设置的响应信息预测模型中,输出所述请求信息对应的响应信息,具体包括以下步骤:
将所述响应信息中前j个响应词汇对应的特征向量和各个请求词汇分别对应的特征向量按照上下文关系输入到响应信息预测模型中,得到第j+1个响应词汇,其中,j为大于或等于0的正整数,第j+1个响应词汇为按照上下文关系,在第j个响应词汇之后的一个响应词汇。
可选地,参考图4,所述将所述响应信息中前j个响应词汇对应的特征向量和各个请求词汇分别对应的特征向量按照上下文关系输入到响应信息预测模型中,得到第j+1个响应词汇,包括:
S401,将各个请求词汇对应的特征向量按照上下文关系输入到所述响应信息预测模型的编码器中进行上下文关系特征提取,得到所述请求信息对应的特征提取向量;
S402,将所述请求信息对应的特征提取向量输入到所述响应信息预测模型的话题预测模块进行话题特征提取,得到所述请求信息对应的响应话题特征向量;
S403,将所述响应话题特征向量、所述响应信息中前j个响应词汇对应的特征向量、请求信息对应的特征提取向量输入到所述响应信息预测模型的解码器中,得到所述第j+1个响应词汇。
可选地,参考图5,根据以下步骤对所述响应信息预测模型进行调整:
S501,构建训练样本库,所述训练样本库中包括请求样本信息和真实响应样本信息;
S502,将所述真实响应样本信息中前i个真实响应样本词汇对应的特征向量和所述请求样本信息中各个请求样本词汇分别对应的特征向量按照对应的请求样本词汇在所述请求样本信息中的上下文关系输入初始响应信息预测模型中,得到第i+1个预测响应样本词汇,其中,i为大于或等于0的正整数,第i+1个预测响应样本词汇为按照上下文关系,在第i个预测响应样本词汇之后的一个预测响应样本词汇;
S503,根据得到的所有预测响应样本词汇和所述真实响应样本信息,对所述初始响应信息预测模型进行调整,得到调整后的响应信息预测模型。
可选地,所述将所述真实响应样本信息中前i个真实响应样本词汇对应的特征向量和所述请求样本信息中各个请求样本词汇分别对应的特征向量按照对应的请求样本词汇在所述请求样本信息中的上下文关系输入初始响应信息预测模型中,得到第i+1个预测响应样本词汇,包括:
将所述请求样本信息中各个请求样本词汇分别对应的特征向量按照上下文关系输入到所述初始响应信息预测模型的初始编码器中,得到所述请求样本信息对应的特征提取向量;
将所述请求样本信息对应的特征提取向量输入到所述初始响应信息预测模型的初始话题预测模块中,得到所述请求样本信息对应的样本响应话题特征向量;
将所述样本响应话题特征向量、所述真实响应样本信息中前i个真实响应样本词汇对应的特征向量、请求样本信息对应的特征提取向量输入到所述响应信息预测模型的初始解码器中,得到所述第i+1个预测响应样本词汇。
可选地,所述方法还包括:
根据所述请求样本信息对应的样本响应话题特征向量和所述真实响应样本信息对应的真实样本响应话题特征向量,对所述初始响应信息预测模型的初始话题预测模块参数进行调整,得到调整后的话题预测模块。
可选地,所述方法还包括:
将所述真实响应样本信息中各个真实响应样本词汇对应的特征向量按照对应的真实响应样本词汇在所述真实响应样本信息中的上下文关系输入到所述初始响应信息预测模型的初始编码器中,得到所述真实响应样本信息对应的特征提取向量;
根据所述真实响应样本信息对应的特征提取向量和所述请求样本信息对应的特征提取向量,对所述初始响应信息预测模型进行调整,得到调整后的响应信息预测模型。
可选地,在所述对所述请求信息进行词汇切割之前,还包括:
去除所述请求信息中的干扰信息。
可选地,所述请求样本词汇为对请求样本信息进行词汇切割处理得到的,所述真实响应样本词汇为对真实响应样本信息进行词汇切割处理得到的。
关于方法中的处理流程、以及交互流程的描述可以参照上述装置实施例中的相关说明,这里不再详述。
本申请实施例还提供了一种计算机设备60,如图6所示,为本申请实施例提供的计算机设备60结构示意图,包括:处理器61、存储器62、和总线63。所述存储器62存储有所述处理器61可执行的机器可读指令(比如,图1中的装置中获取模块11、生成模块12、预测模块13和推送模块14对应的执行指令等),当计算机设备60运行时,所述处理器61与所述存储器62之间通过总线63通信,所述机器可读指令被所述处理器61执行时执行如下处理:
获取用户端的请求信息;
对所述请求信息进行词汇切割,为得到的各个切割后的请求词汇分别生成特征向量;
将各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系,输入到预先设置的响应信息预测模型中,输出所述请求信息对应的响应信息;
将输出的响应信息推送给所述用户端。
一种可能的实施方式中,处理器61执行的指令中,所述将各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系,输入到预先设置的响应信息预测模型中,输出所述请求信息对应的响应信息,包括:
将所述响应信息中前j个响应词汇对应的特征向量和各个请求词汇分别对应的特征向量按照上下文关系输入到响应信息预测模型中,得到第j+1个响应词汇,其中,j为大于或等于0的正整数,第j+1个响应词汇为按照上下文关系,在第j个响应词汇之后的一个响应词汇。
一种可能的实施方式中,处理器61执行的指令中,所述将所述响应信息中前j个响应词汇对应的特征向量和各个请求词汇分别对应的特征向量按照上下文关系输入到响应信息预测模型中,得到第j+1个响应词汇,包括:
将各个请求词汇对应的特征向量按照上下文关系输入到所述响应信息预测模型的编码器中进行上下文关系特征提取,得到所述请求信息对应的特征提取向量;
将所述请求信息对应的特征提取向量输入到所述响应信息预测模型的话题预测模块进行话题特征提取,得到所述请求信息对应的响应话题特征向量;
将所述响应话题特征向量、所述响应信息中前j个响应词汇对应的特征向量、请求信息对应的特征提取向量输入到所述响应信息预测模型的解码器中,得到所述第j+1个响应词汇。
一种可能的实施方式中,处理器61执行的指令中,根据以下步骤对所述响应信息预测模型进行调整:
构建训练样本库,所述训练样本库中包括请求样本信息和真实响应样本信息;
将所述真实响应样本信息中前i个真实响应样本词汇对应的特征向量和所述请求样本信息中各个请求样本词汇分别对应的特征向量按照对应的请求样本词汇在所述请求样本信息中的上下文关系输入初始响应信息预测模型中,得到第i+1个预测响应样本词汇,其中,i为大于或等于0的正整数,第i+1个预测响应样本词汇为按照上下文关系,在第i个预测响应样本词汇之后的一个预测响应样本词汇;
根据得到的所有预测响应样本词汇和所述真实响应样本信息,对所述初始响应信息预测模型进行调整,得到调整后的响应信息预测模型。
一种可能的实施方式中,处理器61执行的指令中,所述将所述真实响应样本信息中前i个真实响应样本词汇对应的特征向量和所述请求样本信息中各个请求样本词汇分别对应的特征向量按照对应的请求样本词汇在所述请求样本信息中的上下文关系输入初始响应信息预测模型中,得到第i+1个预测响应样本词汇,包括:
将所述请求样本信息中各个请求样本词汇分别对应的特征向量按照上下文关系输入到所述初始响应信息预测模型的初始编码器中,得到所述请求样本信息对应的特征提取向量;
将所述请求样本信息对应的特征提取向量输入到所述初始响应信息预测模型的初始话题预测模块中,得到所述请求样本信息对应的样本响应话题特征向量;
将所述样本响应话题特征向量、所述真实响应样本信息中前i个真实响应样本词汇对应的特征向量、请求样本信息对应的特征提取向量输入到所述响应信息预测模型的初始解码器中,得到所述第i+1个预测响应样本词汇。
一种可能的实施方式中,处理器61执行的指令中,还包括:
根据所述请求样本信息对应的样本响应话题特征向量和所述真实响应样本信息对应的真实样本响应话题特征向量,对所述初始响应信息预测模型的初始话题预测模块参数进行调整,得到调整后的话题预测模块。
一种可能的实施方式中,处理器61执行的指令中,还包括:
将所述真实响应样本信息中各个真实响应样本词汇对应的特征向量按照对应的真实响应样本词汇在所述真实响应样本信息中的上下文关系输入到所述初始响应信息预测模型的初始编码器中,得到所述真实响应样本信息对应的特征提取向量;
根据所述真实响应样本信息对应的特征提取向量和所述请求样本信息对应的特征提取向量,对所述初始响应信息预测模型进行调整,得到调整后的响应信息预测模型。
一种可能的实施方式中,处理器61执行的指令中,在所述对所述请求信息进行词汇切割之前,还包括:
去除所述请求信息中的干扰信息。
可选地,所述请求样本词汇为对请求样本信息进行词汇切割处理得到的,所述真实响应样本词汇为对真实响应样本信息进行词汇切割处理得到的。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述响应用户端请求的处理方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述响应用户端请求的处理方法,从而提高用户端与自助服务平台之间的交互效率,为各个切割后的请求词汇分别生成特征向量,通过将各个请求词汇对应的所述特征向量按照请求信息中各个请求词汇的上下文关系输入到预先设置的响应信息预测模型中,预测得到请求信息对应的响应信息,得到的响应信息能够满足用户端的实际需要,减少了用户端与自助服务平台之间的交互次数,提高了交互效率,减少了对用户端和自助服务平台的网络和处理资源的浪费,提高了自助服务平台的服务质量。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (12)
1.一种信息推送装置,其特征在于,该装置包括:
获取模块,用于获取用户端的请求信息;
生成模块,用于对所述获取模块获取的所述请求信息进行词汇切割,为得到的各个切割后的请求词汇分别生成特征向量;
预测模块,用于将所述生成模块生成的各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系,输入到预先设置的响应信息预测模型中,输出所述请求信息对应的响应信息中的第一个响应词汇,将所述第一个响应词汇和所述请求信息中的各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系输入到所述响应信息预测模型中,得到第二个响应词汇,将所述第二个响应词汇和所述请求信息中的各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系输入到所述响应信息预测模型中,得到第j个响应词汇,将所述第j个响应词汇和所述请求信息中的各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系输入到所述响应信息预测模型中,得到第j+1个响应词汇,直至得到所有响应词汇为止,按照各所述响应词汇的产生时间,将各所述响应词汇顺次连接,得到所述请求信息对应的响应信息,其中,j为大于2的正整数;
推送模块,用于将所述预测模块输出的响应信息推送给所述用户端。
2.如权利要求1所述的信息推送装置,其特征在于,所述上下文关系表征各所述请求词汇在所述请求信息中的位置关系。
3.如权利要求2所述的信息推送装置,其特征在于,所述预测模块具体用于:
将各个请求词汇对应的特征向量按照上下文关系输入到所述响应信息预测模型的编码器中进行上下文关系特征提取,得到所述请求信息对应的特征提取向量;
将所述请求信息对应的特征提取向量输入到所述响应信息预测模型的话题预测模块进行话题特征提取,得到所述请求信息对应的响应话题特征向量;
将所述响应话题特征向量、所述响应信息中前j个响应词汇对应的特征向量、请求信息对应的特征提取向量输入到所述响应信息预测模型的解码器中,得到所述第j+1个响应词汇。
4.如权利要求1所述的信息推送装置,其特征在于,该装置还包括:训练模块,所述训练模块用于:
构建训练样本库,所述训练样本库中包括请求样本信息和真实响应样本信息;
将所述真实响应样本信息中前i个真实响应样本词汇对应的特征向量和所述请求样本信息中各个请求样本词汇分别对应的特征向量按照对应的请求样本词汇在所述请求样本信息中的上下文关系输入初始响应信息预测模型中,得到第i+1个预测响应样本词汇,其中,i为大于或等于0的正整数,第i+1个预测响应样本词汇为按照上下文关系,在第i个预测响应样本词汇之后的一个预测响应样本词汇;
根据得到的所有预测响应样本词汇和所述真实响应样本信息,对所述初始响应信息预测模型进行调整,得到调整后的响应信息预测模型。
5.如权利要求4所述的信息推送装置,其特征在于,所述训练模块具体用于:
将所述请求样本信息中各个请求样本词汇分别对应的特征向量按照上下文关系输入到所述初始响应信息预测模型的初始编码器中,得到所述请求样本信息对应的特征提取向量;
将所述请求样本信息对应的特征提取向量输入到所述初始响应信息预测模型的初始话题预测模块中,得到所述请求样本信息对应的样本响应话题特征向量;
将所述样本响应话题特征向量、所述真实响应样本信息中前i个真实响应样本词汇对应的特征向量、请求样本信息对应的特征提取向量输入到所述响应信息预测模型的初始解码器中,得到所述第i+1个预测响应样本词汇。
6.如权利要求5所述的信息推送装置,其特征在于,所述训练模块还用于:
根据所述请求样本信息对应的样本响应话题特征向量和所述真实响应样本信息对应的真实样本响应话题特征向量,对所述初始响应信息预测模型的初始话题预测模块参数进行调整,得到调整后的话题预测模块。
7.如权利要求5所述的信息推送装置,其特征在于,所述训练模块还用于:
将所述真实响应样本信息中各个真实响应样本词汇对应的特征向量,按照对应的真实响应样本词汇在所述真实响应样本信息中的上下文关系,输入到所述初始响应信息预测模型的初始编码器中,得到所述真实响应样本信息对应的特征提取向量;
根据所述真实响应样本信息对应的特征提取向量和所述请求样本信息对应的特征提取向量,对所述初始响应信息预测模型进行调整,得到调整后的响应信息预测模型。
8.如权利要求1所述的信息推送装置,其特征在于,所述生成模块还用于:
去除所述请求信息中的干扰信息。
9.如权利要求5所述的信息推送装置,其特征在于,所述请求样本词汇为对请求样本信息进行词汇切割处理得到的,所述真实响应样本词汇为对真实响应样本信息进行词汇切割处理得到的。
10.一种信息推送方法,其特征在于,该方法包括:
获取用户端的请求信息;
对所述请求信息进行词汇切割,为得到的各个切割后的请求词汇分别生成特征向量;
将各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系,输入到预先设置的响应信息预测模型中,输出所述请求信息对应的响应信息中的第一个响应词汇,将所述第一个响应词汇和所述请求信息中的各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系输入到所述响应信息预测模型中,得到第二个响应词汇,将所述第二个响应词汇和所述请求信息中的各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系输入到所述响应信息预测模型中,得到第j个响应词汇,将所述第j个响应词汇和所述请求信息中的各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系输入到所述响应信息预测模型中,得到第j+1个响应词汇,直至得到所有响应词汇为止,按照各所述响应词汇的产生时间,将各所述响应词汇顺次连接,得到所述请求信息对应的响应信息,其中,j为大于2的正整数;
将输出的响应信息推送给所述用户端。
11.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求10所述的方法的步骤。
12.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求10所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910319748.0A CN111859096B (zh) | 2019-04-19 | 2019-04-19 | 信息推送装置、方法、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910319748.0A CN111859096B (zh) | 2019-04-19 | 2019-04-19 | 信息推送装置、方法、电子设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111859096A CN111859096A (zh) | 2020-10-30 |
CN111859096B true CN111859096B (zh) | 2024-04-19 |
Family
ID=72951944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910319748.0A Active CN111859096B (zh) | 2019-04-19 | 2019-04-19 | 信息推送装置、方法、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111859096B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017041372A1 (zh) * | 2015-09-07 | 2017-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和*** |
CN108388674A (zh) * | 2018-03-26 | 2018-08-10 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
WO2018196684A1 (zh) * | 2017-04-24 | 2018-11-01 | 北京京东尚科信息技术有限公司 | 对话机器人生成方法及装置 |
CN109360028A (zh) * | 2018-10-30 | 2019-02-19 | 北京字节跳动网络技术有限公司 | 用于推送信息的方法和装置 |
-
2019
- 2019-04-19 CN CN201910319748.0A patent/CN111859096B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017041372A1 (zh) * | 2015-09-07 | 2017-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和*** |
WO2018196684A1 (zh) * | 2017-04-24 | 2018-11-01 | 北京京东尚科信息技术有限公司 | 对话机器人生成方法及装置 |
CN108388674A (zh) * | 2018-03-26 | 2018-08-10 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN109360028A (zh) * | 2018-10-30 | 2019-02-19 | 北京字节跳动网络技术有限公司 | 用于推送信息的方法和装置 |
Non-Patent Citations (2)
Title |
---|
基于word2vec和TF-IDF算法实现酒店评论的个性化推送;张雷;;电脑与信息技术(06);全文 * |
基于移动互联的信息化智能处理平台设计;毛正标;彭勇;;现代电子技术(20);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111859096A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190341036A1 (en) | Modeling multiparty conversation dynamics: speaker, response, addressee selection using a novel deep learning approach | |
CN111241237B (zh) | 一种基于运维业务的智能问答数据处理方法及装置 | |
CN107241260B (zh) | 基于人工智能的新闻推送的方法和装置 | |
CN113360622B (zh) | 用户对话信息的处理方法、装置及计算机设备 | |
US20130159219A1 (en) | Predicting the Likelihood of Digital Communication Responses | |
CN115309877B (zh) | 对话生成方法、对话模型训练方法及装置 | |
CN114787814A (zh) | 指代解析 | |
EP4113357A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
CN113407850B (zh) | 一种虚拟形象的确定和获取方法、装置以及电子设备 | |
CN110738056B (zh) | 用于生成信息的方法和装置 | |
CN115272540A (zh) | 基于虚拟客服形象的处理方法和装置、设备、介质 | |
CN112686035A (zh) | 一种未登录词进行向量化的方法和装置 | |
CN112989046B (zh) | 实时话术预判方法、装置、计算机设备和存储介质 | |
CN116580704A (zh) | 语音识别模型的训练方法、语音识别方法、设备及介质 | |
CN116644765A (zh) | 语音翻译方法、语音翻译装置、电子设备及存储介质 | |
CN111859096B (zh) | 信息推送装置、方法、电子设备及计算机可读存储介质 | |
CN115936016A (zh) | 基于对话的情绪主题识别方法、装置、设备以及介质 | |
CN113342932B (zh) | 目标词向量的确定方法、装置、存储介质和电子装置 | |
CN113505293B (zh) | 信息推送方法、装置、电子设备及存储介质 | |
CN115238676A (zh) | 招标需求热点识别方法、装置、存储介质及电子设备 | |
CN114817734A (zh) | 推荐模型的训练方法、推荐方法和装置、电子设备及介质 | |
CN114490967A (zh) | 对话模型的训练方法、对话机器人的对话方法、装置和电子设备 | |
CN110535749B (zh) | 对话推送方法、装置、电子设备及存储介质 | |
CN114118937A (zh) | 基于任务的信息推荐方法、装置、电子设备及存储介质 | |
CN112632241A (zh) | 智能会话的方法、装置、设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |