CN111581623B - 智能数据交互方法、装置、电子设备及存储介质 - Google Patents
智能数据交互方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111581623B CN111581623B CN202010389172.8A CN202010389172A CN111581623B CN 111581623 B CN111581623 B CN 111581623B CN 202010389172 A CN202010389172 A CN 202010389172A CN 111581623 B CN111581623 B CN 111581623B
- Authority
- CN
- China
- Prior art keywords
- data
- preset
- vector
- client
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000003993 interaction Effects 0.000 title claims abstract description 42
- 230000008569 process Effects 0.000 claims abstract description 17
- 239000013598 vector Substances 0.000 claims description 150
- 238000012549 training Methods 0.000 claims description 34
- 238000012795 verification Methods 0.000 claims description 20
- 238000004378 air conditioning Methods 0.000 claims description 18
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 13
- 230000005540 biological transmission Effects 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 7
- 238000012790 confirmation Methods 0.000 claims description 6
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000013527 convolutional neural network Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 239000003814 drug Substances 0.000 description 6
- 208000019622 heart disease Diseases 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Evolutionary Computation (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明涉及人工智能,提供了一种智能数据交互方法,应用于电子设备,该方法包括预先创建能够短时存储数据的数据池,获取待识别用户的人脸图像,识别出该人脸图像的待确认身份信息与数据库的预设身份信息进行对比,若数据库中存在与待确认身份信息匹配一致的预设身份信息,则在客户端上展示信息录入界面,并建立客户端与数据池之间的数据传输通道,获取信息录入界面上相应栏位上的操作数据并存储至数据池,提取单个栏位对应的标题词语与预设词语构建查询语句,实时接收待识别用户发起的查询请求,根据查询语句从数据池中查询对应的操作数据反馈至客户端。本发明能够为用户在填写信息的过程中提供被遗忘的信息,提升用户体验感。
Description
技术领域
本发明涉及人工智能,尤其涉及一种智能数据交互方法、装置、电子设备及存储介质。
背景技术
在一些需要用户填写很多信息,例如个人账号、密码等繁杂的信息的等自助平台应用场景中,通常用户的下一步操作依赖于上一步操作,由于在人的记忆力有限的情况下,容易出现记忆遗忘,可能上一步填写的信息到了下一步要用到的时候就已经忘了,给用户带来不好的体验感。因此,如何为用户在填写信息的过程中提供被遗忘的信息,提升用户体验感成为了亟需解决的技术问题。
发明内容
本发明的主要目的在于提供一种智能数据交互方法、装置、电子设备及存储介质,旨在如何为用户在填写信息的过程中提供被遗忘的信息,提升用户体验感的问题。
为实现上述目的,本发明提供的一种智能数据交互方法,应用于电子设备,该方法包括:
创建步骤:在数据库中预先创建预设数量的能够短时存储数据的数据池;
识别步骤:通过客户端获取待识别用户的人脸图像,将所述人脸图像输入预先训练的身份识别模型识别出该人脸图像的待确认身份信息;
确认步骤:将所述待确认身份信息与所述数据库的预设身份信息进行对比,若所述数据库中存在与所述待确认身份信息匹配一致的预设身份信息,则在所述客户端上展示信息录入界面,并建立所述客户端与所述数据池之间的数据传输通道;
录入步骤:获取所述信息录入界面上相应栏位上录入的操作数据并存储至所述数据池,提取单个所述栏位对应的标题词语与预设词语构建查询语句,其中,每个所述查询语句对应一条操作数据;及
反馈步骤:通过所述客户端实时接收待识别用户发起的包含查询语句的查询请求,根据所述查询语句从所述数据池中查询对应的操作数据反馈至所述客户端。
优选地,该方法还包括以下步骤:
当所述客户端识别到所述待确认身份信息发生更改时,关闭所述客户端的当前信息录入界面。
优选地,该方法还包括以下步骤:
当所述客户端识别到所述待确认身份信息发生更改时,清除所述数据池中的操作数据。
优选地,所述身份识别模型的训练过程包括:
获取人脸图像样本,为每张所述人脸图像样本分配唯一的待确认身份信息;
将所述人脸图像样本按照预设比例分成训练集和验证集,所述训练集中的人脸图像样本数量大于所述验证集中的人脸图像样本数量;
将所述训练集中的人脸图像样本输入所述身份识别模型进行训练,每隔预设周期使用所述验证集对所述身份识别模型进行验证,利用所述验证集中各张人脸图像样本和对应的待确认身份信息对该身份识别模型的准确率进行验证;及
当验证的准确率大于预设阈值时,结束训练,得到训练完成的所述身份识别模型。
优选地,该方法还包括以下步骤:
通过所述客户端获取待确认用户的第一语音数据,利用预设的语音转化算法将所述第一语音数据进行转化得到文本数据;
将所述得到的文本数据输入预先训练的向量提取模型,输出与所述文本数据对应的文本句向量,将所述文本句向量输入预先训练的意图识别模型,输出与所述文本句向量对应意图类型;
根据所述意图类型,从预先创建在所述数据库中由意图类型与预设答疑***之间的映射关系表中找到对应的预设答疑***作为目标答疑***,将该意图类型对应的文本数据发放至所述目标答疑***;及
利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑***中各个预设答复进行相似度值计算,找出所述相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至所述客户端。
优选地,所述向量提取模型包括:
向量转化层,配置为基于输入的当前句向量序列,添加特殊符的表示向量,并根据表示向量和当前句向量序列包含的各个句向量的位置信息,对表示向量和当前句向量序列包含的各个句向量进行转化,形成向量序列;
Transformer编码器层,配置为对所述向量序列进行编码处理,得到特殊符编码向量,以及得到当前句向量序列包含的各个句向量分别对应的句编码向量;及
基于Transformer编码器的监督注意力层,至少配置为将所述特殊符编码向量的查询向量与所述特殊符编码向量的键向量之间的点积,确定为所述特殊符编码向量的监督注意力,针对每个句编码向量,将该句编码向量的键向量与所述特殊符编码向量的查询向量之间的点积,确定为该句编码向量的监督注意力,根据所述特殊符编码向量、各个句编码向量及其监督注意力,得到所述文本句向量。
为实现上述目的,本发明还进一步提供一种智能数据交互装置,所述智能数据交互装置包括:
创建模块:在数据库中预先创建预设数量的能够短时存储数据的数据池;
识别模块:通过客户端获取待识别用户的人脸图像,将所述人脸图像输入预先训练的身份识别模型识别出该人脸图像的待确认身份信息;
确认模块:将所述待确认身份信息与所述数据库的预设身份信息进行对比,若所述数据库中存在与所述待确认身份信息匹配一致的预设身份信息,则在所述客户端上展示信息录入界面,并建立所述客户端与所述数据池之间的数据传输通道;
录入模块:获取所述信息录入界面上相应栏位上录入的操作数据并存储至所述数据池,提取单个所述栏位对应的标题词语与预设词语构建查询语句,其中,每个所述查询语句对应一条操作数据;及
反馈模块:通过所述客户端实时接收待识别用户发起的包含查询语句的查询请求,根据所述查询语句从所述数据池中查询对应的操作数据反馈至所述客户端。
优选地,该装置还包括以下模块:
当所述客户端识别到所述待确认身份信息发生更改时,关闭所述客户端的当前信息录入界面。
为实现上述目的,本发明还进一步提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现上述所述的智能数据交互方法。
为实现上述目的,本发明进一步提供一种计算机可读存储介质,所述计算机可读存储介质上存储有智能数据交互程序,所述智能数据交互程序可被一个或者多个处理器执行,以实现如上所述的智能数据交互方法的步骤。
本发明提出的智能数据交互方法、装置、电子设备及存储介质,通过在数据库中预先创建预设数量的能够短时存储数据的数据池,通过客户端获取待识别用户的人脸图像,将所述人脸图像输入预先训练的身份识别模型识别出该人脸图像的待确认身份信息,将所述待确认身份信息与所述数据库的预设身份信息进行对比,若所述数据库中存在与所述待确认身份信息匹配一致的预设身份信息,则在所述客户端上展示信息录入界面,并建立所述客户端与所述数据池之间的数据传输通道,获取所述信息录入界面上相应栏位上录入的操作数据并存储至所述数据池,提取单个所述栏位对应的标题词语与预设词语构建查询语句,其中,每个所述查询语句对应一条操作数据,通过所述客户端实时接收待识别用户发起的包含查询语句的查询请求,根据所述查询语句从所述数据池中查询对应的操作数据反馈至所述客户端。本发明能够为用户在填写信息的过程中提供被遗忘的信息,提升用户体验感。
附图说明
图1为本发明一实施例提供的实现智能数据交互方法的电子设备的内部结构示意图;
图2为本发明一实施例提供的智能数据交互装置的模块示意图;
图3为本发明一实施例提供的智能数据交互方法的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参附图做进一步说明。
具体实施方式
为了使本发明的目的、技术本实施例及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术本实施例可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术本实施例的结合出现相互矛盾或无法实现时应当认为这种技术本实施例的结合不存在,也不在本发明要求的保护范围之内。
本发明提供一种智能数据交互方法。参照图1所示,为本发明一实施例提供的智能数据交互方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,智能数据交互方法包括:
S110,在数据库中预先创建预设数量的能够短时存储数据的数据池。
本方案可用于下一步操作依赖于上一步操作这种前后操作之间具有关联,且操作用户不需要将操作过程产生的数据进行长时间保存的应用场景,例如在自助平台上填写个人信息、用户注册、办理业务等应用场景。由于在上述应用场景中往往需要用户填写很多信息,例如个人账号、密码等繁杂的信息。在人的记忆力有限的情况下,容易出现记忆遗忘,可能上一步填写的信息到了下一步要用到的时候就已经忘了,给用户带来不好的体验感。因此,在本实施例中,通过在数据库中预先创建预设数量(具体数量可根据实际情况而定)的能够短时存储数据的数据池,利用能够短时存储数据的数据池可以存储不需要永久性保存的数据,且在一定时间后就会自动删除,减少***的资源占用,适用于上述需要频繁更换用户的应用场景。
S120,通过客户端获取待识别用户的人脸图像,将所述人脸图像输入预先训练的身份识别模型识别出该人脸图像的待确认身份信息。
在本实施例中,通过客户端(例如摄像头)获取待识别用户的人脸图像,将人脸图像输入预先训练的身份识别模型识别出该人脸图像的待确认身份信息,例如用户A,为后续判断用户是否有进入操作***的权限做准备。
区域识别模型可以通过卷积神经网络模型(Convolutional Neural Network,CNN)训练得到,具体训练过程如下:
获取预设数量(例如10万)的待处理图像样本,在每张所述待处理图像样本中标注出所述目标区域及非目标区域;
将所述待处理图像样本按照预设比例(例如5:1)分成训练集和验证集,所述训练集中的图像样本数量大于所述验证集中的图像样本数量;
将所述训练集中的图像样本输入所述目标识别模型进行训练,每隔预设周期(例如每进行1000次迭代)使用所述验证集对所述目标识别模型进行验证,利用所述验证集中各张待处理图像样本和对应的目标区域及非目标区域对该目标识别模型的准确率进行验证;及
当验证的准确率大于预设阈值(例如85%)时,结束训练,得到训练完成的所述区域识别模型。
S130,将所述待确认身份信息与所述数据库的预设身份信息进行对比,若所述数据库中存在与所述待确认身份信息匹配一致的预设身份信息,则在所述客户端上展示信息录入界面,并建立所述客户端与所述数据池之间的数据传输通道。
在本实施例中,通过将待确认身份信息与数据库的预设身份信息进行对比,当判断数据库中存在与待确认身份信息匹配一致的预设身份信息时,则说明该用户具有进入操作***的权限,便在客户端(例如显示屏)上弹出信息录入界面,并建立客户端与数据池之间的数据传输通道,将用户在操作过程中生成的操作数据存储至数据池实现代替用户短时记忆信息。
S140,获取所述信息录入界面上相应栏位上录入的操作数据并存储至所述数据池,提取单个所述栏位对应的标题词语与预设词语构建查询语句,其中,每个所述查询语句对应一条操作数据。
在本实施例中,获取信息录入界面上相应栏位(例如账号输入栏、密码输入栏)上录入的操作数据并存储至数据池,提取单个栏位对应的标题词语(例如“账号”、“密码”)与预设词语(例如“刚才”、“输入”、“是什么?”)构建查询语句(例如“刚才账号输入的是什么?”),并将每个查询语句对应一条操作数据。
S150,通过所述客户端实时接收待识别用户发起的包含查询语句的查询请求,根据所述查询语句从所述数据池中查询对应的操作数据反馈至所述客户端。
在本实施例中,当用户在操作过程中遗忘了之前的信息时,可以通过客户端(例如话筒)向电子设备1发起的包含查询语句(例如“刚才账号输入的是什么?”)的查询请求,根据查询语句从数据池中查询对应的操作数据反馈至客户端。
在另一实施例中,该智能数据交互方法还包括以下步骤:
为了避免用户在操作过程中信息被周围人篡改或者泄露,在本实施例中,当客户端(例如摄像头)识别到当前待确认身份信息发生更改时,例如有其他人对着信息录入界面时,关闭客户端的当前信息录入界面,避免信息被篡改或泄露。
在另一实施例中,该智能数据交互方法还包括以下步骤:
为了进一步提升信息安全性,在本实施例中,当客户端(例如摄像头)识别到当前待确认身份信息发生更改时,清除数据池中的操作数据,避免***被强行侵入,导致信息被篡改或泄露。
在另一实施例中,由于目前大多数智能答疑终端能做到的只是当与用户进行对话时,答疑***将根据用户的提问与预先设置在数据库中的答案进行匹配,得到相似度高的答案反馈给用户,但是,随着业务量增大,该方式会降低数据库的查询效率,增加对话***的反馈延迟,影响用户体验。因此,为了提高数据库的查询效率,减少对话***的反馈延迟,因此,智能数据交互方法还包括以下步骤:
通过所述客户端获取待确认用户的第一语音数据,利用预设的语音转化算法将所述第一语音数据进行转化得到文本数据;
将所述得到的文本数据输入预先训练的向量提取模型,输出与所述文本数据对应的文本句向量,将所述文本句向量输入预先训练的意图识别模型,输出与所述文本句向量对应意图类型;
根据所述意图类型,从预先创建在所述数据库中由意图类型与预设答疑***之间的映射关系表中找到对应的预设答疑***作为目标答疑***,将该意图类型对应的文本数据发放至所述目标答疑***;及
利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑***中各个预设答复进行相似度值计算,找出所述相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至所述客户端。
在本实施例中,电子设备1通过获取客户端上传的第一语音数据后,利用预设的语音转化算法将第一语音数据进行转化得到文本数据。
其中,将第一语音数据转换成文本数据可通过动态时间归整模型(Dynamic TimeWarping, DTW)中实现。在其他实施例中,还可以是利用其他的语音识别模型得到文本数据,例如:BLSTM模型或LSTM模型。而DTW模型在对第一语音数据实施转换之前,通常都需要大量的训练样本进行训练,因此,在本实施例中,可预先对该DTW模型进行训练,具体的训练过程包括:预先采集预设数量的第一语音数据样本以及每个第一语音数据样本对应的文本数据样本,然后针对每个第一语音数据样本,将该第一语音数据样本输入到该预设的DTW模型中得到该第一语音数据样本对应的文本数据,在得到该第一语音数据样本对应的文本数据后,可将该文本数据与该第一语音数据对应的文本数据样本进行比对,并根据比对的结果对该DTW模型进行调整。经大量语音样本信息训练后的DTW模型可准确地将第一语音数据转换为对应的文本数据。
得到文本数据后,将第一语音数据转化得到的文本数据输入预先训练的向量提取模型,输出与文本数据对应的文本句向量,将文本句向量输入预先训练的意图识别模型,输出与文本句向量对应意图类型。
其中,所述向量提取模型由BERT(Bidirectional Encoder Representation fromTransformers)模型训练得到,所述向量提取模型包括:
向量转化层,配置为基于输入的当前句向量序列,添加特殊符的表示向量,并根据表示向量和当前句向量序列包含的各个句向量的位置信息,对表示向量和当前句向量序列包含的各个句向量进行转化,形成向量序列;
Transformer编码器层,配置为对所述向量序列进行编码处理,得到特殊符编码向量,以及得到当前句向量序列包含的各个句向量分别对应的句编码向量;及
基于Transformer编码器的监督注意力层,至少配置为将所述特殊符编码向量的查询向量与所述特殊符编码向量的键向量之间的点积,确定为所述特殊符编码向量的监督注意力,针对每个句编码向量,将该句编码向量的键向量与所述特殊符编码向量的查询向量之间的点积,确定为该句编码向量的监督注意力,根据所述特殊符编码向量、各个句编码向量及其监督注意力,得到所述文本句向量。
所述意图识别模型由CNN(Convolutional Neural Network, 卷积神经网络)模型训练得到,所述意图识别模型包括至少一个卷积层、至少一个池化层和至少一个全连接层。
通过上述BERT模型+CNN模型能够快速识别出文本数据代表的意图类型。
在识别出文本数据代表的意图类型后,即能够初步判断用户的意图,通过预先创建在数据库中由意图类型与预设答疑***(例如闲聊***、智能答疑***、业务办理***等)之间的映射关系表中找到与意图类型对应的预设答疑***作为目标答疑***,并将该意图类型对应的文本数据发放至该目标答疑***进行下一步地解疑答惑。例如用户只是想简单了解常规问题“张某某是谁?”(意图类型为闲聊),对应的关键词为“张某某”,则将该用户对应的客户端发出的文本数据发放给闲聊***,并反馈答复“张某某是xxxx”给客户端;或者专业性较高的专业问题“治疗心脏病的药物有什么?”(意图类型为专业咨询),对应的关键词为“心脏病、药物”,则将该用户对应的客户端发出的文本数据发放给智能答疑***,并反馈答复“治疗心脏病的药物有xxxx”给客户端;或者是想办理业务“设置上午8点开会的闹钟”(意图类型为业务办理),对应的关键词为“上午8点、开会”,则将该用户对应的客户端发出的文本数据发放给业务办理***,并反馈答复“已设置今天上午8点开会的闹钟”给客户端。由于每一个目标答疑***对应一种意图类型,对于用户提出的问题能够提供具有针对性的答复,因此能够提高答疑准确性,提高数据库的查询效率,减少对话***的反馈延迟,提高用户体验感。
通过利用预先确定的相似度计算规则分别计算文本数据与预先存储在目标答疑***中各个预设答复进行相似度值计算,找出相似度值最大者对应的预设答复作为目标答复转化成第二语音数据反馈至客户端。
具体地,首先利用预先确定的计分算法计算出所述文本数据中每个第一词语的得分,将所有所述第一词语按照得分大小进行排序,根据排序结果从大到小从所述文本数据中依次选取预设数量的第一词语作为第一关键词;
利用预先确定的计分算法计算出所述预设答复中每个第二词语的得分,将所有所述第二词语按照得分大小进行排序,根据排序结果从大到小从所述文本数据中依次选取预设数量的第二词语作为第二关键词;
其中,所述计分算法为:
、/>和/>表示从所述文本数据或预设答复中提取的词语节点,S(/>)、S(/>)分别表示词语节点/>、/>的得分,/>表示/>和/>两个词语节点之间边的权重,/>表示/>和/>两个词语节点之间边的权重,In(/>)表示指向词语节点/>的节点集合 , Out(/>)表示词语节点/>指向的节点集合,d表示阻尼系数。
具体地,将文本数据中的每个词语作为上述公式中的节点,对文本数据中的每个句子进行分词和词性标注处理,只保留指定词性的词语(例如:名词、动词、形容词)。构建候选关键词图G = (V,E),其中V由保留的指定词性的词语组成,然后采用共现关系(Co-Occurrence)构造任意两个词语之间的边,两个词语之间存在边,仅当这两个的词语在长度为K的窗口中共现,K表示窗口大小。根据上述公式,将节点之间边的权重的初值设为“1”,迭代传播权重计算各指定性词语的得分,将计算出的指定性词语的得分从大到小排序,可选取得分排前十的词语作为关键词。还可以利用投票的原理,将边作为词语之间的互相投票,经过不断迭代,每个词语的得票数会趋于稳定,然后对词语的得票数由大到小排序,可选取得票数排前六的词语作为关键词,将得到的关键词在原始文本数据中进行标记,若形成相邻词组则组合成多词关键词。
再利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑***中各个预设答复进行相似度值计算。
其中,所述相似度值计算规则采用杰卡德相似系数算法:
其中,表示每个文本数据中所有第一关键词语构成的第一词集,/>表示每个预设答复中所有第二关键词语构成的第二词集,/>表示文本数据与预设答复之间的杰卡德相似系数,/>表示第一词集与第二词集之间相同关键词语的总个数,/>表示第一词集与第二词集中所有关键词语的总个数。
如图2所示,是本发明智能数据交互装置100的功能模块图。
本发明所述智能数据交互装置100可以安装于电子设备中。根据实现的功能,所述智能数据交互装置100可以包括创建模块110、识别模块120、确认模块130、录入模块140及反馈模块140。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
创建模块110,在数据库中预先创建预设数量的能够短时存储数据的数据池。
本方案可用于下一步操作依赖于上一步操作这种前后操作之间具有关联,且操作用户不需要将操作过程产生的数据进行长时间保存的应用场景,例如在自助平台上填写个人信息、用户注册、办理业务等应用场景。由于在上述应用场景中往往需要用户填写很多信息,例如个人账号、密码等繁杂的信息。在人的记忆力有限的情况下,容易出现记忆遗忘,可能上一步填写的信息到了下一步要用到的时候就已经忘了,给用户带来不好的体验感。因此,在本实施例中,通过在数据库中预先创建预设数量(具体数量可根据实际情况而定)的能够短时存储数据的数据池,利用能够短时存储数据的数据池可以存储不需要永久性保存的数据,且在一定时间后就会自动删除,减少***的资源占用,适用于上述需要频繁更换用户的应用场景。
识别模块120,通过客户端获取待识别用户的人脸图像,将所述人脸图像输入预先训练的身份识别模型识别出该人脸图像的待确认身份信息。
在本实施例中,通过客户端(例如摄像头)获取待识别用户的人脸图像,将人脸图像输入预先训练的身份识别模型识别出该人脸图像的待确认身份信息,例如用户A,为后续判断用户是否有进入操作***的权限做准备。
区域识别模型可以通过卷积神经网络模型(Convolutional Neural Network,CNN)训练得到,具体训练过程如下:
获取预设数量(例如10万)的待处理图像样本,在每张所述待处理图像样本中标注出所述目标区域及非目标区域;
将所述待处理图像样本按照预设比例(例如5:1)分成训练集和验证集,所述训练集中的图像样本数量大于所述验证集中的图像样本数量;
将所述训练集中的图像样本输入所述目标识别模型进行训练,每隔预设周期(例如每进行1000次迭代)使用所述验证集对所述目标识别模型进行验证,利用所述验证集中各张待处理图像样本和对应的目标区域及非目标区域对该目标识别模型的准确率进行验证;及
当验证的准确率大于预设阈值(例如85%)时,结束训练,得到训练完成的所述区域识别模型。
确认模块130,将所述待确认身份信息与所述数据库的预设身份信息进行对比,若所述数据库中存在与所述待确认身份信息匹配一致的预设身份信息,则在所述客户端上展示信息录入界面,并建立所述客户端与所述数据池之间的数据传输通道。
在本实施例中,通过将待确认身份信息与数据库的预设身份信息进行对比,当判断数据库中存在与待确认身份信息匹配一致的预设身份信息时,则说明该用户具有进入操作***的权限,便在客户端(例如显示屏)上弹出信息录入界面,并建立客户端与数据池之间的数据传输通道,将用户在操作过程中生成的操作数据存储至数据池实现代替用户短时记忆信息。
录入模块140,获取所述信息录入界面上相应栏位上录入的操作数据并存储至所述数据池,提取单个所述栏位对应的标题词语与预设词语构建查询语句,其中,每个所述查询语句对应一条操作数据。
在本实施例中,获取信息录入界面上相应栏位(例如账号输入栏、密码输入栏)上录入的操作数据并存储至数据池,提取单个栏位对应的标题词语(例如“账号”、“密码”)与预设词语(例如“刚才”、“输入”、“是什么?”)构建查询语句(例如“刚才账号输入的是什么?”),并将每个查询语句对应一条操作数据。
反馈模块150,通过所述客户端实时接收待识别用户发起的包含查询语句的查询请求,根据所述查询语句从所述数据池中查询对应的操作数据反馈至所述客户端。
在本实施例中,当用户在操作过程中遗忘了之前的信息时,可以通过客户端(例如话筒)向电子设备1发起的包含查询语句(例如“刚才账号输入的是什么?”)的查询请求,根据查询语句从数据池中查询对应的操作数据反馈至客户端。
在另一实施例中,该智能数据交互装置100还可以包括以下模块:
当客户端识别到当前待确认身份信息发生更改时,关闭客户端的当前信息录入界面。
为了避免用户在操作过程中信息被周围人篡改或者泄露,在本实施例中,当客户端(例如摄像头)识别到当前待确认身份信息发生更改时,例如有其他人对着信息录入界面时,关闭客户端的当前信息录入界面,避免信息被篡改或泄露。
在另一实施例中,该智能数据交互装置100还可以包括以下模块:
当客户端识别到当前待确认身份信息发生更改时,清除数据池中的操作数据。
为了进一步提升信息安全性,在本实施例中,当客户端(例如摄像头)识别到当前待确认身份信息发生更改时,清除数据池中的操作数据,避免***被强行侵入,导致信息被篡改或泄露。
在另一实施例中,由于目前大多数智能答疑终端能做到的只是当与用户进行对话时,答疑***将根据用户的提问与预先设置在数据库中的答案进行匹配,得到相似度高的答案反馈给用户,但是,随着业务量增大,该方式会降低数据库的查询效率,增加对话***的反馈延迟,影响用户体验。因此,为了提高数据库的查询效率,减少对话***的反馈延迟,因此,该智能数据交互装置100还可以包括以下模块:
通过所述客户端获取待确认用户的第一语音数据,利用预设的语音转化算法将所述第一语音数据进行转化得到文本数据;
将所述得到的文本数据输入预先训练的向量提取模型,输出与所述文本数据对应的文本句向量,将所述文本句向量输入预先训练的意图识别模型,输出与所述文本句向量对应意图类型;
根据所述意图类型,从预先创建在所述数据库中由意图类型与预设答疑***之间的映射关系表中找到对应的预设答疑***作为目标答疑***,将该意图类型对应的文本数据发放至所述目标答疑***;及
利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑***中各个预设答复进行相似度值计算,找出所述相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至所述客户端。
在本实施例中,电子设备1通过获取客户端上传的第一语音数据后,利用预设的语音转化算法将第一语音数据进行转化得到文本数据。
其中,将第一语音数据转换成文本数据可通过动态时间归整模型(Dynamic TimeWarping, DTW)中实现。在其他实施例中,还可以是利用其他的语音识别模型得到文本数据,例如:BLSTM模型或LSTM模型。而DTW模型在对第一语音数据实施转换之前,通常都需要大量的训练样本进行训练,因此,在本实施例中,可预先对该DTW模型进行训练,具体的训练过程包括:预先采集预设数量的第一语音数据样本以及每个第一语音数据样本对应的文本数据样本,然后针对每个第一语音数据样本,将该第一语音数据样本输入到该预设的DTW模型中得到该第一语音数据样本对应的文本数据,在得到该第一语音数据样本对应的文本数据后,可将该文本数据与该第一语音数据对应的文本数据样本进行比对,并根据比对的结果对该DTW模型进行调整。经大量语音样本信息训练后的DTW模型可准确地将第一语音数据转换为对应的文本数据。
得到文本数据后,将第一语音数据转化得到的文本数据输入预先训练的向量提取模型,输出与文本数据对应的文本句向量,将文本句向量输入预先训练的意图识别模型,输出与文本句向量对应意图类型。
其中,所述向量提取模型由BERT(Bidirectional Encoder Representation fromTransformers)模型训练得到,所述向量提取模型包括:
向量转化层,配置为基于输入的当前句向量序列,添加特殊符的表示向量,并根据表示向量和当前句向量序列包含的各个句向量的位置信息,对表示向量和当前句向量序列包含的各个句向量进行转化,形成向量序列;
Transformer编码器层,配置为对所述向量序列进行编码处理,得到特殊符编码向量,以及得到当前句向量序列包含的各个句向量分别对应的句编码向量;及
基于Transformer编码器的监督注意力层,至少配置为将所述特殊符编码向量的查询向量与所述特殊符编码向量的键向量之间的点积,确定为所述特殊符编码向量的监督注意力,针对每个句编码向量,将该句编码向量的键向量与所述特殊符编码向量的查询向量之间的点积,确定为该句编码向量的监督注意力,根据所述特殊符编码向量、各个句编码向量及其监督注意力,得到所述文本句向量。
所述意图识别模型由CNN(Convolutional Neural Network, 卷积神经网络)模型训练得到,所述意图识别模型包括至少一个卷积层、至少一个池化层和至少一个全连接层。
通过上述BERT模型+CNN模型能够快速识别出文本数据代表的意图类型。
在识别出文本数据代表的意图类型后,即能够初步判断用户的意图,通过预先创建在数据库中由意图类型与预设答疑***(例如闲聊***、智能答疑***、业务办理***等)之间的映射关系表中找到与意图类型对应的预设答疑***作为目标答疑***,并将该意图类型对应的文本数据发放至该目标答疑***进行下一步地解疑答惑。例如用户只是想简单了解常规问题“张某某是谁?”(意图类型为闲聊),对应的关键词为“张某某”,则将该用户对应的客户端发出的文本数据发放给闲聊***,并反馈答复“张某某是xxxx”给客户端;或者专业性较高的专业问题“治疗心脏病的药物有什么?”(意图类型为专业咨询),对应的关键词为“心脏病、药物”,则将该用户对应的客户端发出的文本数据发放给智能答疑***,并反馈答复“治疗心脏病的药物有xxxx”给客户端;或者是想办理业务“设置上午8点开会的闹钟”(意图类型为业务办理),对应的关键词为“上午8点、开会”,则将该用户对应的客户端发出的文本数据发放给业务办理***,并反馈答复“已设置今天上午8点开会的闹钟”给客户端。由于每一个目标答疑***对应一种意图类型,对于用户提出的问题能够提供具有针对性的答复,因此能够提高答疑准确性,提高数据库的查询效率,减少对话***的反馈延迟,提高用户体验感。
通过利用预先确定的相似度计算规则分别计算文本数据与预先存储在目标答疑***中各个预设答复进行相似度值计算,找出相似度值最大者对应的预设答复作为目标答复转化成第二语音数据反馈至客户端。
具体地,首先利用预先确定的计分算法计算出所述文本数据中每个第一词语的得分,将所有所述第一词语按照得分大小进行排序,根据排序结果从大到小从所述文本数据中依次选取预设数量的第一词语作为第一关键词;
利用预先确定的计分算法计算出所述预设答复中每个第二词语的得分,将所有所述第二词语按照得分大小进行排序,根据排序结果从大到小从所述文本数据中依次选取预设数量的第二词语作为第二关键词;
其中,所述计分算法为:
、/>和/>表示从所述文本数据或预设答复中提取的词语节点,S(/>)、S(/>)分别表示词语节点/>、/>的得分,/>表示/>和/>两个词语节点之间边的权重,/>表示/>和/>两个词语节点之间边的权重,In(/>)表示指向词语节点/>的节点集合 , Out(/>)表示词语节点/>指向的节点集合,d表示阻尼系数。
具体地,将文本数据中的每个词语作为上述公式中的节点,对文本数据中的每个句子进行分词和词性标注处理,只保留指定词性的词语(例如:名词、动词、形容词)。构建候选关键词图G = (V,E),其中V由保留的指定词性的词语组成,然后采用共现关系(Co-Occurrence)构造任意两个词语之间的边,两个词语之间存在边,仅当这两个的词语在长度为K的窗口中共现,K表示窗口大小。根据上述公式,将节点之间边的权重的初值设为“1”,迭代传播权重计算各指定性词语的得分,将计算出的指定性词语的得分从大到小排序,可选取得分排前十的词语作为关键词。还可以利用投票的原理,将边作为词语之间的互相投票,经过不断迭代,每个词语的得票数会趋于稳定,然后对词语的得票数由大到小排序,可选取得票数排前六的词语作为关键词,将得到的关键词在原始文本数据中进行标记,若形成相邻词组则组合成多词关键词。
再利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑***中各个预设答复进行相似度值计算。
其中,所述相似度值计算规则采用杰卡德相似系数算法:
其中,表示每个文本数据中所有第一关键词语构成的第一词集,/>表示每个预设答复中所有第二关键词语构成的第二词集,/>表示文本数据与预设答复之间的杰卡德相似系数,/>表示第一词集与第二词集之间相同关键词语的总个数,/>表示第一词集与第二词集中所有关键词语的总个数。
如图3所示,是本发明实现智能数据交互方法的电子设备的结构示意图。
所述电子设备1可以包括处理器12、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器12上运行的计算机程序,如智能数据交互程序10。
其中,所述存储器11至少包括一种类型的可读存储介质,所述计算机可用存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如智能数据交互程序10的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器12在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器12是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如智能数据交互程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器12等之间的连接通信。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器12逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口13,可选地,所述网络接口13可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的智能数据交互程序10是多个指令的组合,在所述处理器12中运行时,可以实现:
识别步骤:响应客户端发出的图像获取请求,解析所述图像获取请求得到待处理图像及目标区域类型,将所述待处理图像输入预先训练的区域识别模型,根据所述目标区域类型识别出所述待处理图像上的目标区域及非目标区域;
第一处理步骤:对所述目标区域进行上采样处理得到分辨率大于该目标区域当前分辨率的第一图像;
第二处理步骤:对所述非目标区域进行下采样处理得到分辨率小于该非目标区域当前分辨率的第二图像;及
传输步骤:将所述第一图像及第二图像传输至所述客户端后进行拼接得到完整的目标图像。
具体地,所述处理器11对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。***权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (9)
1.一种智能数据交互方法,应用于电子设备,其特征在于,该方法包括:
创建步骤:在数据库中预先创建预设数量的能够短时存储数据的数据池;
识别步骤:通过客户端获取待识别用户的人脸图像,将所述人脸图像输入预先训练的身份识别模型识别出该人脸图像的待确认身份信息;
确认步骤:将所述待确认身份信息与所述数据库的预设身份信息进行对比,若所述数据库中存在与所述待确认身份信息匹配一致的预设身份信息,则在所述客户端上展示信息录入界面,并建立所述客户端与所述数据池之间的数据传输通道;
录入步骤:获取所述信息录入界面上相应栏位上录入的操作数据并存储至所述数据池,提取单个所述栏位对应的标题词语与预设词语构建查询语句,其中,每个所述查询语句对应一条操作数据;及
反馈步骤:通过所述客户端实时接收待识别用户发起的包含查询语句的查询请求,根据所述查询语句从所述数据池中查询对应的操作数据反馈至所述客户端;
该方法还包括以下步骤:
通过所述客户端获取待确认用户的第一语音数据,利用预设的语音转化算法将所述第一语音数据进行转化得到文本数据;
将所述得到的文本数据输入预先训练的向量提取模型,输出与所述文本数据对应的文本句向量,将所述文本句向量输入预先训练的意图识别模型,输出与所述文本句向量对应意图类型;
根据所述意图类型,从预先创建在所述数据库中由意图类型与预设答疑***之间的映射关系表中找到对应的预设答疑***作为目标答疑***,将该意图类型对应的文本数据发放至所述目标答疑***;及
利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑***中各个预设答复进行相似度值计算,找出所述相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至所述客户端。
2.如权利要求1所述的智能数据交互方法,其特征在于,该方法还包括以下步骤:
当所述客户端识别到所述待确认身份信息发生更改时,关闭所述客户端的当前信息录入界面。
3.如权利要求2所述的智能数据交互方法,其特征在于,该方法还包括以下步骤:
当所述客户端识别到所述待确认身份信息发生更改时,清除所述数据池中的操作数据。
4.如权利要求1所述的智能数据交互方法,其特征在于,所述身份识别模型的训练过程包括:
获取人脸图像样本,为每张所述人脸图像样本分配唯一的待确认身份信息;
将所述人脸图像样本按照预设比例分成训练集和验证集,所述训练集中的人脸图像样本数量大于所述验证集中的人脸图像样本数量;
将所述训练集中的人脸图像样本输入所述身份识别模型进行训练,每隔预设周期使用所述验证集对所述身份识别模型进行验证,利用所述验证集中各张人脸图像样本和对应的待确认身份信息对该身份识别模型的准确率进行验证;及
当验证的准确率大于预设阈值时,结束训练,得到训练完成的所述身份识别模型。
5.如权利要求1所述的智能数据交互方法,其特征在于,所述向量提取模型包括:
向量转化层,配置为基于输入的当前句向量序列,添加特殊符的表示向量,并根据表示向量和当前句向量序列包含的各个句向量的位置信息,对表示向量和当前句向量序列包含的各个句向量进行转化,形成向量序列;
Transformer编码器层,配置为对所述向量序列进行编码处理,得到特殊符编码向量,以及得到当前句向量序列包含的各个句向量分别对应的句编码向量;及
基于Transformer编码器的监督注意力层,至少配置为将所述特殊符编码向量的查询向量与所述特殊符编码向量的键向量之间的点积,确定为所述特殊符编码向量的监督注意力,针对每个句编码向量,将该句编码向量的键向量与所述特殊符编码向量的查询向量之间的点积,确定为该句编码向量的监督注意力,根据所述特殊符编码向量、各个句编码向量及其监督注意力,得到所述文本句向量。
6.一种智能数据交互装置,其特征在于,所述智能数据交互装置包括:
创建模块:在数据库中预先创建预设数量的能够短时存储数据的数据池;
识别模块:通过客户端获取待识别用户的人脸图像,将所述人脸图像输入预先训练的身份识别模型识别出该人脸图像的待确认身份信息;
确认模块:将所述待确认身份信息与所述数据库的预设身份信息进行对比,若所述数据库中存在与所述待确认身份信息匹配一致的预设身份信息,则在所述客户端上展示信息录入界面,并建立所述客户端与所述数据池之间的数据传输通道;
录入模块:获取所述信息录入界面上相应栏位上录入的操作数据并存储至所述数据池,提取单个所述栏位对应的标题词语与预设词语构建查询语句,其中,每个所述查询语句对应一条操作数据;及
反馈模块:通过所述客户端实时接收待识别用户发起的包含查询语句的查询请求,根据所述查询语句从所述数据池中查询对应的操作数据反馈至所述客户端;
该装置还包括转化模块,用于通过所述客户端获取待确认用户的第一语音数据,利用预设的语音转化算法将所述第一语音数据进行转化得到文本数据;将所述得到的文本数据输入预先训练的向量提取模型,输出与所述文本数据对应的文本句向量,将所述文本句向量输入预先训练的意图识别模型,输出与所述文本句向量对应意图类型;根据所述意图类型,从预先创建在所述数据库中由意图类型与预设答疑***之间的映射关系表中找到对应的预设答疑***作为目标答疑***,将该意图类型对应的文本数据发放至所述目标答疑***;及利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑***中各个预设答复进行相似度值计算,找出所述相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至所述客户端。
7.如权利要求6所述的智能数据交互装置,其特征在于,该装置还包括以下模块:
当所述客户端识别到所述待确认身份信息发生更改时,关闭所述客户端的当前信息录入界面。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至5中任一所述的智能数据交互方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有智能数据交互程序,所述智能数据交互程序可被一个或者多个处理器执行,以实现如权利要求1-5中任一项所述的智能数据交互方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010389172.8A CN111581623B (zh) | 2020-05-09 | 2020-05-09 | 智能数据交互方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010389172.8A CN111581623B (zh) | 2020-05-09 | 2020-05-09 | 智能数据交互方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111581623A CN111581623A (zh) | 2020-08-25 |
CN111581623B true CN111581623B (zh) | 2023-12-19 |
Family
ID=72110785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010389172.8A Active CN111581623B (zh) | 2020-05-09 | 2020-05-09 | 智能数据交互方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111581623B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112069230B (zh) * | 2020-09-07 | 2023-10-27 | 中国平安财产保险股份有限公司 | 数据分析方法、装置、设备及存储介质 |
CN113609335B (zh) * | 2021-08-12 | 2023-02-03 | 北京滴普科技有限公司 | 一种目标对象查找方法、***、电子设备及存储介质 |
CN113849795A (zh) * | 2021-10-18 | 2021-12-28 | 深圳追一科技有限公司 | 数字人的交互方法、装置、电子设备及计算机存储介质 |
CN116405300B (zh) * | 2023-04-18 | 2024-01-23 | 无锡锡商银行股份有限公司 | 一种基于场景的在线协议签署安全分析***及方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0628077A (ja) * | 1992-07-07 | 1994-02-04 | Fuji Xerox Co Ltd | 入力支援システム |
CN106250369A (zh) * | 2016-07-28 | 2016-12-21 | 海信集团有限公司 | 语音交互方法、装置和终端 |
CN108427722A (zh) * | 2018-02-09 | 2018-08-21 | 卫盈联信息技术(深圳)有限公司 | 智能交互方法、电子装置及存储介质 |
CN108491709A (zh) * | 2018-03-21 | 2018-09-04 | 百度在线网络技术(北京)有限公司 | 用于识别权限的方法和装置 |
CN108564036A (zh) * | 2018-04-13 | 2018-09-21 | 上海思依暄机器人科技股份有限公司 | 一种基于人脸识别的身份判定方法、装置和云服务器 |
CN109117801A (zh) * | 2018-08-20 | 2019-01-01 | 深圳壹账通智能科技有限公司 | 人脸识别的方法、装置、终端及计算机可读存储介质 |
CN110020382A (zh) * | 2018-03-29 | 2019-07-16 | 中国平安财产保险股份有限公司 | 信息的智能输入方法、用户设备、存储介质及装置 |
WO2020024455A1 (zh) * | 2018-08-01 | 2020-02-06 | 平安科技(深圳)有限公司 | 基于上下文的输入方法、装置、存储介质及计算机设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7647312B2 (en) * | 2005-05-12 | 2010-01-12 | Microsoft Corporation | System and method for automatic generation of suggested inline search terms |
CN107767869B (zh) * | 2017-09-26 | 2021-03-12 | 百度在线网络技术(北京)有限公司 | 用于提供语音服务的方法和装置 |
CN109036425B (zh) * | 2018-09-10 | 2019-12-24 | 百度在线网络技术(北京)有限公司 | 用于操作智能终端的方法和装置 |
-
2020
- 2020-05-09 CN CN202010389172.8A patent/CN111581623B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0628077A (ja) * | 1992-07-07 | 1994-02-04 | Fuji Xerox Co Ltd | 入力支援システム |
CN106250369A (zh) * | 2016-07-28 | 2016-12-21 | 海信集团有限公司 | 语音交互方法、装置和终端 |
CN108427722A (zh) * | 2018-02-09 | 2018-08-21 | 卫盈联信息技术(深圳)有限公司 | 智能交互方法、电子装置及存储介质 |
CN108491709A (zh) * | 2018-03-21 | 2018-09-04 | 百度在线网络技术(北京)有限公司 | 用于识别权限的方法和装置 |
CN110020382A (zh) * | 2018-03-29 | 2019-07-16 | 中国平安财产保险股份有限公司 | 信息的智能输入方法、用户设备、存储介质及装置 |
CN108564036A (zh) * | 2018-04-13 | 2018-09-21 | 上海思依暄机器人科技股份有限公司 | 一种基于人脸识别的身份判定方法、装置和云服务器 |
WO2020024455A1 (zh) * | 2018-08-01 | 2020-02-06 | 平安科技(深圳)有限公司 | 基于上下文的输入方法、装置、存储介质及计算机设备 |
CN109117801A (zh) * | 2018-08-20 | 2019-01-01 | 深圳壹账通智能科技有限公司 | 人脸识别的方法、装置、终端及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111581623A (zh) | 2020-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111581623B (zh) | 智能数据交互方法、装置、电子设备及存储介质 | |
CN111708873A (zh) | 智能问答方法、装置、计算机设备和存储介质 | |
WO2021218028A1 (zh) | 基于人工智能的面试内容精炼方法、装置、设备及介质 | |
CN112988963B (zh) | 基于多流程节点的用户意图预测方法、装置、设备及介质 | |
CN111695354A (zh) | 基于命名实体的文本问答方法、装置及可读存储介质 | |
WO2021204017A1 (zh) | 文本意图识别方法、装置以及相关设备 | |
CN113688221B (zh) | 基于模型的话术推荐方法、装置、计算机设备和存储介质 | |
CN111694937A (zh) | 基于人工智能的面试方法、装置、计算机设备及存储介质 | |
CN112395391B (zh) | 概念图谱构建方法、装置、计算机设备及存储介质 | |
CN113627797B (zh) | 入职员工画像生成方法、装置、计算机设备及存储介质 | |
CN114007131A (zh) | 视频监控方法、装置及相关设备 | |
CN113821622B (zh) | 基于人工智能的答案检索方法、装置、电子设备及介质 | |
CN114387061A (zh) | 产品推送方法、装置、电子设备及可读存储介质 | |
CN114880449B (zh) | 智能问答的答复生成方法、装置、电子设备及存储介质 | |
CN113111159A (zh) | 问答记录生成方法、装置、电子设备及存储介质 | |
CN113821587B (zh) | 文本相关性确定方法、模型训练方法、装置及存储介质 | |
CN113918704A (zh) | 基于机器学习的问答方法、装置、电子设备及介质 | |
CN111694936B (zh) | 用于ai智能面试的识别的方法、装置、计算机设备及存储介质 | |
CN113254814A (zh) | 网络课程视频打标签方法、装置、电子设备及介质 | |
CN116450829A (zh) | 医疗文本分类方法、装置、设备及介质 | |
CN116881446A (zh) | 一种语义分类方法、装置、设备及其存储介质 | |
CN110765245A (zh) | 基于大数据的情感正负判断方法、装置、设备及存储介质 | |
CN115238077A (zh) | 基于人工智能的文本分析方法、装置、设备及存储介质 | |
CN113870478A (zh) | 快速取号方法、装置、电子设备及存储介质 | |
CN113010664A (zh) | 一种数据处理方法、装置及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |