CN109886408A - 一种深度学习方法及装置 - Google Patents

一种深度学习方法及装置 Download PDF

Info

Publication number
CN109886408A
CN109886408A CN201910151308.9A CN201910151308A CN109886408A CN 109886408 A CN109886408 A CN 109886408A CN 201910151308 A CN201910151308 A CN 201910151308A CN 109886408 A CN109886408 A CN 109886408A
Authority
CN
China
Prior art keywords
access log
deep learning
log data
data set
learning model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910151308.9A
Other languages
English (en)
Inventor
王蒙
张红光
宋清云
邱德强
王亚东
袁东方
喻友平
吴甜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910151308.9A priority Critical patent/CN109886408A/zh
Publication of CN109886408A publication Critical patent/CN109886408A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种深度学习方法及装置,该方法包括:获取访问日志数据集,其中,所述访问日志数据集包括第一深度学习模型推理服务中的至少一条访问日志的访问日志数据;训练所述访问日志数据集,生成第二深度学习模型。本发明实施例提供的深度学习方法,在深度学习过程中,可以通过已有深度学习模型服务中的访问日志数据集,训练得到新的深度学习模型,从而可以实现对深度学习模型的更新,且新的深度学习模型是由访问日志数据集训练得到,更能适应新的应用场景,进而提升预测结果准确性。

Description

一种深度学习方法及装置
技术领域
本发明涉及人工智能技术领域,尤其涉及一种深度学习方法及装置。
背景技术
深度学习技术是机器学习研究中的一个新的领域,其动机在于建立和模拟人脑进行分析学习的神经网络,它可以模仿人脑的机制来解释数据,例如图像,声音和文本,让模型自身学习物体的特征表示,且往往可以媲美甚至超越人类的识别精度,因而被广泛应用于人工智能领域。
其中,深度学***台以获取预测结果。但是,由于目前的深度学习模型是训练过程中一次定型,当推理过程中实际应用场景发生变化时,深度学习模型可能无法适应改变后的应用场景,从而导致预测结果准确性低。
发明内容
本发明实施例提供一种深度学习方法及装置,以解决目前深度学习模型存在预测结果准确性低的问题。
第一方面,本发明实施例提供了一种深度学习方法,包括:
获取访问日志数据集,其中,所述访问日志数据集包括第一深度学习模型推理服务中的至少一条访问日志的访问日志数据;
训练所述访问日志数据集,生成第二深度学习模型。
第二方面,本发明实施例还提供了一种深度学习装置,包括:
数据集获取模块,用于获取访问日志数据集,其中,所述访问日志数据集包括第一深度学习模型推理服务中的至少一条访问日志的访问日志数据;
模型训练模块,用于训练所述访问日志数据集,生成第二深度学习模型。
第三方面,本发明实施例还提供了一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述深度学习方法的步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述深度学习方法的步骤。
本发明实施例,获取访问日志数据集,其中,访问日志数据集包括第一深度学习模型推理服务中的至少一条访问日志的访问日志数据;训练所述访问日志数据集,生成第二深度学习模型。这样,在深度学习过程中,可以通过已有深度学习模型服务中的访问日志数据集,训练得到新的深度学习模型,从而可以实现对深度学习模型的更新,且新的深度学习模型是由访问日志数据集训练得到,更能适应新的应用场景,进而提升预测结果准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的深度学习方法的流程示意图;
图2是本发明实施例提供的深度学习方法应用的整体***示意图;
图3是本发明实施例提供的深度学习装置的结构示意图之一;
图4是本发明实施例提供的深度学习装置的结构示意图之二;
图5是本发明实施例提供的数据集获取模块的结构示意图;
图6是本发明实施例提供的深度学习装置的结构示意图之二;
图7是本发明实施例提供的深度学习装置的结构示意图之三;
图8是本发明实施例提供的深度学习装置的结构示意图之四;
图9是本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的一种深度学习方法的流程图,如图1所示,包括以下步骤:
步骤101、获取访问日志数据集,其中,访问日志数据集包括第一深度学习模型推理服务中的至少一条访问日志的访问日志数据;
步骤102、训练访问日志数据集,生成第二深度学习模型。
这里,在深度学习过程中,电子设备可以通过已有深度学习模型服务中的访问日志数据集,训练得到新的深度学习模型,从而可以实现对深度学习模型的更新,且新的深度学习模型是由访问日志数据集训练得到,更能适应新的应用场景,进而提升预测结果准确性。
需要说明的是,上述电子设备可以是任何能够应用上述深度学习方法的设备,例如:可以是自动驾驶车载终端、图像处理服务器或者其他设备,等等。
另外,上述电子设备也可以是一个设备***,该设备***可以由多个设备组合形成,例如:如图2所示,上述电子设备可以包括业务平台、模型仓库、推理服务、数据标注以及数据集仓库等模块,且各模块可以是由一个单独的服务器构成,或者,也可以是多个模块由一个服务器构成,如业务平台和模型仓库可以是处于同一服务器,等等,在此并不进行限定。
在上述步骤101中,上述获取第一深度学习模型推理服务中的访问日志数据集,可以是:电子设备在加载第一深度学习模型后可以为外部设备提供推理服务,且在外部设备调用第一深度学习模型进行推理服务的过程中会产生一系列访问日志,电子设备可以收集每一条访问日志并生成访问日志的访问日志数据,最终构建由大量访问日志数据组成的访问日志数据集。
其中,上述第一深度学习模型可以是电子设备中已有的深度学习模型,其可以是通过训练数据或者历史的访问日志数据集训练得到,且电子设备中可以加载有至少一个深度学习模型,上述第一深度学习模型可以是该至少一个深度学习模型中提供推理服务的任一深度学习模型。
例如:如图2中所示,电子设备中的业务平台可以通过采集的训练数据集训练得到深度学习模型,并将训练得到的深度学习模型推送至模型仓库,该模型仓库中可以存储有至少一个深度学习模型,当外部设备需要调用模型仓库中的某一深度学习模型,即第一深度学习模型时,推理服务模块从模型仓库加载第一深度学习模型并提供推理服务。
另外,上述访问日志是电子设备在第一深度学习模型提供推理服务过程中获取的日志,其可以包括日志产生的时间、访问请求标识、输入参数(来源)以及预测结果等字段。
例如:以图像分类为例,第一深度学习模型用来区分传入图片是猫还是狗,该模型提供在线推理服务时要求调用端传入待预测的图片,访问日志具体如下:
[21/Oct/2016:15:48:54+0800]reuqeust_id:10001;request_img:http://tao.goule w.com/users/upfile/20190127/fd11998f-1f42-4dbb-9d38-78ec0a533ca4.jpg;inferen ce_result:1;
这里,访问日志里至少包括requst_id、request_img和inference_result三个字段,其中requst_id用来标志某次具体请求,可以跟后续调用者用户的反馈做关联,即上述访问请求标识;request_img就是对应需要预测的图片,即第一深度学习模型的输入参数;inferece_result是第一深度学习模型的预测结果,这里1代表猫,0代表狗。
需要说明的是,第一深度学习模型和第二深度学习模型是提供相同推理服务的深度学习模型,因而上述访问日志数据集中的访问日志数据的数据格式与训练第一深度学习模型所采用的数据的数据格式相同,例如:第一深度学习模型的训练数据通常包括输入参数和输出参数,若输入参数包括输入参数1和输入参数2,则上述访问日志数据也包括输入参数1、输入参数2和输出参数(即预测结果)。
本发明实施例中,由于上述访问日志通常包括输入参数、输出参数以及时间戳等字段,故上述获取访问日志数据集,可以是电子设备根据预设规则,提取每一访问日志中与第一深度学习模型的训练数据的数据格式相同的字段,得到对应的访问日志数据,从而生成上述访问日志数据集。上述预设规则可以是任何能够提取每一访问日志中与第一深度学习模型的训练数据的数据格式相同的字段的规则,在此并不进行限定。
可选的,上述获取访问日志数据集,包括:采集第一深度学习模型推理服务中的至少一条访问日志;根据预先定义的访问日志与访问日志数据的映射关系,映射得到至少一条访问日志中每一条访问日志的访问日志数据;生成包括至少一条访问日志的访问日志数据的访问日志数据集。
这里,电子设备通过访问日志与访问日志数据的映射关系,可以映射得到每一访问日志的访问日志数据,并生成由访问日志数据组成的访问日志数据集,使获取访问日志数据集的方式简单,提升电子设备的处理效率。
其中,上述电子设备中预先定义有访问日志与访问日志数据的映射关系,且通过该映射关系可以映射得到每一访问日志中与第一深度学习模型的训练数据的数据格式相同的字段,如输入参数和预测结果的字段,从而提取到访问日志的访问日志数据。
例如:如图2中所示,电子设备中的业务平台预设有【数据接口定义】,该【数据接口定义】中定义有访问日志与访问日志数据的映射关系,在访问日志收集过程中,电子设备可以根据业务平台推送【数据接口定义】中定义的映射关系,将访问日志的字段映射成对应的访问日志数据,具体以上述图像分类为例,深度学习模型的训练数据包括request_img和inferece_result两个字段,则上述【数据接口定义】中可以定义有访问日志与request_img和inferece_result的映射关系,电子设备可以提取每一访问日志中的request_img和inferece_result两个字段形成访问日志数据。
当然,上述电子设备获取访问日志数据集,还可以是根据预设规则,并结合推理服务的预测结果以及置信度等,将访问日志集中每一条访问日志转化为一条有价值的访问日志数据,从而生成访问日志数据集。
本发明实施例中,在电子设备获取到上述访问日志数据集之后,在上述步骤102中,电子设备可以直接将获取到的访问日志数据集训练上述第二深度学习模型。
需要说明的是,由于第一深度学习模型的精度可能有限,使得获取到的访问日志数据集中的部分访问日志数据中预测结果与真实客观的结果存在偏差,因而可以通过标注操作对上述部分访问日志数据中的预测结果进行修正,得到通过修正后的访问日志数据集,该修正后的访问日志数据集为增量数据集,并通过增量数据集训练第二深度学习模型,进而可以提升第二深度学习模型的预测精度。
其中,上述标注操作可以是任何基于访问日志数据中的输入数据对预测结果进行修正,以实现得到推理服务请求真实客观的结果的目的的操作,其可以是通过手工标注或者用户反馈等方式实现,例如:以上述图像分类为例,推理服务中输入图片即request_img中的图像实际为狗,客观的结果应该是0,而访问日志的预测结果即inference_result为1,从而可以对该访问日志的预测结果进行标注,可以是修改预测结果为0,从而得到准确的访问日志。
另外,上述人工标注操作的过程可以是在电子设备上进行,也可以是在外部设备上进行,从而使对访问日志数据集进行该标注操作的方式更为灵活。
可选的,上述训练访问日志数据集,生成第二深度学习模型之前,还可以包括:接收对访问日志数据集进行的标注操作,其中,标注操作为标注人员基于访问日志数据集中至少一条访问日志数据的输入参数,对至少一条访问日志数据的预测结果进行修正的操作;响应于标注操作,生成访问日志数据集对应的第一增量数据集;上述训练访问日志数据集,生成第二深度学习模型,包括:训练第一增量数据集,生成第二深度学习模型,从而可以使标注人员在电子设备上完成对访问日至数据集的标注操作,提升处理效率。
或者,可选的,上述训练访问日志数据集,生成第二深度学习模型之前,还包括:将访问日志数据集发送至外部设备;接收外部设备反馈的第二增量数据集,其中,第二增量数据集为外部设备基于接收到的第二标注操作生成的数据集,且第二标注操作为标注人员基于访问日志数据集中至少一条访问日志数据的输入参数,对至少一条访问日志数据的预测结果进行修正的操作;上述训练访问日志数据集,生成第二深度学习模型,包括:训练第二增量数据集,生成第二深度学习模型,从而可以在外部设备上完成对访问日至数据集的标注操作,节省电子设备的处理资源开销。
例如:如图2中所示,电子设备中的推理服务模块可以进行访问日志收集,将收集到的访问日志生成访问日志数据集并推送至数据标注模块,数据标注模块可以通过人工标注或者众包接入等方式实现对访问日志数据集中的访问日志数据进行标注操作,而在众包接入方式中,可以通过引入第三方众包服务,将推理预测服务的访问日志数据集交付至第三方设备(即外部设备),由第三方设备逐条将访问日志数据打上标签,该标签用以指示将预测结果修正,从而生成标注完的增量数据集(即第二增量数据集),并将上述增量数据集返回至上述电子设备;或者,在人工标注方式中,数据标注模块为开发者提供一个人工标注的工具,将***访问日志数据逐条的展示给开发者,由开发者人工进行标注,从而生成标注完的增量数据集(即第一增量数据集);另外,在上述数据标注模块获取到增量数据集之后,将增量数据集推送至数据集仓库,数据集仓库可以存储至少一组增量数据集,且业务平台可以从数据仓库集中调用增量数据集并进行模型训练,进而得到第二深度学习模型。
本发明实施例中,上述步骤102中,电子设备可以通过预设的模型训练算法训练访问日志数据集,从而生成第二深度学习模型。
其中,上述模型训练的过程可以是:在新模型训练任务触发后,在获取到访问日志数据集的情况下,电子设备可以加载预设的模型版本,在加载的模型版的基础上携带访问日志数据集(或者标注操作后生成的增量数据集)进行训练,当达到训练终止的条件时,得到上述第二深度学习模型。
例如:可以在如图2所示的模型仓库中选择精度最高的深度学***均值不再下降,训练完成并得到上述第二深度学习模型。
本发明实施例中,电子设备根据调用的深度学习模型推理服务中的访问日志数据集重复进行新模型的训练。
可选的,上述获取访问日志数据集之前,还包括:确定第一深度学习模型的访问日志数据的收集过程是否满足预设条件;获取访问日志数据集,包括:在确定收集过程满足预设条件的情况下,执行获取访问日志数据集;其中,访问日志数据集包括在收集过程中收集到的访问日志数据。
这里,电子设备可以在第一深度学习模型的访问日志数据的收集过程满足预设条件的情况下,自动触发新模型训练任务,从而使电子设备可以基于收集过程中的访问日志数据集训练得到新模型,操作便捷。
可选的,上述确定第一深度学习模型的访问日志数据的收集过程是否满足预设条件,包括:确定在第一深度学习模型的访问日志数据的收集过程中收集到的访问日志数据是否达到预设数量,若是,则确定收集过程满足预设条件;或者,确定收集过程中收集访问日志数据的时长是否达到预设时长,若是,则确定收集过程满足预设条件,使电子设备自动触发新模型训练任务的方式更灵活。
当然,上述预设条件还可以是其他条件,在此并不进行限定。
本发明具体实施例中,在上述步骤102中电子设备获取到第二深度学习模型之后,电子设备可以将推理服务中调用的深度学习模型更新为第二深度学习模型,即将第一深度学习模型更新为第二深度学习模型。
其中,上述将第一深度学习模型更新为第二深度学习模型,可以是电子设备在获取到第二深度学习模型之后,直接将第一深度学习模型更新为第二深度学习模型。
或者,可选的,所述训练所述访问日志数据集,生成第二深度学习模型之后,包括:
对所述第一深度学习模型和所述第二深度学习模型进行评估,得到所述第一深度学习模型的第一评估结果以及所述第二深度学习模型的第二评估结果;
在所述第二评估结果与所述第一评估结果满足预设条件的情况下,将所述第一深度学习模型更换为所述第二深度学习模型。
这里,在上述第二评估结果与第一评估结果满足预设条件的情况下,第二深度学习模型推理服务的性能(如精度或者响应效率等)应当高于第一深度学习模型推理服务的性能,从而可以进一步提升推理服务的性能。
例如:如图2中所示,电子设备的业务平台模块中预设有【评估方法定义】,通过【评估方法定义】可以对新的深度学习模型进行评估,并得出新模型的评估得分即评估结果,并比较已有模型的评估得分(即第一评估结果)和新模型的评估得分(即第二评估结果),并在新模型的评估得分高于已有模型的评估得分的情况下,将新模型替换到推理服务。
可选的,所述第一评估结果和所述第二评估结果均包括预测精度;所述在所述第二评估结果与所述第一评估结果满足预设条件的情况下,将所述第一深度学习模型更换为所述第二深度学习模型,包括:在所述第二评估结果大于或者等于所述第一评估结果的情况下,将所述第一深度学习模型更换为所述第二深度学习模型,从而可以提升推理服务的准确性。
当然,上述第一评估结果和第二评估结果还可以包括响应速度和响应时长中的至少一项,例如:上述第一评估结果和第二评估结果均包括预测精度和响应时长,那么,在第二评估结果的预测精度大于或者等于第一评估结果的预测精度,且第二评估结果的响应时长小于或者等于第一评估结果的响应时长的情况下,将第一深度学习模型更换为第二深度学习模型。
另外,上述将第一深度学***台可以将第二深度学习模型推送至模型仓库中,且将模型仓库中的模型1更换为第二深度学习模型。
需要说明的是,上述对第一深度学习模型和第二深度学习模型进行评估,可以是将预设的测试数据作为第一深度学习模型和第二深度学习模型推理服务的输入参数,并根据第一深度学习模型和第二深度学习模型的预测结果,计算测试集数据在第一深度学习模型和第二深度学习模型上的误差,从而得到第一评估结果和第二评估结果。其中,上述预设的测试数据可以是与上述第一深度学习模型和第二深度学习模型的训练数据不同,从而保证评估的准确性。
本发明实施例中,通过获取访问日志数据集,其中,访问日志数据集包括第一深度学习模型推理服务中的至少一条访问日志的访问日志数据;训练所述访问日志数据集,生成第二深度学习模型。这样,在深度学习过程中,可以通过已有深度学习模型服务中的访问日志数据集,训练得到新的深度学习模型,从而可以实现对深度学习模型的更新,且新的深度学习模型是由访问日志数据集训练得到,更能适应新的应用场景,进而提升预测结果准确性。
参见图3,图3是本发明实施例提供的深度学习装置的结构图,如图3所示,深度学习装置300包括:
数据集获取模块301,用于获取访问日志数据集,其中,所述访问日志数据集包括第一深度学习模型推理服务中的至少一条访问日志的访问日志数据;
模型训练模块302,用于训练所述访问日志数据集,生成第二深度学习模型。
可选的,如图4所示,所述深度学习装置300,还包括:
评估模块303,用于对所述第一深度学习模型和所述第二深度学习模型进行评估,得到所述第一深度学习模型的第一评估结果以及所述第二深度学习模型的第二评估结果;
模型更换模块304,用于在所述第二评估结果与所述第一评估结果满足预设条件的情况下,将所述第一深度学习模型更换为所述第二深度学习模型。
可选的,所述第一评估结果和所述第二评估结果均包括预测精度和响应速度中的至少一项;
所述模型更换模块304,具体用于:
在所述第二评估结果大于或者等于所述第一评估结果的情况下,将所述第一深度学习模型更换为所述第二深度学习模型。
可选的,如图5所示,所述数据集获取模块301,包括:
访问日志采集单元3011,用于采集所述第一深度学习模型推理服务中的至少一条访问日志;
映射单元3012,用于根据预先定义的访问日志与访问日志数据的映射关系,映射得到所述至少一条访问日志中每一条访问日志的访问日志数据;
数据集生成单元3013,用于生成包括所述至少一条访问日志的访问日志数据的所述访问日志数据集。
可选的,如图6所示,所述深度学习装置300还包括:
标注操作接收模块305,用于接收对所述访问日志数据集进行的标注操作,其中,所述标注操作为标注人员基于所述访问日志数据集中至少一条访问日志数据的输入参数,对所述至少一条访问日志数据的预测结果进行修正的操作;
增量数据集生成模块306,用于响应于所述标注操作,生成所述访问日志数据集对应的第一增量数据集;
所述模型训练模块302,具体用于:
训练所述第一增量数据集,生成所述第二深度学习模型。
可选的,如图7所示,所述深度学习装置300还包括:
发送模块307,用于将所述访问日志数据集发送至外部设备;
接收模块308,用于接收所述外部设备反馈的第二增量数据集,其中,所述第二增量数据集为所述外部设备基于接收到的第二标注操作生成的数据集,且所述第二标注操作为标注人员基于所述访问日志数据集中至少一条访问日志数据的输入参数,对所述至少一条访问日志数据的预测结果进行修正的操作;
所述模型训练模块302,具体用于:
训练所述第二增量数据集,生成所述第二深度学习模型。
可选的,如图8所示,所述深度学习装置300还包括:
确定模块309,用于确定所述第一深度学习模型的访问日志数据的收集过程是否满足预设条件;
所述数据集获取模块301,还用于:
在确定所述收集过程满足预设条件的情况下,执行所述获取访问日志数据集;
其中,所述访问日志数据集包括在所述收集过程中收集到的访问日志数据。
可选的,所述确定模块309,具体用于:
确定在所述第一深度学习模型的访问日志数据的收集过程中收集到的访问日志数据是否达到预设数量,若是,则确定所述收集过程满足预设条件;或者,
确定所述收集过程中收集访问日志数据的时长是否达到预设时长,若是,则确定所述收集过程满足预设条件。
本发明实施例提供的深度学习装置300能够实现图1中方法实施例中电子设备实现的各个过程,为避免重复,这里不再赘述。
图9为实现本发明各个实施例的一种电子设备的硬件结构示意图。
该电子设备900包括但不限于:射频单元901、网络模块902、音频输出单元903、输入单元904、传感器905、显示单元906、用户输入单元907、接口单元908、存储器909、处理器910、以及电源911等部件。本领域技术人员可以理解,图9中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,处理器910,用于:
获取访问日志数据集,其中,所述访问日志数据集包括第一深度学习模型推理服务中的至少一条访问日志的访问日志数据;
训练所述访问日志数据集,生成第二深度学习模型。
可选的,处理器910,还用于:
对所述第一深度学习模型和所述第二深度学习模型进行评估,得到所述第一深度学习模型的第一评估结果以及所述第二深度学习模型的第二评估结果;
在所述第二评估结果与所述第一评估结果满足预设条件的情况下,将所述第一深度学习模型更换为所述第二深度学习模型。
可选的,所述第一评估结果和所述第二评估结果均包括预测精度和响应速度中的至少一项;
处理器910,具体用于:
在所述第二评估结果大于或者等于所述第一评估结果的情况下,将所述第一深度学习模型更换为所述第二深度学习模型。
可选的,所述访问日志数据集包括至少一条访问日志数据;
处理器910,具体用于:
采集所述第一深度学习模型推理服务中的至少一条访问日志;
根据预先定义的访问日志与访问日志数据的映射关系,映射得到所述至少一条访问日志中每一条访问日志的访问日志数据;
生成包括所述至少一条访问日志的访问日志数据的所述访问日志数据集。
可选的,处理器910,还用于:
接收对所述访问日志数据集进行的标注操作,其中,所述标注操作为标注人员基于所述访问日志数据集中至少一条访问日志数据的输入参数,对所述至少一条访问日志数据的预测结果进行修正的操作;
响应于所述标注操作,生成所述访问日志数据集对应的第一增量数据集;
训练所述第一增量数据集,生成所述第二深度学习模型。
可选的,处理器910,还用于:
将所述访问日志数据集发送至外部设备;
接收所述外部设备反馈的第二增量数据集,其中,所述第二增量数据集为所述外部设备基于接收到的第二标注操作生成的数据集,且所述第二标注操作为标注人员基于所述访问日志数据集中至少一条访问日志数据的输入参数,对所述至少一条访问日志数据的预测结果进行修正的操作;
训练所述第二增量数据集,生成所述第二深度学习模型。
可选的,处理器910,还用于:
确定所述第一深度学习模型的访问日志数据的收集过程是否满足预设条件;
在确定所述收集过程满足预设条件的情况下,执行所述获取访问日志数据集;
其中,所述访问日志数据集包括在所述收集过程中收集到的访问日志数据。
可选的,处理器910,具体用于:
确定在所述第一深度学习模型的访问日志数据的收集过程中收集到的访问日志数据是否达到预设数量,若是,则确定所述收集过程满足预设条件;或者,
确定所述收集过程中收集访问日志数据的时长是否达到预设时长,若是,则确定所述收集过程满足预设条件。
应理解的是,本发明实施例中,射频单元901可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器910处理;另外,将上行的数据发送给基站。通常,射频单元901包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元901还可以通过无线通信***与网络和其他设备通信。
电子设备通过网络模块902为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元903可以将射频单元901或网络模块902接收的或者在存储器909中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元903还可以提供与电子设备900执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元903包括扬声器、蜂鸣器以及受话器等。
输入单元904用于接收音频或视频信号。输入单元904可以包括图形处理器(Graphics Processing Unit,GPU)9041和麦克风9042,图形处理器9041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元906上。经图形处理器9041处理后的图像帧可以存储在存储器909(或其它存储介质)中或者经由射频单元901或网络模块902进行发送。麦克风9042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元901发送到移动通信基站的格式输出。
电子设备900还包括至少一种传感器905,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板9091的亮度,接近传感器可在电子设备900移动到耳边时,关闭显示面板9091和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器905还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元906用于显示由用户输入的信息或提供给用户的信息。显示单元906可包括显示面板9091,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板9091。
用户输入单元907可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元907包括触控面板9091以及其他输入设备9072。触控面板9091,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板9091上或在触控面板9091附近的操作)。触控面板9091可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器910,接收处理器910发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板9091。除了触控面板9091,用户输入单元907还可以包括其他输入设备9072。具体地,其他输入设备9072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板9091可覆盖在显示面板9091上,当触控面板9091检测到在其上或附近的触摸操作后,传送给处理器910以确定触摸事件的类型,随后处理器910根据触摸事件的类型在显示面板9091上提供相应的视觉输出。虽然在图9中,触控面板9091与显示面板9091是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板9091与显示面板9091集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元908为外部装置与电子设备900连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元908可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备900内的一个或多个元件或者可以用于在电子设备900和外部装置之间传输数据。
存储器909可用于存储软件程序以及各种数据。存储器909可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器909可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器910是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器909内的软件程序和/或模块,以及调用存储在存储器909内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器910可包括一个或多个处理单元;优选的,处理器910可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器910中。
电子设备900还可以包括给各个部件供电的电源911(比如电池),优选的,电源911可以通过电源管理***与处理器910逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。
另外,电子设备900包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种电子设备,包括处理器910,存储器909,存储在存储器909上并可在所述处理器910上运行的计算机程序,该计算机程序被处理器910执行时实现上述深度学习方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述深度学习方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (18)

1.一种深度学习方法,其特征在于,包括:
获取访问日志数据集,其中,所述访问日志数据集包括第一深度学习模型推理服务中的至少一条访问日志的访问日志数据;
训练所述访问日志数据集,生成第二深度学习模型。
2.根据权利要求1所述的方法,其特征在于,所述训练所述访问日志数据集,生成第二深度学习模型之后,包括:
对所述第一深度学习模型和所述第二深度学习模型进行评估,得到所述第一深度学习模型的第一评估结果以及所述第二深度学习模型的第二评估结果;
在所述第二评估结果与所述第一评估结果满足预设条件的情况下,将所述第一深度学习模型更换为所述第二深度学习模型。
3.根据权利要求2所述的方法,其特征在于,所述第一评估结果和所述第二评估结果均包括预测精度;
所述在所述第二评估结果与所述第一评估结果满足预设条件的情况下,将所述第一深度学习模型更换为所述第二深度学习模型,包括:
在所述第二评估结果大于或者等于所述第一评估结果的情况下,将所述第一深度学习模型更换为所述第二深度学习模型。
4.根据权利要求1所述的方法,其特征在于,所述获取访问日志数据集,包括:
采集所述第一深度学习模型推理服务中的至少一条访问日志;
根据预先定义的访问日志与访问日志数据的映射关系,映射得到所述至少一条访问日志中每一条访问日志的访问日志数据;
生成包括所述至少一条访问日志的访问日志数据的所述访问日志数据集。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述训练所述访问日志数据集,生成第二深度学习模型之前,还包括:
接收对所述访问日志数据集进行的标注操作,其中,所述标注操作为标注人员基于所述访问日志数据集中至少一条访问日志数据的输入参数,对所述至少一条访问日志数据的预测结果进行修正的操作;
响应于所述标注操作,生成所述访问日志数据集对应的第一增量数据集;
所述训练所述访问日志数据集,生成第二深度学习模型,包括:
训练所述第一增量数据集,生成所述第二深度学习模型。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述训练所述访问日志数据集,生成第二深度学习模型之前,还包括:
将所述访问日志数据集发送至外部设备;
接收所述外部设备反馈的第二增量数据集,其中,所述第二增量数据集为所述外部设备基于接收到的第二标注操作生成的数据集,且所述第二标注操作为标注人员基于所述访问日志数据集中至少一条访问日志数据的输入参数,对所述至少一条访问日志数据的预测结果进行修正的操作;
所述训练所述访问日志数据集,生成第二深度学习模型,包括:
训练所述第二增量数据集,生成所述第二深度学习模型。
7.根据权利要求1至4中任一项所述的方法,其特征在于,所述获取访问日志数据集之前,还包括:
确定所述第一深度学习模型的访问日志数据的收集过程是否满足预设条件;
所述获取访问日志数据集,包括:
在确定所述收集过程满足预设条件的情况下,执行所述获取访问日志数据集;
其中,所述访问日志数据集包括在所述收集过程中收集到的访问日志数据。
8.根据权利要求7所述的方法,其特征在于,所述确定所述第一深度学习模型的访问日志数据的收集过程是否满足预设条件,包括:
确定在所述第一深度学习模型的访问日志数据的收集过程中收集到的访问日志数据是否达到预设数量,若是,则确定所述收集过程满足预设条件;或者,
确定所述收集过程中收集访问日志数据的时长是否达到预设时长,若是,则确定所述收集过程满足预设条件。
9.一种深度学习装置,其特征在于,包括:
数据集获取模块,用于获取访问日志数据集,其中,所述访问日志数据集包括第一深度学习模型推理服务中的至少一条访问日志的访问日志数据;
模型训练模块,用于训练所述访问日志数据集,生成第二深度学习模型。
10.根据权利要求9所述的深度学习装置,其特征在于,所述深度学习装置,还包括:
评估模块,用于对所述第一深度学习模型和所述第二深度学习模型进行评估,得到所述第一深度学习模型的第一评估结果以及所述第二深度学习模型的第二评估结果;
模型更换模块,用于在所述第二评估结果与所述第一评估结果满足预设条件的情况下,将所述第一深度学习模型更换为所述第二深度学习模型。
11.根据权利要求10所述的深度学习装置,其特征在于,所述第一评估结果和所述第二评估结果均包括预测精度和响应速度中的至少一项;
所述模型更换模块,具体用于:
在所述第二评估结果大于或者等于所述第一评估结果的情况下,将所述第一深度学习模型更换为所述第二深度学习模型。
12.根据权利要求9所述的深度学习装置,其特征在于,所述数据集获取模块,包括:
访问日志采集单元,用于采集所述第一深度学习模型推理服务中的至少一条访问日志;
映射单元,用于根据预先定义的访问日志与访问日志数据的映射关系,映射得到所述至少一条访问日志中每一条访问日志的访问日志数据;
数据集生成单元,用于生成包括所述至少一条访问日志的访问日志数据的所述访问日志数据集。
13.根据权利要求9至12中任一项所述的深度学习装置,其特征在于,所述深度学习装置还包括:
标注操作接收模块,用于接收对所述访问日志数据集进行的标注操作,其中,所述标注操作为标注人员基于所述访问日志数据集中至少一条访问日志数据的输入参数,对所述至少一条访问日志数据的预测结果进行修正的操作;
增量数据集生成模块,用于响应于所述标注操作,生成所述访问日志数据集对应的第一增量数据集;
所述模型训练模块,具体用于:
训练所述第一增量数据集,生成所述第二深度学习模型。
14.根据权利要求9至12中任一项所述的深度学习装置,其特征在于,所述深度学习装置还包括:
发送模块,用于将所述访问日志数据集发送至外部设备;
接收模块,用于接收所述外部设备反馈的第二增量数据集,其中,所述第二增量数据集为所述外部设备基于接收到的第二标注操作生成的数据集,且所述第二标注操作为标注人员基于所述访问日志数据集中至少一条访问日志数据的输入参数,对所述至少一条访问日志数据的预测结果进行修正的操作;
所述模型训练模块,具体用于:
训练所述第二增量数据集,生成所述第二深度学习模型。
15.根据权利要求9至12中任一项所述的深度学习装置,其特征在于,所述深度学习装置还包括:
确定模块,用于确定所述第一深度学习模型的访问日志数据的收集过程是否满足预设条件;
所述数据集获取模块,还用于:
在确定所述收集过程满足预设条件的情况下,执行所述获取访问日志数据集;
其中,所述访问日志数据集包括在所述收集过程中收集到的访问日志数据。
16.根据权利要求15所述的深度学习装置,其特征在于,所述确定模块,具体用于:
确定在所述第一深度学习模型的访问日志数据的收集过程中收集到的访问日志数据是否达到预设数量,若是,则确定所述收集过程满足预设条件;或者,
确定所述收集过程中收集访问日志数据的时长是否达到预设时长,若是,则确定所述收集过程满足预设条件。
17.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的深度学习方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的深度学习方法的步骤。
CN201910151308.9A 2019-02-28 2019-02-28 一种深度学习方法及装置 Pending CN109886408A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910151308.9A CN109886408A (zh) 2019-02-28 2019-02-28 一种深度学习方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910151308.9A CN109886408A (zh) 2019-02-28 2019-02-28 一种深度学习方法及装置

Publications (1)

Publication Number Publication Date
CN109886408A true CN109886408A (zh) 2019-06-14

Family

ID=66929992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910151308.9A Pending CN109886408A (zh) 2019-02-28 2019-02-28 一种深度学习方法及装置

Country Status (1)

Country Link
CN (1) CN109886408A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110414187A (zh) * 2019-07-03 2019-11-05 北京百度网讯科技有限公司 模型安全交付自动化的***及其方法
CN111190804A (zh) * 2019-12-28 2020-05-22 同济大学 一种云原生***的多层次的深度学习日志故障检测方法
CN112104659A (zh) * 2020-09-18 2020-12-18 宋清云 一种基于政务应用安全的实时监测平台
CN112722356A (zh) * 2020-12-22 2021-04-30 宋清云 一种安瓿瓶熔封一体机

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951926A (zh) * 2017-03-29 2017-07-14 山东英特力数据技术有限公司 一种混合架构的深度学习***方法及装置
CN107423535A (zh) * 2016-05-23 2017-12-01 百度(美国)有限责任公司 用于确定用户的医疗状况的方法、装置和***
CN108280462A (zh) * 2017-12-11 2018-07-13 北京三快在线科技有限公司 一种模型训练方法及装置,电子设备
CN108364028A (zh) * 2018-03-06 2018-08-03 中国科学院信息工程研究所 一种基于深度学习的互联网网站自动分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423535A (zh) * 2016-05-23 2017-12-01 百度(美国)有限责任公司 用于确定用户的医疗状况的方法、装置和***
CN106951926A (zh) * 2017-03-29 2017-07-14 山东英特力数据技术有限公司 一种混合架构的深度学习***方法及装置
CN108280462A (zh) * 2017-12-11 2018-07-13 北京三快在线科技有限公司 一种模型训练方法及装置,电子设备
CN108364028A (zh) * 2018-03-06 2018-08-03 中国科学院信息工程研究所 一种基于深度学习的互联网网站自动分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴向阳等: "面向订票服务器端爬虫的可视检测方法研究", 《计算机辅助设计与图形学学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110414187A (zh) * 2019-07-03 2019-11-05 北京百度网讯科技有限公司 模型安全交付自动化的***及其方法
CN110414187B (zh) * 2019-07-03 2021-09-17 北京百度网讯科技有限公司 模型安全交付自动化的***及其方法
CN111190804A (zh) * 2019-12-28 2020-05-22 同济大学 一种云原生***的多层次的深度学习日志故障检测方法
CN112104659A (zh) * 2020-09-18 2020-12-18 宋清云 一种基于政务应用安全的实时监测平台
CN112722356A (zh) * 2020-12-22 2021-04-30 宋清云 一种安瓿瓶熔封一体机

Similar Documents

Publication Publication Date Title
CN109886408A (zh) 一种深度学习方法及装置
CN107101665A (zh) 运动信息提供方法及支持所述方法的电子装置
CN110096580A (zh) 一种faq对话方法、装置及电子设备
CN108090855A (zh) 一种学习计划推荐方法及移动终端
CN108121803A (zh) 一种确定页面布局的方法和服务器
CN108089891A (zh) 一种应用程序启动方法、移动终端
CN108984064A (zh) 分屏显示方法、装置、存储介质和电子设备
CN109543099A (zh) 一种内容推荐方法及终端设备
CN109871246A (zh) 一种消息显示方法及终端设备
CN109005336A (zh) 一种图像拍摄方法及终端设备
CN106649010A (zh) 一种终端设备测试方法及终端设备
CN108616448A (zh) 一种信息分享的路径推荐方法及移动终端
CN108135033A (zh) 一种蓝牙连接方法及移动终端
CN109062468A (zh) 分屏显示方法、装置、存储介质和电子设备
CN108037885A (zh) 一种操作提示方法及移动终端
CN108681483A (zh) 一种任务处理方法及装置
CN108958593A (zh) 一种确定通讯对象的方法及移动终端
CN109085963A (zh) 一种界面显示方法及终端设备
CN108958629A (zh) 分屏退出方法、装置、存储介质和电子设备
CN108549660B (zh) 信息推送方法及装置
CN107317918A (zh) 参数设置方法及相关产品
CN109815462A (zh) 一种文本生成方法及终端设备
CN107765954A (zh) 一种应用程序图标更新方法、移动终端及服务器
CN108762621B (zh) 一种消息显示方法及移动终端
CN109783722A (zh) 一种内容输出方法及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190614

RJ01 Rejection of invention patent application after publication